标签:模型优化

刚刚,AI视频的天花板被掀翻!测完SkyReels后飘了:我亦有成为专业导演的潜质

昆仑万维近日推出全新升级的AI视频创作平台SkyReels,标志着多模态内容生成技术进入新阶段。该平台通过'模型+平台'双轨模式,集成图像、音频、视频、数字人等...

长上下文快2.9倍,解码快6倍:Kimi 用线性注意力实现性能与效率双突破

月之暗面团队开发的Kimi Linear模型通过创新的混合线性注意力架构,在公平比较中全面超越传统全注意力机制,实现了推理速度与模型性能的双重突破。该模型的核...

Cursor2.0:再强的 AI Coding,也要拼尽全力补模型的课

Cursor 2.0的发布标志着AI编程工具进入新阶段。其核心转变是从“以文件为核心的编辑器”升级为“以Agent为中枢的开发平台”,通过智能体并行处理任务,开发者仅需...

让AI学习效率飙升50倍的秘密:在线策略蒸馏

Thinking Machines Lab的最新研究《On-Policy Distillation》提出了一种颠覆性的AI训练方法,旨在通过实时指导优化模型的学习过程。传统训练方式分为监督微调...

MetaAI解锁Transformer潜意识,仅额外3%计算开销,性能提升最高55%

Meta FAIR部门研究员François Fleuret近期发表的论文《The Free Transformer》提出了一种创新性的解码器Transformer扩展方案。这项技术的核心突破在于让模型...

当 AI 下场炒 A 股,「推理」成了新的直觉

RETuning方法通过反思式证据调优显著提升了大语言模型在金融预测任务中的表现。在一项针对中国A股市场的系统验证中,该方法使模型在三分类任务(预测股票上涨...

DeepSeek新模型用OCR解决超长文本:这世界还能被更高效压缩?

DeepSeek近期发布的《DeepSeek-OCR》技术方案突破了传统OCR工具的局限,其核心价值在于通过视觉压缩解决大模型长上下文处理的瓶颈问题。当前主流大模型受限于...

对 Kimi 最新 Agent 模式的真实评价

ChatBot的Agent化已成为行业明确趋势,Kimi推出的OK Computer模式标志着其正式进入智能代理领域。该功能面向曾打赏过的用户开放内测,提供三次免费额度后转为...

扒完全网最强 AI 团队的 Context Engineering 攻略,我们总结出了这 5 大方法

检索策略(Retrieve)发展出多元技术路线。传统RAG方案如Windsurf结合向量搜索、grep和知识图谱,而Anthropic的Claude Code则完全依赖生成式检索。Lance Mart...

GPT-5 放弃追求智能上限了?

GPT-5的发布标志着OpenAI从追求基础模型智能突破转向了多任务性能优化的工程实践。尽管在编程、写作、数学等高频任务中实现了显著性能提升(如SWE-bench测试...
1 2 3 7