标签:推理
AI Infra 工程师们如何应对大模型流水线里的“暗涌”?
在大模型基础设施(Infra)领域,工程师们面临着诸多挑战和需求,尤其是在训练和推理环节的稳定性、性能优化以及资源调度方面。并行策略兼容性、工程流水线管...
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
OpenAI前研究主管Bob McGrew公开表示,AGI的「技术拼图」已经齐全,关键在于如何将推理能力落地并重塑价值创造路径。他认为,实现通用人工智能(AGI)的三大...
田渊栋:连续思维链效率更高,可同时编码多个路径,“叠加态”式并行搜索
田渊栋团队的最新研究揭示了AI模型在处理复杂任务时,通过连续思维链的并行搜索机制,能够显著提升推理效率。传统的大语言模型(LLM)通常采用离散思维链进行...
统一框架下的具身多模态推理:自变量机器人让AI放下海德格尔的锤子
当前最先进的机器人在工具使用上仍面临显著挑战,无法像人类一样直觉地操作工具。它们每次使用工具时都需要重新识别和规划,这种割裂式的处理方式限制了其能...
请记住 MiniMax M1:MiniMax 用自己的方法追上R1们,直奔最强Agent模型而去
MiniMax M1 的发布标志着该公司在基础模型领域的一次重大突破。该模型采用了线性注意力 Lightning Attention 机制,并将其与传统的 softmax attention 相结合...
微软分享三大王炸算法:突破大模型推理瓶颈,性能大涨
微软近日分享了其自研的三大创新算法——rStar-Math、LIPS和CPL,旨在增强大语言模型的推理能力,特别是在数学推理和思考链方面的表现。这些算法不仅适用于小参...
MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。
MiniMax近期在X平台上预告了一整周的发布计划,首日推出了开源推理模型MiniMax M1,这一模型在多个评测集上表现优异,尤其在上下文处理能力上取得了显著突破...
Day0迁移、一键部署,华为开源的昇思MindSpore成为大模型开发的“万能钥匙”
在AI大模型时代,行业逐渐形成一个共识:没有一个大模型可以一统天下。面对众多且不断更新的主流大模型和AI技术,开发者们面临的主要挑战是如何在一个统一的...
「Next-Token」范式改变!刚刚,强化学习预训练来了
在人工智能领域,强化学习(RL)长期以来被视为提升模型能力的辅助工具,而非核心方法。然而,近年来,强化学习在提升大语言模型(LLMs)能力方面的作用逐渐...
AI疯狂进化6个月,一张天梯图全浓缩!30+模型混战,大神演讲爆火
在旧金山AI工程师世博会上,Simon Willison通过自创的「骑自行车的鹈鹕」图像生成测试,回顾了过去六个月大语言模型(LLM)的飞速发展。他亲测了30多款AI模型...