万字探讨Agent发展真方向:模型即产品,Agent的未来要靠模型而不是Workflow

万字探讨Agent发展真方向:模型即产品,Agent的未来要靠模型而不是Workflow

 

文章摘要


【关 键 词】 AI智能体模型推理强化学习

Alexander Doria,知名 AI 工程师和 Pleias 的联合创始人,近期发表了两篇文章,深入探讨了 AI 智能体的未来发展方向。他明确指出,未来的 AI 智能体将依赖于模型本身,而非工作流(Work Flow)。他以 Manus 为例,指出基于预先编排的提示词和工具路径的工作流智能体虽然在短期内表现良好,但长期来看将遇到瓶颈,无法处理需要长期规划和多步骤推理的复杂任务。真正的下一代智能体将通过强化学习(RL)与推理(Reasoning)的结合来实现,能够自主掌控任务执行的全过程,包括动态规划搜索策略和主动调整工具使用。

在另一篇文章中,Doria 进一步阐述了 AI 模型的未来趋势,强调AI 模型本身就是未来的产品。他指出,通用型模型的扩展已经遇到瓶颈,而定向训练(Opinionated training)的效果远超预期,强化学习与推理能力的结合正在让模型迅速掌握具体任务。推理成本的极速下降也使得模型提供商必须向价值链更高层发展,而不再依赖简单的 token 销售模式。这一趋势将导致应用层生态的颠覆,投资人押注的应用层可能会最先被自动化取代。

Doria 还详细分析了 OpenAI 的 DeepResearch 和 Anthropic 的 Claude Sonnet 3.7,指出这些模型并非简单的 LLM 或聊天机器人,而是专为端到端任务设计的全新研究型语言模型。它们能够自主完成搜索任务,无需外部调用或提示词干预。相比之下,其他类似产品如 Perplexity 和 Google 的 Gemini 则缺乏真正的优化和量化评估,更多依赖于工作流而非模型本身。

未来的 AI 智能体将不再依赖外部提示或工作流,而是通过模型训练阶段的复杂性提升,从根本上增强自主推理能力。这种转变意味着模型训练方将创造并捕获绝大部分价值,而应用层企业将面临被取代的风险。Doria 预测,未来 2-3 年内,所有闭源 AI 大模型提供商将停止提供 API 服务,转而直接提供模型本身作为产品,API 经济即将终结。

此外,Doria 强调,强化学习(RL)的潜力尚未被资本市场充分评估。尽管 RL 技术取得了突破,但市场对其价值的认识仍然不足。许多具备训练能力的新兴 AI 公司难以获得投资,而应用层企业则面临自主训练模型或被上游大模型取代的两难处境。Doria 认为,未来最赚钱的 AI 应用场景将集中在那些尚未被充分开发的领域,谁能训练出针对这些领域的专用模型,谁就能获得显著优势。

最后,Doria 指出,智能体与基础语言模型的结合需要通过强化学习和推理来实现,而非依赖预定义的提示和规则。他引用 Richard Sutton 的「苦涩教训」,强调人为预设知识的方法在长期来看并不奏效,真正的突破将来自通过大量计算资源进行搜索和学习。未来的 LLM 智能体将通过草稿式推理和多阶段训练,逐步提升其自主规划和行动能力,最终实现真正的智能体设计。

原文和模型


【原文链接】 阅读原文 [ 9426字 | 38分钟 ]
【原文作者】 Founder Park
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...