
文章摘要
当前,AI领域呈现出一种近乎“追星式”的热情氛围,每当有新的技术发布,便迅速引发广泛关注与高度评价。OpenAI最近发布的《A Practical guide to building AI agents》指南,被誉为“市面上最优秀的资源”,旨在为产品和工程团队提供构建AI智能体的实用方法。然而,LangChain创始人Harrison Chase对这份指南提出了强烈异议,认为其核心观点具有误导性,并指出OpenAI在定义Agent时采取了过于僵硬的“二元对立”方法。实际上,大多数“Agentic系统”是Workflows和Agents的有机结合,理想的Agent框架应支持从“结构化工作流”向“由大模型驱动”的模式逐步过渡。
在构建与大模型相关的应用过程中,工程师们逐渐认识到一个残酷的现实:数百小时投入的精细流程和手动调优,往往在下一次大型模型更新后,一夜之间就被彻底摧毁。这种反复被打击、被迫重新适应的经历,正在成为AI工程师们必须经历的一次又一次的惨痛教训。传统的软件系统设计遵循清晰的请求-响应模式,而今天越来越多的系统开始引入模糊计算,依靠大模型进行动态推理和生成响应。这种变化意味着,应用程序的行为不再由静态代码全权决定,而是由不断进化的模型能力动态驱动。
Harrison Chase认为,目前Agent并没有一个统一的定义,不同的人常常从不同的角度来定义它。OpenAI将Agent定义为“能代表你独立完成任务的系统”,而Anthropic的定义更为精确,认为Agentic系统包括Workflows和Agents。Workflows依靠预先编写好的代码路径,协调LLM和工具完成任务;而Agents由LLM动态推理,自主决定任务流程与工具使用,拥有更大的决策自由度。大多数情况下,简单的Workflows就足够用,只有在任务复杂且需要更高灵活性时,才需要构建Agentic系统。
构建可靠Agents的关键挑战在于确保大模型接收到正确的上下文信息,而Workflows的优势在于它们能够将正确的上下文传递给LLMs,可以精确地决定数据如何流动。在实际应用中,Agentic系统往往并非由单一Agent组成,而是由多个Agent协作完成。在多Agent系统中,通信机制至关重要,而Workflows和Agents的混合模式,往往能带来最好的可靠性。
Harrison Chase指出,OpenAI在讨论Agentic框架时,其观点建立在一些错误的二分法之上,混淆了“Agentic框架”的不同维度,从而夸大了他们单一封装的价值。归根结底,他们没有准确把握生产级Agentic系统的核心挑战,也没有清晰认识到框架真正应该提供的价值——即一个可靠、透明的编排层,能够让开发者精确控制传递给LLM的上下文,同时无缝处理持久化、容错、Human-in-the-loop等生产关键问题。
总结来看,简单Agents在特定条件下有效,但仅限于数据和任务极为匹配的场景。对绝大多数应用而言,Workflows仍然不可或缺,且生产环境中的Agentic系统将是Workflows和Agents的结合。未来所有应用都将由简单的、能够调用工具的Agents主导的观点是值得商榷的,因为任务本身具有大量细微差异,难以靠单一、通用的Agent处理。
原文和模型
【原文链接】 阅读原文 [ 4182字 | 17分钟 ]
【原文作者】 AI前线
【摘要模型】 deepseek/deepseek-v3/community
【摘要评分】 ★★★★★