吴恩达力推,微软、谷歌、OpenAI 押注,AI Agent 会是创业新风口吗?
文章摘要
【关 键 词】 AI Agent、发展、重要力量、自动化操作
AI Agent 正在成为AI领域的新风口,其发展被认为将成为AI时代的重要力量。AI巨头们如微软、OpenAI和谷歌正在开发能够处理复杂任务的AI Agent,以将客户对AI的热情转换为收入。这些Agent能够自动完成困难任务,比如自动化操作、重写代码、操作多种应用程序、处理基于网络的任务等,从而为公司带来更多营收。
OpenAI、谷歌和Meta Platforms正在开发各自版本的Agent,旨在将ChatGPT引发的兴奋转变为更多收入。微软正在开发能够自动化多个操作的软件,比如根据客户订单历史创建、发送和跟踪客户发票,或用另一种语言重写应用程序的代码。OpenAI正在设计可以控制个人计算机并同时操作多种应用程序的Agent,以及能够处理复杂的基于网络的任务的Agent。谷歌的DeepMind也在开发能处理复杂任务的AI Agent。
Adept这家初创公司计划推出其计算机使用型Agent产品,该公司通过分析人们在计算机上的工作视频来训练AI系统,使其能够在计算机上执行类似人类的操作。AI Agent的想法最初在一年前兴起,但早期的Agent执行效果良莠不齐,容易陷入重复的行为循环。微软没有推出最复杂的Agent,而是在寻求推出可以逐步提升其现有软件版本自动化功能的Agent。
微软组建了一个新团队,目的是为Copilot产品系列开发Agent功能。例如,微软正在其Dynamics销售应用中开发的Agent功能,能够主动建议应用程序可以执行的多步骤操作。尽管微软研究部门正在探索开发更复杂的Agent程序,但仍在努力解决如何防止代理程序失控的问题。软件程序员可能是第一批体验高级Agent技术的专业人士,GitHub Copilot就是一个例子。
最近的两项技术进步可能帮助AI提供商为更广泛的应用开发Agent,包括使用大语言模型(LLMs)生成合成数据来训练其他模型,以及建立AI模型来自动验证其他模型输出的有效性。尽管Agent技术尚未大规模推广,AI提供商及其客户仍在进行技术基础工作,以消除当前Chatbot常见的错误。
吴恩达在AI Ascent 2024大会上分享了他对AI Agent的看法,他认为基于GPT-3.5构建的Agent工作流在实际应用中的表现比GPT-4更好。他谈到了四种Agent的模式:反思(Reflection)、使用工具(Tool use)、规划(Planning)以及多智能体协同(Multi-agent collaboration)。反思是一个有效的工具,但尚未得到广泛认可。规划和多智能体协同目前还处于新兴阶段,尚不能稳定工作。
原文和模型
【原文链接】 阅读原文 [ 2920字 | 12分钟 ]
【原文作者】 Founder Park
【摘要模型】 gpt-4
【摘要评分】 ★★★★★