吴恩达力推，微软、谷歌、OpenAI 押注，AI Agent 会是创业新风口吗？

AI-Agent1年前 (2024)更新 Founder Park

2,316 0 0

吴恩达力推，微软、谷歌、OpenAI 押注，AI Agent 会是创业新风口吗？

文章摘要

AI Agent 正在成为AI领域的新风口，其发展被认为将成为AI时代的重要力量。AI巨头们如微软、OpenAI和谷歌正在开发能够处理复杂任务的AI Agent，以将客户对AI的热情转换为收入。这些Agent能够自动完成困难任务，比如自动化操作、重写代码、操作多种应用程序、处理基于网络的任务等，从而为公司带来更多营收。

OpenAI、谷歌和Meta Platforms正在开发各自版本的Agent，旨在将ChatGPT引发的兴奋转变为更多收入。微软正在开发能够自动化多个操作的软件，比如根据客户订单历史创建、发送和跟踪客户发票，或用另一种语言重写应用程序的代码。OpenAI正在设计可以控制个人计算机并同时操作多种应用程序的Agent，以及能够处理复杂的基于网络的任务的Agent。谷歌的DeepMind也在开发能处理复杂任务的AI Agent。

Adept这家初创公司计划推出其计算机使用型Agent产品，该公司通过分析人们在计算机上的工作视频来训练AI系统，使其能够在计算机上执行类似人类的操作。AI Agent的想法最初在一年前兴起，但早期的Agent执行效果良莠不齐，容易陷入重复的行为循环。微软没有推出最复杂的Agent，而是在寻求推出可以逐步提升其现有软件版本自动化功能的Agent。

微软组建了一个新团队，目的是为Copilot产品系列开发Agent功能。例如，微软正在其Dynamics销售应用中开发的Agent功能，能够主动建议应用程序可以执行的多步骤操作。尽管微软研究部门正在探索开发更复杂的Agent程序，但仍在努力解决如何防止代理程序失控的问题。软件程序员可能是第一批体验高级Agent技术的专业人士，GitHub Copilot就是一个例子。

最近的两项技术进步可能帮助AI提供商为更广泛的应用开发Agent，包括使用大语言模型（LLMs）生成合成数据来训练其他模型，以及建立AI模型来自动验证其他模型输出的有效性。尽管Agent技术尚未大规模推广，AI提供商及其客户仍在进行技术基础工作，以消除当前Chatbot常见的错误。

吴恩达在AI Ascent 2024大会上分享了他对AI Agent的看法，他认为基于GPT-3.5构建的Agent工作流在实际应用中的表现比GPT-4更好。他谈到了四种Agent的模式：反思（Reflection）、使用工具（Tool use）、规划（Planning）以及多智能体协同（Multi-agent collaboration）。反思是一个有效的工具，但尚未得到广泛认可。规划和多智能体协同目前还处于新兴阶段，尚不能稳定工作。