AI Agent满级进化!骑马种田、办公修图,样样精通,昆仑万维等发布通用Agent新框架

AI-Agent5个月前发布 AIera
802 0 0
AI Agent满级进化!骑马种田、办公修图,样样精通,昆仑万维等发布通用Agent新框架

 

文章摘要


【关 键 词】 AI框架通用控制智能体Cradle游戏应用

近日,昆仑万维与北京智源人工智能研究院、新加坡南洋理工大学、北京大学等机构联合发布了一款名为CradleAI框架Cradle是首个能够同时玩多种商业游戏和操作各种软件应用的AI框架。该框架的论文、项目和代码已经开源。

Cradle框架的核心是通用计算机控制(GCC),它使用统一的输入输出接口,使智能体能够像人类一样通过眼、脑、手的配合与计算机进行互动。Cradle框架由六个模块组成:信息收集、自我反思、任务推断、技能管理、行动规划和记忆模块。这些模块共同实现了智能体的通用性和决策推理能力。

Cradle在多个领域表现出色。在游戏领域,Cradle能够在《荒野大镖客2》、《星露谷物语》、《城市天际线》和《当铺人生2》等游戏中完成各种任务。在软件应用方面,Cradle能够使用Chrome浏览器、Outlook邮件客户端、CapCut视频编辑软件、Meitu图片编辑软件和Feishu办公软件完成下载论文、发送邮件、编辑图片和视频等任务。

Cradle的成功得益于其高度的通用性和决策推理能力。它能够根据游戏内的提示和教程或自我探索的方式生成对应的操作键盘和鼠标的可执行代码作为技能,逐步丰富自己的技能库,并在之后的游戏中重复使用这些技能。此外,Cradle还能够周期性地总结和维护储存在情境记忆中的历史信息以及储存在周期性记忆中的技能。

Cradle的发布为通用人工智能的发展奠定了基础。它扩展了智能体可以交互的范围,证明了将一切软件转化为测试智能体不同能力的testbed的可能性。Cradle的通用计算机控制设定统一了输入输出的接口,促进了统一粒度数据的搜集,为未来Agent在各个环境中交互并且自我提升提供了支持。随着Cradle等框架的发展,面向数字世界的通用人工智能正在加速到来。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 2325字 | 10分钟 ]
【原文作者】 新智元
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...