挤爆字节服务器的Agent到底啥水平?一手实测来了

AI-Agent1天前发布 QbitAI
92 0 0
挤爆字节服务器的Agent到底啥水平?一手实测来了

 

文章摘要


【关 键 词】 智能体任务规划信息整理专家模式协作系统

扣子空间(Coze Space)是字节推出的智能体协作系统,旨在实现用户与AI Agent的协同办公。该系统在早期测试中已展现出强大的信息整理、任务执行和工具调用能力,具备解决真实任务的潜力。尽管在指令遵循方面仍有改进空间,但其整体表现已相当惊艳,尤其在自主任务规划和资料搜集方面表现突出。

扣子平台的通用智能体分为探索和规划两种模式。探索模式注重效率,能够自动整理和搜集信息,并生成网页或PPT。例如,智能体可以根据话题扩展搜索词,形成文字报告,并生成包含丰富内容的网页。规划模式则支持在虚拟沙盒环境中执行任务,如订票、浏览网页等。虽然在某些复杂任务中仍存在执行问题,但智能体的网页信息识别和规划执行能力已相当不错。

此外,扣子空间还支持MCP协议,接入了飞书文档、GitHub、MySQL数据库、天气、地图等一系列应用。通过结合MCP,智能体能够完成更复杂的任务,如整理会议流程和嘉宾信息,并生成包含天气预报、交通指南和语音播报的网页。尽管在任务执行过程中存在一些细节问题,但智能体最终能够生成符合预期的页面,解决了工具有无的问题。

在通用智能体之外,扣子空间还提供了专家模式,包括用户研究专家和华泰A股观察助手。用户研究专家能够生成用户访谈提纲、调研问卷和虚拟用户数据,并最终生成用户分析报告。华泰A股观察助手则能够生成股票早报,尽管任务耗时较长,但其在实用性方面表现突出。专家模式吸收了更多私人数据和第三方数据,能够自主发现错误并不断尝试更正,提升了任务的准确性和实用性。

扣子空间的目标是打造一个开放的Agent系统,当用户提出需求时,系统能自动调度最合适的一位或多位专家Agent协同完成任务。尽管当前版本仍处于测试阶段,但其在自主规划和任务驱动方面的加强,已使其成为一个可以上手、能用的Agent系统。此外,扣子空间还通过“裂变玩法”增加了体验资格的获取机会,进一步扩大了用户群体。

原文和模型


【原文链接】 阅读原文 [ 2798字 | 12分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...