
文章摘要
Manus的发布引发了智能体领域的广泛关注,带动了开源复现和商业闭源产品的快速发展。目前,两个开源项目——OpenManus和OWL——在Manus发布当天就推出了复现代码。其中,OWL由国内开源社区CAMEL-AI团队开发,其最新提交在智能体测试基准GAIA的验证集上排名第三,在开源项目中位列第一。OWL的Level 1分数达到81.13,超过了OpenAI的Deep Research,接近Manus公布的86.5分。尽管在Level 2和Level 3分数上仍有差距,但团队表示有信心进一步提升表现。
与此同时,GitHub热榜上涌现了大量与智能体相关的项目和工具库,MetaGPT、AutoGPT等老牌项目也重新受到关注。Claude团队推出的模型上下文协议MCP因其与Manus的实现路径相关,成为讨论焦点。Manus的火爆不仅限于国内,还迅速扩展到海外市场。通过发放邀请码,Manus吸引了大量海外用户,许多试用者对其表现感到惊艳,并积极分享使用体验。海外用户的付费意愿也较高,认为Manus相比OpenAI的高价智能体更具性价比。
Manus的应用场景广泛,用户利用其完成个人主页部署、编程任务、信息检索等复杂操作。尽管存在速度较慢和邀请码短缺的抱怨,但其灵活性和准确性仍受到高度评价。此外,Manus的成功也推动了GAIA基准测试的普及。GAIA由Meta AI、HuggingFace和AutoGPT团队联合推出,旨在解决现有大语言模型基准测试被快速突破的问题。GAIA测试分为三个难度级别,考验智能体系统的工具使用能力和自主性。目前,Manus在Level 3分数上保持领先,显示出其在复杂任务处理上的优势。
随着智能体技术的快速发展,GAIA基准测试正成为行业竞争的新焦点。未来,智能体竞技场的出现或将进一步推动技术的前沿探索。
原文和模型
【原文链接】 阅读原文 [ 1506字 | 7分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek-v3
【摘要评分】 ★★☆☆☆