被骂惨的“现象级”Manus,今天我们来扒一扒它的真实水平!

AI-Agent1天前发布 ai-front
124 0 0
被骂惨的“现象级”Manus,今天我们来扒一扒它的真实水平!

 

文章摘要


【关 键 词】 AIAgent技术应用市场

由中国团队发布的 AI Agent 产品 Manus 近日在 AI 圈迅速走红,成为热门话题。这款产品被描述为一个真正自主的 AI 助手,能够直接交付完整的任务成果,涵盖写周报、做 PPT、简历筛选、甚至炒股票等多种场景。Manus 在 GAIA 基准测试中表现优异,超越了 OpenAI 的 Deep Search,成为新的最先进 (SOTA) 技术。由于 Manus 尚未公开上线,仅通过邀请码机制开放体验,导致其官网一度崩溃,甚至出现二手平台上邀请码标价高达数十万的现象。

Manus 的火爆背后,反映了市场对 AI 应用的高度期待。数势科技 AI 负责人李飞指出,Deepseek 的成功让国内对大模型及其应用充满信心,而 Manus 的崛起则进一步推动了这一趋势。AI Agent 被认为将在数据分析、智能客服等企业办公和业务领域迎来大规模爆发。与此同时,其他 AI Agent 产品如 MGX 和 OpenManus 也在市场上崭露头角,展示了多智能体协作在编程和开发领域的潜力。

尽管 Manus 在技术上采用了多智能体架构,能够在虚拟环境中调用各类工具,但其技术细节尚未对外披露。李飞认为,Manus 的架构和理念并不算全新,工程实现难度也相对可控,但其任务覆盖范围较广,泛化性较高。然而,Manus 在实际应用中仍面临诸多挑战,包括物理世界的高复杂度、任务流的连通性以及缺乏通用 Agent 协议。部分试用者反馈,Manus 在执行复杂任务时表现不佳,甚至出现崩溃现象,这引发了算力焦虑。

Manus 的爆火也引发了对通用 Agent 可行性的讨论。李飞指出,通用 Agent 的实现难度极大,因为其需要具备丰富的工具池和规划能力,能够应对用户的各种个性化请求。当前,Manus 虽然在某些场景中表现优异,但距离真正的通用 Agent 仍有较大差距。商汤科技高级 AI 产品经理王尚则认为,Agent 的自主实现能力受限于模型本身的能力边界和缺乏通用协议,短期内难以突破。

在其他领域,MGX 作为一款专注于编程开发的多智能体产品,展示了 AI 在软件开发中的潜力。MGX 通过多个专业 AI Agent 的协作,能够模拟人类软件开发流程,涵盖从项目领导到工程师的多个角色。然而,MGX 在处理大型、复杂任务时仍面临诸多问题,如上下文遗忘、错误信息放大以及生成内容缺乏解释性。JetBrains 中国 AI 解决方案专家孙涛指出,MGX 在小型任务上表现超出预期,但在复杂任务中的应用仍需进一步优化。

随着大模型的不断发展,AI Agent 的未来发展路径也引发关注。王尚认为,所有开放性的解决方案最终都可能被大模型内化,而大模型与 Agent 的边界也在逐渐模糊。李飞则指出,大模型无法完全内化某些场景,如企业内部数据处理和特定工具能力的应用。未来,通用 Agent 可能会以整合的方式融入人机交互的某个节点,而非独立存在。

总体来看,Manus 的爆火反映了市场对 AI 应用的高度期待,但其在实际应用中仍面临诸多挑战。AI Agent 的发展前景广阔,但实现真正的通用性和广泛应用仍需克服技术和应用场景上的诸多障碍。

原文和模型


【原文链接】 阅读原文 [ 4611字 | 19分钟 ]
【原文作者】 AI前线
【摘要模型】 deepseek/deepseek-v3/community
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...