
文章摘要
Manus AI 的推出引发了硬件行业的广泛关注,尤其是在大型行动模型(LAM)领域。LAM 是大型语言模型(LLM)的延伸,旨在成为人类在数字世界中的代理人,帮助用户完成各种任务。与 LLM 不同,LAM 的目标是模拟人类行为,而非超越人类。Manus AI 的核心功能包括自然语义理解、计算机视觉、用户行为习惯学习、场景感知以及跨应用调用工具的能力。这些功能使其在用户体验上与传统的计算机使用方式拉开显著差距。例如,Manus AI 可以通过搜索第三方工具来生成视频,尽管这一过程复杂,但最终能够满足用户需求。
LAM 的未来发展已经成为一个明显的趋势,尤其是在端侧的落地应用。早在 2024 年,Rabbit R1 硬件及其 LAM Playground 已经展示了类似 Manus AI 的能力,但由于技术限制,Rabbit Playground 在处理复杂任务时表现不佳,最终退出主流市场。然而,LAM 作为改变人机交互方式的重要技术,仍然在行业中占据重要地位。Manus AI 的出现,尤其是在处理人机验证和跨应用调用方面的能力,为 LAM 产品的开发提供了新的契机。
系统级厂商在开发 LAM 产品中具有明显优势,尤其是在降低算力成本和提升运行速度方面。Manus AI 的某些简单场景可以在端侧处理,效果更好,尤其是在文件管理和本地工具使用方面。例如,Manus AI 能够自动安装依赖环境并生成 PPT,尽管响应时间较长,但最终完成了任务。这表明,端侧与云端混合运行的模式可能是未来 LAM 发展的主流方向。
Manus AI 展示了 LAM 在生产力领域的潜力,但其商业化仍面临挑战。用户对 Manus AI 的定价存在诸多猜测,而云端运行的高昂成本可能成为其进入消费级市场的最大阻力。与 LLM 的订阅模式不同,LAM 需要找到一种既能降低订阅成本又能提供高效服务的商业模式。未来,随着云端 LAM 的进一步完善,可能会出现更多形态灵活的 AI 硬件设备,如智能手表、AI 眼镜等。
Manus AI 的意义在于它展示了 LAM 和 Agent AI 的潜力,即便它最终不是赢家,也足够重要。通过 Manus AI,普通用户能够更直观地理解 LAM 的能力,这为未来的技术发展提供了重要的参考。随着 LAM 技术的成熟,用户与硬件的交互方式将发生显著变化,最终可能不再需要传统的用户界面,而是通过简单的指令输入和结果交付来完成交互。
原文和模型
【原文链接】 阅读原文 [ 2356字 | 10分钟 ]
【原文作者】 极客公园
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★