OpenAI会杀死Manus们吗？

95 0 0

文章摘要

OpenAI于7月18日发布ChatGPT Agent，标志着AI Agent领域进入巨头主导的新阶段。这一系统通过单一模型实现任务规划、工具调用和文档生成等复杂流程，创始人山姆·阿尔特曼称其为”首次真正感受到AGI”的突破。技术测试显示，该模型在《人类的最后考试》等基准评估中表现优异，数据分析能力相当于1-3年经验的分析师水平，但实际应用中存在响应速度慢（部分任务需20分钟）、输出文档美观度不足等问题。

初创公司Manus和Genspark迅速发起技术对标，发布多组对比测试结果。Manus在10个场景测试中强调任务完成度优势，如生成带设计元素的行程海报而非基础表格；Genspark则展示更快的响应速度和更低成本。两家公司均采用上下文工程技术路线，通过提示工程优化实现性能提升，Manus联合创始人季逸超指出，其KV缓存技术能将推理成本降低10倍。这与OpenAI端到端训练的技术路线形成鲜明对比，反映出创业公司在底层模型受限条件下寻求差异化的生存策略。

行业影响层面，AI Agent的普及正在重塑就业市场与商业格局。Klarna公司案例显示，AI Agent已替代700名客服人力；微软30%代码由AI生成。市场预测2030年AI Agent市场规模将达471亿美元，但同时也引发隐私安全担忧——系统需访问日历、支付信息等敏感数据。OpenAI虽推出主动监督等安全措施，阿尔特曼仍警告需限制Agent权限。值得注意的是，公司正开发支付结账系统，暗示其向商业生态延伸的野心。

技术迭代速度正成为创业公司的生存威胁。理想汽车李想等业内人士认为，基础模型厂商将吞噬垂直领域创新空间。OpenAI研究员透露ChatGPT Agent仅是第一步，未来将持续更新。这种压迫感促使Manus等公司加速功能扩展，两个月内新增视频生成等能力，但底层模型差距仍构成长期挑战。测试数据表明，即便采用相同模型，优化提示工程可使性能提升近一倍，这或将成为创业公司短期内的技术护城河。

隐私与伦理问题伴随能力提升日益凸显。OpenAI承认Agent可能被诱导执行不当操作，建议避免高风险场景应用。行业研究者指出，AI Agent的”思考-行动”闭环使其比传统大模型更具不可预测性。这种风险与商业扩张的张力，预示着AI发展将面临更复杂的监管平衡需求。