OpenAI会杀死Manus们吗?

文章摘要
【关 键 词】 AI技术、创业竞争、模型对比、行业影响、隐私安全
OpenAI于7月18日发布ChatGPT Agent,标志着AI Agent领域进入巨头主导的新阶段。这一系统通过单一模型实现任务规划、工具调用和文档生成等复杂流程,创始人山姆·阿尔特曼称其为”首次真正感受到AGI”的突破。技术测试显示,该模型在《人类的最后考试》等基准评估中表现优异,数据分析能力相当于1-3年经验的分析师水平,但实际应用中存在响应速度慢(部分任务需20分钟)、输出文档美观度不足等问题。
初创公司Manus和Genspark迅速发起技术对标,发布多组对比测试结果。Manus在10个场景测试中强调任务完成度优势,如生成带设计元素的行程海报而非基础表格;Genspark则展示更快的响应速度和更低成本。两家公司均采用上下文工程技术路线,通过提示工程优化实现性能提升,Manus联合创始人季逸超指出,其KV缓存技术能将推理成本降低10倍。这与OpenAI端到端训练的技术路线形成鲜明对比,反映出创业公司在底层模型受限条件下寻求差异化的生存策略。
行业影响层面,AI Agent的普及正在重塑就业市场与商业格局。Klarna公司案例显示,AI Agent已替代700名客服人力;微软30%代码由AI生成。市场预测2030年AI Agent市场规模将达471亿美元,但同时也引发隐私安全担忧——系统需访问日历、支付信息等敏感数据。OpenAI虽推出主动监督等安全措施,阿尔特曼仍警告需限制Agent权限。值得注意的是,公司正开发支付结账系统,暗示其向商业生态延伸的野心。
技术迭代速度正成为创业公司的生存威胁。理想汽车李想等业内人士认为,基础模型厂商将吞噬垂直领域创新空间。OpenAI研究员透露ChatGPT Agent仅是第一步,未来将持续更新。这种压迫感促使Manus等公司加速功能扩展,两个月内新增视频生成等能力,但底层模型差距仍构成长期挑战。测试数据表明,即便采用相同模型,优化提示工程可使性能提升近一倍,这或将成为创业公司短期内的技术护城河。
隐私与伦理问题伴随能力提升日益凸显。OpenAI承认Agent可能被诱导执行不当操作,建议避免高风险场景应用。行业研究者指出,AI Agent的”思考-行动”闭环使其比传统大模型更具不可预测性。这种风险与商业扩张的张力,预示着AI发展将面临更复杂的监管平衡需求。
原文和模型
【原文链接】 阅读原文 [ 3762字 | 16分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★