OpenAI 秘密武器曝光!Q* 推理能力大爆发,逼近 AGI L2 里程碑
文章摘要
【关 键 词】 AI发展、Strawberry项目、推理能力、后训练方法、AGI目标
OpenAI的AGI路线图最近引起了广泛关注,该路线图将人工智能的发展分为五个等级:L1的聊天机器人、L2的推理者、L3的智能体、L4的创新者和L5的组织者。
OpenAI的新项目Strawberry被披露,该项目可能已达到L2级别,具备推理能力和自主浏览网页的能力。
Elon Musk对此发表了评论,暗示AI的发展可能带来意想不到的后果。
路透社在5月份获得的内部文件显示,OpenAI团队正在全力研究Strawberry项目,该项目的具体运作方式在OpenAI内部也是高度保密的。
Strawberry模型的目标是提高AI模型的推理能力,使其能够进行深度研究和提前规划。
Strawberry项目涉及一种被称为”后训练”的特殊方法,即在AI模型已经在大量通用数据上训练后,调整基础模型以特定方式优化其性能。
OpenAI还希望Strawberry具备执行长时间任务(Long Horizon Task, LHT)的能力,这指的是需要模型提前计划,并在较长时间内执行一系列动作的复杂任务。
2023年11月,OpenAI的Q*项目在AI社区引起了轰动。
Q*的能力是解决以前从未见过的数学题,这被视为朝向AGI迈出的重要一步。
最近,OpenAI在旧金山人工智能工程师世界博览会上展示了GPT-4o Voice、ChatGPT桌面版、Sora和Voice Engine(未发布)等产品。
这些产品展示了OpenAI在AI领域的最新进展。
如果再加上Strawberry的推理能力,OpenAI离实现AGI的目标可能已经非常接近。
原文和模型
【原文链接】 阅读原文 [ 4069字 | 17分钟 ]
【原文作者】 Founder Park
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★