文章摘要
【关 键 词】 AGI趋势、o3模型、智能挑战、AI合作、技术演进
OpenAI的12天连续发布会虽然在科技界引起了广泛关注,但最终被认为亮点不足,未达预期。尽管如此,最后一天发布的o3推理模型在数学、代码、物理等多项测试中表现出色,令技术人士感到震撼,认为AGI(人工通用智能)已来。o3在复杂问题上超越了部分人类专家的水平,如在GPQA Diamond科学考试中的准确率达到87.7%,远超博士专家的70%。此外,o3在Codeforces上得分2727分,超过了OpenAI研究高级副总裁Mark Chen的得分。
o3的智能深度已经足够,但是否能达到AGI还需看其智能广度。清华大学副教授刘知远表示,o3正在朝超高智能的超级计算机方向发展,但AGI的实现还需大众化、普惠化。国内大模型公司面临的挑战是如何追赶o3,从训练架构、数据、训练方法和评价数据集等关键要素来看,这似乎是工程化能解决的问题。
尽管o3模型能力强大,但模型与应用落地之间仍有较大距离。数据掣肘、封装能力和模型成本过高是主要障碍。OpenAI在发布会上发布了AI强化微调功能,帮助开发者优化推理能力、提升性能。此外,o1模型向开发者开放使用,支持函数调用和视觉能力,引入了WebRTC,实现实时语音应用开发。
Sora的视频生成能力低于预期,但产品开放会提升其物理模拟能力。Sora提供了一些提升视频创作体验的编辑功能,如故事板功能,让用户更好地表达自己。Sora的发布后,会有更多人尝试和探索其物理模拟能力,这些测试样本或许对提升其物理模拟起到一定的指导作用。
OpenAI在发布会上的主要动作是增加新功能,优化用户体验,同时积极推动与苹果等企业的深度合作,探索AI融入终端设备和操作系统。ChatGPT的演进方向似乎是要成为一个无所不能、无所不在、人人可得的超级AI助理。OpenAI也在积极扩张生态,通过融入人们最常用的终端设备、操作系统、上层软件等,触达更广泛人群。尽管o3模型让外界看到了OpenAI的技术实力,但关于推理的Scaling Law能达到怎样的智能上限、以及GPT-5的难产问题,依然让外界对这家公司的技术发展充满疑虑。
原文和模型
【原文链接】 阅读原文 [ 4569字 | 19分钟 ]
【原文作者】 极客公园
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★