o3-mini 碾压DeepSeek R1？一条python程序引发近400万围观

AIGC动态7个月前发布 almosthuman2014

1,624 0 0

o3-mini 碾压DeepSeek R1？一条python程序引发近400万围观

文章摘要

OpenAI最近推出了新的推理模型系列o3-mini，这是其推理模型系列中最新、最具成本效益的模型，相比之前的o1系列，成本降低了15倍。o3-mini的推出引起了广泛关注，尤其是与国产大模型DeepSeek R1的比较。在模拟弹跳球的测试中，o3-mini展现出了更好的碰撞和弹跳效果，对重力和摩擦力的理解也更为准确。相比之下，DeepSeek R1在模拟四维超立方体内的弹跳时，对形状的理解不够深入，运动轨迹也显得诡异。

在更复杂的测试中，o3-mini能够完美满足提示词中的所有要求，包括在球体内部弹跳、留下逐渐消失的轨迹、容器缓慢旋转等。而DeepSeek R1虽然效果也不错，但在某些情况下会简化四维空间为三维坐标轴。这些差异反映了模型对真实世界物理规律的理解能力。OpenAI也在发布博客中强调，o3-mini在博士级科学问题上的表现优于o1系列。

总的来说，o3-mini在模拟物体物理状态方面展现出了较强的”世界模型”理解能力，这在大语言模型领域是一个重要的突破。DeepSeek R1虽然在某些方面稍逊一筹，但整体表现仍然可圈可点。这些测试结果为AI社区提供了宝贵的参考，也为未来的模型发展指明了方向。