标签：模型挑战

o3崛起，但推理模型离「撞墙」只剩一年？

OpenAI的o3推理模型算力暴增10倍，能力显著提升，但专家警告其可能在一年内撞上算力资源极限。Epoch AI团队认为，推理模型虽有进步空间，但顶尖AI公司难以实...

AIGC动态

3个月前

Claude挣钱强于o1！OpenAI开源百万美元编码基准，检验大模型钞能力

OpenAI推出并开源了全新基准测试SWE-Lancer，旨在通过真实软件工程任务评估大模型的编码能力。该基准包含来自自由职业平台Upwork的1,488个任务，总价值达100...

AIGC动态

7个月前