标签：计算策略

清华一作1B暴打405B巨无霸，7B逆袭DeepSeek R1！测试时Scaling封神

多机构联合研究发现，通过优化测试时计算扩展（TTS）策略，小型语言模型在复杂数学任务中展现出超越大型模型的潜力。0.5B参数的模型在MATH-500和AIME24基准测...

AIGC动态

7个月前

o1突发内幕曝光？谷歌8月论文已揭示原理，大模型光有软件不存在护城河

谷歌DeepMind的一篇论文揭示了一种新的计算策略，该策略与OpenAI的o1模型的工作方式几乎一致。这项研究指出，在测试时增加计算比扩展模型参数更有效，这使得...

AIGC动态

1年前 (2024)