标签:测试时间扩展

训练1000样本就能超越o1,李飞飞等人画出AI扩展新曲线

斯坦福大学在读博士Niklas Muennighoff领导的研究团队提出了一种名为s1的新方法,旨在改进AI的推理效率。s1方法通过仅使用1000个样本和简单的测试时间干预,...