标签:训练策略

智谱AI、清华开源新视觉大模型:刷新41项纪录,同级别最强

智谱AI与清华大学联合开源最新视觉大模型GLM - 4.5V,其在多个领域表现卓越。测试数据显示,GLM - 4.5V在42项主流测试中创造41项新记录,尤其在视觉智能体方...

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10

大规模强化学习在激发大型语言模型的复杂推理行为方面展现出显著效果,OpenAI 的 o1 系列和 DeepSeek-R1 的成功便是明证。然而,这些模型的核心训练方法在技...