标签：训练流程

快手Klear-Reasoner登顶8B模型榜首，GPPO算法双效强化稳定性与探索能力！

在大语言模型竞争中，数学与代码推理能力是关键“分水岭”。许多中小规模开源推理模型在高难测试中与闭源 SOTA 存在差距，而快手 Klear 语言大模型团队推出的 K...

AIGC动态

3周前

Sebastian Raschka：关于DeepSeek R1和推理模型，我有几点看法

著名AI研究者Sebastian Raschka基于DeepSeek技术报告，系统阐述了增强大语言模型推理能力的四大核心方法。_推理模型被定义为擅长处理需要多步骤中间推导的复...

AIGC动态

7个月前

全球首个类Sora开源复现方案来了！全面公开所有训练细节和模型权重

文章介绍了全球首个开源的类Sora架构视频生成模型Open-Sora 1.0的发布。该模型开放了整个训练流程，包括数据处理、训练细节和模型权重。Open-Sora能生成繁华...

AIGC动态

2年前 (2024)