模型推理 | 学习AIGC

RL 是推理神器？清华上交大最新研究指出：RL 让大模型更会「套公式」，却不会真推理

清华和上交的最新研究对当前“纯强化学习（RL）有利于提升模型推理能力”的主流观点提出了质疑。通过一系列实验，研究者发现引入强化学习的模型在某些任务中的...

AIGC动态

5个月前

研究团队通过系统分析揭示了强化学习训练中数据质量与模型推理能力提升的内在关联。核心发现表明，训练样本的质量和相关性远比数量重要，这一结论对传统认知...

AIGC动态

7个月前

Ben Thompson在其博客Stratechery中深入分析了DeepSeek的技术细节及其对科技行业的影响。DeepSeek的V3模型通过技术创新显著降低了AI模型的训练成本，对行业产...

AIGC动态

7个月前

硅基流动与华为云团队合作，成功在国内推出了基于华为云昇腾云服务的DeepSeek-V3和DeepSeek-R1模型推理服务，作为春节礼物献给国内用户。这两款模型的推出得...

AIGC动态

8个月前

中国人工智能实验室DeepSeek发布的低成本推理大模型R1性能与OpenAI的o1相当，引发对美国在AI领域领先地位的担忧。AI领域分析师Alberto Romero提出，OpenAI的G...

AIGC动态

8个月前