标签:模型推理

强化学习Scaling Law错了?无需蒸馏,数据量只要1/6,效果还更好

研究团队通过系统分析揭示了强化学习训练中数据质量与模型推理能力提升的内在关联。核心发现表明,训练样本的质量和相关性远比数量重要,这一结论对传统认知...

​Ben Thompson聊DeepSeek,硅谷关于DeepSeek最值得看的一篇

Ben Thompson在其博客Stratechery中深入分析了DeepSeek的技术细节及其对科技行业的影响。DeepSeek的V3模型通过技术创新显著降低了AI模型的训练成本,对行业产...

硅基流动上线DeepSeek R1&V3推理服务!和华为云合作,全国产服务

硅基流动与华为云团队合作,成功在国内推出了基于华为云昇腾云服务的DeepSeek-V3和DeepSeek-R1模型推理服务,作为春节礼物献给国内用户。这两款模型的推出得...

DeepSeek震动硅谷AI圈,GPT-5还秘而“不发”?7千亿利润奥特曼都看不上了

中国人工智能实验室DeepSeek发布的低成本推理大模型R1性能与OpenAI的o1相当,引发对美国在AI领域领先地位的担忧。AI领域分析师Alberto Romero提出,OpenAI的G...