推理优化 | 第 2 页

直逼DeepSeek-R1-32B，碾压李飞飞s1！UC伯克利等开源全新SOTA推理模型

斯坦福大学、加州大学伯克利分校等机构联合发布了开源推理模型OpenThinker-32B，其性能接近当前最先进的DeepSeek-R1-32B模型。该模型仅使用114k训练数据（相...

AIGC动态

6个月前

最近，DeepSeek 和 Kimi 的推理模型更新引起了广泛关注。同时，谷歌 DeepMind、加州大学圣地亚哥分校和阿尔伯塔大学的研究者发表了一篇题为《Evolving Deeper...

AIGC动态

7个月前

Adobe和加州大学的研究人员联合开发了一款名为DITTO-2的音乐模型，该模型基于扩散模型，显著提升了音乐生成的效率和控制能力，包括音乐修复、扩展、强度调整...

AIGC动态

7个月前

纽约大学谢赛宁领导的团队近期研究了扩散模型在推理时的scaling效果，发现增加推理时间计算能显著提升扩散模型生成样本的质量。研究团队通过通用搜索框架系统...

AIGC动态

7个月前

香港中文大学（深圳）和深圳市大数据研究院联合开源了一款专用于医疗领域的复杂大模型——华佗GPT-o1，旨在辅助医生进行更高效的推理。该模型的开发基于高质量...

AIGC动态

7个月前

DeepSeek V3，一个参数量为671B的MoE模型，已全面开源。该模型在14.8T高质量token上进行了预训练，激活37B参数，并在多项测评中达到开源SOTA，超越了Llama 3....

AIGC动态

8个月前

AI领域正面临重大转变，传统大模型的Scaling Law已遭遇瓶颈。OpenAI的下一代旗舰Orion和其他公司的大规模语言模型（LLM）如谷歌的Gemini 2.0和Anthropic的Opu...

AIGC动态

10个月前

Snowflake的Arctic模型以其128位专家和4800亿参数的规模，成为目前最大的开源模型。该模型基于Dense-MoE架构设计，由一个10B的稠密Transformer模型和128×3.66...

AIGC动态

1年前 (2024)