大模型

出人意料！DeepSeek-R1用的GRPO其实非最优？规模化强化学习训练用PPO就够了

DeepSeek-R1模型的核心强化学习算法GRPO通过分组分数替代价值模型，显著降低了训练资源消耗。然而，阶跃星辰与清华大学的最新研究表明，采用带GAE（λ=1，γ=1...

AIGC动态

6个月前

Grok 3的发布标志着人工智能领域进入推理智能体时代。该模型在xAI的Colossus超级计算集群上训练，运算能力达到现有顶尖模型的10倍，通过20万块GPU的算力支持...

AIGC动态

6个月前

ByteDance Research与上海交通大学合作提出的WMP框架，首次将世界模型技术应用于四足机器人视觉控制领域，为解决传统特权学习方法的局限性提供了新思路。通过...

AIGC动态

6个月前

2024年2月20日，中美两国科研团队同日发布了两项突破性AI生物学模型研究成果。美国英伟达联合多家机构推出开源模型Evo2，其参数规模达400亿，覆盖12.8万个物...

AIGC动态

6个月前

春节期间DeepSeek的走红标志着AI行业进入新阶段。模型训练成本下降与用户认知普及，推动行业跨越发展临界点。2025年全球开发者先锋大会的召开，进一步聚焦如...

AIGC动态

6个月前

美国AI云服务商Together AI近期宣布完成3.05亿美元B轮融资，估值达到33亿美元。本轮融资由General Catalyst和Prosperity7 Ventures领投，参与方包括英伟达、S...

AIGC动态

6个月前

微软在《自然》杂志上公布了名为Muse的生成式AI模型，该模型基于世界和人类行为模型（WHAM-1.6B），能够生成游戏视觉效果并预测玩家操作反应。作为首个通过《...

AIGC动态

6个月前

Topaz Labs推出的新一代视频修复工具Starlight，通过扩散模型（Diffusion Model）技术实现了对低质量视频的突破性修复。该工具在测试阶段凭借一段NASA火箭发...

AIGC动态

6个月前

2025全球开发者先锋大会迎来电竞行业标志性人物Miss韩懿莹的参与，引发业界高度关注。作为中国女子电竞领域的开拓者，韩懿莹不仅以WCG魔兽争霸3和星际争霸2双...

AIGC动态

6个月前

微软开源的最新蛋白质生成模型BioEmu-1通过技术创新显著提升了动态蛋白质结构预测效率。该模型在单个GPU上每小时可生成数千种蛋白质结构，生成效率比传统分子...

AIGC动态

6个月前