大模型
LLM,VLM,模型
出人意料!DeepSeek-R1用的GRPO其实非最优?规模化强化学习训练用PPO就够了
DeepSeek-R1模型的核心强化学习算法GRPO通过分组分数替代价值模型,显著降低了训练资源消耗。然而,阶跃星辰与清华大学的最新研究表明,采用带GAE(λ=1,γ=1...
杭州95后学霸坐C位,Grok 3登顶App Store!Hinton高徒、多伦多华人博士领衔
Grok 3的发布标志着人工智能领域进入推理智能体时代。该模型在xAI的Colossus超级计算集群上训练,运算能力达到现有顶尖模型的10倍,通过20万块GPU的算力支持...
机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA
ByteDance Research与上海交通大学合作提出的WMP框架,首次将世界模型技术应用于四足机器人视觉控制领域,为解决传统特权学习方法的局限性提供了新思路。通过...
中国清华AIR和美国的“生物学DeepSeek时刻”撞车了|钛媒体AGI
2024年2月20日,中美两国科研团队同日发布了两项突破性AI生物学模型研究成果。美国英伟达联合多家机构推出开源模型Evo2,其参数规模达400亿,覆盖12.8万个物...
2025 年,开发者如何抓住 AI 这波「开门红」
春节期间DeepSeek的走红标志着AI行业进入新阶段。模型训练成本下降与用户认知普及,推动行业跨越发展临界点。2025年全球开发者先锋大会的召开,进一步聚焦如...
「卖铲子」也疯狂!美国「DeepSeek概念」AI初创,估值达33亿美元
美国AI云服务商Together AI近期宣布完成3.05亿美元B轮融资,估值达到33亿美元。本轮融资由General Catalyst和Prosperity7 Ventures领投,参与方包括英伟达、S...
微软力推新视频游戏 AI 模型,超 10 亿张画面训练、相当于 7 年老玩家?开发者们:去他的吧!
微软在《自然》杂志上公布了名为Muse的生成式AI模型,该模型基于世界和人类行为模型(WHAM-1.6B),能够生成游戏视觉效果并预测玩家操作反应。作为首个通过《...
一键将老视频超清修复,Topaz出的这个新AI工具有点强。
Topaz Labs推出的新一代视频修复工具Starlight,通过扩散模型(Diffusion Model)技术实现了对低质量视频的突破性修复。该工具在测试阶段凭借一段NASA火箭发...
开发者,找找找丨千万粉丝女子电竞第一人同游 GDC(限量粉丝福利)
2025全球开发者先锋大会迎来电竞行业标志性人物Miss韩懿莹的参与,引发业界高度关注。作为中国女子电竞领域的开拓者,韩懿莹不仅以WCG魔兽争霸3和星际争霸2双...
有望治愈癌症!微软开源新模型,诺奖级重大突破
微软开源的最新蛋白质生成模型BioEmu-1通过技术创新显著提升了动态蛋白质结构预测效率。该模型在单个GPU上每小时可生成数千种蛋白质结构,生成效率比传统分子...