大模型
LLM,VLM,模型
OpenAI实名举报Grok3作弊,一题答64次踩着台阶和o3-mini比
Grok-3模型发布后因评估方法引发争议,OpenAI团队公开指责其测试结果存在误导性。争议焦点集中在Grok-3的AIME 2025评估图中,其柱状图浅色部分标注为Con@64成...
比亚迪把智驾打到7万后,最惨的人是谁?
2025年2月,比亚迪通过21款新车标配「天神之眼」高阶智驾系统,将智能驾驶功能下探至7万元级别市场,引发行业震动。这一举措不仅扭转了消费者对其智能驾驶能...
与 Open AI 分手后,Figure 推出具身模型 Helix,多个机器人一同做家务
Figure公司近日推出首个自主研发的具身智能模型Helix,实现了对人形机器人上半身35个自由度的高速协调控制。该模型通过融合视觉、语言与感知能力,使人形机器...
揭秘多轮越狱攻击新框架:RACE 如何利用大模型推理能力突破安全防线?
来自北京航空航天大学等机构的研究团队提出RACE多轮越狱攻击框架,通过将有害查询转化为良性推理任务,成功突破多个主流大模型的安全防线。实验结果显示,该...
出人意料!DeepSeek-R1用的GRPO其实非最优?规模化强化学习训练用PPO就够了
DeepSeek-R1模型的核心强化学习算法GRPO通过分组分数替代价值模型,显著降低了训练资源消耗。然而,阶跃星辰与清华大学的最新研究表明,采用带GAE(λ=1,γ=1...
杭州95后学霸坐C位,Grok 3登顶App Store!Hinton高徒、多伦多华人博士领衔
Grok 3的发布标志着人工智能领域进入推理智能体时代。该模型在xAI的Colossus超级计算集群上训练,运算能力达到现有顶尖模型的10倍,通过20万块GPU的算力支持...
机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA
ByteDance Research与上海交通大学合作提出的WMP框架,首次将世界模型技术应用于四足机器人视觉控制领域,为解决传统特权学习方法的局限性提供了新思路。通过...
中国清华AIR和美国的“生物学DeepSeek时刻”撞车了|钛媒体AGI
2024年2月20日,中美两国科研团队同日发布了两项突破性AI生物学模型研究成果。美国英伟达联合多家机构推出开源模型Evo2,其参数规模达400亿,覆盖12.8万个物...
2025 年,开发者如何抓住 AI 这波「开门红」
春节期间DeepSeek的走红标志着AI行业进入新阶段。模型训练成本下降与用户认知普及,推动行业跨越发展临界点。2025年全球开发者先锋大会的召开,进一步聚焦如...
「卖铲子」也疯狂!美国「DeepSeek概念」AI初创,估值达33亿美元
美国AI云服务商Together AI近期宣布完成3.05亿美元B轮融资,估值达到33亿美元。本轮融资由General Catalyst和Prosperity7 Ventures领投,参与方包括英伟达、S...