大模型

LLM,VLM,模型

OpenAI实名举报Grok3作弊,一题答64次踩着台阶和o3-mini比

Grok-3模型发布后因评估方法引发争议,OpenAI团队公开指责其测试结果存在误导性。争议焦点集中在Grok-3的AIME 2025评估图中,其柱状图浅色部分标注为Con@64成...

比亚迪把智驾打到7万后,最惨的人是谁?

2025年2月,比亚迪通过21款新车标配「天神之眼」高阶智驾系统,将智能驾驶功能下探至7万元级别市场,引发行业震动。这一举措不仅扭转了消费者对其智能驾驶能...

与 Open AI 分手后,Figure 推出具身模型 Helix,多个机器人一同做家务

Figure公司近日推出首个自主研发的具身智能模型Helix,实现了对人形机器人上半身35个自由度的高速协调控制。该模型通过融合视觉、语言与感知能力,使人形机器...

揭秘多轮越狱攻击新框架:RACE 如何利用大模型推理能力突破安全防线?

来自北京航空航天大学等机构的研究团队提出RACE多轮越狱攻击框架,通过将有害查询转化为良性推理任务,成功突破多个主流大模型的安全防线。实验结果显示,该...

出人意料!DeepSeek-R1用的GRPO其实非最优?规模化强化学习训练用PPO就够了

DeepSeek-R1模型的核心强化学习算法GRPO通过分组分数替代价值模型,显著降低了训练资源消耗。然而,阶跃星辰与清华大学的最新研究表明,采用带GAE(λ=1,γ=1...

杭州95后学霸坐C位,Grok 3登顶App Store!Hinton高徒、多伦多华人博士领衔

Grok 3的发布标志着人工智能领域进入推理智能体时代。该模型在xAI的Colossus超级计算集群上训练,运算能力达到现有顶尖模型的10倍,通过20万块GPU的算力支持...

机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA

ByteDance Research与上海交通大学合作提出的WMP框架,首次将世界模型技术应用于四足机器人视觉控制领域,为解决传统特权学习方法的局限性提供了新思路。通过...

中国清华AIR和美国的“生物学DeepSeek时刻”撞车了|钛媒体AGI

2024年2月20日,中美两国科研团队同日发布了两项突破性AI生物学模型研究成果。美国英伟达联合多家机构推出开源模型Evo2,其参数规模达400亿,覆盖12.8万个物...

2025 年,开发者如何抓住 AI 这波「开门红」

春节期间DeepSeek的走红标志着AI行业进入新阶段。模型训练成本下降与用户认知普及,推动行业跨越发展临界点。2025年全球开发者先锋大会的召开,进一步聚焦如...

「卖铲子」也疯狂!美国「DeepSeek概念」AI初创,估值达33亿美元

美国AI云服务商Together AI近期宣布完成3.05亿美元B轮融资,估值达到33亿美元。本轮融资由General Catalyst和Prosperity7 Ventures领投,参与方包括英伟达、S...
1 8 9 10 11 12 500