
❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️
◈ 07月17日 星期四 【 6 篇 】
◎ K2发布后,Kimi 研究员集体在X和知乎上搞起了“团建”
2025年7月11日深夜,月之暗面公司突然开源了其万亿参数模型Kimi K2,这一举动迅速在AI领域引发了广泛关注。K2模型在代码和Agent任务上表现出色,很快与Grok 4一同出现在马斯克转发的热门模型趋势榜单上。与以往通过巨额广告预算推广不同,这次Kimi选择了一种更为开放和互动的方式,通过社交媒体和技术社区与外界分享K2的研发过程和技术细节。
在知乎等平台上,月之暗面的工程师和研究员们积极参与讨论,详细介绍了K2的架构和优化策略。例如,Infra团队的刘少伟指出K2在架构上复用了DeepSeek-V3,并采用了“fewer heads, more experts”的策略,以在相似成…
来源: 硅星人Pro
◎ 深谋科技独家发布真正为人类服务的新一代人形机器人核心技术「声波传感 · 意念控制 · 高精视觉 · 类脑智能」
深谋科技在2025世界人工智能大会(WAIC)上展示了其最新的人形机器人技术,旨在推动具身智能的变革。公司自研的全尺寸人形机器人“美猴王”尚未正式亮相,便已荣获德国红点大奖与美国MUSE金奖,成为首个同时摘得这两项国际顶级设计殊荣的人形机器人。深谋科技强调,其关注点不仅在于单项技术突破,而是构建贯穿感知、控制与决策的一体化能力,以实现对复杂现实与人类意图的深度适配与响应。
深谋科技推出了基于声表面波(SAW)的人形机器人多物理量智能感知系统“OmniSense”,该系统覆盖环境、生理、运动三大维度,能够实现温湿度、有害气体、化学物质、脉搏、汗液、呼气生物成分等多维度的智能感知。OmniSe…
来源: 量子位
◎ Transformer终结者!谷歌DeepMind全新MoR架构问世,新一代魔王来了
KAIST、Mila和谷歌DeepMind团队近期发布了一种名为Mixture-of-Recursions(MoR)的全新大型语言模型(LLM)架构,该架构被认为有潜力成为Transformer的替代者。MoR在推理速度上提升了2倍,训练FLOPs减少,KV缓存内存直接减半,显著优化了模型性能。在135M到1.7B的参数规模下,MoR展示了新的帕累托前沿,即在相同的训练FLOPs下,困惑度更低、小样本准确率更高,并且吞吐量提升超过2倍,全面超越了传统的Transformer架构。
MoR的核心创新在于其递归混合体设计,通过小型路由器为每个token的隐藏状态打分,仅高分token继续循环,…
来源: 新智元
◎ 英伟达登顶市值第一,国产AI芯片如何用新技术突围算力封锁?
全球AI算力变革正在加速,英伟达市值突破4万亿美元,成为全球市值最高的科技企业,凸显了AI算力在产业发展中的核心地位。这一现象不仅反映了英伟达的成功,更揭示了AI时代全球科技和资本市场格局的深刻变化。AI算力和基础设施的重要性日益凸显,成为推动AI产业发展的关键因素。
在国内,AI算力的需求迅速增长,但国产AI芯片产能不足,面临较大的缺口。预计到2030年,中国AI芯片市场规模将超过1.3万亿元,AI产业及相关行业价值将达到1.4万亿美元。然而,国内AI芯片行业在“后摩尔时代”下面临技术封锁和制造工艺瓶颈的挑战。清华大学教授尹首一提出的STCO(系统技术协同优化)方法,通过整合芯片设计、制…
来源: 钛媒体AGI
◎ 现场直击英伟达黄仁勋:DeepSeek R1非常创新,AI下一个浪潮是机器人
英伟达创始人兼CEO黄仁勋在第三届中国供应链博览会开幕式上发表演讲,这是他年内第三次到访中国,首次穿上唐装并用部分中文进行演讲。此次访问正值英伟达获批向中国市场销售H20芯片,并即将发布RTX Pro GPU,公司股价也创下历史新高,市值超过4.1万亿美元。黄仁勋在演讲中强调了中国市场的重要性,指出中国培养了全球50%的AI人才,并在AI大模型和应用方面取得了显著进展。他特别提到DeepSeek推出的全球首个开源推理模型,认为这是技术上的重大突破。
黄仁勋在随后的交流会上与媒体分享了关于中美AI算力、大模型、H20芯片进展以及中国电动车发展的看法。他指出,中国在模型层和应用层的发展非常迅速…
来源: 钛媒体AGI
◎ 在这个世界级编程竞赛中,这可能是人类最后一次战胜AI了。
昨晚,一场人类与AI之间的激烈竞赛落下帷幕,人类选手Psyho以微弱优势险胜AI代表OpenAI,暂时守住了胜利。这场名为AtCoder World Tour Finals 2025 Heuristic Contest的比赛,是全球顶级编程赛事之一,吸引了众多顶尖选手参与。比赛分为Algorithm和Heuristic两个赛道,而此次的Heuristic赛道比赛持续了10个小时,选手们需要在未知最优解的情况下,通过反复调整和优化,逐步逼近最佳答案。
比赛开始仅15分钟,OpenAI便以惊人的速度提交了第一份解答,迅速占据榜首,并在接下来的7个小时内一直保持领先。这一幕让人联想到多年前Alp…
来源: 数字生命卡兹克
◈ 07月16日 星期三 【 10 篇 】
◎ 2025 上半年具身智能融资复盘:金额超 200 亿、头部收敛趋势明显、传统制造业巨头增多
资本兴趣从大模型转向具身智能的趋势愈发明显。2024年上半年,国内具身智能领域共发生130起融资事件,总融资金额预估超过200亿元人民币,远超2023年全年的90起融资和89.33亿元的融资金额。相比之下,大语言模型领域的融资事件仅72起,且基座模型公司仅有3家官宣了新融资,显示出大模型领域的增势趋缓。这一转变表明,资本正在重新评估人工智能领域的投资方向,具身智能成为新的焦点。
具身智能领域的融资呈现出向头部企业聚拢的趋势。上半年,绝大部分资金流向了已有相对成熟产品和量产计划的明星公司,如银河通用、星动纪元、云深处等。这些公司频繁获得大额融资,进一步巩固了其市场地位。与此同时,新创业者获得…
来源: AI科技评论
◎ OpenAI离职员工自曝:干了一年就润了!007压力逼到极限,AGI成宗教
OpenAI以其独特的自下而上文化和行动导向推动了大模型的突破。前员工Calvin French-Owen在参与编程智能体Codex的开发后,分享了内部视角下的OpenAI运作模式。从零到上线仅用7周,Codex的诞生过程展现了高强度冲刺的魔力,也体现了OpenAI快速迭代的文化内核。
OpenAI的发展速度令人瞩目,员工规模在一年内从1000人激增至3000人。这种快速扩张带来了内部机制的调整压力,不同团队的文化差异显著,研究、应用和市场团队的工作节奏完全不同。Slack成为公司运转的核心工具,几乎所有工作都在Slack上完成,这种模式对信息管理能力提出了极高要求。公司文化强调实力至上,…
来源: 新智元
◎ AI 上新|这个 AI 浏览器,替我给女朋友打了「分手电话」
Genspark作为一家快速迭代的AI公司,经历了从AI搜索到超级Agent再到AI浏览器的战略转型。2024年推出时主打AI搜索,2025年果断转向AI Agent领域,尽管已积累500万用户。这种转变源于对传统AI搜索局限性的判断——无法应对复杂任务,反映了AI行业竞争激烈、迭代迅速的特点。两个月前推出的AI浏览器标志着其产品矩阵的又一次扩展。
在功能层面,Genspark展现出强大的生产力工具属性。其”自动研究”功能可通过分析用户社交网络数据生成个性化画像,而”电话代打”等创新应用被日本用户开发出辞职、分手等非预期使用场景。核心能力体现在处理复杂任务上,如视频总结生成PPT、批量分析…
来源: 极客公园
◎ 机器人“梅西”的养成:干活之前,得先学踢足球
机器人如何学习与物理世界交互?这一问题近年来引发了广泛讨论。深庭纪创始人王弢提出,机器人应像人类一样,从“玩”开始学习。人类通过玩耍理解空间物理规则和人际互动法则,而足球恰好集合了动态物理环境、明确目标、反馈、合作与对抗等元素,成为机器人学习的理想场景。自1992年起,机器人足球比赛逐渐成为人工智能和机器人学科的重要课题。1993年,日本发起了“Robot J-League”,随后扩展为国际性项目RoboCup。1997年,RoboCup首届比赛在日本名古屋举行,标志着机器人足球时代的开启。
机器人足球的发展历程充满了挑战与突破。1999年,RoboCup增设“四腿组”,使用索尼Aibo机…
来源: AI科技评论
◎ DeepMind让AI当「上帝」,导演一场只有AI演员的「西部世界」
剧本杀作为一种经典的桌上角色扮演游戏(TTRPG),其核心角色是游戏主持人(GM),负责掌控游戏环境、讲述故事背景并扮演非玩家角色(NPC)。设想用生成式 AI 担任 GM,同时玩家也由 AI 担任,这将开启全新的应用场景。这些应用包括科学模拟、互动叙事和 AI 评估。科学模拟可用于构建虚拟社会,观察群体行为的涌现;互动叙事则通过 AI 智能体扮演角色,共同演绎剧情;AI 评估则通过设计特定场景来测试 AI 的推理、协作和沟通能力。
然而,科学性、戏剧性和公平性这三种需求差异巨大,甚至相互冲突。为了解决这一问题,Google DeepMind 和多伦多大学的研究人员提出了 Concordi…
来源: 机器之心
◎ 新加坡博士团队打造的 AI 办公产品,挑战微软 Office
AI 办公领域的变革正在加速,而 Agnes 平台的出现标志着协作范式的重构。 2023 年 3 月,微软发布的 Office Copilot 开启了 AI 办公革命的第一波浪潮,但其功能仍局限于简单的智能助手或聊天工具栏,未能从根本上改变办公逻辑。与此同时,Manus 和 Genspark 等 AI 原生平台虽然尝试提供更轻量级的办公体验,但在协作功能和编辑灵活性方面仍存在明显短板。在此背景下,新加坡的博士团队推出了 Agnes,一个旨在打破现有僵局的 AI 协作平台。
Agnes 的核心创新在于其多智能体驱动的协作工作空间。 与传统的 AI 办公工具不同,Agnes 不仅关注单人任务,…
来源: 极客公园
◎ 英伟达、AMD恢复向中国销售AI芯片,美国商务部长:中国只能买到英伟达“第四等”货
美国政府近期放宽了对华AI芯片出口限制,英伟达和AMD相继宣布将恢复向中国市场销售特制AI芯片。英伟达CEO黄仁勋确认H20芯片已获出口许可,AMD也表示MI308芯片进入审核流程。这两款产品均为符合美国出口管制要求的”降配版”芯片,专为中国市场设计。
政策转变与中美贸易谈判进展密切相关。美国财政部长贝森特透露,这一决定是中美在稀土等关键领域谈判的”筹码”。霍华德·卢特尼克直言不讳地表示,美国策略是向中国出售”第四好”的芯片,目的是让中国企业继续依赖美国技术体系。”卖’刚刚够用’的产品,让中国开发者对美国技术形成依赖”成为美方的明确策略。
市场反应极为强烈,消息公布后英伟达和AMD股价分…
来源: 钛媒体AGI
◎ Windsurf之外,OpenAI投资真正在拼的那块图是什么?
OpenAI近期收购Windsurf未果引发外界对其编程领域布局的猜测,但事实上,其战略远不止于此。自2022年起,OpenAI通过投资Cursor和Magic.dev等公司,已在编程领域提前落子。这些投资并非单纯补位,而是其构建未来协作生态的重要步骤。OpenAI Startup Fund成立以来,已投资17家AI原生项目,其中近30%成长为独角兽。这一高命中率背后,是OpenAI独特的投资逻辑:与真正理解GPT应用场景的团队合作,共同打造行业接口。
从行业分布来看,这些被投企业覆盖教育、家庭、医疗、工业等多个领域,每一家都像是未来城市中的一个关键节点,如Speak聚焦语言学习,Amb…
来源: Founder Park
◎ 有家 AI 创业公司,居然想要挑战 Office
微软的 Office Copilot 在发布初期引发了广泛关注,但两年后实际使用率并不高。尽管它给传统 Office 套上了智能外壳,但并未从根本上改变工作方式,更多是锦上添花的功能,未能真正适应团队协作场景的需求。相比之下,创业公司推出的 Agnes AI 则完全重新思考了新一代 Office 的形态。Agnes 以 Agent 逻辑为基础,打造了一个全新的协作工作空间,将所有工作内容和协作流程整合到一个统一的入口,避免了用户在多个应用之间频繁切换。
Agnes 的三大亮点使其在协作型 AI 工作空间中脱颖而出。首先,它通过团队记忆、智能协作和一体化内容生成,真正适配团队场景,任务推进和…
来源: AI产品阿颖
◎ 最强人才接连被挖,创业大佬离开 OpenAI 后说了实话:7 周硬扛出 Codex,无统一路线、全靠小团队猛冲
OpenAI研究员Jason Wei和Hyung Won Chung即将加入Meta新成立的超级智能实验室。Jason Wei曾在OpenAI参与o3模型和深度研究模型的开发,并专注于强化学习领域。Meta的超级智能团队此前也聘请了多位深耕强化学习的研究员。两人的离职引发了外界对OpenAI团队运作和文化的关注。与此同时,前OpenAI员工Calvin French-Owen分享了他在这家公司的经历,提供了对OpenAI内部生态的独特视角。
OpenAI的内部文化并非外界所想象的高度集权,而是由众多小团队并行运作的集群体系。研究方向并非由上层强行指派,而是通过激发研究员的兴趣和挑战欲,让他…
来源: AI前线
◈ 07月14日 星期一 【 10 篇 】
◎ 一个 200 美元的 AI 浏览器,想重新教会我「上网」
AI浏览器Comet的推出标志着Perplexity正式加入浏览器领域的竞争,试图通过AI技术重新定义人与信息的关系。这款自称为“AI Agent原生”的浏览器目前仅面向高付费订阅用户开放,其核心理念是“从浏览到思考”,旨在解决传统浏览器中信息孤岛的问题,将割裂的网页信息流整合为统一的智能交互环境。Comet的核心功能是位于侧边栏的Comet助手,它具备情境感知和代理执行两大能力,能够同时读取多个网页信息并执行复杂任务,例如自动生成报告或操作在线文档。
Comet的最大卖点在于其浏览器级自动化与深度AI集成,试图让AI真正替代用户完成上网和工作的流程。与传统浏览器不同,Comet更像是一个…
来源: 极客公园
◎ 深谋科技重磅发布真正为人类服务的新一代人形机器人核心技术「声波传感 · 意念控制 · 高精视觉 · 类脑智能」
深谋科技将在2025世界人工智能大会(WAIC)上展示其最新研发的陆上具身智能人形机器人“美猴王”和空中具身智能巨兽“星汉一号”。作为大会的精英合作伙伴,深谋科技致力于推动人形机器人从“跑跑跳跳”的娱乐功能向真正服务于人类需求的方向发展,通过全能感知、先进控制和类脑智能等核心技术,引领具身智能的变革。
“美猴王”是深谋科技自主研发的全尺寸人形机器人,尚未正式亮相便已荣获德国红点大奖与美国MUSE金奖,成为首个同时获得这两项国际顶级设计殊荣的人形机器人。深谋科技不仅关注设计上的突破,更注重构建感知、控制与决策的一体化能力,旨在通过具身智能改变人类生活方式,实现对复杂现实与人类意图的深度适配与…
来源: AI科技评论
◎ 新加坡,挤满了“跳”向全球的AI创业者|SEA Frontline
新加坡近年来逐渐成为全球AI创业者的聚集地,吸引了大量中国AI初创企业落地。数据显示,新加坡在AI领域的投资累计约70亿新元,占2022年GDP的1.5%,位居全球第一。2024年东南亚AI领域的融资中,新加坡占比超60%,红杉、淡马锡等知名投资机构纷纷押注AI应用层产品。新加坡不仅是AI高敏感度市场,还因其政策开放、数据中心容量全球领先等优势,成为AI公司出海的“第一站”。新加坡的监管友好性和国际化视野,使其成为AI创业者撬动东南亚及全球市场的“黄金支点。
AI创业者们不仅看重新加坡本地市场,更重视其对东南亚6.8亿人口、GDP总量3.6万亿美元的巨大市场的辐射能力。Sapiens AI…
来源: 钛媒体AGI
◎ 亚洲最大的漫展,没有「AI 入侵」
在Bilibili World 2025这场亚洲最大规模的漫展中,AI技术的缺席与主机游戏的崛起形成了鲜明对比。尽管行业热议”AI+二次元”的融合前景,但展会现场几乎看不到AI相关展区,而传统IP衍生品和主机游戏却引发狂热追捧。凌晨两点就开始排队的观众,目标明确地争夺限量周边,这种现象凸显出二次元消费的核心驱动力——情感连接与稀缺性体验。AI当前作为工具属性的产品,尚未能构建这种深层次的情感价值体系。
展会上观察到一个有趣现象:穿越火线展台的AI装备生成体验区门可罗雀,而同一展区的传统互动项目却大排长龙。通过与观众交流发现,Coser互动、实体周边收集等行为能带来”真实参与感”,这是当前A…
来源: 极客公园
◎ 一年上线超 10 款产品,AI 时代如何做独立开发
艾逗笔(idoubi)在AICon全球人工智能开发与应用大会上的分享聚焦于AI时代的独立开发实践与行业洞察。作为ThinkAny&MCP.so创始人,他结合自身从非科班程序员到独立开发者的转型经历,总结了一年半内开发十余款AI产品的实战经验,并提炼出对行业趋势的判断与可复用的方法论。
快速迭代与验证需求是独立开发的核心策略。通过AI红包封面生成器、ThinkAny搜索引擎等案例,他展示了如何在极短时间内完成产品上线,强调“先起飞再加油”的理念——即通过最小可行产品快速验证市场需求,再决定是否深度投入。这种模式尤其适合资源有限的独立开发者,但同时也需警惕“浅尝辄止”的陷阱。他反思早期涉足ch…
来源: AI前线
◎ Kimi K2发布两天即“封神”?80%成本优势追平Claude 4、打趴“全球最强AI”,架构与DeepSeek相似!
月之暗面最新发布的MoE架构基础模型Kimi K2在海外引发了广泛关注。该模型的总参数量达到1万亿,激活参数为32B,已在Kimi Web端和App端上线。Kimi K2在OpenRouter平台的token使用量迅速超越了xAI的Grok 4,显示出其强大的市场竞争力。该模型在非英伟达硬件上的流畅运行,被认为是中国实验室通过巧妙路由策略在更少芯片上实现更强智能的典型案例,可能动摇英伟达在AI硬件领域的垄断地位。
在代码、Agent和工具调用等基准测试中,Kimi K2均取得了开源模型中的SOTA成绩。实际应用中,Kimi K2在前端开发任务中生成兼具设计感与视觉表现力的代码,自动拆解需求…
来源: AI前线
◎ 全网首个爆料Manus裁员消息的人,如何看待其彻底撤出中国一事?
年初爆火的AI Agent公司Manus近期对中国业务进行大规模裁员,120名员工中仅40余名核心技术人员迁往新加坡总部,其余均被裁撤。该公司同时清空国内社交平台内容,屏蔽中国IP访问官网,并删除与阿里的合作承诺,以极端方式宣告其总部迁至新加坡的计划。这一举动引发行业广泛讨论,彭博社等外媒对此进行了报道。
Manus的”塌房”源于其在中美AI博弈背景下选择全面转向海外市场,与DeepSeek等兼顾国内外市场的企业形成鲜明对比。公司CEO肖弘在回应中强调”全球化”发展目标,透露硅谷投资机构Benchmark的资金支持将主要用于开拓美国市场。值得注意的是,该公司工商结构复杂,通过开曼群岛和中国…
来源: 钛媒体AGI
◎ 周杰伦发的1400万人点赞的AI视频,是怎么做出来的?
上周五,周杰伦在抖音上发布了第一条视频,迅速引发了广泛关注。该视频在短短一天内获得了超过千万的点赞,目前点赞数已突破1400万。这条视频的特别之处在于,它是由AI技术生成的,通过将周杰伦人生中的重要节点和专辑串联在一起,形成了一种史诗般的叙事效果。视频的背景音乐《三年二班》更是唤起了许多人的青春回忆,让人仿佛回到了过去的时光。
视频的制作过程相对简单,主要利用了AI视频生成工具的首尾帧功能。用户只需上传两张图片作为首帧和尾帧,AI便会自动生成中间的过渡画面,从而形成一个流畅的视频。以周杰伦的视频为例,制作时选取了他小时候的两张照片作为首尾帧,并通过输入提示词“小男孩对着镜头缓缓微笑,然后笑…
来源: 数字生命卡兹克
◎ AI 编程冲击来袭,程序员怎么办?IDEA研究院张磊:底层系统能力才是护城河
在人工智能迈向“多模态智能体”新时代的过程中,视觉理解、空间智能建模以及感知、认知与行动的高效整合仍是当前面临的主要挑战。IDEA研究院计算机视觉与机器人研究中心讲席科学家张磊在AICon全球人工智能开发与应用大会上,深入剖析了这些问题的核心,并提出了务实的落地路径。他指出,“看懂、想透、做好”是多模态智能体的核心目标,涵盖了视觉、语言推理和物理执行能力。尽管语言模型、机器人本体技术和视觉技术在过去几年取得了显著进展,但将这些环节有效整合仍是关键难题。
视觉理解因其高维度和复杂性,成为多模态智能体发展中的瓶颈。视觉输入涉及连续空间信号和三维结构的理解,同时还需要结合与物体交互的通用知识。张磊…
来源: AI前线
◎ 陶哲轩看傻:三破18年数学纪录!谷歌推出「AI爱迪生」,科研不再靠灵感?
谷歌在5月中旬发布了AlphaEvolve,这一突破性的人工智能系统在短短30天内攻克了一项封尘18年的数学难题,展示了AI在科学领域的巨大潜力。AlphaEvolve的诞生不仅标志着AI在算法优化上的重大进展,更预示着未来科学研究可能不再依赖人类的直觉和灵感,而是通过AI的智能探索来解决复杂问题。这一进展引发了广泛关注,知名数学家陶哲轩对此表示惊讶,认为AlphaEvolve的突破性成果可能开启一场不依赖“灵感”的科学革命。
AlphaEvolve的核心技术源于DeepMind此前开发的AlphaGo和AlphaTensor。AlphaGo通过高效搜索围棋的可能局面,提出了人类从未发现的…
来源: 新智元
◈ 07月12日 星期六 【 10 篇 】
◎ 美国芯片行业现状
半导体作为现代科技的基石,支撑着从智能手机到人工智能数据中心的广泛应用。芯片中的晶体管数量已从数十亿增长到数千亿,技术复杂度不断提升。然而,尽管美国在半导体领域拥有领先地位,其全球芯片制造产能占比却从1990年的37%降至2022年的10%。这一趋势引发了关于美国在技术、设计和关键材料方面可能落后的担忧。为应对这一挑战,美国政府通过激励措施和研究投资,推动国内半导体产业的复兴。截至2025年,28个州已宣布超过100个项目,私人投资总额超过5000亿美元,预计将创造50万个就业岗位,并显著提升美国的芯片制造能力。
美国的半导体生态系统正在通过大规模投资实现再工业化。这些投资不仅解决了经济和…
来源: 半导体行业观察
◎ 不止AlphaFold,「药界ChatGPT」横空出世!华人女投资人深度揭秘
Chai Discovery的AI模型Chai-2在抗体设计领域取得了突破性进展,将成功率从0.1%提升至16%,并且实现了零样本生成。这一成就不仅标志着技术上的奇迹,更预示着生物医药领域的范式革命。Chai-2的出现,使得抗体设计不再依赖于传统的实验室试错方法,而是通过AI生成模型实现高效设计。这一技术的核心在于其能够生成与目标蛋白结合的分子,并且生成的3D结构误差小于一个原子,展现了极高的精度。
Chai Discovery的联合创始人Josh Meier和Jack Dent认为,AI药物设计的突破得益于结构预测、蛋白质折叠技术的进步,以及扩散模型和大型语言模型的应用。他们强调,AI不…
来源: 新智元
◎ 杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
Kimi在172天后发布了全新的Kimi K2基础大模型,采用MoE架构,总参数达到1T,激活参数为32B,尤其在代码、Agent和数学推理任务上展现了领先能力。此次发布不仅开源了模型,还同步上线了Web端、App和API服务。Kimi K2在多个基准评测中创造了开源模型的全新SOTA成绩,特别是在SWE Bench Verified、Tau2和AceBench等测试中表现突出。
Kimi K2的核心能力集中在代码生成、Agent任务和数学推理上。在前端开发任务中,Kimi K2支持粒子系统、可视化和3D场景等复杂表现形式,能够生成支持昼夜循环的山川峡谷3D景观和3D粒子星系模拟。在Age…
来源: 量子位
◎ 奖励模型也能Scaling!上海AI Lab突破强化学习短板,提出策略判别学习新范式
强化学习已成为推动人工智能向通用人工智能(AGI)发展的关键技术节点,但奖励模型的设计与训练一直是制约模型能力提升的瓶颈。当前,大语言模型通过Next Token Prediction和Test-time Scaling两种范式实现了能力的持续跃升,而奖励模型却缺乏系统性的预训练和扩展方法,导致其能力难以随计算量增长而提升。上海人工智能实验室的研究团队提出了一种新的奖励建模范式——策略判别学习(POLAR),通过解耦绝对偏好,使奖励模型具备可扩展性和强泛化能力。
POLAR的核心创新在于其能够基于参考答案为模型输出打分,从而灵活适配多样化的定制需求。与传统奖励模型的“绝对偏好”不同,POL…
来源: 量子位
◎ 深夜开源首个万亿模型K2,压力给到OpenAI,Kimi时刻要来了?
月之暗面正式发布了 Kimi K2 大模型并开源,新模型同步上线并更新了 API,价格为 16 元人民币 / 百万 token 输出。此次发布赶在了全球大模型集中发布的风口浪尖,前有 xAI 的 Grok 4,下周可能还有谷歌新 Gemini 和 OpenAI 开源模型。本次开源的共有两款模型,分别是基础模型 Kimi-K2-Base 与微调后模型 Kimi-K2-Instruct,均可商用。根据 Hugging Face 页面数据显示,Kimi K2 的下载量在前 20 分钟便接近了 12K。
从 LiveCode Bench、AIME2025 和 GPQA-Diamond 等多个基准测…
来源: 机器之心
◎ ICML 2025 Spotlight | 快手、南开联合提出模块化双工注意力机制,显著提升多模态大模型情感理解能力!
新一代人工智能发展的重要方向是“情智兼备”,这是迈向通用人工智能的关键一步。在人机交互场景中,具备情智的数字人与机器人需要精准解译多模态交互信息,深度挖掘人类内在情感状态,从而实现更具真实感与自然性的人机对话。然而,面对多模态情感数据语义的高度复杂性,如何有效建模跨模态关联关系仍是领域内亟待突破的核心挑战。
快手可灵团队与南开大学在「多模态情感理解」领域完成了开创性研究,成功定位了现有多模态大模型在情感线索捕捉中的关键短板。研究团队从多模态注意力机制的维度切入,提出了新的模块化双工注意力范式,并基于此构建了一个涵盖感知、认知与情感能力的多模态模型‘摩达(MODA)’。该模型在通用对话、知识…
来源: AI前线
◎ 外卖补贴大战之外,美团悄悄“买下”半个机器人赛道
美团在7月初通过大额补贴将外卖日订单量提升至超1亿单,展现了其在外卖市场的绝对统治力。这一举措被视为对京东入局外卖市场的全面反击,同时也标志着互联网企业烧钱换市场的策略再次回归。美团不仅在外卖领域发力,还在零售行业的线下场景中加快了布局速度。近期,美团通过战投领投了具身智能初创公司它石智航和星海图的多轮融资,进一步扩展了其在机器人领域的投资版图。过去三年,美团已投资了30家机器人及相关企业,成为多家公司的重要股东。
美团创始人王兴在内部会议上提出,未来十年将重点关注食杂零售、国际化和科技三个方向。在科技领域,美团希望通过抓住AI机遇,建设一个大规模、全品类、有纵深且生态健康的本地商业系统。…
来源: 钛媒体AGI
◎ 这届985毕业生直播带货一把好手!50余款产品热销全网供不应求
中国农业大学举办了一场特殊的毕业典礼,毕业生们带着各自的农业研究成果回到母校,通过拼多多直播带货,吸引了全网3000万观众围观和拼购。这些成果包括国产树上熟榴莲、玉露香梨汁、妮娜皇后葡萄等50余款产品,部分甚至供不应求。这场活动不仅展示了学生的毕业作品,更体现了科技小院项目的实际价值。
科技小院由中国工程院院士张福锁于2009年首创,旨在为小农户提供零距离的科技服务。16年间,该项目已扩展至1800多个,覆盖全国各地的乡村。学生的课堂直接设在田间地头,课题聚焦于解决实际农业问题。例如,三亚优旗的榴莲科技小院通过提炼深海鱼类制作鱼蛋白肥料,加速榴莲树生长并提升果实品质。首批2000吨国产树上…
来源: 量子位
◎ “跑路”争议之外,Manus这半年产品做怎么样了
2025年初,AI行业的风向发生了变化,从聊天机器人转向了能够直接执行任务的AI Agent。在这一背景下,Manus产品迅速吸引了全球科技圈的关注。Manus的核心目标是让AI不仅能够表达想法,还能直接执行任务,将想法转化为结果。这一创新思路使其在短时间内成为行业焦点。尽管OpenAI等公司也推出了类似产品,但Manus首次将“通用”AI Agent推向更广泛的用户群体。
Manus的发展速度惊人。2025年3月产品亮相,4月即完成7500万美元的B轮融资,领投方为硅谷顶级风投Benchmark。公司还迅速扩展了其生态,与Anthropic等主要模型公司合作,并在全球范围内举办用户见面会…
来源: 硅星人Pro
◎ 腾讯AI Lab 提出解耦推理新框架,破解IMO 数学难题
近年来,大语言模型(LLM)在数学推理领域取得了显著进展,但在形式化数学证明方面却遇到了瓶颈。尽管LLM能够以超过80%的准确率生成非形式化的解题思路,但在将这些思路转化为机器可验证的严格证明时,成功率骤降至不足8%。这一现象揭示了当前AI数学研究中的一个核心矛盾:在“思考”与“证明”之间,存在一道难以逾越的鸿沟。
现有的一体化或耦合式方案试图在单个模型内集成“思考草稿”与“形式化证明”两个环节,但这种设计存在根本性缺陷。首先,模型的高层“思考”受到了其自身底层“证明”能力的严格束缚,导致推理潜力被扼杀。其次,这些模型普遍采用“可验证奖励的强化学习”(RLVR)进行训练,这种训练范式鼓励模…
来源: AI科技评论
这个主题很棒,赞
收藏啦收藏啦
有啥改进意见,欢迎提出
精选内容有重复的😅
精选内容很好,方便查看