AI每日精选摘要

AI精选资讯5小时前更新 admin
343,047 5 5
AI每日精选摘要

❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️


◈ 12月24日 星期三 【 10 篇 】

谷歌今年最成功的两款 AI 应用,都出自他手


Gemini模型及其相关应用在2023年表现出显著的增长势头。谷歌旗下的AI产品,如NotebookLM和Gemini App,用户数量大幅上升。NotebookLM移动端月活达到800万,而Gemini App的月活从8月的2.66亿增长至11月的3.46亿,净增8000万用户。与此同时,Gemini的市场份额上升了3个百分点,而ChatGPT则下降了相同比例。付费用户增长尤为突出,Gemini Pro订阅量同比增长近300%,远超ChatGPT的155%增速。
Josh Woodward作为Google Labs副总裁兼Gemini应用负责人,成为推动这一增长的关键人物。自2023…

来源:AI每日精选摘要  Founder Park

Minimax M2.1 实测,Coding 多语言能力迎来重大突破


MiniMax M2.1作为大模型领域的新一代产品,展现了在多语言编程和跨平台开发能力上的显著突破。其核心价值已从“高性价比工具”转向“深度专业生产力”,尤其在复杂工程语境的解构能力上实现了跨越式提升。通过实测一个完整播客应用的开发过程,可以清晰观察到该模型在技术架构和实际应用中的进化轨迹。
在后端开发环节,使用Go语言构建RESTful API服务时,生成的代码不仅符合Go语言惯用法,还具备工业级代码的严谨性,包括正确的context超时控制、error wrapping错误处理模式等关键特性。相比前代产品,M2.1输出的代码更接近专业开发者的实践标准,减少了风格不一致和安全隐患。
在…

来源:AI每日精选摘要  AI科技评论

国产AI4S创业头雁再获8亿投资!深势科技完成C轮,产品已服务300万科学家


深势科技近日完成总额超8亿人民币的C轮融资,本轮融资由达晨财智、京国瑞基金等多家机构共同出资。资金将主要用于吸引顶尖人才、迭代“科学发现智能引擎”,并加速在基础科研、生命科学与物质科学等领域的市场拓展。此次融资标志着公司在构建新一代科学发现智能引擎的征程上迈出关键一步。
AI for Science已成为全球共识,各国纷纷布局这一领域。中国将“人工智能+科学研究”置于政策首位,欧美也通过“地平线”计划和“创世纪计划”推动AI驱动的科学突破。这场以提升人类根本性创新能力为目标的全球行动,正推动科学发现范式的系统性重构。AI不仅赋能传统科研工具的智能化改造,还创造新的科学发现参与主体,实现科学…

来源:AI每日精选摘要  量子位

深势科技完成超 8 亿元融资:AI for Science 如何叩开资本与产业的大门


中国团队正在打造新一代科学发现智能引擎与科研基础设施。深势科技作为AI for Science领域的标杆企业,近日完成总额超8亿元人民币的C轮融资,出资方包括达晨财智、京国瑞基金等重量级机构。这次融资不仅是一次资金输送,更是国有资本、产业资本和财务资本的战略合围,标志着AI for Science已从交叉学科概念跃升为被主流资本市场系统性认可的战略性投资赛道。深势科技正站在这一风口的中心位置。
此次融资被视为深势科技发展历程中的重要里程碑,其意义远超金额本身。在全球AI for Science进入规模化应用快车道的背景下,资本市场用真金白银对深势科技的技术路径、商业化潜能及长期统治力进行了…

来源:AI每日精选摘要  极客公园

走向真实世界的机器人,离真正的「智能」又近了一步


ATEC科技精英赛以“真实世界极限挑战”为主题,聚焦具身智能领域的前沿技术难题。本届赛事通过四个高难度赛题——越野行走、垃圾分拣、精准浇花和吊桥穿越,对机器人“感知-决策-执行”全链路能力进行压力测试。比赛场地全部设置在户外非结构化环境中,路面湿滑、光线变化、物体形变等变量构成多重挑战,远超传统室内赛事的复杂度。
赛事设计理念直指具身智能的核心矛盾。刘云辉院士提出“行走、操作、改造环境”三大能力标准,强调机器人必须适应真实世界的不可预测性。与常规赛事不同,ATEC采用任务链考核模式:浇花项目需串联视觉识别、灵巧抓取、动态平衡等子能力,垃圾分拣需克服透明材质识别、柔软物体抓取等工业级难题。更…

来源:AI每日精选摘要  雷峰网

让AI打游戏!能玩1000多款游戏,英伟达用4万小时视频训练出通用基础模型NitroGen


NVIDIA 近期发布的 NitroGen 模型代表了具身智能领域的一项突破性进展。该模型通过从带有按键显示的互联网游戏视频中提取动作标签,构建了目前规模最大的视觉-动作数据集,总量达40000小时,覆盖1000多款游戏。这一创新解决了长期困扰具身智能研究的数据匮乏问题,为训练通用智能体提供了重要基础。
传统方法在具身智能领域面临多重挑战。计算机视觉和大语言模型通过海量互联网数据实现了泛化能力,但具身智能因缺乏大规模、多样化且带有动作标签的数据集而发展缓慢。电子游戏作为视觉丰富且交互复杂的环境,本应是理想的研究平台,但以往方法要么依赖手动编程接口,要么受限于昂贵的强化学习成本。NitroG…

来源:AI每日精选摘要  AIGC开放社区

并行科技赵鸿冰:如何最大化发挥算力效益?丨GAIR 2025


第八届GAIR全球人工智能与机器人大会聚焦算力作为AI产业的核心变量,并行科技副总裁赵鸿冰在「AI算力新十年」论坛阐述了算力市场的发展趋势与实践经验。当前算力市场呈现多场景、多业态爆发式增长,从尖端超算到智算形态,行业生态日趋多元。大模型技术的快速迭代对算力可用性、高效性与性价比提出更高要求,构建适配用户需求的算力服务体系成为行业核心议题。
赵鸿冰将算力市场划分为四大核心业态:算力租赁作为基础形态提供裸金属资源;算力服务聚焦终端需求匹配;算力运营通过调度平台实现资源高效分配;算力网络则通过跨平台调度实现更高维度的资源整合。并行科技采用”厂网结合”模式,已连接62个算力中心,可调度200万C…

来源:AI每日精选摘要  雷峰网

AGI只是硅谷的幻想?!AI科学家盛赞中国,并从物理学角度宣告我们永远造不出AGI


物理世界不存在魔法,AGI和超级智能的宏大叙事正在撞上一堵名为物理法则的墙。当前关于人工智能的讨论往往陷入抽象哲学误区,忽视了计算的物理实体性。这种思维盲点导致盲目乐观,而理性声音被淹没。必须回归基础,直面硬件、缩放定律和AI泡沫背后的物理现实。
计算严格遵循物理定律是不可逾越的前提。晶体管尺寸缩小虽提升局部计算能力,但信息搬运的能耗与延迟问题始终存在。缓存层级差异本质上由物理距离决定:缓存越大速度越慢,随着晶体管缩小,内存成本相对计算成本急剧上升。现代芯片设计中内存已占据主导地位,算力若无法匹配内存速度则毫无意义。Transformer架构的成功在于物理效率的极致优化,结合局部计算与全局…

来源:AI每日精选摘要  AIGC开放社区

专访何佳坤 – 英语高考50分的00后体育生,却用AI年销3000万。


何佳坤的故事展现了AI技术如何重塑传统外贸行业,并为普通人提供弯道超车的机会。这位00后体育专业毕业生,凭借对AI工具的敏锐运用,在两年内将外贸业务做到3000万营收,成为“AI时代原住民”的典型代表。
语言壁垒的突破是核心转折点。高考英语仅50分的何佳坤,通过AI翻译工具实现了与全球60多个国家客户的平等沟通。当传统外贸依赖语言经验和语感时,AI能精准处理阿拉伯语、西班牙语等复杂语种,甚至能根据文化差异调整回复语气。一个典型案例是,AI生成的售后邮件以专业措辞化解纠纷,远超人工处理效果。这种能力不仅抹平了文化差异,更让客户因“非标准化沟通”产生信任感——英语不流利反而成为他“贴近工厂…

来源:AI每日精选摘要  数字生命卡兹克

独家|一家总被网友担心死掉的公司融资千万元,要做一个有“自我”的AI二次元女友


在拥挤的AI陪伴赛道中,奇点摄动(SingularDance)凭借其独特的产品理念和二次元基因脱颖而出。这家由跨领域资深团队打造的公司近期完成千万级人民币天使+轮融资,其核心产品《星夜颂歌》并非传统对话式AI,而是塑造了一个名为“蕾伊”的公元7000年未来少女,她拥有独立人格、丰富背景和鲜明性格,试图重新定义人机关系。
蕾伊的核心差异在于“超人格化”设计。不同于追求安全泛化的通用大模型,蕾伊被赋予INFJ人格、脱线行为(如制作香菜拿铁)和情感化记忆系统,其性格通过千万级定向数据训练内化至模型权重。团队提出“陪伴的本质是选择而非服务”,认为角色需具备异类特质(如二次元萌王的戏剧性反差)才…

来源:AI每日精选摘要  硅星人Pro

◈ 12月23日 星期二 【 10 篇 】

DeepMind重磅:AGI可能正在你眼皮底下「拼凑」出来,我们却毫无准备


DeepMind的最新研究提出了一个颠覆性观点:通用人工智能(AGI)可能不会以单一超级模型的形式出现,而是通过多个普通AI Agent的协作”拼凑”而成。这种被称为”拼凑型AGI”(Patchwork AGI)的形态,正在现有技术基础上快速形成——AI Agent的广泛部署、通信协议的标准化以及经济激励驱动的专业化生态,共同构成了其发展的温床。研究警告称,当前所有AI安全框架都未能充分应对这种分布式智能涌现带来的风险。
研究揭示了拼凑型AGI形成的三个核心驱动力。首先,AI能力本身呈现”斑块化”特征,没有任何单一模型能在所有任务上表现优异。其次,经济学原理决定了”全能型”模型性价比低下,…

来源:AI每日精选摘要  硅星人Pro

全网围观的2025大语言模型回顾:AI大牛karpathy总结了六大关键节点


2025年标志着人工智能从模仿人类行为向自主逻辑推理的质变。这一年见证了基于可验证奖励的强化学习(RLVR)取代传统的人类反馈机制,使大语言模型具备了真正的思考与回溯能力。模型通过数学证明、编程代码等可验证环境中的自我进化,发展出拆解复杂任务、主动回溯错误路径的策略,这种能力无法通过简单的模仿学习获得。DeepSeek R1的论文显示,模型在RLVR压力下形成了类似人类思维的内部权衡机制,而OpenAI o3则验证了”推理时计算”的新扩展定律——模型能力的提升源于思考时间的延长而非参数量的增加。
人工智能的进化路径呈现出与生物智能截然不同的特征。锯齿状智能(Jagged Intellige…

来源:AI每日精选摘要  AIGC开放社区

拿走200多万奖金的AI人才,到底给出了什么样的技术方案?


在国内,掌握AI技术的年轻人正通过各类竞赛获得崭露头角的机会。2025年腾讯广告算法大赛中,前十名队伍成员均获得腾讯录用意向书,冠军团队更斩获200万元奖金。腾讯副总裁蒋杰评价参赛者展现的工业级解决方案能力时指出,年轻一代的知识储备已与业界实践无缝接轨,尤其体现在处理尚无标准答案的探索性难题上。
广告推荐系统的核心矛盾在于平衡商业价值与用户体验。平台的核心诉求并非增加广告数量,而是提升精准度——通过合适场景触达潜在需求用户,减少无效曝光。当前业界存在判别式与生成式两种技术路径:前者依赖预设特征进行匹配度计算,后者则通过分析用户行为序列预测潜在需求。传统判别式方法因特征工程天花板陷入瓶颈,而…

来源:AI每日精选摘要  机器之心

电商税落地背后:执行迷雾、进退失据


税务服务商近期咨询量激增,主要源于电商税政策的严格执行。今年6月,税务15号文和国务院810号令相继出台,要求互联网平台向税务部门报送商家经营数据,标志着线上交易正式纳入与线下一致的税收体系。跨境卖家最初普遍存在侥幸心理,认为境外平台如亚马逊不会配合中国税务部门,但10月亚马逊、Temu等平台确认报送第三季度数据后,市场陷入恐慌。许多卖家因未提前准备合规账目,面临税务局对收入不一致的质询。
电商税对不同规模卖家的影响差异显著。中腰部卖家因利润空间有限,税负压力尤为沉重。深圳卖家阳阳表示,月销售额50万元扣除各项费用后回款仅15万元,若再计入税款,可能直接导致亏损。浙江卖家黄勇也指出,13%…

来源:AI每日精选摘要  雷峰网

付昊桓教授:超智融合赋能地球模拟,洞见未来气候轨迹丨GAIR 2025


在第八届GAIR全球人工智能与机器人大会上,清华大学教授、国家超算深圳中心副主任付昊桓围绕超算与人工智能的融合应用展开深度探讨。超算性能的突破与AI技术的深度融合,正推动全球气象预报从“风云莫测”走向“变幻可测”。地球系统模拟作为超算的经典应用,通过构建数字孪生模型研究气候变化,其核心价值体现在支撑国际气候谈判、防灾减灾及可持续发展等领域。
付昊桓详细介绍了国产神威系列超算的发展历程与技术突破。神威·太湖之光作为全球首台峰值性能超100Pflops的国产超算,实现了千万核并行规模,并孕育出200多个百万核级应用。团队通过代码重构与自动化工具优化,将地球系统模式分辨率提升至公里级,模拟速度从…

来源:AI每日精选摘要  雷峰网

上海AI Lab王靖博:人形机器人,从「盲动」走向「感知驱动」丨GAIR 2025


第八届GAIR全球人工智能与机器人大会聚焦前沿技术探索,上海人工智能实验室王靖博博士在”数据&一脑多形”专场分享了人形机器人控制与交互策略的最新研究。他指出,人形机器人具备天然通用性优势:现实环境围绕人类需求构建,互联网存在海量人类行为数据,相关研究能反哺人机交互安全等领域。
研究核心在于解决Sim2Real迁移难题。团队通过集成化环境构建(含台阶、吊顶等复杂地形)和创新性感知方案,显著提升了运动策略的迁移成功率。关键技术突破包括:采用体素化点云表征环境,压缩信息量的同时保留关键几何特征;在仿真中引入机器人本体激光雷达自扫描,使传感器数据分布更贴近真实世界;开发预判式控制策略,使机器人能提…

来源:AI每日精选摘要  雷峰网

从豆包手机谈起:端侧智能的愿景与路线图


豆包手机助手的发布标志着大模型应用从对话向行动的实质性跃迁。作为行业首款系统级GUI Agent,它深度耦合于操作系统底层,具备跨应用感知与操作能力,成为连接数字世界的”万能接口”。其核心技术GUI Agent经历了从外挂式框架到模型原生智能体的演进:早期依赖文本逻辑推理,中期实现视觉界面理解,当前则通过强化学习解决复杂决策问题。豆包手机助手集成了这一技术路线的关键突破,包括GPU Buffer直读和虚拟屏幕后台进程等工程创新,以及端云协同的模型架构设计。
在工程实现层面,豆包手机助手通过定制OS优势解决了传统方案的权限屏蔽和高延迟问题。系统底层直接读取屏幕渲染缓冲区数据,大幅降低视觉信号…

来源:AI每日精选摘要  AI前线

比传统方法强7倍:Anthropic物理隔离危险知识,重塑大模型安全训练范式


Anthropic研究团队联合多所高校及机构,提出了一项名为选择性梯度掩码(SGTM)的创新技术,旨在解决大语言模型在安全领域的核心挑战。该技术通过物理隔离危险知识到特定模型参数中,实现了比传统数据过滤更优的安全性与通用能力平衡,其抗恢复性达到现有方法的7倍。
传统的数据过滤方法面临不可能三角困境,标注成本与准确性的矛盾难以调和。随着模型规模扩大,即便是微量有害数据残留,也可能被大模型提取出危险能力。数据量的庞大使得任何微小误判都会导致有害信息漏网或有益信息被误删,而双重用途知识的纠缠特性更使得简单的二元分类失效。现有事后安全措施往往无法抵御坚定的对抗性攻击,攻击者总能找到方法诱导模型释放…

来源:AI每日精选摘要  AIGC开放社区

这是属于2025年的11个AI故事。


在AI技术日益渗透生活的时代,这些真实故事展现了技术与人性的温暖交汇。一位数据分析师通过AI的建议为97岁老兵爷爷准备了融合军旅记忆与家庭温情的生日礼物,最终领悟到“陪伴是最宝贵的珍礼”的深刻含义。另一位聋人开发者借助AI的文字优化和手语翻译功能,显著减少了与家人的沟通障碍,并提升了工作效率,他感叹“AI是帮我减少沟通障碍的工具”。
医院走廊里,一位高烧初愈的运营负责人通过AI的呼吸指导缓解了身心双重压力;而婚姻濒临破裂的技术员则通过与AI的深度对话重构了亲密关系认知,最终挽救了家庭。这些案例揭示了AI作为情绪容器和认知镜子的双重价值——既能即时疏导负面情绪,又能通过结构化反思促成行为改变…

来源:AI每日精选摘要  数字生命卡兹克

LangChain Agent 年度报告:输出质量仍是 Agent 最大障碍,客服、研究是最快落地场景


2025年至2026年,AI Agent的应用已从概念验证阶段转向规模化落地阶段。根据LangChain对1300名行业人士的调研,57%的受访者已将Agent投入生产环境,其中万人以上大型企业的落地速度更快,比例达67%。这一现象表明,资源丰富的大企业能更快将Agent转化为稳定生产力工具,而行业整体关注点也从“是否采用”转向“如何高效规模化应用”。
客户服务(26.5%)和研究与数据分析(24.4%)成为当前Agent最核心的应用场景。前者体现企业将Agent直接推向客户端的胆识,后者则突显其在信息整合与知识型工作中的优势。值得注意的是,大企业更倾向于优先通过Agent提升内部运营效率…

来源:AI每日精选摘要  Founder Park

◈ 12月18日 星期四 【 10 篇 】

外卖战场:什么变了,什么没变


外卖平台在经历巨额亏损后进入利润修复期,市场格局已从美团一家独大转变为美团与淘宝闪购双雄对峙。截至三季度,两家平台合计亏损超1000亿元,其中淘宝闪购投入超500亿元,订单份额提升至45%,美团则守住55%的订单份额。当前双方GMV市场份额为6:4,竞争焦点从规模扩张转向UE(单位经济效益)优化。美团明确将资源聚焦中高客单价用户,15元以上订单市占超三分之二,30元以上订单市占70%,而淘宝闪购则通过统一品牌(饿了么更名)释放长期投入信号。
四季度起,平台减亏步伐分化。淘宝闪购单均UE亏损从三季度的5.5-6元降至4元左右,美团则维持在1.6-2元,差距约100亿元。这种差异源于淘宝闪购通…

来源:AI每日精选摘要  雷峰网

中山大学王广润:大模型的微调只是对空间建模的微调 | GAIR 2025


王广润博士在GAIR 2025大会的演讲聚焦于基础模型与物理世界建模的前沿探索。他指出,真实世界的动态性和复杂性要求AI不仅具备感知能力,还需理解物理规律并预判场景变化。这一背景下,物理空间智能被视为未来“物理世界操作系统”的核心,其理想状态应能通过类似清洁房间的“物理图灵测试”,但目前技术仍存在显著差距。
演讲重点探讨了端到端物理模型的实现路径。传统分层模型将感知、规划与执行割裂,而端到端系统通过黑箱式整合实现多模态输入(图像、文本)到动作输出的直接映射。这种范式虽在机器人、航天和自动驾驶领域潜力巨大,但面临数据需求庞大和训练困难的挑战。王博士团队提出创新性的“原位推理离散扩散模型”,直…

来源:AI每日精选摘要  AI科技评论

赛马会「软性材料应用机器人」创科实验室总监小菅一弘:如何借助 AI 机器人变革服装生产流程?丨GAIR 2025


服装制造业面临自动化程度极低的矛盾,尽管市场规模高达万亿美元,但2019年中国服装行业仅引入157台工业机器人,与整体工业机器人使用量形成鲜明对比。小菅一弘团队的研究揭示了这一现象的核心原因:柔性材料(如布料)的处理是世界性难题,传统刚性夹具难以适应快速变化的服装款式,导致自动化系统通用性差、成本高。研究数据显示,80%的生产时间与成本浪费在物料处理环节,其中缝制前的准备工作消耗了67%的人工,主要用于整理、对齐和折叠布料。
在技术突破方面,小菅一弘团队开发了多项关键创新。针对多层裁剪后织物部件的分离问题,设计了基于被动柔顺机构的抓取器,可稳定拾取单层面料;针对缝纫环节,开发了专用控制器,…

来源:AI每日精选摘要  雷峰网

破解通用平台困局!逐际动力TRON 2多形态具身机器人,一机三态为具身智能科研提速


逐际动力近日发布了全球首款多形态具身机器人TRON 2,售价4.98万元起,标志着具身智能领域取得重大突破。TRON 2支持双臂、双足、双轮足构型的灵活切换,甚至能实现人形与四足形态的实验性重构,具备多场景自适应能力。这款产品不仅解决了通用硬件平台缺失导致的重复研发困境,更构建了一套面向复杂运动控制算法的实战验证平台。
当前具身智能领域面临多重技术挑战,包括复杂环境下的鲁棒性不足、人机交互自然性有待提升、硬件成本与能效平衡等问题。TRON 2的创新之处在于其打破了硬件构型单一的研发桎梏,为技术研发扫清关键障碍。该机器人以核心本体为基础,通过模块化组合实现三种形态切换,覆盖全类型科研与应用需…

来源:AI每日精选摘要  机器人前瞻

BOSS直聘3B超越Qwen3-32B,更多训练数据刷新小模型极限


一款仅有30亿参数的小模型在数学和推理能力上超越了320亿参数的大模型,这一突破性成果由BOSS直聘Nanbeige大语言模型实验室通过其开源的Nanbeige4-3B模型实现。该模型通过23万亿Token的高质量数据训练重塑了小模型的潜能,远超常规3B级别模型几万亿Token的训练量。团队设计了一套混合数据过滤机制,包含基于标签的评分和基于检索的召回两个核心维度,深入内容层面定义了超过60个维度,最终精选出20个关键维度进行人工标注。实验发现,内容相关的标签比格式标签更能预测数据质量,精细打分比简单的二分类更准确,配合检索数据库剔除了数十万亿低质Token,保留了23T高质量数据作为模型的…

来源:AI每日精选摘要  AIGC开放社区

云天励飞罗忆:推理超越训练,国产算力的真正战场在生态与成本丨GAIR 2025


第八届GAIR全球人工智能与机器人大会聚焦AI算力新十年的发展趋势,云天励飞副总裁罗忆在主题演讲中系统阐述了国产芯片路径与AI普惠化的核心观点。他指出,当前AI产业正经历从训练到推理的范式转移,推理算力消耗首次超越训练,成为产业主战场。这一转变标志着AI技术从”发电”阶段进入”用电”阶段,推动行业关注点转向如何降低推理成本、提升规模化落地能力。
在技术演进层面,罗忆揭示了Scaling Law带来的连锁反应:算力瓶颈已从单一芯片扩展到系统级方案,催生了对”超节点”等新型基础设施的需求。同时,模型迭代周期从数月压缩至数周,市场加速度对芯片公司的全栈能力提出更高要求。面对这一挑战,云天励飞采取…

来源:AI每日精选摘要  雷峰网

别把 AI 写代码当赌博:从 Vibe Coding 到 Vibe Engineering


Kitze在《From Vibe Coding To Vibe Engineering》演讲中犀利对比了科技行业不同领域的发展差异:Vision Pro已实现布料碰撞与生成式城市等前沿技术,而前端社区仍在为select组件样式化等基础问题争论不休。这种割裂揭示了技术演进的不均衡性,也引出了演讲的核心命题——当大模型显著降低编码门槛时,真正的变革并非代码写法本身,而是整个工程实践体系的转型。
演讲首次系统阐释了”vibe coding”现象,即开发者依赖LLM生成代码却缺乏系统化管理的模式。Kitze将其类比为赌场机制:开发者像赌徒般不断投入token生成代码,时而获得功能完整的”头奖”,时…

来源:AI每日精选摘要  硅星人Pro

Gemini 3 Flash 倒反天罡了:关键性能居然超过了 Pro!


Google 正式发布 Gemini 3 Flash,这是一款定价仅为竞争对手 1/4 至 1/5 的轻量级 AI 模型,却在多项基准测试中展现出超越同级别甚至旗舰模型的性能。 在编码能力上,它超过了 Claude Sonnet 4.5,在多模态理解和推理任务上全面领先,并与 GPT-5.2 互有胜负。更引人注目的是,Gemini 3 Flash 甚至在 SWE-bench 测试中以 78% 的成绩超过了自家旗舰 Gemini 3 Pro 的 76.2%,这是 Flash 系列首次在同代产品中实现反超。
Gemini 3 Flash 的实际应用表现同样令人印象深刻。 它能够单次生成完整的动…

来源:AI每日精选摘要  硅星人Pro

刚刚,谷歌祭出迄今最前沿模型 Gemini 3 Flash!编程能力上反超 Gemini 3 Pro,且更快更便宜


谷歌发布了其迄今为止最快的AI模型Gemini 3 Flash,该模型专为速度设计,旨在帮助用户更快地学习、构建和规划。Gemini 3 Flash在博士级别的推理和知识基准测试中表现出前沿性能,例如在GPQA Diamond测试中达到90.4%,在Humanity’s Last Exam中得分为33.7%(不使用工具),与规模更大的前沿模型性能相当。此外,它在MMMU Pro测试中取得了81.2%的成绩,与Gemini 3 Pro的性能接近。
Gemini 3 Flash在性能、成本和速度方面突破了帕累托极限。其速度比前代Gemini 2.5 Pro快3倍,而价格更低。具体定价为每百万个…

来源:AI每日精选摘要  AI前线

12月,我们推荐这 7 款 AI 新品


在极客公园创新大会上,7款前沿AI产品通过线下发布会形式亮相,展现了AI技术在不同领域的创新应用。这些产品均诞生于近一个月内,涵盖硬件、笔记工具、营销服务等多个方向,体现了行业快速迭代的特点。Founder Park的AI产品市集自4月起已推荐超过150款产品,聚集了17000余名从业者,成为行业生态的重要节点。
flomo明确提出拒绝AI内容生成功能,专注于通过多视角分析帮助用户重新理解自己的原始记录。其5.0版本将”AI洞察”升级为”多视角洞察”,内置芒格思维、逆向思考等认知工具。联合创始人少楠举例说明,当记录育儿焦虑时,AI通过逆向视角指出”自我牺牲式付出”的潜在危害,这种基于真实上…

来源:AI每日精选摘要  Founder Park

© 版权声明
“绘蛙”

相关文章

没有相关内容!
“讯飞星辰”

5 条评论

  • 硅星人Pro
    硅星人Pro 投稿者

    这个主题很棒,赞

    回复
  • AI前线
    AI前线 投稿者

    收藏啦收藏啦

    回复
  • admin

    有啥改进意见,欢迎提出

    回复
  • Founder Park
    Founder Park 投稿者

    精选内容有重复的😅

    回复
  • 新智元
    新智元 投稿者

    精选内容很好,方便查看

    回复