❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️
◈ 12月18日 星期四 【 10 篇 】
◎ 外卖战场:什么变了,什么没变
外卖平台在经历巨额亏损后进入利润修复期,市场格局已从美团一家独大转变为美团与淘宝闪购双雄对峙。截至三季度,两家平台合计亏损超1000亿元,其中淘宝闪购投入超500亿元,订单份额提升至45%,美团则守住55%的订单份额。当前双方GMV市场份额为6:4,竞争焦点从规模扩张转向UE(单位经济效益)优化。美团明确将资源聚焦中高客单价用户,15元以上订单市占超三分之二,30元以上订单市占70%,而淘宝闪购则通过统一品牌(饿了么更名)释放长期投入信号。
四季度起,平台减亏步伐分化。淘宝闪购单均UE亏损从三季度的5.5-6元降至4元左右,美团则维持在1.6-2元,差距约100亿元。这种差异源于淘宝闪购通…
来源:
雷峰网
◎ 中山大学王广润:大模型的微调只是对空间建模的微调 | GAIR 2025
王广润博士在GAIR 2025大会的演讲聚焦于基础模型与物理世界建模的前沿探索。他指出,真实世界的动态性和复杂性要求AI不仅具备感知能力,还需理解物理规律并预判场景变化。这一背景下,物理空间智能被视为未来“物理世界操作系统”的核心,其理想状态应能通过类似清洁房间的“物理图灵测试”,但目前技术仍存在显著差距。
演讲重点探讨了端到端物理模型的实现路径。传统分层模型将感知、规划与执行割裂,而端到端系统通过黑箱式整合实现多模态输入(图像、文本)到动作输出的直接映射。这种范式虽在机器人、航天和自动驾驶领域潜力巨大,但面临数据需求庞大和训练困难的挑战。王博士团队提出创新性的“原位推理离散扩散模型”,直…
来源:
AI科技评论
◎ 赛马会「软性材料应用机器人」创科实验室总监小菅一弘:如何借助 AI 机器人变革服装生产流程?丨GAIR 2025
服装制造业面临自动化程度极低的矛盾,尽管市场规模高达万亿美元,但2019年中国服装行业仅引入157台工业机器人,与整体工业机器人使用量形成鲜明对比。小菅一弘团队的研究揭示了这一现象的核心原因:柔性材料(如布料)的处理是世界性难题,传统刚性夹具难以适应快速变化的服装款式,导致自动化系统通用性差、成本高。研究数据显示,80%的生产时间与成本浪费在物料处理环节,其中缝制前的准备工作消耗了67%的人工,主要用于整理、对齐和折叠布料。
在技术突破方面,小菅一弘团队开发了多项关键创新。针对多层裁剪后织物部件的分离问题,设计了基于被动柔顺机构的抓取器,可稳定拾取单层面料;针对缝纫环节,开发了专用控制器,…
来源:
雷峰网
◎ 破解通用平台困局!逐际动力TRON 2多形态具身机器人,一机三态为具身智能科研提速
逐际动力近日发布了全球首款多形态具身机器人TRON 2,售价4.98万元起,标志着具身智能领域取得重大突破。TRON 2支持双臂、双足、双轮足构型的灵活切换,甚至能实现人形与四足形态的实验性重构,具备多场景自适应能力。这款产品不仅解决了通用硬件平台缺失导致的重复研发困境,更构建了一套面向复杂运动控制算法的实战验证平台。
当前具身智能领域面临多重技术挑战,包括复杂环境下的鲁棒性不足、人机交互自然性有待提升、硬件成本与能效平衡等问题。TRON 2的创新之处在于其打破了硬件构型单一的研发桎梏,为技术研发扫清关键障碍。该机器人以核心本体为基础,通过模块化组合实现三种形态切换,覆盖全类型科研与应用需…
来源:
机器人前瞻
◎ BOSS直聘3B超越Qwen3-32B,更多训练数据刷新小模型极限
一款仅有30亿参数的小模型在数学和推理能力上超越了320亿参数的大模型,这一突破性成果由BOSS直聘Nanbeige大语言模型实验室通过其开源的Nanbeige4-3B模型实现。该模型通过23万亿Token的高质量数据训练重塑了小模型的潜能,远超常规3B级别模型几万亿Token的训练量。团队设计了一套混合数据过滤机制,包含基于标签的评分和基于检索的召回两个核心维度,深入内容层面定义了超过60个维度,最终精选出20个关键维度进行人工标注。实验发现,内容相关的标签比格式标签更能预测数据质量,精细打分比简单的二分类更准确,配合检索数据库剔除了数十万亿低质Token,保留了23T高质量数据作为模型的…
来源:
AIGC开放社区
◎ 云天励飞罗忆:推理超越训练,国产算力的真正战场在生态与成本丨GAIR 2025
第八届GAIR全球人工智能与机器人大会聚焦AI算力新十年的发展趋势,云天励飞副总裁罗忆在主题演讲中系统阐述了国产芯片路径与AI普惠化的核心观点。他指出,当前AI产业正经历从训练到推理的范式转移,推理算力消耗首次超越训练,成为产业主战场。这一转变标志着AI技术从”发电”阶段进入”用电”阶段,推动行业关注点转向如何降低推理成本、提升规模化落地能力。
在技术演进层面,罗忆揭示了Scaling Law带来的连锁反应:算力瓶颈已从单一芯片扩展到系统级方案,催生了对”超节点”等新型基础设施的需求。同时,模型迭代周期从数月压缩至数周,市场加速度对芯片公司的全栈能力提出更高要求。面对这一挑战,云天励飞采取…
来源:
雷峰网
◎ 别把 AI 写代码当赌博:从 Vibe Coding 到 Vibe Engineering
Kitze在《From Vibe Coding To Vibe Engineering》演讲中犀利对比了科技行业不同领域的发展差异:Vision Pro已实现布料碰撞与生成式城市等前沿技术,而前端社区仍在为select组件样式化等基础问题争论不休。这种割裂揭示了技术演进的不均衡性,也引出了演讲的核心命题——当大模型显著降低编码门槛时,真正的变革并非代码写法本身,而是整个工程实践体系的转型。
演讲首次系统阐释了”vibe coding”现象,即开发者依赖LLM生成代码却缺乏系统化管理的模式。Kitze将其类比为赌场机制:开发者像赌徒般不断投入token生成代码,时而获得功能完整的”头奖”,时…
来源:
硅星人Pro
◎ Gemini 3 Flash 倒反天罡了:关键性能居然超过了 Pro!
Google 正式发布 Gemini 3 Flash,这是一款定价仅为竞争对手 1/4 至 1/5 的轻量级 AI 模型,却在多项基准测试中展现出超越同级别甚至旗舰模型的性能。 在编码能力上,它超过了 Claude Sonnet 4.5,在多模态理解和推理任务上全面领先,并与 GPT-5.2 互有胜负。更引人注目的是,Gemini 3 Flash 甚至在 SWE-bench 测试中以 78% 的成绩超过了自家旗舰 Gemini 3 Pro 的 76.2%,这是 Flash 系列首次在同代产品中实现反超。
Gemini 3 Flash 的实际应用表现同样令人印象深刻。 它能够单次生成完整的动…
来源:
硅星人Pro
◎ 刚刚,谷歌祭出迄今最前沿模型 Gemini 3 Flash!编程能力上反超 Gemini 3 Pro,且更快更便宜
谷歌发布了其迄今为止最快的AI模型Gemini 3 Flash,该模型专为速度设计,旨在帮助用户更快地学习、构建和规划。Gemini 3 Flash在博士级别的推理和知识基准测试中表现出前沿性能,例如在GPQA Diamond测试中达到90.4%,在Humanity’s Last Exam中得分为33.7%(不使用工具),与规模更大的前沿模型性能相当。此外,它在MMMU Pro测试中取得了81.2%的成绩,与Gemini 3 Pro的性能接近。
Gemini 3 Flash在性能、成本和速度方面突破了帕累托极限。其速度比前代Gemini 2.5 Pro快3倍,而价格更低。具体定价为每百万个…
来源:
AI前线
◎ 12月,我们推荐这 7 款 AI 新品
在极客公园创新大会上,7款前沿AI产品通过线下发布会形式亮相,展现了AI技术在不同领域的创新应用。这些产品均诞生于近一个月内,涵盖硬件、笔记工具、营销服务等多个方向,体现了行业快速迭代的特点。Founder Park的AI产品市集自4月起已推荐超过150款产品,聚集了17000余名从业者,成为行业生态的重要节点。
flomo明确提出拒绝AI内容生成功能,专注于通过多视角分析帮助用户重新理解自己的原始记录。其5.0版本将”AI洞察”升级为”多视角洞察”,内置芒格思维、逆向思考等认知工具。联合创始人少楠举例说明,当记录育儿焦虑时,AI通过逆向视角指出”自我牺牲式付出”的潜在危害,这种基于真实上…
来源:
Founder Park
◈ 12月17日 星期三 【 10 篇 】
◎ 对话张进:当 AI 不再只靠「看见」去理解世界丨GAIR 2025
声波与毫米波等无线感知技术正在成为人工智能理解物理世界的新维度。随着AI系统从实验室走向真实场景,传统依赖视觉的感知方式在动态复杂环境中逐渐显现局限性,这促使学术界和产业界重新审视多模态感知技术的价值。南方科技大学副教授张进的研究表明,无线感知技术通过物理信号建模,能在不增加设备负担的前提下实现环境与行为理解,为空间智能和真实世界交互奠定基础。
在GAIR 2025大会上,张进分享了其团队在无线感知领域的实践与思考。她强调技术落地需优先考虑可行性与可信性,而非仅追求实验效果。其研究路径从通信系统延伸至智慧医疗,最终聚焦于毫米波雷达与声波感知的融合创新。通过将信号处理与AI模型结合,团队实现…
来源:
AI科技评论
◎ 我得炸裂一次,Vibe Video 的时代彻底来了。
2025年标志着AI视频创作工具的爆发式发展,以Medeo为代表的产品彻底改变了传统视频制作流程。过去一年间,AI原生应用从概念讨论快速进入实际应用阶段,其发展速度令人联想到移动互联网初期的繁荣景象。与早期仅作为附加功能的AI工具不同,当前涌现的产品正在重新定义创作范式,将专业复杂的视频制作转化为自然语言驱动的简易过程。
Medeo的突破性在于将剧本创作、画面生成、配音剪辑等环节整合为连贯的对话式交互。用户仅需提供主题描述和风格要求,系统即可自动生成包含完整叙事结构的视频作品。这种模式显著降低了技术门槛,使非专业人士也能在30分钟内完成质量达标的视频创作。其工作流程支持实时修改和细节调整,…
来源:
AI产品阿颖
◎ 逃离内卷:一个深圳老板自投 1000 多万「豪赌」出的 AI 硬件新品类——相机耳机/MusicCam
何卫,一位传统耳机制造商,面对行业激烈的价格竞争,决定投入1000多万元开发全新产品MusicCam,这是一款融合骨传导耳机和运动相机的创新设备。这款产品旨在解决户外运动爱好者在骑行、徒步或潜水时同时听音乐和记录画面的需求,将两个分离的动作合二为一。MusicCam在Kickstarter上已获得68万美元众筹资金和2000多名支持者,展现了市场对这一新品的积极反应。
MusicCam的诞生源于何卫对市场痛点的深刻洞察。他研究了影像记录和骨传导耳机领域的领先企业,发现前者存在佩戴不便的问题,后者功能单一。通过结合两者的优势,他开发出这款“音乐摄像机”,不仅提供2K高清视频和六轴防抖功能,还…
来源:
极客公园
◎ 大厂竞逐,健康AI率先跑出一个阿福
AI技术在健康领域的应用正以前所未有的速度渗透到基层医疗场景。江西九江00后村医吴静怡使用手机AI为200多位老人建立健康档案的案例,生动展现了年轻一代如何通过技术创新改善老年人生活品质。这一现象背后,反映出AI健康管理已突破传统医疗边界,开始服务于最基层的乡村社区。
行业格局正在发生显著变化。蚂蚁集团推出的「蚂蚁阿福」APP上线6个月即突破1500万月活用户,每天处理500多万个健康咨询,其中55%用户来自三线及以下城市。与此同时,上海瑞金医院与华为合作开源病理大模型,标志着专业医疗机构与科技企业的深度合作。权威机构预测显示,中国AI医疗健康市场规模将在2023至2033年间从88亿元激…
来源:
雷峰网
◎ 一位 95 后投资人踏入江湖,身处「具身智能」浪潮的这三年
资本密集涌入具身智能领域的现象背后,核心驱动力源于市场共识的形成与技术变革的窗口期。BV百度风投投资副总裁崔轲迪指出,当前融资热潮是行业从”非共识”转向共识阶段的自然结果,尽管部分企业尚未展现实质性进展,但资本对赛道的集体押注反映了对人工智能底层逻辑的认可——即算力、算法、数据构成的三角框架正在物理世界实现延伸。具身智能本质上被定义为AI问题而非单纯的机器人制造,这种认知差异直接影响了投资权重分配,智能价值而非硬件量产能力成为早期评估的关键指标。
行业演进路径呈现明显阶段性特征。崔轲迪团队将投资策略划分为本体智能、数据智能、场景智能三阶段,对应着技术从基础能力构建到垂直场景落地的全过程。2…
来源:
极客公园
◎ 万字拆解371页HBM路线图
高带宽内存(HBM)作为AI算力发展的关键支撑技术,正在经历从HBM3到HBM8的快速迭代升级。韩国KAIST大学TERALAB实验室发布的《HBM Roadmap Ver 1.7》揭示了未来15年HBM技术的发展路径,其核心目标是通过持续提升带宽、降低延迟、优化能效,彻底解决AI计算中的“内存墙”瓶颈。报告显示,HBM的带宽将从HBM3的819GB/s跃升至HBM8的64TB/s,增幅达78倍,这一进化背后依赖三大关键技术:硅通孔(TSV)、混合键合(Cu-Cu Bonding)和AI辅助设计。
HBM的核心价值在于重构了内存与计算单元的关系。传统DDR5内存受限于平面布局和有限带宽,导…
来源:
半导体行业观察
◎ 刚刚,沐曦上市,开盘暴涨超500%
国内GPU厂商沐曦股份在A股市场上市首日股价暴涨超500%,市值逼近3000亿元,重现了此前摩尔线程的盛况。该公司成立于2020年,核心团队拥有近20年高性能GPU研发经验,曾主导十多款世界主流GPU产品的研发及量产。沐曦致力于为异构计算提供全栈GPU芯片及解决方案,产品广泛应用于智算、云计算、自动驾驶等领域,为数字经济提供算力支撑。
沐曦推出了曦思N系列、曦云C系列和曦彩G系列GPU产品,分别针对智算推理、通用计算和图形渲染需求。其产品采用完全自主研发的核心GPU IP,拥有自主知识产权的指令集和架构,并兼容主流GPU生态的软件栈。截至报告期末,公司GPU产品累计销量超过25,000颗,…
来源:
半导体行业观察
◎ 英伟达开源全新大模型:黄仁勋不想只「卖铲子」
长期以来,AI领域形成了明确的产业分工,英伟达凭借硬件优势占据着不可撼动的地位。作为“卖铲人”的英伟达,其市值一度登顶全球科技公司榜首,这种商业模式使其在AI淘金热中持续获利。然而2025年底的战略转向彻底打破了行业平衡——英伟达正式发布Nemotron 3开源模型家族,标志着这家芯片巨头开始亲自下场参与AI模型竞赛。
Nemotron 3系列绝非简单的产品迭代,而是融合三大尖端技术的架构革命。其创新性地将Mamba状态空间模型、Transformer注意力机制与MoE混合专家系统进行深度整合,形成了独特的混合架构。其中Nano版本作为首发的30B参数模型,通过仅激活3B参数的动态机制,在…
来源:
新智元
◎ 还在手搓PPT?试完这款AI,我连夜卸载了付费模板库
办公小浣熊3.0的发布标志着AI从内容生成向任务执行的范式跃迁。这一升级版工具通过多模态智能体创作引擎,实现了PPT从草稿到交付的全流程自动化,同时支持百万级数据分析,将企业决策周期从小时级压缩至分钟级。其核心突破在于融合了语言交互(LUI)与图形界面(GUI),用户可通过自然语言指令生成初稿,再通过传统操作完成细节调整,形成人机协作闭环。
在PPT生成领域,小浣熊3.0解决了AI工具”能用但不好用”的痛点。它通过理解文档结构、提炼关键信息、规划叙事逻辑,最终输出可直接使用的演示文稿。与市场同类产品不同,该工具会在生成前通过引导问题确认用户需求,并允许实时修改大纲,确保内容符合预期。其…
来源:
新智元
◎ 量产「中国版 FSD」后,地平线为何公开高阶智驾的「灵魂代码」?
2025年标志着自动驾驶行业进入关键转折点,特斯拉FSD功能进入中国市场加剧了行业竞争,同时也推动了技术普及的迫切需求。地平线HSD高阶智能驾驶的量产,首次将城区辅助驾驶功能下探至15万元以下车型,打破了价格与技术之间的传统壁垒。这一突破不仅体现在硬件性能上,更源于地平线创新的商业模式——「HSD Together」生态合作体系,通过算法服务全周期覆盖,为合作伙伴提供从芯片到算法的灵活选择。
作为后摩尔定律时代的「非典型芯片公司」,地平线从创立之初就确立了软硬协同的技术路径。其四代BPU架构的迭代清晰地展现了场景驱动的技术进化:从伯努利架构的基础感知,到纳什架构的复杂博弈决策,直至最新黎曼…
来源:
极客公园
◈ 12月16日 星期二 【 10 篇 】
◎ 评测也很酷,Data Agent 自动化评测的三层框架与实战
在大模型技术快速发展的背景下,数据领域的应用如数仓开发、ChatBI问数和深度分析Agent等显著提升了效率,但如何科学评估这些应用的效果成为行业难题。字节跳动数据平台大模型评测技术负责人尹小明在AICon大会上分享了Agent自动化评测技术的创新与实践。评测的挑战主要体现在效果评价的贴切性和传统技术的可复用性上,需关注效果、性能与推理性能、稳健性三个维度。效果维度包括事实性、有用性和有害性;性能维度涉及首字符时延和生成速度;稳健性则关注容错和抗攻击能力。
评测方法包括人工评测、自动化评测和人机协同评测。自动化评测中,客观题通过结果匹配评估,文本类通过相似度比较,排序评估则用于RLHF场景…
来源:
AI前线
◎ 独家对话 Looki 创始人孙洋:摸着自己过河
Looki L1作为全球首款多模态个人AI可穿戴设备,开创了全新的产品品类。这款挂在胸口的设备能通过拍照、录像、录音持续记录生活,用户日均使用时长从初期的6.2小时持续攀升至7.9小时,远超运动相机的使用频率。创始人孙洋最初将其定位为”Lifelogging Camera”,但市场反馈表明用户更认同其AI属性,促使团队将官网描述改为”能看见、听见、理解生活的AI设备”。
设备的核心价值在于打破传统”指令-反馈”的交互模式,通过自动生成生活洞察、漫画回忆等内容创造惊喜体验。一位用户在驾驶途中收到基于实时路况的暴风雪预警,印证了设备的环境理解能力。隐私设计采用本地存储+手动上传机制,有效缓解了…
来源:
Founder Park
◎ 西湖大学修宇亮:数字人重建,慢慢都会变成基础模型的微调任务 | GAIR 2025
在第八届GAIR全球人工智能与机器人大会上,西湖大学助理教授修宇亮分享了远兮实验室在高精度数字人重建领域的三项突破性进展。UP2You技术将传统数字人建模时间从4小时压缩至1.5分钟,通过创新性地将”脏数据”转化为多视角正交图片,实现了重建效率的质的飞跃。该技术的核心优势在于重建质量随输入图片数量增加而稳定提升,即使面对手机相册等非专业拍摄的杂乱图像也能获得理想效果。
ETCH技术解决了从穿着服装的三维扫描中还原解剖学准确人体结构的难题。通过定义衣服与皮肤间的等变紧度向量,该技术首次实现了服装厚度与人体形态的精确建模,避免了传统方法将服装直接视为皮肤导致的体型失真问题。这项获得ICCV H…
来源:
AI科技评论
◎ 无弦吉他中场战事
无弦吉他这一小众赛道从最初备受质疑到引发资本狂热仅用了三年时间。LiberLive作为品类开创者,早期因投资人“看不懂”而融资艰难,甚至被误认为“昙花一现的潮流玩具”,直到李泽湘教授基于产品创新价值投出关键资金,才为其后续发展奠定基础。2023年C1单月销量破万台的业绩彻底扭转行业认知,证明无弦吉他具备十亿级市场潜力,也吸引拿火、Musspark等新老玩家蜂拥入场。
市场验证阶段的核心转折来自营销策略的精准调整。LiberLive早期“零门槛上手”卖点遇冷后,在字节千川团队建议下转向真实场景营销,借助学生、街头艺人等KOC内容引爆抖音算法,最终通过双十一集中投放实现单链接2.3亿元销售额。…
来源:
雷峰网
◎ 用企业级智能体落地,还有谁没踩这四种大坑?无问芯穹的系统性解法来了
近年来,智能体技术逐渐成为企业智能化转型的重要组成部分,但实际落地过程中仍面临诸多挑战。尽管智能体已嵌入部分工作流,但其能力上限普遍停留在”实习生水平”,难以承担核心职责。行业关注点已从模型性能转向工程化和场景化落地,这标志着2025年AI行业最显著的心态转变之一。
企业部署智能体主要面临四大障碍:效果稳定性、规模化部署、成本控制和商业化闭环。效果问题表现为智能体表现易受模型选择、提示词设计等因素影响,且随业务变化可能出现衰减。规模化时暴露的稳定性问题更为突出,包括任务堆积、延迟抖动等系统性风险。成本问题尤为尖锐,单次深度研究可能消耗上百万token,成本高达20-50元。商业化闭环则受限…
来源:
量子位
◎ 智能宗教戒指卖爆了,400 万只出货,我们和创始人聊了聊
iQibla智能宗教戒指在中东市场4年售出400万只,成为深圳硬件企业转型自主品牌的典型案例。这款产品通过精准捕捉中东用户的宗教需求,开发出记录赞念次数和朝圣健康报警两大核心功能,填补了市场空白。其母公司优美创新的创始人邵国光,经历了从药品代理到电子产品制造的多次跨界创业,曾踩中功能手机、智能手表、翻译机等多个风口,但直到聚焦自主品牌才实现稳定增长。
深圳硬件产业正经历从代工到品牌化的深刻变革。iQibla的成长路径揭示了硬件创新的关键:早期通过OEM/ODM积累技术能力,后转向孵化品牌出售(如被谷歌收购的Doki Watch),最终选择深耕垂直领域建立自主品牌。这种转型使企业从价格竞争的…
来源:
极客公园
◎ 港中文 MMlab×美团新研究:仅用一个模型,应对多种视觉推理任务
香港中文大学多媒体实验室与美团联合研究团队提出了一种名为OneThinker的统一多模态推理模型,旨在解决当前单一任务或单一模态方法面临的瓶颈问题。现实世界的视觉理解系统需要同时处理问答、动态视频理解、事件定位、目标跟踪、描述生成以及复杂逻辑推理等多种任务,这要求模型具备跨任务和跨模态的综合能力。现有方法多依赖任务专化模型,难以实现不同视觉任务间的协同与知识共享,导致系统复杂度高且综合推理能力受限。
OneThinker采用了一种激进的设计思路,将图像与视频中的多种任务统一抽象为“先推理、后作答”的通用形式。该模型通过多任务强化学习进行整体优化,不仅关注单一基准的性能提升,更致力于验证统一…
来源:
AI科技评论
◎ 国产算力Day 0适配,一人剧组时代到来,商汤Seko 2.0降本增效让AI短剧真正落地
商汤科技发布的Seko 2.0标志着AI视频生成技术进入新阶段,首次实现创编一体与多剧集智能生成,将漫剧制作周期缩短近90%。该系统通过突破性的一致性控制技术,解决了AI生成内容中角色连贯性和逻辑性的核心难题。数据显示,上线半年内已吸引超20万创作者,其中短剧和漫剧创作者占比达50%,反映出市场对高效创作工具的强烈需求。
在技术架构层面,SekoIDX技术通过负参考图机制创新性地平衡了角色一致性与动作自由度,使生成角色既保持特征稳定又能灵活表演。SekoTalk技术则突破多人交互场景的声形同步瓶颈,支持超过2人的精准对口型,极大简化了多人场景制作流程。这些技术进步使得AI生成内容从单镜头质…
来源:
AIGC开放社区
◎ 阿里妈妈发布MUSE:用多模态搞定十万级超长行为序列,并开源Taobao-MM数据集
推荐系统长期以来面临”短期健忘症”的困境,受限于算力和存储,用户多年前的行为数据往往被截断或遗忘。阿里妈妈与武汉大学团队提出的MUSE框架,通过多模态搜索技术重构用户跨越时空的兴趣图谱,为这一难题提供了创新解决方案。
当前CTR建模已走过从短期行为到两阶段长期行为建模的技术演进,但单纯在ID-based结构上叠加改进的边际收益逐渐降低。MUSE突破性地利用图像与文本语义力量,系统性提升了终身兴趣建模的质量与可用长度,其架构与现有模型正交,可作为可插拔模块使用。线上实验显示,该框架在10万长度用户行为序列建模中实现CTR提升12.6%,同时开源了Taobao-MM数据集支持学界研究。
在技…
来源:
机器之心
◎ eFuse时代,来袭
电子保险丝(eFuse)作为一种基于半导体技术的智能电路保护方案,正从细分领域走向舞台中央,成为保障产业创新与可靠运行的关键基石。传统熔断保险丝因一次性熔断、响应迟缓且功能单一的局限,短板尽显。相比之下,eFuse通常由功率MOSFET、电流检测电路、控制逻辑和多种保护功能模块集成而成,核心功能包括过流、过压、过温、反向电流等多维度智能保护,并具备微秒级响应速度、可编程阈值和自恢复能力,显著提升系统安全性与可靠性。
电动汽车市场的电动化转型是eFuse最强劲的引擎之一。随着车辆从400V向800V高压平台演进,电池管理系统、电驱逆变器、车载充电机等核心高压部件的安全隔离与保护变得空前复杂和…
来源:
半导体行业观察
◈ 12月15日 星期一 【 10 篇 】
◎ AI 时代,如何定义电商营销新范式?
抖音电商通过AI技术「千川・乘方」实现了电商营销的系统级改造,解决了传统单点AI应用难以规模化落地的核心瓶颈。该产品由千寻、千策、千意三大技术模块构成,分别对应需求预判、策略优化和内容生成,形成营销闭环。其成功依赖于两大基础条件:一是平台积累的「行为+交易+内容」三维数据燃料,二是强化学习、MCP工具控制技术和多模态大模型三大技术引擎的成熟。
在需求预判层面,千寻系统通过万亿级多模态参数模型实现了用户全生命周期行为分析,将推荐逻辑从被动匹配升级为主动预判。例如能根据「海边度假」场景推荐防晒面料服装,而非简单匹配关键词。技术突破体现在三方面:用户行为序列分析能力从千级扩展至万级;模型架构升级…
来源:
极客公园
◎ 一人剧组不是梦,商汤 Seko 2.0 把拍剧流程做成了按钮
2025年成为AI视频生成领域的”祛魅”年份,行业从OpenAI Sora等模型带来的技术震撼转向对产品化落地的集体焦虑。当前AI视频生成的核心矛盾在于”碎片化能力”与”工业化需求”的断层——虽然能产出大量精美片段,却难以保持角色一致性、服装连贯性等基础影视要素,导致创作者面临”造不出完整房子”的困境。
商汤科技发布的Seko 2.0展现出差异化竞争策略,其创新聚焦于”多剧集管理”这一被忽视的工业化环节。该系统将传统影视流程压缩为”丢剧本-AI拆解-交互成片”三步操作,通过建立角色资产库解决关键的角色一致性问题。当输入《李白诗仙传》文本时,系统能自动分解角色、场景、道具并生成三集结构化大纲…
来源:
硅星人Pro
◎ 极客公园:一直寻找那个与众不同的「Why」
极客公园创始人张鹏在第十六届创新大会的演讲中,系统梳理了这一平台的起源、演变与核心价值。最初源于2010年对移动互联网创业者的兴趣小组,极客公园在非商业化的四年里,见证了王兴、张一鸣等后来成为行业领袖的早期成长。这段经历形成了极客公园对创新本质的认知框架:所有成功创新都遵循”见识-认知-行动”的闭环,如张一鸣2014年硅谷行后形成的全球化认知,直接影响了TikTok的决策路径。
2014年转型为公司后,极客公园重新定义了内容目标函数——不再是追求流量,而是识别和激发科技领域的”变量”。通过创新大会等载体,平台持续捕捉非共识趋势:2014年邀请尚未成名的马斯克与张一鸣同台,2015年预言AI…
来源:
极客公园
◎ 浙江大学研究员彭思达:底层空间感知技术对训练机器人有何作用?丨GAIR 2025
浙江大学研究员彭思达在GAIR 2025论坛上提出,人类行为数据可作为训练人形机器人的重要资源,通过采集人类日常活动记录,结合空间感知技术解决具身智能领域的数据匮乏问题。其团队聚焦三大核心技术突破:相机定位、深度估计与物体运动估计,旨在构建机器人的通用空间感知能力体系。
在相机定位领域,传统Colmap方法受限于图像匹配的准确性,尤其在跨模态场景下表现不佳。团队开发的MatchAnything模型通过多模态预训练框架,实现了红外与可见光、CT与MR等异构数据的匹配,并创新性提出Detector-free SfM方法解决多视图匹配问题。针对重建效率瓶颈,Scal3R系统通过”场景记忆”机制在…
来源:
雷峰网
◎ 打破确定性魔咒!北航团队提出VBF++:用“不确定性建模”刷新多模态视频推荐 SOTA
VBF++框架通过概率化建模解决了多模态视频推荐系统中确定性融合方法面临的三大核心挑战。传统方法采用点估计策略,为输入计算单一最优权重向量,难以应对真实短视频生态中的认知不确定性、上下文无关先验和目标错位问题。该研究提出的VBF++框架将融合过程重新表述为变分推理问题,实现了从”点估计”到”分布建模”的范式转变。
上下文感知的结构化先验机制是VBF++的首要创新点。不同于传统变分方法假设所有视频服从相同简单分布,该框架根据视频语义类别动态调整融合策略的先验分布。实验显示,训练后的策略在潜在空间中自动聚类为有意义的语义群组:动作类视频视觉模态权重达0.68,音乐类视频声学模态权重升至0.71…
来源:
AI前线
◎ 谁将定义中国智算未来?从系统可用的算力基建,到产业认可的价值闭环丨GAIR 2025
“谁能构建未来智算的标准、模式与底座,谁就将在下一代智能化竞争中拥有真正的主导权。”这一核心观点贯穿GAIR 2025「AI算力新十年」下午场论坛的全程讨论。与会专家从技术突破、产业实践和商业模式等维度,深入探讨了中国智算体系的未来发展方向。
工业大模型的应用成为焦点议题之一。清华大学王智副教授指出,工业大模型面临数据、成本、算力三大挑战,并提出虚实融合的智能数据制备路径。其团队开发的IGen框架通过单张照片生成上千条机器人操作数据,将无人工示教模型的成功率从0%提升至75%。在模型设计层面,团队创新性地引入成本感知框架和机理感知调度框架,实现性能与成本的动态平衡。针对边缘计算环境,团队提…
来源:
雷峰网
◎ DRAM严重短缺:苹果告急,戴尔大幅涨价
全球存储器市场正面临严峻的DRAM供应紧张局面,预计将持续至2028年。SK海力士的内部分析显示,普通DRAM产能增长受限,主要因制造商将重心转向满足AI服务器需求。服务器DRAM需求呈现指数级增长,预计2030年将占据53%的市场份额。云服务提供商大力建设AI训练数据中心,进一步加剧了DRAM的供需失衡。
消费级PC市场受到严重冲击,内存价格持续攀升且供应不足。SK海力士等厂商采取保守的产能扩张策略,更注重维持盈利能力而非扩大生产规模。NAND闪存同样面临供应滞后问题,服务器端的高利润需求挤压了消费市场的资源分配。预计到2026年,AI PC将占据55%的市场份额,但传统PC的DRAM供…
来源:
半导体行业观察
◎ 美国半导体版图,太强了
美国半导体产业正经历前所未有的全国性重构,通过《CHIPS Act》政策推动和各州差异化布局,形成覆盖设计、制造、材料、装备及科研的完整生态网络。加州作为全球半导体创新核心,集聚了NVIDIA、AMD等头部Fabless企业,以及Synopsys、Cadence等EDA/IP巨头,同时拥有ASML、Lam Research等设备供应商,牢牢掌控算法、设计工具链和高端装备三大价值链制高点。
亚利桑那州凭借地理和政策优势崛起为先进制造中心,台积电凤凰城工厂与英特尔钱德勒基地构成双引擎,Amkor提供OSAT能力,配合SUMCO等材料供应商及亚利桑那州立大学科研体系,构建美国唯一具备”先进制程-…
来源:
半导体行业观察
◎ AI圈最准的消息,都藏在这个小小的Web3网站里。
近期GPT-5.2的发布引发了广泛讨论,但更值得关注的是在模型发布前出现的精准预测现象。一个名为Polymarket的Web3预测平台多次准确预判了包括GPT-5.2、Gemini 3.0 pro等AI产品的发布时间,甚至成功预测了奥斯卡最佳影片和美国大选结果。该平台通过让用户用加密货币对各类事件进行概率化下注,形成动态价格机制——价格直接反映市场集体认知的概率,且参与者需用真金白银为判断背书。
Polymarket的运作原理基于”群体智慧”的统计学概念。1907年高尔顿的”猜牛体重”实验证明,多元化群体的平均判断往往比单一专家更准确。该平台将这一理念数字化,并引入经济激励作为核心筛选机制…
来源:
数字生命卡兹克
◎ 阿斯麦CEO:中国不可能接受被卡脖子,不如让其保持依赖;国家发文禁止亏本卖车,多家车企响应;月薪100K!京东招募AI芯片人才
阿斯麦CEO提出技术出口策略引发行业关注。阿斯麦首席执行官克里斯托夫·富凯在近期访谈中强调,中国不会接受技术封锁,西方应通过适度技术输出维持中国对进口技术的依赖,同时延缓其自主研发进程。他透露,目前阿斯麦向中国出口的设备技术落后最新产品八代,差距超过十年。富凯担忧过度限制可能倒逼中国加速自主创新,最终导致西方失去这一庞大市场。中国已在多个领域实现技术突破,未来或成为技术输出方。
摩尔线程回应75亿元现金管理计划。针对外界对募资用途的质疑,摩尔线程解释称,75亿元为现金管理额度上限,实际使用金额将显著低于该数字。公司强调资金将严格按原定三年研发计划分阶段投入,闲置部分通过现金管理提升收益符合…
来源:
雷峰网
◈ 12月14日 星期日 【 9 篇 】
◎ 低调霸榜全球最难SQL榜单超两月,国产AI这次选择高调开源!
蚂蚁数科正式开源其数据智能体关键技术Agentar-SQL系列,这一技术已在全球权威的BIRD-Bench NL2SQL评测基准上以81.67%的执行准确率和77%的执行效率双料登顶,超越了谷歌、亚马逊等国际科技巨头。此次开源不仅包含实时文本转SQL框架的全套资源,后期还将陆续开源数据库理解与挖掘、行业知识挖掘等关键技术,覆盖从意图理解到数据理解的全链路能力。
自然语言转SQL在实际落地中面临四大挑战:理解模糊多义的人类口语、注入庞大的行业专业知识、解析复杂的数据库结构与关联,以及生成准确无误的复杂SQL语句。蚂蚁数科的解决方案通过系统化工程方法,让AI真正赋能生产,在某头部城商行试运营期…
来源:
量子位
◎ GPT-5.2降智遭全网差评!奥特曼慌了
OpenAI最新发布的GPT-5.2模型在多项基准测试中表现不及预期,未能超越谷歌的Gemini 3 Pro。Epoch AI报告显示,GPT-5.2的能力指数(ECI)得分为152,虽位列第二,但与Gemini 3 Pro存在明显差距。在数学推理测试FrontierMath中,GPT-5.2仅在初级难度(T1-3)领先,而高级难度(T4)仍由Gemini 3主导。国际象棋解题(Chess Puzzles)是其唯一取得第一的领域,但SimpleQA Verified测试中甚至不及前代GPT-5.1,可信度出现倒退。
第三方评测数据进一步揭示了GPT-5.2的短板。OCR-Arena、sim…
来源:
新智元
◎ GAIR 2025 「数据&一脑多形」分论坛,激辩 AI 演进路径
第八届GAIR全球人工智能与机器人大会“数据&一脑多形”分论坛聚焦两大技术前沿:数据价值的重构与“一脑多形”架构的革新。数据正从传统资源转变为定义模型认知边界与价值对齐的核心框架,而“一脑多形”则通过统一底层认知核心衍生多形态智能体,推动通用性与自主性突破。两者的融合为高阶AI发展提供了路径——以革新性数据方法论支撑多样化智能形态的协同进化。
诺亦腾机器人CEO戴若犁提出,具身智能领域对高质量、跨本体数据的需求激增。动作捕捉技术可构建标准化数据工厂,但遥操作等传统采集方式面临成本高、能力局限等挑战,需转向以人为中心的数据复用体系。极数迭代CEO佟显乔指出,数据服务将成为机器人赛道的“S…
来源:
雷峰网
◎ 1100多个模型殊途同归,指向一个「通用子空间」,柏拉图又赢一回?
研究发现,不同神经网络在训练过程中会收敛到共享的低维子空间,表明存在一种先验的数学结构,架构对学习结果的影响可能比数据更大。约翰斯・霍普金斯大学的研究通过分析1100多个神经网络,发现无论数据集、初始化或超参数如何变化,模型权重都会趋向于同一子空间。这一现象暗示神经网络并非创造新知识,而是在发现已有的几何形式。架构的优先级决定了模型的学习方向,而非数据本身。
该发现为多个未解现象提供了统一解释,包括过参数化模型的泛化能力、不同初始化的相似表示以及LoRA等技术的有效性。如果神经网络确实在共享子空间中学习,这将支持隐式正则化、可迁移性和稀疏训练方法的理论基础。同时,这一发现可能推动模型压缩、…
来源:
机器之心
◎ 统一视觉多模态与多任务!快手可灵与港科大团队发布视频生成模型,加速真实世界理解
统一多模态多任务的视频生成模型UnityVideo通过整合多种视觉模态,显著提升了模型对物理世界的理解能力和生成质量。该模型由港科大、港中文、清华大学和快手可灵的研究团队联合开发,其核心创新在于将深度图、光流、骨骼、分割掩码等多种视觉模态统一训练,使模型能够更全面地理解场景的几何结构、运动模式和物体关系。这种多模态联合训练不仅加速了模型收敛,还带来了性能的显著提升,特别是在物理现象建模和零样本泛化方面展现出突出优势。
UnityVideo的技术突破主要体现在动态任务路由、模态切换器和渐进式课程学习三个方面。动态噪声调度策略使模型能够同时支持条件生成、模态估计和联合生成三种训练范式,避免了传…
来源:
量子位
◎ GAIR 2025 世界模型分论坛:从通用感知到视频、物理世界模型的百家争鸣
在第八届GAIR全球人工智能与机器人大会的世界模型分论坛上,五位青年学者围绕具身智能和世界模型的前沿研究展开了深入探讨。浙江大学研究员彭思达提出,赋予机器人通用空间感知能力是具身智能发展的核心,其团队开发的相机定位、深度估计和物体运动估计技术,为机器人决策提供了关键支持。这些技术不仅能提升行为规划的准确性,还能通过记录人类日常行为生成训练数据,缓解当前具身智能领域的数据匮乏问题。团队创新的LoFTR模型和Pixel-Perfect-Depth方法,分别解决了图像匹配和深度估计中的“飞点”问题,而SpatialTracker则通过三维空间跟踪实现了更鲁棒的行为数据采集。
腾讯ARC Lab高…
来源:
AI科技评论
◎ 重磅预告,就在明天!赵何娟Talk X 唐·塔斯考特:人类与AI的新型身份关系|2025 T-EDGE全球对话
唐·塔斯考特提出“Identic AI”概念,标志着人类与人工智能的关系进入新阶段。这一新型伙伴关系不再局限于工具性辅助,而是发展为能够理解、学习并与人类协同的智能伙伴。Identic AI的核心在于从被动记录转向主动协作,成为个人思维与价值观的延伸。
从辅助到协作的转变是Identic AI的关键特征。传统AI专注于预测与优化,而Identic AI能够从个体经验中学习,充当可信赖的协作者。它帮助管理日程、分析数据并提供解决方案,但并非取代人类判断,而是扩展人类能力。这种协作模式预计将在几年内普及,成为日常生活的一部分。
数字身份的演进是另一重要维度。Identic AI将静…
来源:
钛媒体AGI
◎ 对话Noitom Robotics CEO戴若犁:没有人比我更适合解决机器人的数据问题 | GAIR 2025
戴若犁博士作为诺亦腾机器人公司的创始人兼CEO,分享了关于机器人数据采集行业的深刻见解。全行业普遍认为动作捕捉技术等同于数据采集,这种观点被明确指出是错误的。动捕仅是数据采集中的一个单一模态,而机器人数据的需求远不止于此。
诺亦腾机器人公司从诺亦腾拆分出来,专注于机器人数据业务。2024年至2025年,机器人业务营收增长40倍,这一爆发式增长促使戴若犁决定独立运营。他强调,公司并非简单的设备或服务提供商,而是以数据本身为核心交易界面,目标是成为具身智能领域最大的数据供应商。公司已完成两轮数亿元融资,团队由多位行业资深人士组成,包括腾讯具身模型前负责人等。
机器人数据的需求与传统行业截然不…
来源:
AI科技评论
◎ 宇树和智元罕见同台!为什么世界最好的机器人,都要去上海“过招”?
在全球开发者先锋大会(GDPS 2025)上,宇树G1和智元远征A2与灵犀X2机器人首次全国范围内同台亮相,标志着上海在人工智能与机器人产业的领先地位。作为中国乃至全球AI领域最具影响力的开发者盛会之一,大会吸引了国内外众多具身智能厂商参与,展示了上海从技术研发到产品落地的紧密产业生态。
大会通过插花、救援和灵巧手操作等“物理考题”检验机器人的动手能力。插花测试考验了机器人的场景理解、多步骤规划与力位混合控制能力;应急救援场景则评估机器人在极端环境下的感知、决策和实时响应能力;灵巧手操作则聚焦视觉识别、目标定位与任务优化。这些考题直指视觉-语言-动作大模型在复杂环境中的泛化能力和决策效…
来源:
机器人前瞻
◈ 12月13日 星期六 【 10 篇 】
◎ 喊话谷歌、OpenAI,微软AI CEO亮出「人文超级智能」底牌
微软AI CEO穆斯塔法·苏莱曼近期公开宣称,AI已经超越人类能力,并预测自主AI智能体将在未来12-18个月内实现日常任务执行。他特别提到AI在购物、电影推荐等场景的应用潜力,尽管当前仍存在幻觉问题和操作错误,但通过人类介入机制可确保安全性。苏莱曼强调,AI在创意性、小众任务中表现尤为突出,其团队正在实验的Copilot Actions功能已能自主完成订票等操作,未来将实现更复杂的个性化服务。
苏莱曼提出“人文主义超级智能”概念,主张AI发展必须与人类利益深度绑定。作为微软新成立的超级智能团队负责人,他反对行业内的AGI竞赛叙事,认为超级智能伴随巨大风险,需优先解决约束和对齐问题。这一理…
来源:
新智元
◎ 硅谷还在「卷PPT」,中国机器人大军上岗!看呆歪果仁
全球具身智能顶级赛事GDPS 2025在上海张江科学会堂开幕,标志着中国在具身智能领域迈入实战检验阶段。赛事汇聚智元、宇树等头部企业及国际团队,通过工业搬运、医疗康养、应急救援等六大主题赛道,系统验证机器人在真实场景中的软硬协同能力。现场展示的机器人不仅完成高精度工业任务,还能执行插花艺术、康复护理等需人文关怀的动作,凸显技术从实验室走向产业落地的关键突破。
赛事设计紧密围绕产业需求,将上海积累的百大场景转化为标准化考题。工业搬运赛项要求机器人在非结构化环境中动态规划路径;医疗康养环节则强调安全交互算法与柔性硬件的结合,实现毫秒级力控计算与温柔触碰的平衡。灵巧手赛项进一步挑战机器人的微操作…
来源:
新智元
◎ AI算力新十年:技术革新、生态协同与商业闭环,共探「下一个寒武纪」之路丨GAIR 2025
GAIR 2025「AI 算力新十年」专场聚焦算力作为基础设施时代的核心议题,探讨技术路径、生态战略与商业逻辑如何穿越周期。论坛以“谁是下一个寒武纪”为主题,集结产学研投多方视角,揭示国产算力的现状与未来方向。
深圳理工大学唐志敏院长指出,软件生态对算力芯片产业具有决定性作用。随着摩尔定律放缓与AI算力需求激增,异构计算面临编程复杂度与兼容性挑战。他强调,X86等传统架构的生态壁垒极高,而中国需通过软硬件协同优化突破制程限制,并警示GPGPU部分产品偏离本质功能。在架构创新上,他主张以RISC-V为统一标准,推动回归CPU中心化的融合架构。
刘方明教授分析大模型从“百模大战”向“十模争锋…
来源:
雷峰网
◎ 谢赛宁REPA得到大幅改进,只需不到4行代码
反直觉的发现颠覆了传统认知:驱动生成模型性能的关键因素并非预训练视觉编码器的全局语义信息(如ImageNet分类准确率),而是其提取的空间结构特征。一项由Adobe Research、澳大利亚国立大学和纽约大学联合开展的大规模实证研究表明,图像块(patch)token之间的成对余弦相似度——即空间自相似性(Spatial Self-Similarity)——与生成质量的皮尔逊相关系数高达0.852,而传统线性探测准确率的相关性仅为-0.260。这一结论通过27种视觉编码器的测试得到验证,例如分割模型SAM2-S虽分类准确率仅24.1%,但其指导生成的FID分数优于准确率高出60%的PE-C…
来源:
机器之心
◎ GPT-5.2已上线24小时:差评如潮!
OpenAI最新发布的GPT-5.2模型在官方宣传中被称为”迄今为止在专业知识工作上最强大的模型系列”,并在多项基准测试中刷新了SOTA水平。然而,用户反馈却呈现显著反差,大量批评集中在模型的情感智能缺失、过度安全审查以及实际应用表现不佳等问题上。
在性能测试方面,GPT-5.2的表现引发争议。SimpleBench测试结果显示,其得分不仅低于Claude Sonnet 3.7这样的旧模型,甚至未能显著超越前代GPT-5。这个专门检测常识推理能力的测试暴露出模型在时空推理、社会常识等基础认知能力上的缺陷。类似情况也出现在LiveBench测试中,GPT-5.2的得分落后于竞争对手Opus …
来源:
机器之心
◎ 谷歌最新 Gemini Agent 爆击GPT-5.2?人类最后考试得分见分晓!网友:Altman又该发“红色警报”了
全球人工智能领域的竞争正进入白热化阶段,谷歌与OpenAI在同一天发布重大更新,凸显了行业竞争的激烈程度。谷歌推出全新Gemini Deep Research版本,首次开放嵌入式研究智能体API;与此同时,OpenAI正式发布GPT-5.2(代号Garlic)。这两家科技巨头的竞争焦点集中在智能体的未来发展、基础大模型能力边界以及应用生态主导权上,标志着行业进入了一个前所未有的焦灼阶段。
谷歌的Deep Research Agent展现了显著的技术突破。该工具基于Gemini 3 Pro核心模型构建,具备模型升级、推理稳定性突破和交互能力全面增强三大关键优势。谷歌采用多步强化学习训练策略,…
来源:
AI前线
◎ 张涛首次回应争议,Manus 为什么没有被替代?
11月30日,真格基金在清华大学举办的AI创业分享活动中,Manus联合创始人张涛首次公开回应了关于其产品的质疑,并分享了创业历程与行业洞察。 Manus作为3月5日发布的首个通用智能体,迅速引发全球关注,但也面临技术含量不足、营销炒作等争议。张涛强调,Manus的核心秘密在于”Less structure, more intelligence”的设计理念,其技术架构通过零预设工作流和原子能力调用,在Scale AI的RLI等基准测试中长期保持领先。
团队最初开发AI浏览器的尝试因用户体验问题被放弃,转而受Cursor启发,聚焦于”让非程序员享受AI编码红利”。关键转折是意识到”AI不该用…
来源:
AI前线
◎ 最贵船票来了:马斯克为何突然改口,大开SpaceX资本闸门
SpaceX近期传出计划于2026年进行首次公开募股(IPO),目标估值高达1.5万亿美元,或将成为史上规模最大的IPO事件。这一决策标志着埃隆·马斯克对资本市场态度的重大转变,其背后隐含着技术融合与太空战略的深层逻辑。长期以来,马斯克坚持SpaceX私有化以保护火星移民愿景,但如今通过上市融资的需求已超越了对短期逐利干扰的担忧。
资金需求是推动上市的核心动因。尽管SpaceX预计2023年收入达155亿美元,明年或突破240亿美元,但部署卫星网络、开发星际飞船及建设太空数据中心等项目仍需巨额投入。尤其值得注意的是,马斯克将人工智能视为实现太空野心的关键催化剂。他提出AI、自动驾驶与机器人…
来源:
钛媒体AGI
◎ 拒绝融资、拒绝PR、拒绝扩张:一个研究者如何做出10亿美元的AI公司
Surge AI是一家在人工智能领域具有独特发展路径的公司,尽管其知名度不及OpenAI、Google DeepMind等巨头,但其在行业中的影响力不容忽视。这家公司以不到100人的团队实现了年收入超10亿美元,且从未接受过任何风险投资,从创立之初就保持盈利。其成功的关键在于专注于为ChatGPT、Claude、Gemini等一线大模型提供高质量的数据和工具,尤其在模型的后训练、评测和对齐阶段发挥了重要作用。
创始人Edwin Chen的背景与典型的硅谷创业者不同,他是一位学术型工程师,曾在MIT、Google、Facebook和Twitter从事机器学习研究。他的创业哲学完全背离了硅谷的…
来源:
硅星人Pro
◎ 迪士尼砸10亿绑定OpenAI,200个IP+Sora,该起飞了吧
迪士尼与OpenAI的深度战略合作标志着娱乐产业与人工智能技术融合的重大突破。这一合作不仅包含10亿美元股权投资和认股权证,还涉及迪士尼向OpenAI旗下短视频平台Sora开放包括米老鼠、漫威英雄在内的200余个核心IP的三年授权协议。作为全球顶级娱乐IP持有者,迪士尼此次主动开放版权资源,彻底改变了其长期以来对AI技术侵蚀版权的防御姿态。
对OpenAI而言,此次合作解决了Sora平台面临的核心困境。此前因版权争议导致的严格内容审查严重限制了平台活力,用户留存率大幅下降。获得迪士尼官方授权后,Sora从可能侵权的工具转变为合法创作平台,用户可基于经典IP生成短视频,优质作品还有机会登陆D…
来源:
硅星人Pro
◈ 12月12日 星期五 【 4 篇 】
◎ 中国机器人比赛应急救援,美国网友Reddit破防:我们还在给机器狗化妆拍段子
美国网友近期对中国具身智能技术的快速发展表现出高度关注,甚至产生了一定程度的焦虑。这种情绪源于上海举办的GDPS 2025(全球开发者先锋大会暨国际具身智能技能大赛)上展示的实战能力——中国机器人已能参与应急救援比赛,而美国同类产品仍停留在娱乐化演示阶段。Reddit等平台的热议反映出,海外观察者已意识到中美在技术落地层面的代差。
赛事的亮点不仅在于技术展示,更在于其规模化和产业化特征。与特斯拉、Figure等美国企业仍处于原型机阶段不同,中国优必选、智元等企业已实现5000台量产的里程碑。这种差异并非偶然:量产能力使中国团队能快速暴露硬件缺陷、优化算法,并通过场景扩展积累真实数据。彭志辉…
来源:
量子位
◎ AI鸿沟正在拉大!OpenAI报告揭示:不用AI的企业将被淘汰
企业AI正在全球范围内引发深刻的商业变革。数据显示,企业对AI的使用量呈现爆发式增长,消息量激增8倍,API推理消耗增长了320倍。这一趋势表明,商业世界已跨越实验阶段,进入将智能深度嵌入核心业务的实战期。AI正从简单的对话工具进化为业务流基础设施,OpenAI的付费商业用户已突破100万,工作场所的ChatGPT席位数量同比激增约9倍。
更深层次的变革体现在交互方式的进化上。自定义GPT和项目功能的兴起显示企业正将碎片化知识固化为标准化工具,这类工具的周活跃用户数增长了约19倍,约20%的企业消息通过它们处理。西班牙对外银行等机构内部定期使用的GPT数量超过4000个,表明AI驱动的工作…
来源:
AIGC开放社区
◎ GPT5.2发布:屠榜?不,是OpenAI在补课
OpenAI最新发布的GPT-5.2版本标志着人工智能模型在专业工作领域的重大突破。该版本在GDPval基准测试中,70.9%的任务表现达到或超越人类专家水平,较上一代的38.8%实现显著跃升。这一进步主要体现在工作效率的惊人提升:速度提高11倍,成本降至不足1%。虽然GDPval是OpenAI自行开发的评估标准,但其展现的性能飞跃不容忽视。
在编程能力方面,GPT-5.2在SWE-bench Pro测试中取得55.6%的成绩,超越主要竞争对手。前端开发能力尤其突出,3D场景渲染和复杂交互界面处理获得合作伙伴认可。模型在代码审查、错误查找等实际开发场景中的表现也有可测量的提升。
数学能力…
来源:
硅星人Pro
◎ 何小鹏打赌:明年VLA追不上FSD,负责人就裸奔;DeepSeek使用走私Blackwell?英伟达回应;魏牌CEO被曝「休假」
小鹏汽车创始人何小鹏近期在硅谷试驾特斯拉FSD V14.2版本后,对自动驾驶技术进展提出新赌约:若2026年8月30日前小鹏VLA系统在国内未能达到FSD同等水平,其智驾负责人将接受裸奔惩罚。此次试驾显示,FSD已从L2级辅助驾驶进阶至“准L4”阶段,Robotaxi与标准车辆采用统一模型表现稳定。何小鹏预测未来将形成“私享Robo与共享Robotaxi并存”的L4级自动驾驶生态,并强调小鹏首个版本虽未完全对标FSD,但团队对技术追赶充满信心。
英伟达针对中国AI公司DeepSeek涉嫌使用走私Blackwell芯片的传闻回应称“未发现证据”。美国出口管制使Blackwell芯片成为中…
来源:
雷峰网





这个主题很棒,赞
收藏啦收藏啦
有啥改进意见,欢迎提出
精选内容有重复的😅
精选内容很好,方便查看