DeepSeek V3.1 专为国产芯片设计的 UE8M0 FP8 到底是什么?

文章摘要
【关 键 词】 DeepSeek、国产芯片、UE8M0 FP8、软硬协同、AI圈
DeepSeek V3.1发布后,官方留言提及新架构和下一代国产芯片,引发AI圈轰动,国产芯片企业股价和半导体ETF上涨。
首先介绍了UE8M0 FP8的概念。“UE8M0 FP8”可拆分为两部分,UE8M0是MXFP8路径里的“缩放因子”。MXFP8基于FP8建立,FP8是将常规浮点格式压缩到8 bit的编码方式,MXFP8把张量切块并为每个块指定“缩放因子”,扩展了动态范围。UE8M0中U表示无符号,E8M0指8个bit全部分配给指数位。采用全指数表示缩放因子有诸多好处,处理器复原数据时只需移动指数位,缩短时钟关键路径,动态范围大,能解决单尺度FP8的问题,减少信息损失。大部分已量产国产AI加速器未集成完整FP8乘加单元,但2025 H2首发的新款国产芯片已宣传支持“原生FP8”或“Block FP8”,并验证UE8M0格式。UE8M0能节省流量,是下一代架构的重要优化方向。
接着探讨了DeepSeek为哪个国产芯片做了优化。在官方卖关子的情况下,人们关注首批通过“DeepSeek大模型适配”的8家厂商,寒武纪被视为“头号种子选手”,其芯片支持FP8计算,架构设计和低精度计算优化领先,海光、沐曦、中昊芯英、摩尔线程等也被点名。华为昇腾虽暂不支持原生FP8,但官方路线图显示2025Q4将支持。市场对国产芯片概念反应热烈,科创50大涨,芯片产业链走强。
最后说明国产芯片支持UE8M0 FP8的意义。这代表国产AI走向软硬协同阶段,能减少对国外算力的依赖。UE8M0 FP8能提高国产芯片“性价比”,让国产芯片厂商在竞争中更具优势。DeepSeek改动精度格式,贴合国产芯片最佳性能点,形成类似“Wintel联盟”的软硬协同模式。
原文和模型
【原文链接】 阅读原文 [ 2080字 | 9分钟 ]
【原文作者】 Founder Park
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★☆☆