标签:算力优化
V3.2逼近Gemini 3,DeepSeek硬气喊话:接下来我要堆算力了
OpenAI前首席科学家Ilya Sutskever近期提出,过去五年依赖算力堆叠模型的'规模时代'正面临瓶颈,单纯扩大模型规模难以实现质变。然而DeepSeek通过V3.2系列模...
抛弃“级联”架构!快手OneRec用大模型重构推荐系统,服务成本降至1/10
传统推荐架构面临规模化瓶颈与范式局限,级联式设计导致算力碎片化,整体算力利用效率(MFU)长期低于1%。快手提出的生成式端到端架构OneRec通过统一召回、粗...
华为开源突破性技术Flex:ai,AI算力效率直升30%,GPU、NPU一起用
华为联合三所高校发布了开源AI容器技术Flex:ai,旨在解决全球算力资源利用率低下的核心问题。当前AI产业面临算力资源严重浪费的困境:小模型任务独占整卡导致...
360纳米AI的“多智能体蜂群引擎”如何为智能体时代铺设高速公路?
当AI告别单打独斗,多智能体协作被视为打开生产力新纪元的钥匙。然而,从理论走向现实的路上,横亘着层层技术壁垒。算力成本是第一道隐形的天花板,单个智能...
狂拿大模型明星订单,一家清华系HPC-AI Infra公司浮出水面
93年创始人闫博文带领的是石科技在高性能计算领域展现出独特的发展路径。这家从国家超级计算无锡中心孵化而来的企业,凭借深厚的技术积累,在不盲目囤积算力...
华为CloudMatrix重磅论文披露AI数据中心新范式,推理效率超NV H100
AI大厂在GPU采购上的投入持续加码,但单纯堆砌硬件已无法满足高效算力需求。马斯克的xAI计划将10万卡超算规模扩大10倍,Meta则投资100亿美元建设130万卡数据...
推荐大模型来了?OneRec论文解读:端到端训练如何同时吃掉效果与成本
推荐系统正经历由大型语言模型(LLM)驱动的范式变革。传统级联架构因算力碎片化、目标冲突等问题面临瓶颈,而快手提出的端到端生成式系统OneRec通过整合Enco...
华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群
华为首次推出了一项名为“数字化风洞”的技术,旨在通过虚拟环境平台在正式训练和推理复杂AI模型之前进行预演,从而优化资源配置并减少算力浪费。该技术由华为...
谷歌提出Titans:突破算力限制,扩展上下文
谷歌研究院推出的Titans框架通过创新架构设计突破了大语言模型的长上下文处理瓶颈,将模型上下文窗口扩展至200万token,同时仅增加1.8倍算力消耗。该框架在语...
Nature认证DeepSeek成科研工具全能者,国内高校如何借力大模型?
近年来,大模型在科研领域的应用深度显著提升,DeepSeek系列模型因其开源、低成本和高性能特点受到全球科研界关注。科学家们纷纷涌向DeepSeek,这种模型已成...
1
2




