文章摘要
【关 键 词】 算力集群、万卡规模、百度昆仑、AI平台、国产崛起
百度智能云成功点亮了国内首个自研万卡集群,这一由昆仑芯三代组成的算力基础设施标志着中国在AI算力领域迈出了重要一步。百度计划进一步扩大规模,目标点亮3万卡集群,进一步彰显技术实力和战略布局。随着全球AI竞争加剧,算力成为核心资源。无论是OpenAI、Anthropic还是谷歌、微软等科技巨头,都在加大算力投入以支持模型训练与推理需求。万卡集群的出现不仅能大幅提升训练效率、缩短模型迭代周期,还可支持复杂任务和多模态数据处理,为AI应用开发提供强大支持。
实现万卡集群的关键在于百度自主研发的百舸AI异构计算平台4.0。该平台突破了硬件扩展性瓶颈,并通过高效散热方案、分布式训练优化、稳定性提升以及通信带宽优化等技术手段,全面解决大规模算力调度难题。其创新之处包括将集群的MFU提升至58%,容错机制使有效训练效率达98%,以及构建超大规模高性能网络,确保带宽利用率超过90%。此外,百舸4.0还能动态整合异构芯片资源,提高多芯混合训练效能,实现高达95%的资源利用率。
在应用场景方面,百度万卡集群已展现出显著成果。例如,在与生数科技合作中,Vidu 1.5大模型利用百舸平台生成高质量视频内容,将渲染效率提升3倍,数据拉取效率提高51倍。在科研领域,上海交通大学借助百舸构建了国内首个AI for Science开源开放平台,加速科研算力配置和实验进程。教育行业则受益于对“九章大模型(MathGPT)”的支持,大幅提升了多尺寸模型的训练性能,加速比保持在90%以上,推动AI深入课堂与学习设备。
国产AI正迎来发展新阶段。DeepSeek两款顶尖模型R1和V3在千帆ModelBuilder平台上架,API价格大幅降低,部分服务甚至限时免费,这体现了国产AI在成本效益上的竞争优势。通过搭建稳定高效的算力体系,百度希望赋能更多企业与开发者创建Sora类多模态应用,助力AI产业创新发展。这种专注于基础设施建设的战略获得了市场积极响应,央企和国企客户的广泛采用证明了国产AI崛起带来的深远影响。未来,基于万卡集群的能力,中国有望在全球AI技术创新中占据更重要的位置,而2025年或将成为AI应用落地的关键拐点。
原文和模型
【原文链接】 阅读原文 [ 2759字 | 12分钟 ]
【原文作者】 新智元
【摘要模型】 qwen-max-latest
【摘要评分】 ★★★★☆