Nature认证DeepSeek成科研工具全能者，国内高校如何借力大模型？

1,072 0 0

文章摘要

近年来，大模型在科研领域的应用深度显著提升，DeepSeek系列模型因其开源、低成本和高性能特点受到全球科研界关注。科学家们纷纷涌向DeepSeek，这种模型已成为科研AI工具中的全能者，其Hugging Face下载量接近四百万次。然而，高使用量带来的算力需求激增，暴露出资源碎片化、人才短缺等系统性难题：科研机构面临算力”饥饿与浪费并存”的困境，同时复合型AI人才供给严重滞后。

为解决这些挑战，昆仑芯P800万卡集群的部署成为关键突破。该集群作为国内首个自研万卡算力基础设施，单机8卡即可运行671B参数模型，训练千亿模型周期缩短32%，电力成本节省超300万元。其完全自主可控的架构不仅保障数据安全，更通过联邦学习平台实现多机构协同训练，医疗影像分析模型精度提升12%的同时满足隐私合规要求。

百度智能云构建的AI For Science解决方案形成完整技术生态：昆仑芯提供算力底座，百舸平台实现跨集群资源调度，飞桨框架支撑算法创新，千帆平台简化模型开发流程。百舸平台使上海交大GPU利用率翻倍至72%，任务排队时间减少60%；飞桨框架助力中科大实现量子化学模拟效率百倍提升。这套全栈体系已赋能多所高校，清华智能产业研究院通过该方案将模型训练周期压缩近三分之一。

高校与企业的深度协同创新成为新趋势。同济大学基于百度技术搭建全国产具身智能平台，推进多智能体算法研究；北大、浙大等通过”科研算力银行”模式加速项目迭代。这种合作突破传统点状对接，形成技术、数据、人才要素的立体化流动，如百度”松果计划”已培养5000余名AI工程人才，孵化20余个跨学科项目。

从AlphaFold到DeepSeek，AI For Science正经历范式变革。大模型正从单领域突破转向跨学科赋能，其通用性使物理模拟、分子预测、社会科学分析等场景均能受益。随着国产算力基建的完善，科研创新链条中的数据处理、模型训练到成果转化环节正被重构。这场以智能化基础设施为核心的科研革命，正在重塑知识生产的底层逻辑。