钛媒体AGI独家|通信效率超98%!壁仞科技实现中国首个三种异构芯片混训技术

钛媒体AGI独家|通信效率超98%!壁仞科技实现中国首个三种异构芯片混训技术

 

文章摘要


【关 键 词】 AI芯片异构GPU算力架构国产自主技术突破

壁仞科技(Biren),一家专注于高性能通用GPU(AI芯片)研发的国内公司,近期公布了其在算力架构领域的最新技术成果。该公司计划在2024年全球AI芯片峰会上首次展示其自主研发的异构GPU协同训练方案HGCT。这一方案是业界首次支持三种及以上异构GPU(包括壁仞GPU、英伟达GPU以及其他国产芯片)混合训练同一个大模型,通过统一方案支持不同型号和厂商的GPU,并且能够适配多种框架仅需一行代码。HGCT方案的异构协同通信效率超过98%,端到端训练效率在90-95%之间,有效解决了大模型异构算力孤岛的问题。

壁仞科技副总裁、AI软件首席架构师丁云帆透露,公司正在与中国移动、中国电信、商汤科技等客户和合作伙伴共同推动异构GPU协同训练生态的建设。壁仞科技的解决方案不仅支持千卡集群、千亿参数的自动断点续训,还能实现15天连续训练不中断,4天连续训练无故障。

壁仞科技自2019年成立以来,一直致力于构建国产自主智能计算产业生态。公司创始人、董事长、CEO张文强调了资本、人才和大规模场景应用在芯片行业中的重要性。在投融资方面,壁仞科技已完成超过50亿元人民币的融资,投资方包括启明创投、IDG资本等知名机构,成为中国GPU芯片领域的重要“独角兽”企业。

随着AI大模型的热潮,算力需求不断增长,研发成本提升,各国对“主权AI”的争夺也日益激烈。在这样的背景下,如何通过软件优化和异构集成方法提高芯片性能和算力规模变得尤为重要。壁仞科技的HGCT方案正是为了解决这一挑战,通过异构调度、异构通信、异构拆分三层架构,实现了对多种不同型号、不同厂商的GPU的支持。

壁仞科技的HGCT方案对行业具有重要意义,它不仅实现了国产GPU和英伟达GPU的异构共存,加快了国产GPU的落地迁移,还赋能了整个算力产业的发展。此外,壁仞科技还推出了BIRENSUPA生态方案,基于开放的AI算力软件生态体系,为运营商、智算中心、大模型、能源、金融等领域的客户和开发者提供支持。

丁云帆指出,AI芯片产业是技术密集型的,需要强大的技术实力、人才、资金和产业领域的认知度。芯片行业不能犯错,任何一处错误都可能是致命的。因此,企业需要克服众多障碍,市场也需要给予AI芯片企业更多的耐心。

豆包-智能助手

原文和模型


【原文链接】 阅读原文 [ 1480字 | 6分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

© 版权声明

相关文章

暂无评论

暂无评论...