标签:AI基础设施
字节万卡集群技术细节公开:2天搞定GPT-3训练,算力利用率超英伟达Megatron-LM
字节跳动与北京大学合作的一篇新论文揭示了AI基础设施的重要性,并介绍了字节搭建的万卡集群,该集群能在1.75天内完成GPT-3规模模型(175B)的训练。字节提出...
一个令人惊艳的 AI 开源神器,诞生了!
在过去一年里,各大科技公司纷纷推出自己的大型语言模型,以在即将到来的AI时代占据一席之地。然而,在这个过程中,算力消耗成为了一个亟待解决的问题。据统...
1
2