标签:DiLoCo

谷歌重磅推出全新Scaling Law,抢救Transformer!3万亿美元AI面临岔路

谷歌团队近期宣布了一项重大突破,提出了一种全新的分布式训练方法——DiLoCo(Distributed Low-Communication),并验证了其在大型语言模型(LLM)训练中的显...