标签:算法研究

DeepMind研究成本大起底,一篇ICML论文烧掉1290万美元

DeepMind近期在ICML 2024上发表的一篇论文,详细研究了大型语言模型(LLM)在扩展规模时的算法和架构细节,包括参数和优化器的选择。这项研究覆盖了数以万计...