文章摘要
【关 键 词】 AlphaChip、深度学习、芯片设计、学术争议、开源代码
DeepMind在2020年发布了AlphaChip项目,这是一种深度强化学习方法,用于生成超越人类能力的芯片布局设计。该项目在《自然》杂志上发表,并在GitHub上开源,激发了芯片设计AI领域的大量后续工作,并已在Alphabet最先进的芯片中得到应用,同时得到外部芯片制造商的支持和扩展。然而,AlphaChip也面临了业内的质疑。2024年11月,《ACM通讯》杂志上发表了对三篇论文的元分析,包括AlphaChip原论文、Cheng等人投稿到ISPD的论文以及Markov未发表的论文,总结了对AlphaChip的各种质疑。
DeepMind的高级研究员Anna Goldie、Azalia Mirhoseini和Jeff Dean联合发文,回应了这些质疑。他们指出,Cheng等人的ISPD论文没有遵循标准的机器学习实践,采用的强化学习方法与实验设置同AlphaChip在《自然》论文中的描述存在很大差异,且未经同行评审。Markov的“元分析”论文是一份未发表的PDF,未列出作者名单,文章描述称其为“谷歌二号团队”进行的“单独评估”,但实际上是由Markov本人参与并共同撰写,且这一事实在文章中并未披露。这篇文章并不符合谷歌的出版标准。
DeepMind强调,他们不存在任何学术不端行为,Markov也没有为这些指控提供任何证据。他们详细指出了Cheng等人在成果复现过程中的5个主要错误,包括没有预先训练强化学习方法、使用的计算资源低了一个数量级、未将模型训练到收敛、在不具代表性且不可重复的基准上进行评估、对DeepMind的方法进行了“大规模重新实现”,但这可能会引发错误。
DeepMind表示,他们的开源代码仓库可以完全复现在《自然》杂志上描述的方法。他们投入了很长时间才让TPU团队对他们的成果建立起足够的信任,让他们使用他们的布局。尽管AlphaChip在指标层面的表现已经超越了人类专家,但他们理解TPU团队的担忧。AlphaChip已被部署在Alphabet的其他硬件当中,但属于商业机密因此目前无法披露。
原文和模型
【原文链接】 阅读原文 [ 7020字 | 29分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆