文章摘要
【关 键 词】 AlphaFold3、蛋白质结构、开源代码、生物AI、新药研发
诺奖级AI AlphaFold3的源码在六个月的争议后终于开源,这对蛋白质结构预测领域是一个重大突破。AlphaFold3的开发人员因此荣获诺贝尔化学奖,但其不开源的状态曾引起学界不满。现在,科学家们可以在本地部署AlphaFold3,有望加速新药和疫苗的研发。非商业用途的任何人都可以下载代码,但只有具有学术背景的科学家才能申请访问训练权重。GitHub上的AlphaFold3项目已获得1.8k星。
在AlphaFold3开源之前,一些公司已经根据其论文中的伪代码发布了类似模型。例如,AI生物初创Chai Discovery发布了分子结构预测模型Chai-1,并比较了其与AlphaFold的性能。Ligo Biosciences发布了一个无使用限制的AlphaFold3版本,但功能尚未完整。AlQuraishi团队计划推出完全开源的OpenFold3模型,允许制药公司使用专有数据重新训练模型。
开源对于生物AI模型的发展至关重要。威斯康星大学麦迪逊分校的计算生物学家Anthony Gitter强调,只要盈利性公司遵循科学界标准分享工作,他对此并无异议。DeepMind科学AI负责人Pushmeet Kohli表示,即使没有开源代码,AlphaFold3的模型也是可复现的,他期待未来有更多关于出版规范的讨论。
AlphaFold2的开源曾推动了大量创新,例如在蛋白质设计竞赛中使用该工具设计出能够结合癌症靶标的新蛋白质。AlphaFold项目的负责人Jumper期待AlphaFold3开源后能带来类似的惊喜。
安装AlphaFold3需要一台运行Linux的机器,不支持其他操作系统。完整安装需要多达1TB的磁盘空间和一块具有计算能力8.0或更高的NVIDIA GPU。安装步骤包括在GCP上配置机器、安装Docker、获取基因数据库、获取模型参数、构建AlphaFold3 Docker容器或Singularity镜像。获取基因数据库需要使用Python程序fetch_databases.py,而获取模型参数需要向Google DeepMind申请并获得授权。数据管线的运行时间和模型推理效率取决于输入大小、硬件配置等因素。AlphaFold3正式支持NVIDIA A100和H100 GPU配置,并已进行广泛的数值准确性和吞吐量效率测试。
原文和模型
【原文链接】 阅读原文 [ 1784字 | 8分钟 ]
【原文作者】 新智元
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆