
文章摘要
【关 键 词】 蛋白质工程、干细胞重编程、细胞再生、GPT – 4b、蛋白变体
GPT – 4b micro在蛋白质工程领域取得显著成果,为干细胞重编程和细胞再生研究带来新突破。
模型特性与优势:GPT – 4b micro是OpenAI与Retro Bio合作开发、专为蛋白质工程设计的GPT – 4o微型版本。它基于GPT – 4o精简版初始化,在包含蛋白质序列、生物文本和标记化3D结构数据的数据集上训练,并添加额外上下文信息,使处理内在无序区域蛋白质同样有效。训练样本有效上下文长度显著扩展,输入长达64000个token的超长提示时,模型可控性和输出质量仍提升,这种上下文长度在蛋白质序列模型中前所未有。同时,模型在更大数据集训练下,表现出类似大语言模型的缩放定律,可在小规模迭代训练。
改进诺贝尔获奖蛋白变体:Retro Bio科学家用该模型重新设计与细胞重编程相关蛋白质。重新设计的蛋白质在体外使干细胞重编程标志物表达量比野生型对照组高出50倍以上,还增强了DNA损伤修复能力。山中伸弥因子在再生生物学中重要但效率低,传统优化蛋白质序列困难,筛选方法命中率低。Retro团队利用GPT – 4b micro生成“RetroSOX”和“RetroKLF”变体,“RetroSOX”超30%序列表现更优,“RetroKLF”变体中14种优于最佳组合方案,命中率接近50%。最优组合使用时,成纤维细胞标志物表达水平显著提升,晚期标志物出现提前,还表现出多能性。在不同递送方法和细胞类型中验证,结果持续超越常规iPSC系基准,表明AI指导的蛋白质设计能加速干细胞重编程研究进程。且重新设计的RetroSOX/KLF组合在减少DNA损伤方面比原始山中伸弥因子更有效。
网友反应与未来展望:网友对OpenAI进军生物科学领域举措有不同反应,有人肯定,有人疑惑,还有人提出独特想法。OpenAI科学家Noam Brown称当前模型性能更强,预计未来一年左右会有更多新成果。
原文和模型
【原文链接】 阅读原文 [ 2631字 | 11分钟 ]
【原文作者】 量子位
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★★☆