7人创业、1人投敌！Transformer 八子谷歌坐冷板凳5年再成老黄座上宾

AIGC动态1年前 (2024)发布 ai-front

2,252 0 0

文章摘要

【关键词】 AI、Transformer架构、自注意力机制、谷歌、大语言模型

在2017年，谷歌的8名研究人员联合发表了名为《你所需要的是注意力》的论文，提出了Transformer架构，这项技术彻底改变了技术发展路径。Transformer架构的诞生源于自然语言处理（NLP）领域的迫切需求，它能真正地解决循环神经网络（RNN）和卷积神经网络（CNN）在处理序列数据时存在的问题。Transformer采用了自注意力机制，使得模型能够同时关注序列中的所有位置，从而捕捉长距离依赖关系。

Transformer架构的诞生源于8位谷歌研究人员的共同努力，他们偶然相遇，迷上了共同的探索目标，最终设计出近代历史上最具突破性的关键技术——Transformers。这些研究人员中有的已经离开了谷歌，有的已经创办了自己的公司或是加入了新团队。

在2018年，这篇论文已经拥有了传奇般的历史地位。作者们从神经网络这项蓬勃发展且不断改进的技术入手，打造出一套极为强大的数字系统，该系统的输出就如同是外星智能的产物。这种架构被命名为Transformer，是当今一切令人兴奋的AI产品背后的秘密武器。

然而，尽管Transformer架构的影响力日益显著，但在谷歌内部，其应用并没有立即普及。直到2018年，谷歌才开始尝试将Transformer集成到其产品中，如谷歌翻译工具。而在此期间，一家名叫OpenAI的初创公司行动更快，明显占得了先机。在论文发表后不久，OpenAI公司首席研究员Ilya Sutskever建议科学家Alex Radford认真研究这个方向，最终成果就是首款GPT产品。

如今，这篇论文的所有八位作者都已离开谷歌，其中大部分人都创立了自己的AI初创企业，这些企业均以Transformer技术为业务基础。这些公司的估值从几亿美元到几十亿美元不等，显示出Transformer架构的巨大潜力和价值。