文章摘要
【关 键 词】 AI研究、大模型、智能体、数字自动化、人才争夺
清华姚班学霸姚顺雨近日官宣加入OpenAI,引起了AI圈内外的广泛关注和讨论。姚顺雨的加入不仅因为他在学术界的卓越成就,更因为他在大模型领域的多项创新性研究。姚顺雨在普林斯顿大学攻读计算机博士期间,提出了”Language Agents”(语言智能体)的概念,这是一种将语言模型用于智能体的推理和行动,以实现数字自动化的新型智能体。他的博士毕业论文题目正是”Language Agents: From Next-Token Prediction to Digital Automation”。
姚顺雨在Language Agents领域的研究主要围绕三个关键技术:ReAct、思维树和CoALA。ReAct是一种将推理和行动相结合的方法,通过语言模型生成推理轨迹和行动,解决语言推理和决策任务;思维树是一种基于树搜索的方法,通过生成和评估多个思维路径来解决复杂问题,提高语言模型的推理能力;CoALA是一个概念框架,用于组织和设计语言代理,包括内存、行动空间和决策制定等方面。
除了Language Agents,姚顺雨还提出了开源AI程序员SWE-agent等研究成果,这些研究都在AI圈内产生了广泛影响。姚顺雨的研究愿景是将计算思维与大模型相结合,推动数字自动化的发展。他的加入无疑将为OpenAI在大模型领域的研究带来新的活力和创新。
值得注意的是,姚顺雨的加入只是OpenAI在大模型赛道上人才争夺战的一个缩影。近期,OpenAI不断加大招聘力度,吸引更多顶尖人才加入。例如,OpenAI工程师Karina Nguyen发布了最新的招聘信息,强调这是一个集设计工程与训练后研究于一体的梦想职位。同时,谷歌DeepMind研究员Thibault Sottiaux也被挖到OpenAI,他在Gemini等大模型研究中做出了核心贡献。
在姚班,除了姚顺雨,还有许多优秀的学者在大模型领域取得了显著成果。例如,马腾宇和陈丹琦这两位清华姚班校友,分别在斯坦福大学和普林斯顿大学取得了重要突破。马腾宇创立了Voyage AI,致力于开发嵌入模型和定制化模型;陈丹琦则在普林斯顿大学领导NLP小组,研究大模型的低成本训练和部署等课题。
此外,范浩强、杨格、Dingli Yu等姚班校友也在大模型领域取得了不俗的成绩。范浩强作为旷视科技研究总经理,谷歌学术h-index达到32;杨格参与了xAI的Tensor Programs VI研究;Dingli Yu即将在普林斯顿计算机科学系博士毕业。
总的来说,姚顺雨的加入和姚班校友在大模型领域的卓越表现,充分展示了中国学者在AI领域的强大实力和创新能力。随着大模型技术的不断发展和应用,我们有理由相信,未来将有更多优秀的中国学者在这一领域取得突破,为全球AI技术的发展做出更大的贡献。
原文和模型
【原文链接】 阅读原文 [ 3164字 | 13分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★