告别微软,姜大昕带领这支精英团队攀登Scaling Law,万亿参数模型已有预览版
文章摘要
【关 键 词】 Scaling Law、万亿参数、姜大昕、阶跃星辰、AGI
机器之心原创文章深入探讨了前微软NLP大牛姜大昕的创业之路,以及他所领导的阶跃星辰公司在人工智能领域的发展和规划。
文章首先提到了OpenAI的Scaling Law信仰,并推测GPT-4模型可能拥有超过1.8万亿个参数。文章强调了万亿参数模型对算力和数据的巨大需求,以及这一领域的竞争将局限于少数几家公司。
姜大昕认为,超越GPT-3.5的模型将成为一个分水岭,只有极少数公司能继续攀登Scaling Law。他的公司阶跃星辰已经开发出了超过GPT-3.5的千亿参数模型Step-1,以及与GPT-4V相媲美的多模态大模型Step-1V,并正在开发万亿参数的MoE语言大模型Step-2。
姜大昕描绘了一条清晰的技术路线图,从单模态到多模态,再到具身智能和世界模型,最终指向AGI。他强调了在此基础上推进多模态理解与生成的融合与统一的重要性。文章还提到了OpenAI的一系列动作,包括DALL・E 3、Sora和Figure机器人项目,以及他们的AGI计划。
姜大昕将攀登Scaling Law比作“铁人四项”,强调了在算法、算力、系统和数据方面的挑战。他提到了训练万亿参数模型的复杂性,以及阶跃星辰在这方面的进展。文章还提到了姜大昕和他的团队在搜索引擎方面的经验,以及他们如何利用这些经验来获取高质量的训练数据。
最后,文章介绍了阶跃星辰的产品,包括面向C端用户的AI聊天应用“跃问”和AI开放世界平台“冒泡鸭”,以及公司在金融、网络文学和知识服务等领域的合作。文章总结了阶跃星辰在人工智能领域的雄心和资源配置,展现了公司对未来的期待和信心。
原文和模型
【原文链接】 阅读原文 [ 4344字 | 18分钟 ]
【原文作者】 机器之心
【摘要模型】 gpt-4
【摘要评分】 ★★★★★