文章摘要
【关 键 词】 大模型、多模态、人工智能、技术创新、合作发展
在2024年3月23日的全球开发者先锋大会上,初创公司阶跃星辰发布了Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型和Step-2万亿参数MoE语言大模型预览版。这些模型的发布标志着公司在大模型领域的领先地位,特别是在多模态理解和生成的统一方面,为实现人工通用智能(AGI)奠定了基础。
阶跃星辰的Step-1千亿参数语言大模型在两个月内一次性训练成功,综合性能超过GPT-3.5。Step-1V千亿参数多模态大模型在中国权威的大型模型评估平台“司南”中位列第一,性能比肩GPT-4V。Step-1V的多模理解能力突出,可以精准描述和理解图像中的文字、数据、图表等信息,并实现内容创作、逻辑推理、数据分析等多项任务。此外,Step-1V还能实现视频理解。Step-2万亿参数语言大模型预览版采用MoE架构,聚焦深度智能的探索,对算力、系统、数据、算法四个方面都提出了极高的要求。
阶跃星辰的核心团队由CEO姜大昕(同时也是算法负责人)、数据团队负责人焦斌星博士和系统负责人朱亦博组成。他们在算法、数据和系统三大要素上具有强大的实力。姜大昕在接触到ChatGPT时意识到,要实现更大的技术突破,必须自己从底层做起。因此,他决定创业,与团队一起投身于这场技术变革。
阶跃星辰不仅训练了自己的大模型,还推出了两款C端产品:效率工具“跃问”和AI开放世界平台“冒泡鸭”。这两款产品在多轮对话、执行指令和逻辑推理方面具有强大的性能。此外,阶跃星辰还与财联社、中文在线、中国知网等合作伙伴在金融、网络文学、知识服务等领域达成深度合作,推进大模型的应用落地。
阶跃星辰的成立和发展,以及其在多模态领域的布局,使其成为“new game”中的新玩家。公司在算力、系统、数据、算法四个方面具有技术底气,这使得阶跃星辰在“百模大战”一年后仍有勇气入局。姜大昕认为,多模态理解和生成的统一是通向AGI的必经之路,而阶跃星辰的发展方向正是支持其在此时正式亮相的底气所在。
原文和模型
【原文链接】 阅读原文 [ 3677字 | 15分钟 ]
【原文作者】 极客公园
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★