权威榜单登顶国内第一，阶跃星辰Step-2是如何炼成的

1,738 0 0

文章摘要

国际权威榜单LiveBench官网发布了最新的模型能力榜单，其中阶跃星辰自研的万亿参数语言大模型Step-2位列国产基座大模型第一，全球第五，成绩逼近OpenAI的o1-mini-2024-09-12，超越了多个国际主流模型。LiveBench由图灵奖得主杨立昆联合推出，从多个复杂维度评估模型，被誉为“世界上第一个不可玩弄的LLM基准测试”。Step-2在IF Average（指令遵从）一项中拿到了第一，显示出其在指令遵从能力上的优势。

Step-2是阶跃星辰在今年3月发布的国内首个由创业公司发布的万亿参数大模型，经过快速迭代，已在多个方面全面逼近GPT-4。Step-2采用了特殊的MoE架构，使其在训练和推理时激活的参数量超过市面上的大部分Dense模型，成为其高潜力的基础模型。此外，阶跃星辰还在多模态方面进行了探索，推出了千亿参数的多模态大模型Step-1V，并在WAIC期间发布了Step-1.5V多模态理解大模型和Step-1X图像生成大模型，实现了从图像理解到视频理解的跨模态升级。

阶跃星辰的产品化步伐同样迅速，推出了智能助手“跃问”和AI开放世界平台“冒泡鸭”。基于Step系列通用大模型的能力，“跃问”能够完成内容创作、逻辑推理、数据分析等任务，满足生活场景中的各种需求。“冒泡鸭”则为用户提供了一个全新的AI开放世界，可以探索故事、创作角色。阶跃星辰CEO姜大昕认为，模型和应用的关系犹如“灵魂与皮囊”，两者的深度绑定才是实现技术极致的关键。Step-2和整个Step系列模型，或许就是阶跃星辰撬动世界的支点。