文章摘要
【关 键 词】 模型能力、万亿参数、多模态、智能助手、AI平台
国际权威榜单LiveBench官网发布了最新的模型能力榜单,其中阶跃星辰自研的万亿参数语言大模型Step-2位列国产基座大模型第一,全球第五,成绩逼近OpenAI的o1-mini-2024-09-12,超越了多个国际主流模型。LiveBench由图灵奖得主杨立昆联合推出,从多个复杂维度评估模型,被誉为“世界上第一个不可玩弄的LLM基准测试”。Step-2在IF Average(指令遵从)一项中拿到了第一,显示出其在指令遵从能力上的优势。
Step-2是阶跃星辰在今年3月发布的国内首个由创业公司发布的万亿参数大模型,经过快速迭代,已在多个方面全面逼近GPT-4。Step-2采用了特殊的MoE架构,使其在训练和推理时激活的参数量超过市面上的大部分Dense模型,成为其高潜力的基础模型。此外,阶跃星辰还在多模态方面进行了探索,推出了千亿参数的多模态大模型Step-1V,并在WAIC期间发布了Step-1.5V多模态理解大模型和Step-1X图像生成大模型,实现了从图像理解到视频理解的跨模态升级。
阶跃星辰的产品化步伐同样迅速,推出了智能助手“跃问”和AI开放世界平台“冒泡鸭”。基于Step系列通用大模型的能力,“跃问”能够完成内容创作、逻辑推理、数据分析等任务,满足生活场景中的各种需求。“冒泡鸭”则为用户提供了一个全新的AI开放世界,可以探索故事、创作角色。阶跃星辰CEO姜大昕认为,模型和应用的关系犹如“灵魂与皮囊”,两者的深度绑定才是实现技术极致的关键。Step-2和整个Step系列模型,或许就是阶跃星辰撬动世界的支点。
原文和模型
【原文链接】 阅读原文 [ 2881字 | 12分钟 ]
【原文作者】 极客公园
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆