文章摘要
【关 键 词】 人工智能、大模型、技术创新、AI应用、国产团队
在今年的上海世界人工智能大会上,一家名为阶跃星辰的国产大模型团队成为了焦点。该团队由微软前全球副总裁、微软亚洲互联网工程院前首席科学家姜大昕创立,虽然成立时间不长,但已经迅速跻身大模型领域的第一梯队,成为业界公认的“六小强”之一。
在WAIC期间,阶跃星辰展示了其最新推出的Step系列大模型,包括万亿参数的MoE语言大模型Step-2正式版、千亿参数的多模态大模型Step-1.5V和图像生成大模型Step-1X。这些模型在数理逻辑、编程、中文知识、英文知识、指令跟随等方面表现出色,部分能力甚至逼近了GPT-4的水平。
Step-2采用了创新的算法架构,完全自主研发,从头开始训练,通过部分专家共享参数、异构化专家设计等创新MoE架构设计,使得每个专家都得到了充分训练。在训练过程中,阶跃的系统团队还突破了6D并行、极致显存管理、完全自动化运维等关键技术,支撑起了整个模型的高效训练。
Step-1.5V多模态大模型在感知能力、推理能力和视频理解能力上都有显著提升,能够理解复杂图表、流程图、高分辨率图像和视频中的内容,并进行高级推理任务。而Step-1X图像生成大模型则通过全链路自研的DiT模型架构,具备更好的文本prompt和生成图片的语义对齐能力,以及指令跟随能力。值得一提的是,Step-1X还针对中国元素进行了深度优化,能够生成更符合国人审美的效果。
除了自家产品,阶跃星辰还与上影集团合作,利用AIGC和大模型技术,推出了基于经典动画电影《大闹天宫》的AI互动体验产品。用户只需上传一张个人照片,模型算法会识别照片特征,结合《大闹天宫》的画风和角色,生成新的肖像,并根据用户的选择和回答,分析用户的MBTI人格,最后得出结论:如果用户在天庭当打工人,最适合什么职位。
此次WAIC上,大模型厂商出现了更多创业公司的身影,AI大模型应用的关注和讨论也占据了不小篇幅。姜大昕曾表示,模型和产品的关系就像灵魂和皮囊,只有通用模型与应用深度绑定,应用才能做到极致。阶跃星辰正是以自家Step系列模型为基座,推出了自有产品和合作产品,不断探索攀登AGI巅峰之路。
原文和模型
【原文链接】 阅读原文 [ 3924字 | 16分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★