深度对话阶跃星辰创始人姜大昕:“百模大战”下,大模型如何产生更大价值?|钛媒体AGI

AIGC动态9个月前发布 TMTPOSTAGI
1,065 0 0
深度对话阶跃星辰创始人姜大昕:“百模大战”下,大模型如何产生更大价值?|钛媒体AGI

 

文章摘要


【关 键 词】 AI技术大模型创新应用投资产业规模

姜大昕博士,前微软全球副总裁,现任阶跃星辰创始人及CEO,在2024年3月的全球开发者先锋大会上宣布了该公司在大型AI模型领域的重大进展。阶跃星辰在过去一年中保持低调,专注于技术研发和产品创新,推出了Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型预览版,后者是国内初创公司的首个万亿参数大模型。

姜大昕认为,AI技术经历了三个重要阶段,其中BERT模型的出现是自然语言处理领域的巨大突破,也是迈向通用人工智能(AGI)的第一个节点。Transformer模型的出现使得大模型的能力越来越强,而大规模语言模型的突破则开创了“预训练+微调”的新范式。他强调,攀登Scaling Law(缩放规律)是一个“铁人四项”的超级工程,阶跃星辰在算力、系统、数据和算法四大要素方面不断发力。

阶跃星辰的Step-1模型在多个领域表现出色,性能全面超越GPT-3.5。Step-1V的多模理解能力突出,能够精准描述和理解图像中的信息,并实现内容创作、逻辑推理、数据分析等多项任务。Step-2模型采用MoE架构,聚焦深度智能的探索。姜大昕表示,多模理解和生成的统一是通向AGI的必经之路,而Step系列大模型将为此奠定坚实基础。

据艾瑞咨询报告预测,到2030年,中国生成式AI(AIGC产业规模有望突破万亿元。阶跃星辰目前主打To C端场景,推出了效率工具“跃问”和AI开放世界平台“冒泡鸭”,并与金融、网络文学、知识服务等领域的合作伙伴共同探索面向C端用户的创新应用。姜大昕将模型和产品的关系比喻为灵魂和皮囊,强调有趣的灵魂才能使产品脱颖而出。

阶跃星辰在2023年获得了多家顶级VC机构的投资,选择“闭源+开放生态”的策略,通过API等形式对外开放模型能力,吸引更多开发者和企业共同创造应用场景和行业生态。

原文和模型


【原文链接】 阅读原文 [ 2972字 | 12分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...