阶跃星辰的100天,大模型的“后发先至”

AIGC动态6个月前发布 Si-Planet
806 0 0
阶跃星辰的100天,大模型的“后发先至”

 

文章摘要


【关 键 词】 人工智能阶跃星辰技术创新产业应用性能飞跃

文章讨论了人工智能大模型技术的发展及其在企业中的应用,特别关注了阶跃星辰公司在这一领域的进展。海明威的名言“逐渐地,然后突然地”被用来形象地描述技术发展过程中的渐进积累和突破性飞跃。AI技术经过长期积累,实现了显著的能力提升,特别是在大模型的参数规模达到临界点时,性能实现了质的飞跃。

阶跃星辰公司在短时间内发布了多款性能卓越的大模型,包括综合性能超越GPT-3.5的千亿参数大模型Step-1,以及在世界人工智能大会上展示的Step-2万亿参数语言大模型正式版、Step-1.5V多模态模型和Step-1X图像生成模型。这些模型的开发遵循了从单模态到多模态、从理解到生成的全面升级与布局的路线图。

Step-2模型采用了MoE架构,从头开始训练,提供了更高的性能上限和灵活性,同时避免了继承预训练模型的潜在偏见。Step-1.5V模型在图像和视频理解能力上实现了显著提升,能够进行高级推理任务。Step-1X模型则采用了DiT架构,支持多参数量灵活适配,提升了生成图像与文本描述的一致性。

阶跃星辰不仅在技术上取得了突破,还推出了基于大模型的个人效率助手“跃问”和AI开放世界平台“冒泡鸭”,展示了模型与应用的深度结合。此外,公司还构建了基于Step系列大模型的产业应用生态圈,在电影、金融财经等领域实现了应用落地。

文章最后指出,阶跃星辰的快速发展体现了技术飞跃的本质,与Scaling Law的核心本质相吻合,即随着模型规模的扩大,性能会显著提升,发生跃迁。这表明,在AI领域,每隔一段时间,训练成本会减半,而延迟几个月则可能训练出更强的模型。阶跃星辰的成就正是这种跨越式发展的体现。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 3220字 | 13分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...