文章摘要
【关 键 词】 价格战、AI模型、创新架构、行业竞争、独立发展
最近中国大模型领域掀起了一场价格战,由量化对冲基金幻方旗下的AI团队深度求索引发。深度求索发布了新的模型DeepSeek-V2,并将API价格大幅下调至GPT-4 Turbo的百分之一水平。这引发了字节、阿里等公司的跟进,从而拉开了价格战的序幕。深度求索的创新在于其模型架构,DeepSeek-V2采用Transformer架构并进行了创新设计,使用MLA注意力和高性能MoE架构,使模型效率提升5-100倍,大幅降低成本。DeepSeek-V2的发布也使得深度求索受到业界关注,并加速了其独立上市的进程。深度求索的母公司幻方原本专注量化投资,但在近年来转向AI算法研究,并积累了大量高性能GPU,成为国内大模型行业的重要参与者。深度求索也在致力于独立发展,成为大模型行业的重要玩家。
原文和模型
【原文链接】 阅读原文 [ 3680字 | 15分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 glm-4
【摘要评分】 ★☆☆☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...