量化起家，万卡在手，降价狂魔，DeepSeek可能就是中国大模型混战的终结者

AIGC动态1年前 (2024)发布 Si-Planet

4,085 0 0

量化起家，万卡在手，降价狂魔，DeepSeek可能就是中国大模型混战的终结者

文章摘要

【关键词】 价格战、AI模型、创新架构、行业竞争、独立发展

最近中国大模型领域掀起了一场价格战，由量化对冲基金幻方旗下的AI团队深度求索引发。深度求索发布了新的模型DeepSeek-V2，并将API价格大幅下调至GPT-4 Turbo的百分之一水平。这引发了字节、阿里等公司的跟进，从而拉开了价格战的序幕。深度求索的创新在于其模型架构，DeepSeek-V2采用Transformer架构并进行了创新设计，使用MLA注意力和高性能MoE架构，使模型效率提升5-100倍，大幅降低成本。DeepSeek-V2的发布也使得深度求索受到业界关注，并加速了其独立上市的进程。深度求索的母公司幻方原本专注量化投资，但在近年来转向AI算法研究，并积累了大量高性能GPU，成为国内大模型行业的重要参与者。深度求索也在致力于独立发展，成为大模型行业的重要玩家。

原文和模型

【原文链接】 阅读原文 [ 3680字 | 15分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 glm-4
【摘要评分】 ★☆☆☆☆

智谱AI是一家国内的AI大模型...

# AIGC动态 # GPT-GPTs # 大模型 # AI模型 # 价格战 # 创新架构 # 独立发展 # 行业竞争

© 版权声明

文章版权归作者所有，未经允许请勿转载。

“绘蛙”

相关文章

GLM-4开源版本终于来了：超越Llama3，多模态比肩GPT4V，MaaS平台也大升级

机器之心

2,481

刚刚，Meta开源「分割一切」2.0模型，视频也能分割了

机器之心

2,172

十多个模型打不过 DeepSeek 一个？奥特曼受不了了：怒将 GPT 和 o系列合并，非思维链模型到头！

AI前线

1,114

DeepSeek技术解析：如何冲击英伟达两大壁垒？

admin

1,340

刚刚！OpenAI发布全新o1系列两款模型，o1-mini价格暴降80%，即日起全面上线｜钛媒体AGI

钛媒体AGI

2,652

网友曝光 OpenAI 秘密项目 Feather：简化 AI 应用开发

极客公园

2,138

“极客训练营”

暂无评论

暂无评论...