OpenAI怀疑DeepSeek使用其模型，蒸馏R1

AIGC动态8个月前发布 AIGCOPEN

1,558 0 0

OpenAI怀疑DeepSeek使用其模型，蒸馏R1

文章摘要

【关键词】 OpenAI、DeepSeek、模型训练、数据蒸馏、市场竞争

OpenAI指控国内大模型平台DeepSeek使用其模型训练竞争对手，违反服务条款。大模型蒸馏是行业普遍训练方法，将知识从复杂教师模型转移到简单学生模型。教师模型捕捉数据复杂模式，学生模型结构简单、算力需求小。学生模型训练时，使用原始数据和教师模型输出的软标签作为监督信息，学习拟合硬标签和软标签，从而逼近教师模型性能。蒸馏技术有多种变体，如中间层蒸馏和多教师蒸馏。DeepSeek的R1模型对美国市场造成冲击，英伟达股价暴跌17%，市值蒸发约5890亿美元。社交平台上对此消息讨论激烈，有观点认为OpenAI也曾使用外部数据训练模型，质疑其是否会公布证据，担忧OpenAI可能变得更加封闭。也有观点认为这是行业常态，不应限制使用模型训练自己的模型。

原文和模型

【原文链接】 阅读原文 [ 1517字 | 7分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★☆☆☆☆

Moonshot AI

月之暗面是一家 AI 初创大模...

# AIGC动态 # 大模型 # OpenAI # 市场竞争 # 数据蒸馏 # 模型训练

© 版权声明

文章版权归作者所有，未经允许请勿转载。

“绘蛙”

相关文章

现金流耗尽之前，OpenAI能否做出GPT-5？Altman暴露7万亿帝国野心，但投资人犹豫了

新智元

2,551

这款要一直开着机为你保存记忆的AI眼镜，“雷军来了也做不到”｜对话闪极创始人张波

硅星人Pro

1,959

Ilya Sutskever最新演讲：AI将接管你的一切

AIGC开放社区

1,068

联手OpenAI，吴恩达推出一门o1推理新课程，还免费

机器之心

1,575

微软开源创新LoRA组合方法，增强文生图复杂细节控制

AIGC开放社区

1,876

马斯克怒斥苹果接入ChatGPT：真敢集成就在全公司禁用

量子位

2,582

“极客训练营”

暂无评论

暂无评论...