标签：数据蒸馏

OpenAI怀疑DeepSeek使用其模型，蒸馏R1

OpenAI指控国内大模型平台DeepSeek使用其模型训练竞争对手，违反服务条款。大模型蒸馏是行业普遍训练方法，将知识从复杂教师模型转移到简单学生模型。教师模...

AIGC动态

11个月前

最壕DeepSeek玩家8台Mac跑R1，10万+元凑496GB显存才能跑4bit量化版

DeepSeek-R1是一款正在接受全球网友检验的人工智能模型，它能够通过manim代码快速制作解释勾股定理的动画。为了运行这个模型，有用户投资超过10万元，组建了...

AIGC动态

11个月前

指令层级，帮助AI大模型防御恶意攻击

在AIGC领域，随着生成式AI产品如ChatGPT在多个领域的应用，其安全性问题日益凸显。黑客攻击和恶意文本提示等风险使得大语言模型（LLM）面临挑战。为此，OpenA...

AIGC动态

1年前 (2024)

谷歌DeepMind发布Gecko：专攻检索，与大7倍模型相抗衡

最后，机器之心还宣布将在北京海淀举办AI技术论坛，聚焦于视频生成技术、多模态大模型等前沿领域，旨在帮助企业和从业者掌握最新的技术进展。

AIGC动态

2年前 (2024)