模型压缩 | 学习AIGC

苹果也在蒸馏大模型，给出了蒸馏Scaling Laws

苹果研究人员提出的蒸馏扩展定律为量化评估知识蒸馏效果提供了理论框架。该定律通过计算预算在教师模型与学生模型之间的分配关系，能够预测不同配置下学生模...

AIGC动态

7个月前

清华大学与面壁智能团队提出了一种名为Delta Compression的技术，通过存储主干模型与任务专用模型之间的参数差值，显著降低了模型对显卡的存储需求。在此基础...

AIGC动态

10个月前

这篇文章讨论了对大模型进行压缩的重要性，尤其是在部署代价高昂的情况下。模型量化是一种压缩方法，通过将大模型的参数转换为低位宽的表示来节省空间占用。...

AIGC动态

2年前 (2024)

机器之心编辑部撰写的这篇文章主要讨论了大语言模型（LLMs）的知识蒸馏技术及其在研究和工业界中的应用。文章首先指出，尽管闭源LLMs如GPT-4、Gemini和Claude...

AIGC动态

2年前 (2024)

### 摘要总结清华大学和哈尔滨工业大学的研究团队提出了一种名为OneBit的大模型1bit极限压缩框架，实现了大模型权重压缩超过90%的同时保留83%的能力。这一突...

AIGC动态

2年前 (2024)

摘要总结：清华大学和哈尔滨工业大学的研究团队在模型量化领域取得了重要进展，他们提出了一种名为「OneBit」的方法，成功将大型语言模型（LLM）压缩至1bit，...

AIGC动态

2年前 (2024)