标签：OneBit

如何把大模型压缩到1bit？论文作者这样说

这篇文章讨论了对大模型进行压缩的重要性，尤其是在部署代价高昂的情况下。模型量化是一种压缩方法，通过将大模型的参数转换为低位宽的表示来节省空间占用。...

AIGC动态

1年前 (2024)

让大模型“瘦身”90%！清华&哈工大提出极限压缩方案：1bit量化，能力同时保留83%

### 摘要总结清华大学和哈尔滨工业大学的研究团队提出了一种名为OneBit的大模型1bit极限压缩框架，实现了大模型权重压缩超过90%的同时保留83%的能力。这一突...

AIGC动态

2年前 (2024)