标签:OneBit

如何把大模型压缩到1bit?论文作者这样说

这篇文章讨论了对大模型进行压缩的重要性,尤其是在部署代价高昂的情况下。模型量化是一种压缩方法,通过将大模型的参数转换为低位宽的表示来节省空间占用。...

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案:1bit量化,能力同时保留83%

### 摘要总结清华大学和哈尔滨工业大学的研究团队提出了一种名为OneBit的大模型1bit极限压缩框架,实现了大模型权重压缩超过90%的同时保留83%的能力。这一突...