标签:模型量化

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP

摘要:本文介绍了一种名为OmniQuant的新型大语言模型(LLM)量化算法。该算法由上海人工智能实验室、香港大学和香港中文大学的研究者共同提出,旨在解决大语...