标签:移动优化

Meta开源首个量化模型Llama 3.2:减少40%内存,效率提升2倍以上

Meta公司最近开源了一款名为Llama 3.2的轻量级量化版大语言模型,提供10亿和30亿两种参数规模的版本。这款模型经过特别优化,以适应手机、平板和笔记本等移动...