标签：显存

10倍吞吐提升无损性能：多模态适用的KV cache量化策略来了，即插即用无需改原模型

多模态大语言模型在实际应用中展现出卓越性能，但其计算开销和显存占用问题仍然是关键瓶颈。KV cache机制通过显存换取计算效率，但随着输入数据规模的增大，...

AIGC动态

5个月前

「古董」GPU也能跑DeepSeek同款GRPO！显存只需1/10，上下文爆涨10倍

开源微调工具Unsloth近期发布了重大更新，进一步优化了GRPO（Group Relative Policy Optimization）训练算法，显著提升了性能并大幅降低了显存需求。此次更新...

AIGC动态

6个月前