推理加速 | 学习AIGC

五倍推理加速，激发自回归潜能，苹果新工作让LLM预测未来

近年来，语言模型的显著进展主要得益于大规模文本数据的可获得性以及自回归训练方法的有效性。自回归模型在训练阶段具有明显优势，但在推理阶段存在顺序执行...

AIGC动态

1个月前

近期，DeepSeek技术生态呈现多维度扩展态势。国家超算互联网平台正式上线支持DeepSeek-R1模型，最高可运行671B参数的满血版本，标志着其算力基础设施的深度整...

AIGC动态

7个月前

在过去一年中，KV稀疏算法的研究取得了显著进展，但在实际应用中，如何将这些算法与现有的大型语言模型（LLM）框架如vLLM相融合，以提高推理性能，仍是一个挑...

AIGC动态

11个月前

在AICon全球人工智能开发与应用大会上，月之暗面高级研发工程师唐飞虎分享了Kimi智能助手背后的推理加速方案，以及该方案在设计时所需要考虑的指标和在真实生...

AIGC动态

12个月前

这篇文章介绍了初创公司Groq在大模型生成速度上的突破。Groq由谷歌TPU团队的原班人马创立，推出了基于自研芯片的推理加速方案，其速度比传统云平台快18倍，成...

AIGC动态

2年前 (2024)