DeepSeek精度效率双提升,华为&信工所提出思维链“提前退出”机制

AIGC动态21小时前发布 QbitAI
23 0 0
DeepSeek精度效率双提升,华为&信工所提出思维链“提前退出”机制

 

文章摘要


【关 键 词】 大模型推理效率动态退出思维链精度提升

华为与中科院信工所合作提出了一种名为DEER(动态提前退出推理)的新方法,旨在解决大模型在长思维链推理中可能出现的过度思考问题。DEER的核心在于找到推理信息质量下降之前的临界点,并在该点及时中断推理,从而提升模型的精度和效率。这种方法无需额外训练,已在多个推理基准和模型上验证了其有效性,能够将思维链生成长度平均减少31%到43%,同时将准确率提高1.7%到5.7%。

DEER的灵感来源于“珍珠推理”的概念,即在推理过程中识别出信息刚好足够的临界点,并在此点停止进一步思考。通过实验发现,大约75%的样本包含这样的临界点,甚至有36.7%的样本只需不到一半的原始推理路径就能得到正确答案。这表明,找到并利用这些临界点可以显著提高推理效率

为了验证这一方法,研究团队在DeepSeek系列推理LLM上进行了实验,结果显示,在仅使用20%的推理步骤就提前退出的静态设定下,对于MATH-500数据集,有60.8%的正确回答样本依然能保持正确;对于较难的GPQA数据集,仍然有35.1%的样本可以保持正确。这表明,不同问题的最佳早期退出点各不相同,且与问题本身的难度密切相关。因此,依赖固定启发式的静态提前退出策略是次优的,DEER通过动态提前退出机制进一步提高了准确性。

DEER的具体实现分为三个步骤:推理转换监控、试验性答案诱导和置信度评价。推理转换监控通过识别思路转换的临界点(如“wait”等词)来触发答案诱导,而置信度评价则用于判断是否停止进一步思考。如果置信度足够高,模型将基于已生成的思维链直接生成结论;否则,撤销答案诱导的动作,继续沿原路径推理。这种方法在多个推理任务中表现出色,尤其是在数学和科学推理任务中,DEER显著提升了模型的性能。

为了进一步优化效率,DEER还引入了分支并行加速策略,通过将多个分支线性化为单个序列,并使用专门的Causal Attention Mask并行生成,从而减少推理时延。实验结果显示,在未使用分支并行解码加速的情况下,DEER已经减少了43.4%到47.3%的推理时延,而采用该策略后,推理时延的下降比例与序列长度的下降比例呈现超线性关系。

总体而言,DEER通过动态提前退出机制,显著提升了大模型的推理效率和精度,尤其是在处理复杂问题时表现出色。这一方法不仅减少了推理步骤,还避免了模型在无休止的自我检查中浪费时间,从而实现了更快更强的推理能力。

原文和模型


【原文链接】 阅读原文 [ 2169字 | 9分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...