NeFut Logo NeFut
EN 管理员登录

[AI学术] 超越思维:在叠加中进行推理的革命性方法

发布于:2026-06-16 22:00 最后更新:2026-06-17 01:38
#AI #Machine Learning #Neural

在大型语言模型(LLM)中,长链推理(CoT)虽然能显著提升问题解决能力,但由于序列生成的计算开销,导致其效率低下。近期的研究尝试在连续潜在空间中进行推理,以绕过离散的令牌生成,但通常面临训练不稳定的问题,且在复杂的长时间任务中缺乏监督信号,难以扩展。

为了解决这一问题,我们提出了 SuperThoughts 方法,该方法将一对连续的 CoT 令牌压缩为单一的潜在表示,并通过轻量级的多令牌预测(MTP)模块在每一步解码两个令牌。这种方法在训练时保留了离散令牌的监督信号,而在推理时则实现了双倍的处理能力。

我们对 Qwen2.5-Math-1.5B-Instruct、Qwen2.5-Math-7B-Instruct 和 Qwen2.5-Math-14B-Instruct 进行了微调,并在 MATH500、AMC、OlympiadBench 及 GPQA-Diamond 等数据集上进行了评估。通过基于信心的自适应机制,在不确定时回退到标准解码,SuperThoughts 实现了约 20% 到 30% 的 CoT 长度减少,同时保持了准确性,绝大多数任务的准确性仅下降 1-2 分。

博主点评: SuperThoughts 的提出为长链推理提供了一种高效的解决方案,通过压缩令牌并利用多令牌预测,显著提升了推理速度,适合在复杂任务中使用,值得关注其在实际应用中的表现。

原文链接: https://arxiv.org/abs/2606.13862

[h] 返回首页