[算法理论] 革命性加速：并行时间采样的离散扩散模型

离散扩散模型在学习和生成离散分布中应用广泛。然而，由于生成过程本质上是顺序的，因此采样加速显得尤为重要。在本研究中，我们对主流的 $\tau$-跳跃算法进行了并行化，应用于连续时间马尔可夫链（CTMC）框架。通过利用 $\tau$-跳跃算法的连续时间随机积分形式以及皮卡德迭代方法，我们实现了并行时间采样加速，并为我们的算法提供了指数阶收敛的证明。

在吸收设置下，我们将 $\tau$-跳跃算法的整体时间复杂度从 ${\mathrm{O}}(d \log S)$ 改进为 ${\mathrm{O}}(\log (d\log S)\times \log d)$，相对于 NFE（每次函数评估）。在实验上，我们的方法在合成和真实数据设置中均显示出一致的加速效果。新的采样器在合成分布上实现了最多 $7$ 到 $9$ 倍的运行时间加速，并在单个 GPU 上的图像/文本任务中，在减少 $50\%$ NFE 的同时，保持相同的质量，实现了 $1.45$ 到 $1.86$ 倍的运行时间加速。

我们的研究扩展了离散扩散模型在高效并行推理中的潜力，对分子结构和语言生成等应用具有更广泛的意义。

博主点评： 本文通过并行化 $\tau$-跳跃算法为离散扩散模型的采样加速开辟了新的路径。研究成果不仅在时间复杂度上取得了显著改进，还在实际应用中展示了强大的性能，预示着未来在高效推理领域的广阔前景。