离散扩散模型在学习和生成离散分布中应用广泛。然而,由于生成过程本质上是顺序的,因此采样加速显得尤为重要。在本研究中,我们对主流的 $\tau$-跳跃算法进行了并行化,应用于连续时间马尔可夫链(CTMC)框架。通过利用 $\tau$-跳跃算法的连续时间随机积分形式以及皮卡德迭代方法,我们实现了并行时间采样加速,并为我们的算法提供了指数阶收敛的证明。
在吸收设置下,我们将 $\tau$-跳跃算法的整体时间复杂度从 ${\mathrm{O}}(d \log S)$ 改进为 ${\mathrm{O}}(\log (d\log S)\times \log d)$,相对于 NFE(每次函数评估)。在实验上,我们的方法在合成和真实数据设置中均显示出一致的加速效果。新的采样器在合成分布上实现了最多 $7$ 到 $9$ 倍的运行时间加速,并在单个 GPU 上的图像/文本任务中,在减少 $50\%$ NFE 的同时,保持相同的质量,实现了 $1.45$ 到 $1.86$ 倍的运行时间加速。
我们的研究扩展了离散扩散模型在高效并行推理中的潜力,对分子结构和语言生成等应用具有更广泛的意义。
博主点评: 本文通过并行化 $\tau$-跳跃算法为离散扩散模型的采样加速开辟了新的路径。研究成果不仅在时间复杂度上取得了显著改进,还在实际应用中展示了强大的性能,预示着未来在高效推理领域的广阔前景。