NeFut Logo NeFut
EN 管理员登录

[算法理论] 线性时间高效计算最小后缀集的新算法

发布于:2026-07-01 22:00 最后更新:2026-07-02 03:08
#algorithm #optimization #Data Structure

在近期的研究中,后缀数组(Suffix arrays)作为一种新型数据结构备受关注,因为它们提供了在空间复杂度上比传统的Run-Length BWT更优的模式匹配功能。现有多种算法可用于从后缀数组数据结构构建后缀集。我们提出了第一个满足以下条件的构建算法:(i) 线性时间复杂度,(ii) 单遍历结构,(iii) 可实际应用。这一特性使得该算法在处理大型文本集合时尤为有用。

我们通过实证展示了该算法在空间/时间权衡图中的优势,表明其在实际应用中的优越性。

博主点评: 本文提出的线性时间算法为后缀数组的构建提供了新的思路,尤其在处理大型数据集时显著提高了效率,具有重要的应用价值。

原文链接: https://arxiv.org/abs/2606.31034

[h] 返回首页