NeFut Logo NeFut
EN 管理员登录

[算法理论] 内部字典匹配问题的近最佳解决方案

发布于:2026-07-02 22:00 最后更新:2026-07-04 11:13
#algorithm #optimization #Data Structure

我们研究了内部字典匹配(IDM)问题,该问题给定一个包含 $d$ 个子字符串的字典 $\mathcal{D}$ 和文本 $T$,每个查询涉及在 $T$ 的另一个子字符串中寻找 $\mathcal{D}$ 中模式的出现情况。我们提出了一种新的 $O(n)$ 大小的数据结构,称为基本子字符串结构(BASS),其中 $n$ 是文本 $T$ 的长度。利用 BASS,我们能够在近乎最优的查询和预处理时间内处理 IDM 问题的所有类型查询。具体而言,我们的结果包括:

博主点评: BASS 数据结构的提出代表了对内部字典匹配问题的重大突破,它不仅在理论上提供了近乎最优的时间复杂度,还在实践中展现了强大的适用性。这为处理大规模文本数据提供了新思路,尤其是在需要频繁查询的应用场景中。其高效的预处理和查询时间将极大提升文本检索的性能。

原文链接: https://arxiv.org/abs/2312.11873

[h] 返回首页