NeFut Logo NeFut
EN 管理员登录

[算法理论] 动态窗口成员资格的守护时代布隆过滤器

发布于:2026-06-18 22:00 最后更新:2026-06-20 13:49
#algorithm #Data Structure #Open Source

在流处理中的近似成员资格查询通常需要最近窗口的语义,而非所有曾见过的项目的成员资格。本文研究了守护时代布隆过滤器,这是一种计数和稳定布隆过滤器的滑动窗口替代方案。

该结构将固定的位预算划分为旋转的时代,只有当前时代可以插入数据,在时代边界时清除整个段,并保留一个额外的守护时代。这个守护时代提供了一个确定性的实时窗口不变性:在最后 W 个位置插入的每个项目都保持被表示,而旋转引起的过时保留被限制在目标窗口之外的一个时代。

我们给出了构造,证明了其实时覆盖和有界过时性属性,推导了假阳性近似,并包括一种块状变体,通过将探测限制在每个时代的一个块内来改善局部性。实验覆盖了 225 种合成流配置和 45 种来自时间戳有序的网页服务器访问日志流的配置。在每个活跃项目 14 位的情况下,守护时代过滤器将四位计数布隆基线的合成假阳性中位数从 0.191 降低到 0.02225,同时保持零测量的实时键假阴性。该方法并不是精确删除的替代品;它针对的是那些接受有界过时阳性但不接受实时窗口内假阴性的系统。

博主点评: 该研究提出的守护时代布隆过滤器有效解决了流数据处理中的假阳性问题,尤其是在实时系统中,具有重要的应用价值。通过合理的结构设计和实验验证,展示了其在性能上的显著提升,值得在实际系统中推广应用。

原文链接: https://arxiv.org/abs/2606.19210

[h] 返回首页