[AI学术] FlowRAG：利用频率感知的多粒度图流增强显式推理

在知识密集型和多跳查询任务中，基于图的检索增强生成（GraphRAG）表现出色。然而，许多现有方法主要依赖基于实体的图，并依靠隐式语义相关性传播。这通常导致两个问题：(i) 当用户查询在实体层面上抽象且语义稀疏时，检索效果不佳；(ii) 多跳推理脆弱，噪声激活可能干扰实体间的转移，破坏推理链，得出不可靠的结论。

为此，我们提出了 FlowRAG，一个语义感知的检索框架，旨在提高语义召回和显式推理能力。具体而言，FlowRAG 在段落、摘要、句子和实体上构建了一个四层异构图，其中摘要节点作为粗略的语义中心。

在检索时，双粒度激活模块结合摘要与查询的对齐以及句子级匹配，稳健地激活相关实体以应对同义词和抽象。随后，我们引入了一个频率感知加权流模块，通过实体与段落链接的相关性进行路由，权重由段落内的术语频率决定，从而修剪噪声连接，提取高置信度的推理路径，作为生成的显式逻辑骨架。大量实验表明，FlowRAG 在复杂推理基准上获得了最先进的性能。

博主点评： FlowRAG通过构建多层异构图和引入频率感知模块，有效地解决了传统GraphRAG方法中的语义召回不足和推理脆弱问题。这种创新的设计不仅提升了模型的推理能力，也为知识密集型任务提供了更为可靠的解决方案，具有重要的应用潜力。