在知识密集型和多跳查询任务中,基于图的检索增强生成(GraphRAG)表现出色。然而,许多现有方法主要依赖基于实体的图,并依靠隐式语义相关性传播。这通常导致两个问题:(i) 当用户查询在实体层面上抽象且语义稀疏时,检索效果不佳;(ii) 多跳推理脆弱,噪声激活可能干扰实体间的转移,破坏推理链,得出不可靠的结论。
为此,我们提出了 FlowRAG,一个语义感知的检索框架,旨在提高语义召回和显式推理能力。具体而言,FlowRAG 在段落、摘要、句子和实体上构建了一个四层异构图,其中摘要节点作为粗略的语义中心。
在检索时,双粒度激活模块结合摘要与查询的对齐以及句子级匹配,稳健地激活相关实体以应对同义词和抽象。随后,我们引入了一个频率感知加权流模块,通过实体与段落链接的相关性进行路由,权重由段落内的术语频率决定,从而修剪噪声连接,提取高置信度的推理路径,作为生成的显式逻辑骨架。大量实验表明,FlowRAG 在复杂推理基准上获得了最先进的性能。
博主点评: FlowRAG通过构建多层异构图和引入频率感知模块,有效地解决了传统GraphRAG方法中的语义召回不足和推理脆弱问题。这种创新的设计不仅提升了模型的推理能力,也为知识密集型任务提供了更为可靠的解决方案,具有重要的应用潜力。