摘要
大型语言模型(LLMs)在将自然语言翻译为SQL方面展现了显著的能力,但现有方法在处理需要多步、数据感知推理的复杂查询时仍然存在不足。我们引入了DecoSearch,这是一种无训练的框架,通过将每个查询路由到适当的推理努力级别来解决这一问题。
首先,一个轻量级的模式选择器会将完整的数据库模式修剪为相关的表和列。接着,LLM评判器决定问题是否需要分解:简单问题沿着直接生成路径处理,而复杂问题则升级为原子子问题的有向无环图(DAG),每个子问题通过针对性的SQL生成步骤解决。
RAG组件为分解器提供语义相似的训练示例作为基础,而拓扑优化器在执行失败信号表明分解有缺陷而非可修复的SQL错误时,会重构推理计划。
DecoSearch在BIRD数据集上实现了70.53%的执行准确率,在Spider数据集上达到了88.31%,其DeepSeek骨干网络超越了所有无训练基线,同时消耗的token数量比竞争方法少一个数量级。它还作为一个模型无关的包装器,持续改善微调的SQL生成骨干,而无需对管道进行任何修改。
博主点评: DecoSearch的创新点在于其复杂度感知的路由机制,通过引入分解策略和拓扑优化,显著提升了文本到SQL的转换效率。这种方法不仅提高了执行准确率,还减少了资源消耗,展示了模型无关的灵活性,具有广泛的应用前景。