背景
随着耦合模型比较项目第六阶段(CMIP6)的开展,产生了数千篇同行评审的出版物,这些出版物记录了模型配置、评估程序、新兴约束和预测不确定性。在向CMIP7过渡的过程中,高效提取和操作这些非结构化知识以及实时数据分析成为了一大瓶颈。
CMIP-Forge 系统
我们提出了CMIP-Forge,一个混合检索增强生成(RAG)和自主分析系统,旨在弥合科学文献与地球系统网(ESGF)数据档案之间的差距。该系统结合了6,581篇与CMIP6相关的开放获取出版物(共101,828个索引片段),并通过一个工具增强的工作流规划与执行Python工作流,处理实时气候数据,同时由一组独立的审查模型对其方法进行全面审核。
多层防御架构
CMIP-Forge引入了一种多层防御架构,通过可执行机制强制实施物理和方法不变性,包括抽象语法树(AST)静态分析、经过审计的科学原语及自主对抗性同行评审协议。我们通过涵盖大气遥相关、海洋动力学、区域极端和全球变暖预测的端到端自主研究管道展示了系统的能力。
自主研究工作流
一个基于同行评审文献、受限于自动化代码保护机制并由独立对抗性审查循环审核的自主分析系统,能够独立完成复杂的气候研究工作流。这些实验暴露了审查循环的具体失败模式(如拍马屁回归、未解决的REVISE裁决以及提交审查的存根代码),这些都可以通过与文章一起发布的不变遥测和来源记录进行诊断。
博主点评: CMIP-Forge代表了气候科学研究的一个重要进步,通过结合实时数据分析与文献检索,显著提高了研究效率。然而,系统中仍存在审查机制的潜在问题,这需要进一步优化以确保研究的质量与可靠性。