[AI学术] 利用地理基础模型提升滑坡检测：Clay-CNN混合模型的探索

摘要

快速的滑坡事件后映射对于灾害响应至关重要，但由于极端类别不平衡，自动化检测仍然困难。本文研究了Geo-Foundational Model (GFM) Clay v1.5在Landslide4Sense (L4S)基准上的表现，该基准包含3799个训练样本，包含14个Sentinel-2和地形波段，正样本像素约占2%。

我们比较了三种策略：

将Clay作为主要编码器并结合多尺度残差地形融合；
在瓶颈处增强U-Net主干网络的Clay语义上下文；
标准U-Net基线。

经过测试，采用两阶段低秩适应（LoRA）的混合U-Net + Clay模型在三个种子上的最佳测试F1达到了64.5 +/- 1.8%，超越了仅使用Clay的主干（55.2 +/- 3.6%）和标准U-Net基线（59.9%）。

虽然Clay作为独立编码器的表现不如U-Net，原因在于缺乏多尺度跳跃连接，但其预训练表示在作为辅助上下文注入时，始终能提升性能。这些发现表明，当GFMs与空间细节丰富的卷积架构相结合时，对于滑坡检测效果最佳，而非简单替代。

博主点评： 本文展示了地理基础模型在滑坡检测中的潜力，通过与U-Net结合，显著提高了检测效果。这一研究不仅为灾害响应提供了新的思路，也为未来的模型设计提供了重要参考，强调了多尺度融合的重要性。