摘要
快速的滑坡事件后映射对于灾害响应至关重要,但由于极端类别不平衡,自动化检测仍然困难。本文研究了Geo-Foundational Model (GFM) Clay v1.5在Landslide4Sense (L4S)基准上的表现,该基准包含3799个训练样本,包含14个Sentinel-2和地形波段,正样本像素约占2%。
我们比较了三种策略:
- 将Clay作为主要编码器并结合多尺度残差地形融合;
- 在瓶颈处增强U-Net主干网络的Clay语义上下文;
- 标准U-Net基线。
经过测试,采用两阶段低秩适应(LoRA)的混合U-Net + Clay模型在三个种子上的最佳测试F1达到了64.5 +/- 1.8%,超越了仅使用Clay的主干(55.2 +/- 3.6%)和标准U-Net基线(59.9%)。
虽然Clay作为独立编码器的表现不如U-Net,原因在于缺乏多尺度跳跃连接,但其预训练表示在作为辅助上下文注入时,始终能提升性能。这些发现表明,当GFMs与空间细节丰富的卷积架构相结合时,对于滑坡检测效果最佳,而非简单替代。
博主点评: 本文展示了地理基础模型在滑坡检测中的潜力,通过与U-Net结合,显著提高了检测效果。这一研究不仅为灾害响应提供了新的思路,也为未来的模型设计提供了重要参考,强调了多尺度融合的重要性。