[AI学术] 深度评估基础模型在多模态癌症分析中的表现与信任度

摘要

基础模型（FMs）作为医学数据的强大表示提取器，逐渐受到关注，但其在分布变化下的泛化能力仍未得到充分探讨。本研究系统性地评估了基于FM的表示在两组真实商业数据集IH-BC和IH-NSCLC上的计算病理任务表现，这些数据源自授权的内部（IH）肿瘤数据集。

分析集中于来自IH多模态数据的两种模态：全幻灯片图像和转录组特征。我们首先基准测试了五个FMs在八个下游分类任务中的单模态探测性能，发现图像和组学表示携带互补的预测信号。接着，我们通过比较基于配对表示的三种图像-组学融合策略，研究了多模态融合是否能在单模态基线之上带来额外收益。

此外，通过保形预测评估所选单模态和多模态管道的可信度。结果显示，FM表示在分布外数据上实现了竞争力的性能，且当单一模态信号不占主导时，多模态融合尤为有效。保形预测表明，在大多数点预测失败的情况下，真实诊断仍可在预测集中恢复，进一步强化了基于不确定性的推理在临床支持中的价值。

博主点评： 本研究对基础模型在多模态癌症分析中的应用进行了全面评估，展示了不同模态之间的互补性及融合策略的有效性，强调了在临床环境中不确定性管理的重要性。该研究为未来的医学AI应用提供了重要的参考和启示。