摘要
交并比(IoU)作为评估候选提案与真实标注空间对齐的重要指标,直接决定了正样本集的质量及视觉检测模型的训练效果。通过理论建模和分析,我们发现了IoU响应曲线上的一个非敏感区域,在此区域内,样本即使具有不同的几何重叠,依然会产生几乎相同的IoU分数。
为了解决这一局限性,我们引入了一套形态相似性度量,涵盖面积、形状和长宽比,以优化正样本分配过程,从而确保更具辨别力和可靠性的匹配。通过多维相似性均值聚合的方式,我们得出了一个补充匹配分数,弥补了IoU在表示结构对应关系上的固有局限性。
从理论上讲,融入形态相似性重塑了匹配函数的响应分布,产生有效的方向梯度和多边形状的等响应轮廓,紧密限制了每个真实实例周围的高响应区域,并显著提高了正样本选择的精度。基于YOLOv9框架的实验结果表明,在NEUDET和GC10-DET数据集上,性能均有持续提升。值得注意的是,所提方法完全可插拔,并且不会增加额外的推理开销,从而确保工业视觉检测的部署效率。
博主点评: 本文通过引入形态相似性度量,有效提升了表面缺陷检测的准确性,解决了IoU在几何重叠评价上的不足,具有较强的理论与实践意义,值得关注。尤其是在工业应用中的高效性,凸显了其实际价值。