Optimizing the F-measure for Threshold-free Salient Object Detection (ICCV 2019)
文件大小:
37k
资源说明:Optimizing the F-measure for Threshold-free Salient Object Detection
本文的出发点主要是基于CNN的显著性目标检测主要依赖于对交叉熵损失的优化。然后被检测的显著性图经常通过F-measure进行衡量。这篇文章调查了一个有趣的问题:在训练和衡量阶段能否一致使用F-measure?通过重新定义标准的F-measure,提出relaxed F-measure。与传统的交叉熵损失相比较,梯度在饱和区域降低更快,这个损失函数称为FLoss,甚至当激活接近目标时也有相当大梯度。因此,FLoss可以不断的迫使网络产生极化激活。
提出了FLo
《优化F-measure以实现无阈值显著对象检测》(ICCV 2019)
在当前的计算机视觉领域,显著性目标检测是一项关键任务,它通常基于卷积神经网络(CNN)进行处理。传统的做法是利用交叉熵损失函数来优化模型,然而,评估显著性检测结果时常用的是F-measure。这篇研究工作关注了一个引人入胜的问题:是否可以在训练和评估阶段统一使用F-measure?
F-measure是一种综合考虑精确度(Precision)和召回率(Recall)的评价指标,其计算公式为二者的调和平均值。对于显著性检测而言,精确度表示预测为前景的像素中有多少真正是前景,而召回率则表示所有真实前景像素中有多少被正确预测。F-measure在处理类别不平衡数据时具有优势,能平衡不同类别的贡献。
论文中,作者重新定义了标准的F-measure,提出了“松弛的F-measure”(relaxed F-measure),并设计了一个相应的损失函数——FLoss。FLoss的特点在于,它的梯度在饱和区域下降速度更快,即使在激活值接近目标时,仍然能保持较大的梯度。这种特性使得网络更容易学习到极化的激活模式,有助于区分前景与背景,从而在广泛的不同阈值下保持高性能。
FLoss的三个主要特性包括:
1. 无阈值显著对象检测。经过FLoss训练的模型能够生成对比度高的显著性图,前景与背景的界限清晰,因此在各种阈值下都能表现出色。
2. 处理不平衡数据的能力。由于F-measure是精确度和召回率的调和平均,因此它天生具备平衡不同类别样本的能力。实验结果显示,使用该方法能够在精确度和召回率之间找到更好的平衡点。
3. 快速收敛。FLoss能够在仅数百次迭代后迅速学习聚焦显著对象区域,表现出快速的收敛速度。
FLoss的推导公式及更详细的理论分析可在原始论文中找到。这项工作由作者taxuewuhenxiaoer进行,它为显著性目标检测提供了一种新的优化策略,有望改进现有模型的性能,特别是在面对复杂场景和不平衡数据集时。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。
English
