原文:Wang X, Yang X, Zhang S, et al. Consistent Teacher Provides Better Supervision in Semi-supervised Object Detection[J]. arXiv preprint arXiv:2209.01589, 2022.
在这项研究中,我们深入探讨了半监督目标检测(SSOD)中的独特挑战。我们观察到目前的检测器普遍存在3种不一致问题。(1)匹配不一致,即传统匹配策略对标注噪声敏感。(2)子任务不一致,即分类和回归预测在同一特征点不一致。(3)时间不一致,即在不同的训练步骤中,伪bboxes会发生显著变化。这些问题导致学生网络的优化目标不一致,进而导致模型性能下降,收敛速度变慢。为了应对上述挑战,我们提出了一个系统的解决方案,称为Consistent-Teacher。首先,我们用自适应锚匹配替代基于IoU的静态策略,使学生网络能够抵抗噪声干扰。然后,我们通过特征对齐模块来校准子任务预测。最后,我们采用高斯混合模型(GMM)动态调整伪bboxes的阈值。Consistent-Teacher为一系列SSOD评估提供了新的强大基线。Consistent-Teacher仅使用10%的MS-COCO标注数据,用ResNet-50就达到了40.0 mAP,超过之前的基线约4 mAP。当同时使用10%的MS-COCO标注数据和90%的无标注数据时,Consistent-Teacher的性能进一步提高到了49.1 mAP。
图1:(a)匹配不一致问题。(b)分类-回归子任务不一致问题。(c)时间不一致问题。
图2:Consistent-Teacher的流程图。
图3:Consistent-Teacher中不同PB-bboxes的匹配结果。黄色和红色矩形分别表示正特征点和负特征点。每个矩形内的数字表示其匹配成本。
图4:Consistent-Teacher的检测头结构。左侧为头部结构,右侧为3D FAM模块。
图5:两种高斯混合的分数分布和拟合结果。正、负分布分别用橙色和蓝色线条表示。蓝色虚线表示最终阈值。
表1:使用IOU-Confidence线性回归误差进行分类和回归不一致性分析。
图6:训练步数和噪声比对IOU匹配分数的影响。
图7:GMM阈值随训练步数的变化情况。
表2:在COCO-partial基准上,Consistent-Teacher与其他半监督检测器的比较。所有模型均采用ResNet50-FPN作为骨干网络。
表3:在VOC-partial基准上,Consistent-Teacher与其他半监督检测器的比较。所有模型均采用ResNet50-FPN作为骨干网络。
表4:在COCO-addition基准上的实验结果。
表5:在COCO 10%基准上,IOU-based和ASA匹配方案的比较。
表6:检测头结构的消融研究。
表7:基于GMM的伪标签过滤方法的消融研究。
表8:在不同比例的COCO标记数据上,GMM的消融研究。
图8:仅使用10%的COCO标记数据微调Consistent-Teacher和Mean-Teacher的定性结果比较。紫色边框是预测结果,橙色边框是真实结果。红色边框是假阳性预测结果。
图9:仅使用10%的COCO标记数据微调Consistent-Teacher的良好检测结果。紫色边框是预测结果,橙色边框是真实结果。
图10:仅使用10%的COCO标记数据微调Consistent-Teacher的失败检测结果。紫色边框是预测结果,橙色边框是真实结果。
表9:用于有标记图像的数据增强方法。
表10:用于无标记图像的弱数据增强。
表11:用于无标记图像的强数据增强。
表12:Appearance transformations。
表13:Geometric transformations。
本文系统地研究了半监督目标检测中的三种不一致问题,即匹配不一致、分类-回归子任务不一致和时间不一致。为了缓解上述挑战,我们提出了一种简单有效的半监督目标检测器,称为Consistent-Teacher。我们引入了Consistent anchor assignment和FAM方法,使分类和回归任务保持一致。我们利用高斯混合模型(GMM)动态调整自训练阈值,以解决时间不一致的问题。Consistent-Teacher为一系列SSOD评估提供了新的强大基线。
多模态人工智能
为人类文明进步而努力奋斗^_^↑
欢迎关注“
多模态人工智能
”公众号^_^↑