Consistent Teacher：一种简单有效的半监督目标检测器

Post author:xfxia
Post published:2023年9月26日
Post category:其他

原文：Wang X, Yang X, Zhang S, et al. Consistent Teacher Provides Better Supervision in Semi-supervised Object Detection[J]. arXiv preprint arXiv:2209.01589, 2022.

在这项研究中，我们深入探讨了半监督目标检测(SSOD)中的独特挑战。我们观察到目前的检测器普遍存在3种不一致问题。(1)匹配不一致，即传统匹配策略对标注噪声敏感。(2)子任务不一致，即分类和回归预测在同一特征点不一致。(3)时间不一致，即在不同的训练步骤中，伪bboxes会发生显著变化。这些问题导致学生网络的优化目标不一致，进而导致模型性能下降，收敛速度变慢。为了应对上述挑战，我们提出了一个系统的解决方案，称为Consistent-Teacher。首先，我们用自适应锚匹配替代基于IoU的静态策略，使学生网络能够抵抗噪声干扰。然后，我们通过特征对齐模块来校准子任务预测。最后，我们采用高斯混合模型(GMM)动态调整伪bboxes的阈值。Consistent-Teacher为一系列SSOD评估提供了新的强大基线。Consistent-Teacher仅使用10%的MS-COCO标注数据，用ResNet-50就达到了40.0 mAP，超过之前的基线约4 mAP。当同时使用10%的MS-COCO标注数据和90%的无标注数据时，Consistent-Teacher的性能进一步提高到了49.1 mAP。

图1：(a)匹配不一致问题。(b)分类-回归子任务不一致问题。(c)时间不一致问题。

图2：Consistent-Teacher的流程图。

图3：Consistent-Teacher中不同PB-bboxes的匹配结果。黄色和红色矩形分别表示正特征点和负特征点。每个矩形内的数字表示其匹配成本。

图4：Consistent-Teacher的检测头结构。左侧为头部结构，右侧为3D FAM模块。

图5：两种高斯混合的分数分布和拟合结果。正、负分布分别用橙色和蓝色线条表示。蓝色虚线表示最终阈值。

表1：使用IOU-Confidence线性回归误差进行分类和回归不一致性分析。

图6：训练步数和噪声比对IOU匹配分数的影响。

图7：GMM阈值随训练步数的变化情况。

表2：在COCO-partial基准上，Consistent-Teacher与其他半监督检测器的比较。所有模型均采用ResNet50-FPN作为骨干网络。

表3：在VOC-partial基准上，Consistent-Teacher与其他半监督检测器的比较。所有模型均采用ResNet50-FPN作为骨干网络。

表4：在COCO-addition基准上的实验结果。

表5：在COCO 10%基准上，IOU-based和ASA匹配方案的比较。

表6：检测头结构的消融研究。

表7：基于GMM的伪标签过滤方法的消融研究。

表8：在不同比例的COCO标记数据上，GMM的消融研究。

图8：仅使用10%的COCO标记数据微调Consistent-Teacher和Mean-Teacher的定性结果比较。紫色边框是预测结果，橙色边框是真实结果。红色边框是假阳性预测结果。

图9：仅使用10%的COCO标记数据微调Consistent-Teacher的良好检测结果。紫色边框是预测结果，橙色边框是真实结果。

图10：仅使用10%的COCO标记数据微调Consistent-Teacher的失败检测结果。紫色边框是预测结果，橙色边框是真实结果。

表9：用于有标记图像的数据增强方法。

表10：用于无标记图像的弱数据增强。

表11：用于无标记图像的强数据增强。

表12：Appearance transformations。

表13：Geometric transformations。

本文系统地研究了半监督目标检测中的三种不一致问题，即匹配不一致、分类-回归子任务不一致和时间不一致。为了缓解上述挑战，我们提出了一种简单有效的半监督目标检测器，称为Consistent-Teacher。我们引入了Consistent anchor assignment和FAM方法，使分类和回归任务保持一致。我们利用高斯混合模型(GMM)动态调整自训练阈值，以解决时间不一致的问题。Consistent-Teacher为一系列SSOD评估提供了新的强大基线。

多模态人工智能

为人类文明进步而努力奋斗^_^↑

欢迎关注“

多模态人工智能

”公众号^_^↑

你可能也喜欢