SNIP 算法笔记

  • Post author:
  • Post category:其他


论文:An Analysis of Scale Invariance in Object Detection – SNIP

论文链接:

https://arxiv.org/abs/1711.08189


代码链接:

http://bit.ly/2yXVg4c

这篇是

CVPR2018

的文章,引用文献非常到位,同时实验结果非常惊艳,总体来看比同是CVPR2018上的cascade RCNN效果还要好一些。

概括而言,这篇文章从COCO数据集开始分析,认为目前目标检测算法的难点在于数据集中object的尺寸分布较大,尤其对于小目标的检测效果也有待提高,因此提出Scale Normalization for Image Pyramids (SNIP)

算法来解决这个问题。


先来看看这篇文章的出发点

。这篇文章的出发点可以简单概括为:

数据集

。作者发现如果将数据集按照图像中object的尺寸(scale)除以图像尺寸的倍数来排序,那么在ImageNet数据集中,这个倍数的中位数差不多是0.554倍,而在COCO数据集中,这个倍数是0.106倍,如Figure1中两条线标出的Median点所示。Figure1是关于ImageNet和COCO数据集中object尺寸和图像尺寸的倍数关系曲线,横坐标表示object的尺寸/图像尺寸的值,纵坐标表示占比。

也就是说在COCO数据集中,大部分的object面积只有图像面积的1%以下,这说明在COCO数据集中小目标占比要比ImageNet数据集大

。另外&#x



版权声明:本文为u014380165原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。