如何解决神经网络输入图片尺寸固定问题

  • Post author:
  • Post category:其他


如题,

这个问题很实际,总的就是两种思路。

**1.**从图像数据入手,最简单最粗暴的方法就是resize到指定大小,虽然简单粗暴,但是有效。但是这个也要因任务而异,比如普通的图像分类问题,resize一下可能无碍,然而物体检测时物体发生了形变,可能就会很影响效果,这时候需要使用更加精细的resize手段。或者你可以crop特定位置的图像区域,这样需要一定的额外算法或者人工的辅助,操作起来不如resize。

**2.**从模型入手,比如物体检测中使用的SPP-Net,取消了全连接层的设计,就可以支持任意大小输入。事实上,全连接层是制约输入大小的关键因素,因为卷积和池化层根本不care你输入尺寸是多少,他们只管拿到前一层的feature map,然后做卷积池化输出就好了,只有全连接层,因为权重维度固定了,就不能改了,这样层层向回看,才导致了所有的尺寸都必须固定才可以。

来自知乎

CNN在分类图片时图片大小不一怎么办