如题,
这个问题很实际,总的就是两种思路。
**1.**从图像数据入手,最简单最粗暴的方法就是resize到指定大小,虽然简单粗暴,但是有效。但是这个也要因任务而异,比如普通的图像分类问题,resize一下可能无碍,然而物体检测时物体发生了形变,可能就会很影响效果,这时候需要使用更加精细的resize手段。或者你可以crop特定位置的图像区域,这样需要一定的额外算法或者人工的辅助,操作起来不如resize。
**2.**从模型入手,比如物体检测中使用的SPP-Net,取消了全连接层的设计,就可以支持任意大小输入。事实上,全连接层是制约输入大小的关键因素,因为卷积和池化层根本不care你输入尺寸是多少,他们只管拿到前一层的feature map,然后做卷积池化输出就好了,只有全连接层,因为权重维度固定了,就不能改了,这样层层向回看,才导致了所有的尺寸都必须固定才可以。
来自知乎
CNN在分类图片时图片大小不一怎么办