如何解决神经网络输入图片尺寸固定问题

Post author:xfxia
Post published:2023年9月26日
Post category:其他

如题,

这个问题很实际，总的就是两种思路。

**1.**从图像数据入手，最简单最粗暴的方法就是resize到指定大小，虽然简单粗暴，但是有效。但是这个也要因任务而异，比如普通的图像分类问题，resize一下可能无碍，然而物体检测时物体发生了形变，可能就会很影响效果，这时候需要使用更加精细的resize手段。或者你可以crop特定位置的图像区域，这样需要一定的额外算法或者人工的辅助，操作起来不如resize。

**2.**从模型入手，比如物体检测中使用的SPP-Net，取消了全连接层的设计，就可以支持任意大小输入。事实上，全连接层是制约输入大小的关键因素，因为卷积和池化层根本不care你输入尺寸是多少，他们只管拿到前一层的feature map，然后做卷积池化输出就好了，只有全连接层，因为权重维度固定了，就不能改了，这样层层向回看，才导致了所有的尺寸都必须固定才可以。

来自知乎

CNN在分类图片时图片大小不一怎么办

你可能也喜欢