FCN核心思想
- 不含全连接层的全卷积网络,可适应任意尺寸输入。
- 增大数据尺寸的反卷积(deconv)层。能够输出精细的结果。
重点知识点
- 损失函数是在最后一层的spatial map上的pixel的loss和,在每一个pixel使用softmax loss。
- 使用skip结构融合多层(3层)输出,底层网络应该可以预测更多的位置信息,因为它的感受野小可以看到小的pixels。
- 上采样lower-resolution layers时,如果采样后的图因为padding等原因和前面的图大小不同,使用crop,当裁剪成大小相同的spatially aligned,使用concat 操作融合两个层。
FCN对图像进行像素级的分类,从而解决了语义级别的图像分割问题。与经典的CNN在卷积层使用全连接层得到固定长度的特征向量进行分类不同,FCN可以接受任意尺寸的输入图像,采用反卷积层对最后一个卷积层的特征图进行上采样,使它恢复到输入图像相同的尺寸,从而可以对每一个像素都产生一个预测,同时保留了原始输入图像的空间信息,最后就在上采样的特征图进行像素的分类。
FCN是从抽象的特征中恢复出每个像素所属的类别。即从图像级别的分类进一步延伸到像素级别的分类。
简单的说,FCN与CNN的区别在于FCN把CNN最后的全连接层换成卷积层,输出一张已经label好的图。
网络结构
网络结构如下。输入可为任意尺寸图像彩色图像;输出与输入尺寸相同,深度为:20类目标+背景=21。 (在PASCAL数据集上进行的,PASCAL一共20类)
版权声明:本文为qq_37249672原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。