最大池化有时候被称为下采样,pytorch 官网中 maxunpool,叫做上采样。
一、maxpool2d定义
以上是关于最大池化层在官网的定义:其中,参数解释如下:
kernel_size
:卷积核大小;如果输入 3 (int型),就会生成一个 3*3 的池化核;
如果输入一个 (2, 3)(Tuple型),就会生成一个 2*3 的池化核;
stride
:卷积核步长,即横向纵向的步径大小;这里的默认值和卷积层(默认1)不一样,这里默认是 kernel_size;
padding
:卷积核填充;
dilation
:是空洞卷积,也就是卷积核上,是一个隔着一个的。
|
|
ceil_mode
:当他是 True 的时候,使用 ceil 模式,而不是floor 模式;默认为 False。
ceil_mode 详解:对于上面的数值:2.31,ceil会向上取整变成 3,floor会向下取整变成 2。在最大池化上的操作会是这样:
这个图像输入是 5*5,池化核是 3*3,每次步长为3,那他在横向移动的时候就会出现上面的情况,就是卷积核跑出来了,这时是取这六个数的最大值还是放弃就要看 ceil_mode,如果是 True,采用 ceil 模式,表示向上取整,那么这六个数字会被保留取最大值,否则就是 floor模式,这六个数字会被舍弃。整个走完结果如下:
二、实例
import torch
from torch import nn
from torch.nn import MaxPool2d
input = torch.tensor([[1, 2, 0, 3, 1],
[0, 1, 2, 3, 1],
[1, 2, 1, 0, 0],
[5, 2, 3, 1, 1],
[2, 1, 0, 1, 1]], dtype=torch.float32)
# print(input.shape) # 输出: torch.Size([5, 5])
# 因为这里 batchsize 不符合输入要求,所以要 reshape
input = torch.reshape(input,(-1, 1, 5, 5)) # 这里填 -1 ,是模糊形状,让他自己找合适的 batch_size
# print(input.shape) # 输出:torch.Size([1, 1, 5, 5])
class Tudui(nn.Module):
def __init__(self):
super(Tudui, self).__init__()
self.maxpool = MaxPool2d(kernel_size=3, ceil_mode=True)
pass
def forward(self, input):
output = self.maxpool(input)
return output
tudui = Tudui()
output = tudui(input)
print(output)
# 输出:
tensor([[[[2., 3.],
[5., 1.]]]])
这是ceil_mode 是 True的情况,False的话就会输出2
三、作用
从上面的结果来看,输出的图片减小了,那么网络的运算量就会减小,训练的更快,例如:看视频 1080p 就是原始图像, 720p 就是池化后的图像