pytorch(6)——最大池化(pool)

  • Post author:
  • Post category:其他


最大池化有时候被称为下采样,pytorch 官网中 maxunpool,叫做上采样。

一、maxpool2d定义

以上是关于最大池化层在官网的定义:其中,参数解释如下:


kernel_size

:卷积核大小;如果输入 3 (int型),就会生成一个 3*3 的池化核;

如果输入一个 (2, 3)(Tuple型),就会生成一个 2*3 的池化核;


stride

:卷积核步长,即横向纵向的步径大小;这里的默认值和卷积层(默认1)不一样,这里默认是 kernel_size;


padding

:卷积核填充;


dilation

:是空洞卷积,也就是卷积核上,是一个隔着一个的。

普通卷积

空洞卷积


ceil_mode

:当他是 True 的时候,使用 ceil 模式,而不是floor 模式;默认为 False。

ceil_mode 详解:对于上面的数值:2.31,ceil会向上取整变成 3,floor会向下取整变成 2。在最大池化上的操作会是这样:

这个图像输入是 5*5,池化核是 3*3,每次步长为3,那他在横向移动的时候就会出现上面的情况,就是卷积核跑出来了,这时是取这六个数的最大值还是放弃就要看 ceil_mode,如果是 True,采用 ceil 模式,表示向上取整,那么这六个数字会被保留取最大值,否则就是 floor模式,这六个数字会被舍弃。整个走完结果如下:

二、实例

import torch
from torch import nn
from torch.nn import MaxPool2d

input = torch.tensor([[1, 2, 0, 3, 1],
                      [0, 1, 2, 3, 1],
                      [1, 2, 1, 0, 0],
                      [5, 2, 3, 1, 1],
                      [2, 1, 0, 1, 1]], dtype=torch.float32)
# print(input.shape)  # 输出: torch.Size([5, 5])
# 因为这里 batchsize 不符合输入要求,所以要 reshape
input = torch.reshape(input,(-1, 1, 5, 5))  # 这里填 -1 ,是模糊形状,让他自己找合适的 batch_size
# print(input.shape)  # 输出:torch.Size([1, 1, 5, 5])

class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()
        self.maxpool = MaxPool2d(kernel_size=3, ceil_mode=True)
        pass

    def forward(self, input):
        output = self.maxpool(input)
        return output


tudui = Tudui()
output = tudui(input)
print(output)
# 输出:
tensor([[[[2., 3.],
          [5., 1.]]]])
这是ceil_mode 是 True的情况,False的话就会输出2

三、作用

从上面的结果来看,输出的图片减小了,那么网络的运算量就会减小,训练的更快,例如:看视频 1080p 就是原始图像, 720p 就是池化后的图像



版权声明:本文为weixin_44674875原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。