智能数字图像处理:ResNet代码(pytorch)之model.py解读

  • Post author:
  • Post category:其他


涉及到迁移学习:

1.self.conv1 = nn.Conv2d(in_channels=in_channel, out_channels=out_channel, kernel_size=3, stride=stride, padding=1, bias=False)-》第一层输入通道数和输出通道数由调用函数传参决定。

2.self.bn1 = nn.BatchNorm2d(out_channel)-》卷积层之后总会添加BatchNorm2d进行数据的归一化处理,这使得数据在进行Relu之前不会因为数据过大而导致网络性能的不稳定。

3.self.relu = nn.ReLU()-》进行一次激活。

4.self.conv2 = nn.Conv2d(in_channels=out_channel, out_channels=out_channel,kernel_size=3, stride=1, padding=1, bias=False)-》再进行一次卷积,stride=1则不改变输入 图像的大小。

5.self.bn2 = nn.BatchNorm2d(out_channel)-》归一化。

6. self.downsample = downsample-》定义下采样方法,默认为None。


前向传播模块:

1.if self.downsample is not None:

identity = self.downsample(x)-》》判断下采样不是None则对输入矩阵进行下采样。

2.然后进行卷积正则化Relu激活卷积正则化->输出加上下采样输出求和作为下一层Relu激活函数输入。作用:防止梯度消失。使网络可以变得更深。

out = self.conv1(x)

out = self.bn1(out)

out = self.relu(out)

out = self.conv2(out)

out = self.bn2(out)

out += identity

out = self.relu(out)

3.最后return out输出参差网络的处理结果。


接下来定义50层、101层和152层的参差结构:


输入56x56x256

1.self.conv1 = nn.Conv2d(in_channels=in_channel, out_channels=out_channel,

kernel_size=1, stride=1, bias=False)  # squeeze channels

self.bn1 = nn.BatchNorm2d(out_channel)->卷积层一和第一层正则化和原来一样。卷积核数量是128,输出56x56x128。深度缩小一半。

2.self.conv2 = nn.Conv2d(in_channels=out_channel, out_channels=out_channel,

kernel_size=3, stride=stride, bias=False, padding=1)

self.bn2 = nn.BatchNorm2d(out_channel)-》卷积层二kernel_size=3则处理后的图像长宽缩小一半。卷积核数量是128,输出28x28x128。长宽缩小一半。

3.self.conv3 = nn.Conv2d(in_channels=out_channel, out_channels=out_channel*self.expansion,

kernel_size=1, stride=1, bias=False)  # unsqueeze channels

self.bn3 = nn.BatchNorm2d(out_channel*self.expansion)->卷积层三卷积核大小1×1不改变图像大小,但卷积核数量变成4倍。作用是增加图像的深度。卷积核数量是128×4=512,输出28x28x512。深度增加4倍。

4.        self.relu = nn.ReLU(inplace=True



版权声明:本文为com_fang_bean原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。