class CNNMnist(nn.Module):
def __init__(self, args):
super(CNNMnist, self).__init__()
self.conv1 = nn.Conv2d(args.num_channels, 10, kernel_size=5)
self.conv2 = nn.Conv2d(10, 20, kernel_size=5)
self.conv2_drop = nn.Dropout2d()
self.fc1 = nn.Linear(320, 50)
self.fc2 = nn.Linear(50, args.num_classes)
def forward(self, x):
x = F.relu(F.max_pool2d(self.conv1(x), 2))
x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
x = x.view(-1, x.shape[1]*x.shape[2]*x.shape[3])
x = F.relu(self.fc1(x))
x = F.dropout(x, training=self.training)
x = self.fc2(x)
return F.log_softmax(x, dim=1)
conv2_drop 是一个 Dropout 层。Dropout 是一种正则化技术,用于防止神经网络过拟合。在训练过程中,Dropout 层会随机地将其输入单元的一部分设置为 0,这有助于使模型更加健壮,不会过度依赖训练集中的任何单个输入。在这种情况下,nn.Dropout2d () 是一个二维 Dropout,它会随机地将整个通道置 0,这在卷积神经网络中特别有用。这意味着在训练过程中,整个特征图(在卷积层 conv2 之后)会被随机地关闭。这有助于防止过拟合,并增强模型的泛化能力。在测试阶段,Dropout 层不会起作用,所有的神经元都会被使用。
x = x.view (-1, x.shape [1]*x.shape [2]*x.shape [3]):然后,x 的形状被改变(或者说被展平),以便可以被全连接层处理。这一步通常被称为展平(flattening)。
x = F.dropout (x, training=self.training):然后,x 通过一个 Dropout 层,这有助于防止过拟合。注意,Dropout 层只在训练阶段起作用,在测试阶段,所有神经元都会被使用。
输入 num_channels 图像,输出 num_classes 个对应相似度(转换为概率密度),选取最大相似度 class 作为结果