CNN Mnist训练集卷积神经网络案例

class CNNMnist(nn.Module):
    def __init__(self, args):
        super(CNNMnist, self).__init__()
        self.conv1 = nn.Conv2d(args.num_channels, 10, kernel_size=5)
        self.conv2 = nn.Conv2d(10, 20, kernel_size=5)
        self.conv2_drop = nn.Dropout2d()
        self.fc1 = nn.Linear(320, 50)
        self.fc2 = nn.Linear(50, args.num_classes)

    def forward(self, x):
        x = F.relu(F.max_pool2d(self.conv1(x), 2))
        x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
        x = x.view(-1, x.shape[1]*x.shape[2]*x.shape[3])
        x = F.relu(self.fc1(x))
        x = F.dropout(x, training=self.training)
        x = self.fc2(x)
        return F.log_softmax(x, dim=1)

conv2_drop 是一个 Dropout 层。Dropout 是一种正则化技术，用于防止神经网络过拟合。在训练过程中，Dropout 层会随机地将其输入单元的一部分设置为 0，这有助于使模型更加健壮，不会过度依赖训练集中的任何单个输入。在这种情况下，nn.Dropout2d () 是一个二维 Dropout，它会随机地将整个通道置 0，这在卷积神经网络中特别有用。这意味着在训练过程中，整个特征图（在卷积层 conv2 之后）会被随机地关闭。这有助于防止过拟合，并增强模型的泛化能力。在测试阶段，Dropout 层不会起作用，所有的神经元都会被使用。
x = x.view (-1, x.shape [1]*x.shape [2]*x.shape [3])：然后，x 的形状被改变（或者说被展平），以便可以被全连接层处理。这一步通常被称为展平（flattening）。
x = F.dropout (x, training=self.training)：然后，x 通过一个 Dropout 层，这有助于防止过拟合。注意，Dropout 层只在训练阶段起作用，在测试阶段，所有神经元都会被使用。

输入 num_channels 图像，输出 num_classes 个对应相似度（转换为概率密度），选取最大相似度 class 作为结果