banner
Alexeisie

AlexEisie

啊? Email: alexeisie@brs.red
github

CNN Mnist训练集卷积神经网络案例

class CNNMnist(nn.Module):
    def __init__(self, args):
        super(CNNMnist, self).__init__()
        self.conv1 = nn.Conv2d(args.num_channels, 10, kernel_size=5)
        self.conv2 = nn.Conv2d(10, 20, kernel_size=5)
        self.conv2_drop = nn.Dropout2d()
        self.fc1 = nn.Linear(320, 50)
        self.fc2 = nn.Linear(50, args.num_classes)

    def forward(self, x):
        x = F.relu(F.max_pool2d(self.conv1(x), 2))
        x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
        x = x.view(-1, x.shape[1]*x.shape[2]*x.shape[3])
        x = F.relu(self.fc1(x))
        x = F.dropout(x, training=self.training)
        x = self.fc2(x)
        return F.log_softmax(x, dim=1)

conv2_drop 是一个 Dropout 层。Dropout 是一种正则化技术,用于防止神经网络过拟合。在训练过程中,Dropout 层会随机地将其输入单元的一部分设置为 0,这有助于使模型更加健壮,不会过度依赖训练集中的任何单个输入。在这种情况下,nn.Dropout2d () 是一个二维 Dropout,它会随机地将整个通道置 0,这在卷积神经网络中特别有用。这意味着在训练过程中,整个特征图(在卷积层 conv2 之后)会被随机地关闭。这有助于防止过拟合,并增强模型的泛化能力。在测试阶段,Dropout 层不会起作用,所有的神经元都会被使用。
x = x.view (-1, x.shape [1]*x.shape [2]*x.shape [3]):然后,x 的形状被改变(或者说被展平),以便可以被全连接层处理。这一步通常被称为展平(flattening)。
x = F.dropout (x, training=self.training):然后,x 通过一个 Dropout 层,这有助于防止过拟合。注意,Dropout 层只在训练阶段起作用,在测试阶段,所有神经元都会被使用。

输入 num_channels 图像,输出 num_classes 个对应相似度(转换为概率密度),选取最大相似度 class 作为结果

加载中...
此文章数据所有权由区块链加密技术和智能合约保障仅归创作者所有。