class CNNMnist(nn.Module):
def init(self, args):
super(CNNMnist, self).init()
self.conv1 = nn.Conv2d(args.num_channels, 10, kernel_size=5)
self.conv2 = nn.Conv2d(10, 20, kernel_size=5)
self.conv2_drop = nn.Dropout2d()
self.fc1 = nn.Linear(320, 50)
self.fc2 = nn.Linear(50, args.num_classes)
def forward(self, x):
x = F.relu(F.max_pool2d(self.conv1(x), 2))
x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
x = x.view(-1, x.shape[1]*x.shape[2]*x.shape[3])
x = F.relu(self.fc1(x))
x = F.dropout(x, training=self.training)
x = self.fc2(x)
return F.log_softmax(x, dim=1)
conv2_drop 是一个 Dropout 层。Dropout 是一种正则化技术,用于防止神经网络过拟合。在训练过程中,Dropout 层会随机地将其输入单元的一部分设置为 0,这有助于使模型更加健壮,不会过度依赖训练集中的任何单个输入。在这种情况下,nn.Dropout2d() 是一个二维 Dropout,它会随机地将整个通道置 0,这在卷积神经网络中特别有用。这意味着在训练过程中,整个特征图(在卷积层 conv2 之后)会被随机地关闭。这有助于防止过拟合,并增强模型的泛化能力。在测试阶段,Dropout 层不会起作用,所有的神经元都会被使用。
x = x.view(-1, x.shape[1]*x.shape[2]*x.shape[3]):然后,x 的形状被改變(或者說被展平),以便可以被全連接層處理。這一步通常被稱為展平(flattening)。
x = F.dropout(x, training=self.training):然後,x 通過一個 Dropout 層,這有助於防止過擬合。注意,Dropout 層只在訓練階段起作用,在測試階段,所有神經元都會被使用。
輸入num_channels圖像,輸出num_classes個對應相似度(轉換為概率密度),選取最大相似度class作為結果