class CNNMnist(nn.Module):
def __init__(self, args):
super(CNNMnist, self).__init__()
self.conv1 = nn.Conv2d(args.num_channels, 10, kernel_size=5)
self.conv2 = nn.Conv2d(10, 20, kernel_size=5)
self.conv2_drop = nn.Dropout2d()
self.fc1 = nn.Linear(320, 50)
self.fc2 = nn.Linear(50, args.num_classes)
def forward(self, x):
x = F.relu(F.max_pool2d(self.conv1(x), 2))
x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
x = x.view(-1, x.shape[1]*x.shape[2]*x.shape[3])
x = F.relu(self.fc1(x))
x = F.dropout(x, training=self.training)
x = self.fc2(x)
return F.log_softmax(x, dim=1)
conv2_drop は Dropout 層です。Dropout は過学習を防ぐための正則化技術です。訓練中、Dropout 層は入力ユニットの一部をランダムに 0 に設定し、モデルが訓練セットの任意の単一の入力に過度に依存しないようにします。この場合、nn.Dropout2d () は 2 次元の Dropout であり、畳み込みニューラルネットワークで特に有用です。つまり、訓練中に畳み込み層 conv2 の後の全ての特徴マップがランダムにオフになります。これは過学習を防ぎ、モデルの汎化能力を向上させます。テスト段階では、Dropout 層は機能せず、すべてのニューロンが使用されます。
x = x.view (-1, x.shape [1]*x.shape [2]*x.shape [3]):次に、x の形状が変更され(またはフラット化され)、全結合層で処理できるようになります。このステップは通常、フラット化と呼ばれます。
x = F.dropout (x, training=self.training):次に、x は Dropout 層を通過し、過学習を防ぎます。注意してください、Dropout 層は訓練段階でのみ機能し、テスト段階ではすべてのニューロンが使用されます。
num_channels の画像を入力し、num_classes 個の対応する類似度(確率密度に変換)を出力し、最大類似度の class を結果として選択します。