Python深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)殘差塊
ResNet沿用VGG完整的KaTeX parse error: Undefined control sequence: \time at position 2: 3\̲t̲i̲m̲e̲3卷積層設(shè)計(jì)。殘差塊里首先有2個(gè)相同輸出通道數(shù)的KaTeX parse error: Undefined control sequence: \time at position 2: 3\̲t̲i̲m̲e̲3卷積層。每個(gè)卷積層后接一個(gè)批量歸一化層和ReLU激活函數(shù)。然后我們通過跨層數(shù)據(jù)通路,跳過這2個(gè)卷積運(yùn)算,將輸入直接加在最后的ReLU激活函數(shù)前。這樣的設(shè)計(jì)要求2個(gè)卷積層的輸出與輸入形狀一樣,從而可以相加。如果想改變通道數(shù),就需要引入一個(gè)額外的 1 × 1 1\times1 1×1卷積層來(lái)講輸入變換成需要的形狀后再做相加運(yùn)算。
殘差塊的實(shí)現(xiàn)如下:
import torch from torch import nn from torch.nn import functional as F from d2l import torch as d2l class Residual(nn.Module): def __init__(self, input_channels, num_channels, use_1x1conv=False, strides=1): super().__init__() self.conv1 = nn.Conv2d(input_channels, num_channels, kernel_size=3, padding=1, stride=strides) self.conv2 = nn.Conv2d(num_channels, num_channels, kernel_size=3, padding=1) if use_1x1conv: self.conv3 = nn.Conv2d(input_channels, num_channels, kernel_size=1, stride=strides) else: self.conv3 = None self.bn1 = nn.BatchNorm2d(num_channels) self.bn2 = nn.BatchNorm2d(num_channels) self.relu = nn.ReLU(inplace=True) def forward(self, X): Y = F.relu(self.bn1(self.conv1(X))) Y = self.bn2(self.conv2(Y)) if self.conv3: X = self.conv3(X) Y += X return F.relu(Y)
如下圖所示,此外碼生成兩種類型的網(wǎng)絡(luò):一種是在use_1x1conv=False、應(yīng)用ReLU非線性函數(shù)之前,將輸入添加到輸出。另一種是在use_1x1conv=True時(shí),添加通過 1 × 1 卷積調(diào)整通道和分辨率。
下面我們來(lái)查看輸入和輸出形狀一致的情況。
blk = Residual(3, 3) X = torch.rand(4, 3, 6, 6) Y = blk(X) Y.shape
torch.Size([4, 3, 6, 6])
我們也可以在增加輸出通道數(shù)的同時(shí),減半輸出的高和寬。
blk = Residual(3, 6, use_1x1conv=True, strides=2) blk(X).shape
torch.Size([4, 6, 3, 3])
ResNet模型
ResNet的前兩層為:在輸出通道數(shù)為64、步幅為2的 7 × 7 卷積層后,接步幅為2的 3 × 3 的最大匯聚層。不同之處在于ResNet的每個(gè)卷積層后增加了批量歸一化層。
b1 = nn.Sequential(nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3), nn.BatchNorm2d(64), nn.ReLU(), nn.MaxPool2d(kernel_size=3, stride=2, padding=1))
ResNet使用4個(gè)由殘差塊組成的模塊,每個(gè)模塊使用若干個(gè)同樣輸出通道數(shù)的殘差塊。第一個(gè)模塊的通道數(shù)同輸入通道數(shù)一致。由于之前已經(jīng)使用了步幅為2的最大匯聚層,所以無(wú)須減小高和寬。之后的每個(gè)模塊在第一個(gè)殘差塊里將上一個(gè)模塊的通道數(shù)翻倍,并將高和寬減半。
下面我們來(lái)實(shí)現(xiàn)這個(gè)模塊。注意,我們對(duì)第一個(gè)模塊做了特別處理。
def resnet_block(input_channels, num_channels, num_residuals, first_block=False): blk = [] for i in range(num_residuals): if i == 0 and not first_block: blk.append(Residual(input_channels, num_channels, use_1x1conv=True, strides=2)) else: blk.append(Residual(num_channels, num_channels)) return blk
接著在ResNet加入所有殘差塊,這里每個(gè)模塊使用2個(gè)殘差塊。
b2 = nn.Sequential(*resnet_block(64, 64, 2, first_block=True)) b3 = nn.Sequential(*resnet_block(64, 128, 2)) b4 = nn.Sequential(*resnet_block(128, 256, 2)) b5 = nn.Sequential(*resnet_block(256, 512, 2))
最后,在ResNet中加入全局平均匯聚層,以及全連接層輸出。
net = nn.Sequential(b1, b2, b3, b4, b5, nn.AdaptiveAvgPool2d((1, 1)), nn.Flatten(), nn.Linear(512, 10))
每個(gè)模塊有4個(gè)卷積層(不包括恒等映射的 1 × 1 1\times1 1×1卷積層)。加上第一個(gè) 7 × 7 7\times7 7×7卷積層和最后一個(gè)全連接層,共有18層。因此,這種模型通常被稱為ResNet-18。通過配置不同的通道數(shù)和模塊里的殘差塊數(shù)可以得到不同的ResNet模型,例如更深的152層的ResNet-152。ResNet的結(jié)構(gòu)更簡(jiǎn)單,修改也更方便。這些因素都導(dǎo)致了ResNet迅速被廣泛使用。下圖描述了完整的ResNet-18。
在訓(xùn)練ResNet之前,讓我們觀察一下ResNet中的不同模塊的輸入形狀是如何變化的。在之前的所有架構(gòu)中,分辨率降低,通道數(shù)量增加,直到全局平均匯聚層聚集所有特征。
X = torch.rand(size=(1, 1, 224, 224)) for layer in net: X = layer(X) print(layer.__class__.__name__,'output shape:\t', X.shape)
Sequential output shape: torch.Size([1, 64, 56, 56]) Sequential output shape: torch.Size([1, 64, 56, 56]) Sequential output shape: torch.Size([1, 128, 28, 28]) Sequential output shape: torch.Size([1, 256, 14, 14]) Sequential output shape: torch.Size([1, 512, 7, 7]) AdaptiveAvgPool2d output shape: torch.Size([1, 512, 1, 1]) Flatten output shape: torch.Size([1, 512]) Linear output shape: torch.Size([1, 10])
訓(xùn)練模型
同之前一樣,我們?cè)贔ashion-MNIST數(shù)據(jù)集上訓(xùn)練ResNet。
lr, num_epochs, batch_size = 0.05, 10, 256 train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=96) d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())
loss 0.014, train acc 0.996, test acc 0.895 4680.2 examples/sec on cuda:0
以上就是Python深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)殘差塊的詳細(xì)內(nèi)容,更多關(guān)于Python神經(jīng)網(wǎng)絡(luò)的資料請(qǐng)關(guān)注本站其它相關(guān)文章!
版權(quán)聲明:本站文章來(lái)源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請(qǐng)保持原文完整并注明來(lái)源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來(lái)源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來(lái),僅供學(xué)習(xí)參考,不代表本站立場(chǎng),如有內(nèi)容涉嫌侵權(quán),請(qǐng)聯(lián)系alex-e#qq.com處理。