噜噜婷婷,国产精品永久久久久久久久久 ,国产精品香蕉在线观看

ResNet沿用VGG完整的KaTeX parse error: Undefined control sequence: \time at position 2: 3\̲t̲i̲m̲e̲3卷積層設(shè)計(jì)。殘差塊里首先有2個(gè)相同輸出通道數(shù)的KaTeX parse error: Undefined control sequence: \time at position 2: 3\̲t̲i̲m̲e̲3卷積層。每個(gè)卷積層后接一個(gè)批量歸一化層和ReLU激活函數(shù)。然后我們通過跨層數(shù)據(jù)通路，跳過這2個(gè)卷積運(yùn)算，將輸入直接加在最后的ReLU激活函數(shù)前。這樣的設(shè)計(jì)要求2個(gè)卷積層的輸出與輸入形狀一樣，從而可以相加。如果想改變通道數(shù)，就需要引入一個(gè)額外的 1 × 1 1\times1 1×1卷積層來(lái)講輸入變換成需要的形狀后再做相加運(yùn)算。

殘差塊的實(shí)現(xiàn)如下：

import torch
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l
class Residual(nn.Module):
	def __init__(self, input_channels, num_channels, use_1x1conv=False, strides=1):
	super().__init__()
	self.conv1 = nn.Conv2d(input_channels, num_channels, kernel_size=3, padding=1, stride=strides)
	self.conv2 = nn.Conv2d(num_channels, num_channels, kernel_size=3, padding=1)
	if use_1x1conv:
		self.conv3 = nn.Conv2d(input_channels, num_channels, kernel_size=1, stride=strides)
	else:
		self.conv3 = None
	self.bn1 = nn.BatchNorm2d(num_channels)
	self.bn2 = nn.BatchNorm2d(num_channels)
	self.relu = nn.ReLU(inplace=True)
def forward(self, X):
	Y = F.relu(self.bn1(self.conv1(X)))
	Y = self.bn2(self.conv2(Y))
	if self.conv3:
		X = self.conv3(X)
	Y += X
	return F.relu(Y)

如下圖所示，此外碼生成兩種類型的網(wǎng)絡(luò)：一種是在use_1x1conv=False、應(yīng)用ReLU非線性函數(shù)之前，將輸入添加到輸出。另一種是在use_1x1conv=True時(shí)，添加通過 1 × 1 卷積調(diào)整通道和分辨率。

下面我們來(lái)查看輸入和輸出形狀一致的情況。

blk = Residual(3, 3)
X = torch.rand(4, 3, 6, 6)
Y = blk(X)
Y.shape

torch.Size([4, 3, 6, 6])

我們也可以在增加輸出通道數(shù)的同時(shí)，減半輸出的高和寬。

blk = Residual(3, 6, use_1x1conv=True, strides=2)
blk(X).shape

torch.Size([4, 6, 3, 3])

ResNet模型

ResNet的前兩層為：在輸出通道數(shù)為64、步幅為2的 7 × 7 卷積層后，接步幅為2的 3 × 3 的最大匯聚層。不同之處在于ResNet的每個(gè)卷積層后增加了批量歸一化層。

b1 = nn.Sequential(nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3),
				nn.BatchNorm2d(64), nn.ReLU(),
				nn.MaxPool2d(kernel_size=3, stride=2, padding=1))

ResNet使用4個(gè)由殘差塊組成的模塊，每個(gè)模塊使用若干個(gè)同樣輸出通道數(shù)的殘差塊。第一個(gè)模塊的通道數(shù)同輸入通道數(shù)一致。由于之前已經(jīng)使用了步幅為2的最大匯聚層，所以無(wú)須減小高和寬。之后的每個(gè)模塊在第一個(gè)殘差塊里將上一個(gè)模塊的通道數(shù)翻倍，并將高和寬減半。

下面我們來(lái)實(shí)現(xiàn)這個(gè)模塊。注意，我們對(duì)第一個(gè)模塊做了特別處理。

def resnet_block(input_channels, num_channels, num_residuals, first_block=False):
	blk = []
	for i in range(num_residuals):
		if i == 0 and not first_block:
			blk.append(Residual(input_channels, num_channels, use_1x1conv=True, strides=2))
		else:
			blk.append(Residual(num_channels, num_channels))
	return blk

接著在ResNet加入所有殘差塊，這里每個(gè)模塊使用2個(gè)殘差塊。

b2 = nn.Sequential(*resnet_block(64, 64, 2, first_block=True))
b3 = nn.Sequential(*resnet_block(64, 128, 2))
b4 = nn.Sequential(*resnet_block(128, 256, 2))
b5 = nn.Sequential(*resnet_block(256, 512, 2))

最后，在ResNet中加入全局平均匯聚層，以及全連接層輸出。

net = nn.Sequential(b1, b2, b3, b4, b5,
					nn.AdaptiveAvgPool2d((1, 1)),
					nn.Flatten(), nn.Linear(512, 10))

每個(gè)模塊有4個(gè)卷積層（不包括恒等映射的 1 × 1 1\times1 1×1卷積層）。加上第一個(gè) 7 × 7 7\times7 7×7卷積層和最后一個(gè)全連接層，共有18層。因此，這種模型通常被稱為ResNet-18。通過配置不同的通道數(shù)和模塊里的殘差塊數(shù)可以得到不同的ResNet模型，例如更深的152層的ResNet-152。ResNet的結(jié)構(gòu)更簡(jiǎn)單，修改也更方便。這些因素都導(dǎo)致了ResNet迅速被廣泛使用。下圖描述了完整的ResNet-18。

在訓(xùn)練ResNet之前，讓我們觀察一下ResNet中的不同模塊的輸入形狀是如何變化的。在之前的所有架構(gòu)中，分辨率降低，通道數(shù)量增加，直到全局平均匯聚層聚集所有特征。

X = torch.rand(size=(1, 1, 224, 224))
for layer in net:
	X = layer(X)
	print(layer.__class__.__name__,'output shape:\t', X.shape)

Sequential output shape: torch.Size([1, 64, 56, 56])
Sequential output shape: torch.Size([1, 64, 56, 56])
Sequential output shape: torch.Size([1, 128, 28, 28])
Sequential output shape: torch.Size([1, 256, 14, 14])
Sequential output shape: torch.Size([1, 512, 7, 7])
AdaptiveAvgPool2d output shape: torch.Size([1, 512, 1, 1])
Flatten output shape: torch.Size([1, 512])
Linear output shape: torch.Size([1, 10])

訓(xùn)練模型

同之前一樣，我們?cè)贔ashion-MNIST數(shù)據(jù)集上訓(xùn)練ResNet。

lr, num_epochs, batch_size = 0.05, 10, 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=96)
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

loss 0.014, train acc 0.996, test acc 0.895
4680.2 examples/sec on cuda:0

以上就是Python深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)殘差塊的詳細(xì)內(nèi)容，更多關(guān)于Python神經(jīng)網(wǎng)絡(luò)的資料請(qǐng)關(guān)注本站其它相關(guān)文章！

版權(quán)聲明：本站文章來(lái)源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有，歡迎引用、轉(zhuǎn)載，請(qǐng)保持原文完整并注明來(lái)源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站，禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像，否則將依法追究法律責(zé)任。本站部分內(nèi)容來(lái)源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來(lái)，僅供學(xué)習(xí)參考，不代表本站立場(chǎng)，如有內(nèi)容涉嫌侵權(quán)，請(qǐng)聯(lián)系alex-e#qq.com處理。

排名優(yōu)化：網(wǎng)站排名優(yōu)化方法有什么，如何做有效果

老域名：怎樣才算老域名，老域名建站有什么影響

內(nèi)容優(yōu)化：關(guān)鍵字排名要做哪些方面的優(yōu)化，怎樣做

技巧：網(wǎng)站轉(zhuǎn)化率究竟是什么，有什么提升的技巧

一下吧：外貿(mào)站優(yōu)化有哪些基本的做法和注意事項(xiàng)

概要：競(jìng)價(jià)推廣費(fèi)用大概要多少呢，競(jìng)價(jià)推廣好不好

一下吧：SEO中site是什么意思，作用和應(yīng)用是怎樣的

郵箱：付費(fèi)郵箱有哪些優(yōu)勢(shì)，付費(fèi)郵箱挑選要考慮什么

集群是什么意思：集群是什么意思，都有哪些優(yōu)勢(shì)呢