国产精品1024免费视频,久久精品人人做人人妻人人玩

神經(jīng)網(wǎng)絡(luò)框架使用方法及設(shè)計(jì)思想

在框自己手寫架上基本模仿pytorch，用以學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的基本算法，如前向傳播、反向傳播、各種層、各種激活函數(shù)
采用面向?qū)ο蟮乃枷脒M(jìn)行編程，思路較為清晰
想要神經(jīng)網(wǎng)絡(luò)的同學(xué)們可以參考一下
代碼大體框架較為清晰，但不否認(rèn)存在丑陋的部分，以及對(duì)于pytorch的拙劣模仿

項(xiàng)目介紹

MINST_recognition:

手寫數(shù)字識(shí)別，使用MINST數(shù)據(jù)集

訓(xùn)練30輪可以達(dá)到93%準(zhǔn)確度，訓(xùn)練500輪左右達(dá)到95%準(zhǔn)確度無(wú)法繼續(xù)上升

RNN_sin_to_cos:

使用循環(huán)神經(jīng)網(wǎng)絡(luò)RNN，用sin的曲線預(yù)測(cè)cos的曲線

目前仍有bug，無(wú)法正常訓(xùn)練

框架介紹

與框架有關(guān)的代碼都放在了mtorch文件夾中
使用流程

與pytorch相似，需要定義自己的神經(jīng)網(wǎng)絡(luò)、損失函數(shù)、梯度下降的優(yōu)化算法等等

在每一輪的訓(xùn)練中，先獲取樣本輸入將其輸入到自己的神經(jīng)網(wǎng)絡(luò)中獲取輸出。然后將預(yù)測(cè)結(jié)果和期望結(jié)果交給損失函數(shù)計(jì)算loss，并通過loss進(jìn)行梯度的計(jì)算，最后通過優(yōu)化器對(duì)神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行更新。

結(jié)合代碼理解更佳👇：

以下是使用MINST數(shù)據(jù)集的手寫數(shù)字識(shí)別的主體代碼

	# 定義網(wǎng)絡(luò) define neural network
	class DigitModule(Module):
	 def __init__(self):
	  # 計(jì)算順序就會(huì)按照這里定義的順序進(jìn)行
	  sequential = Sequential([
	layers.Linear2(in_dim=ROW_NUM * COLUM_NUM, out_dim=16, coe=2),
	layers.Relu(16),
	layers.Linear2(in_dim=16, out_dim=16, coe=2),
	layers.Relu(16),
	layers.Linear2(in_dim=16, out_dim=CLASS_NUM, coe=1),
	layers.Sigmoid(CLASS_NUM)
	  ])
	  super(DigitModule, self).__init__(sequential)
	
	
	module = DigitModule()  # 創(chuàng)建模型 create module
	loss_func = SquareLoss(backward_func=module.backward)  # 定義損失函數(shù) define loss function
	optimizer = SGD(module, lr=learning_rate)  # 定義優(yōu)化器 define optimizer
	
	
	for i in range(EPOCH_NUM):  # 共訓(xùn)練EPOCH_NUM輪
	 trainning_loss = 0  # 計(jì)算一下當(dāng)前一輪訓(xùn)練的loss值，可以沒有
	 for data in train_loader:  # 遍歷所有樣本，train_loader是可迭代對(duì)象，保存了數(shù)據(jù)集中所有的數(shù)據(jù)
	  imgs, targets = data  # 將數(shù)據(jù)拆分成圖片和標(biāo)簽
	  outputs = module(imgs)  # 將樣本的輸入值輸入到自己的神經(jīng)網(wǎng)絡(luò)中
	  loss = loss_func(outputs, targets, transform=True)  # 計(jì)算loss / calculate loss
	  trainning_loss += loss.value
	  loss.backward()  # 通過反向傳播計(jì)算梯度 / calculate gradiant through back propagation
	  optimizer.step()  # 通過優(yōu)化器調(diào)整模型參數(shù) / adjust the weights of network through optimizer
	 if i % TEST_STEP == 0:  # 每訓(xùn)練TEST_STEP輪就測(cè)試一下當(dāng)前訓(xùn)練的成果
	  show_effect(i, module, loss_func, test_loader, i // TEST_STEP)
	  print("{} turn finished, loss of train set = {}".format(i, trainning_loss))

接下來(lái)逐個(gè)介紹編寫的類，這些類在pytorch中都有同名同功能的類，是仿照pytorch來(lái)的：

Module類

與pytorch不同，只能有一個(gè)Sequential類（序列），在該類中定義好神經(jīng)網(wǎng)絡(luò)的各個(gè)層和順序，然后傳給Module類的構(gòu)造函數(shù)
正向傳播：調(diào)用Sequential的正向傳播
反向傳播：調(diào)用Sequential的反向傳播
目前為止，這個(gè)類的大部分功能與Sequential相同，只是套了個(gè)殼保證與pytorch相同

lossfunction

有不同的loss函數(shù)，構(gòu)造函數(shù)需要給他指定自己定義的神經(jīng)網(wǎng)絡(luò)的反向傳播函數(shù)
調(diào)用loss函數(shù)會(huì)返回一個(gè)Loss類的對(duì)象，該類記錄了loss值。
通過調(diào)用Loss類的.backward()方法就可以實(shí)現(xiàn)反向傳播計(jì)算梯度
內(nèi)部機(jī)制：
內(nèi)部其實(shí)就是調(diào)用了自己定義的神經(jīng)網(wǎng)絡(luò)的反向傳播函數(shù)
也算是對(duì)于pytorch的一個(gè)拙劣模仿，完全沒必要，直接通過Module調(diào)用就好

優(yōu)化器：

目前只實(shí)現(xiàn)了隨機(jī)梯度下降SGD
構(gòu)造函數(shù)的參數(shù)是自己定義的Module。在已經(jīng)計(jì)算過梯度之后，調(diào)用optimizer.step()改變Module內(nèi)各個(gè)層的參數(shù)值
內(nèi)部機(jī)制：
目前由于只有SGD一種算法，所以暫時(shí)也只是一個(gè)拙劣模仿
就是調(diào)用了一下Module.step()，再讓Module調(diào)用Sequential.step()，最后由Sequential調(diào)用內(nèi)部各個(gè)層的Layer.step()實(shí)現(xiàn)更新
梯度值在loss.backward的時(shí)候計(jì)算、保存在各個(gè)層中了

Layer類

有許多不同的層

共性
前向傳播：

接受一個(gè)輸入進(jìn)行前向傳播計(jì)算，輸出一個(gè)輸出
會(huì)將輸入保存起來(lái)，在反向傳播中要用

反向傳播：

接受前向傳播的輸出的梯度值，計(jì)算自身參數(shù)（如Linear中的w和b）的梯度值并保存起來(lái)
輸出值為前向傳播的輸入的梯度值，用來(lái)讓上一層（可能沒有）繼續(xù)進(jìn)行反向傳播計(jì)算
這樣不同的層之間就可以進(jìn)行任意的拼裝而不妨礙前向傳播、反向傳播的進(jìn)行了

.step方法

更新自身的參數(shù)值（也可能沒有，如激活層、池化層）

Sequential類

這個(gè)類也是繼承自Layer，可以當(dāng)作一層來(lái)使用

它把多個(gè)層按照順序拼裝到一起，在前向、反向傳播時(shí)按照順序進(jìn)行計(jì)算

結(jié)合它的forward、backward方法來(lái)理解：

	def forward(self, x):
	 out = x
	 for layer in self.layers:
	  out = layer(out)
	 return out
	
	def backward(self, output_gradiant):
	 layer_num = len(self.layers)
	 delta = output_gradiant
	 for i in range(layer_num - 1, -1, -1):
	  # 反向遍歷各個(gè)層, 將期望改變量反向傳播
	  delta = self.layers[i].backward(delta)
	
	def step(self, lr):
	 for layer in self.layers:
	  layer.step(lr)

RNN類：循環(huán)神經(jīng)網(wǎng)絡(luò)層

繼承自Layer，由于內(nèi)容比較復(fù)雜故單獨(dú)說(shuō)明一下

RNN內(nèi)部由一個(gè)全連接層Linear和一個(gè)激活層組成

前向傳播

 def forward(self, inputs):
	  """
	  :param inputs: input = (h0, x) h0.shape == (batch, out_dim) x.shape == (seq, batch, in_dim)
	  :return: outputs: outputs.shape == (seq, batch, out_dim)
	  """
	  h = inputs[0]  # 輸入的inputs由兩部分組成
	  X = inputs[1]
	  if X.shape[2] != self.in_dim or h.shape[1] != self.out_dim:
	# 檢查輸入的形狀是否有問題
	raise ShapeNotMatchException(self, "forward: wrong shape: h0 = {}, X = {}".format(h.shape, X.shape))
	
	  self.seq_len = X.shape[0]  # 時(shí)間序列的長(zhǎng)度
	  self.inputs = X  # 保存輸入，之后的反向傳播還要用
	  output_list = []  # 保存每個(gè)時(shí)間點(diǎn)的輸出
	  for x in X:
	# 按時(shí)間序列遍歷input
	# x.shape == (batch, in_dim), h.shape == (batch, out_dim)
	h = self.activation(self.linear(np.c_[h, x]))
	output_list.append(h)
	  self.outputs = np.stack(output_list, axis=0)  # 將列表轉(zhuǎn)換成一個(gè)矩陣保存起來(lái)
	  return self.outputs

反向傳播

	def backward(self, output_gradiant):
	 """
	 :param output_gradiant: shape == (seq, batch, out_dim)
	 :return: input_gradiant
	 """
	 if output_gradiant.shape != self.outputs.shape:
	  # 期望得到(seq, batch, out_dim)形狀
	  raise ShapeNotMatchException(self, "__backward: expected {}, but we got "
	"{}".format(self.outputs.shape, output_gradiant.shape))
	
	 input_gradients = []
	 # 每個(gè)time_step上的虛擬weight_gradient, 最后求平均值就是總的weight_gradient
	 weight_gradients = np.zeros(self.linear.weights_shape())
	 bias_gradients = np.zeros(self.linear.bias_shape())
	 batch_size = output_gradiant.shape[1]
	
	 # total_gradient: 前向傳播的時(shí)候是將x, h合成為一個(gè)矩陣，所以反向傳播也先計(jì)算這個(gè)大矩陣的梯度再拆分為x_grad, h_grad
	 total_gradient = np.zeros((batch_size, self.out_dim + self.in_dim))
	 h_gradient = None
	 
	 # 反向遍歷各個(gè)時(shí)間層，計(jì)算該層的梯度值
	 for i in range(self.seq_len - 1, -1, -1):
	  # 前向傳播順序: x, h -> z -> h
	  # 所以反向傳播計(jì)算順序：h_grad -> z_grad -> x_grad, h_grad, w_grad, b_grad
	
	  # %%%%%%%%%%%%%%計(jì)算平均值的版本%%%%%%%%%%%%%%%%%%%%%%%
	  # h_gradient = (output_gradiant[i] + total_gradient[:, 0:self.out_dim]) / 2
	  # %%%%%%%%%%%%%%不計(jì)算平均值的版本%%%%%%%%%%%%%%%%%%%%%%%
	  #  計(jì)算h_grad: 這一時(shí)間點(diǎn)的h_grad包括輸出的grad和之前的時(shí)間點(diǎn)計(jì)算所得grad兩部分
	  h_gradient = output_gradiant[i] + total_gradient[:, 0:self.out_dim]  
	
	  # w_grad和b_grad是在linear.backward()內(nèi)計(jì)算的，不用手動(dòng)再計(jì)算了
	  z_gradient = self.activation.backward(h_gradient)  # 計(jì)算z_grad
	  total_gradient = self.linear.backward(z_gradient)  # 計(jì)算x_grad和h_grad合成的大矩陣的梯度
	
	  # total_gradient 同時(shí)包含了h和x的gradient, shape == (batch, out_dim + in_dim)
	  x_gradient = total_gradient[:, self.out_dim:]
	
	  input_gradients.append(x_gradient)  
	  weight_gradients += self.linear.gradients["w"]
	  bias_gradients += self.linear.gradients["b"]
	
	 # %%%%%%%%%%%%%%%%%%計(jì)算平均值的版本%%%%%%%%%%%%%%%%%%%%%%%
	 # self.linear.set_gradients(w=weight_gradients / self.seq_len, b=bias_gradients / self.seq_len)
	 # %%%%%%%%%%%%%%%%%%不計(jì)算平均值的版本%%%%%%%%%%%%%%%%%%%%%%%
	 self.linear.set_gradients(w=weight_gradients, b=bias_gradients)  # 設(shè)置梯度值
	 
	 list.reverse(input_gradients)  # input_gradients是逆序的，最后輸出時(shí)需要reverse一下
	 print("sum(weight_gradients) = {}".format(np.sum(weight_gradients)))
	 
	 # np.stack的作用是將列表轉(zhuǎn)變成一個(gè)矩陣
	 return np.stack(input_gradients), h_gradient

以上就是numpy創(chuàng)建神經(jīng)網(wǎng)絡(luò)框架的詳細(xì)內(nèi)容，更多關(guān)于numpy神經(jīng)網(wǎng)絡(luò)的資料請(qǐng)關(guān)注本站其它相關(guān)文章！

國(guó)外服務(wù)器租用

版權(quán)聲明：本站文章來(lái)源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有，歡迎引用、轉(zhuǎn)載，請(qǐng)保持原文完整并注明來(lái)源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站，禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像，否則將依法追究法律責(zé)任。本站部分內(nèi)容來(lái)源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來(lái)，僅供學(xué)習(xí)參考，不代表本站立場(chǎng)，如有內(nèi)容涉嫌侵權(quán)，請(qǐng)聯(lián)系alex-e#qq.com處理。

排名優(yōu)化：網(wǎng)站排名優(yōu)化方法有什么，如何做有效果

老域名：怎樣才算老域名，老域名建站有什么影響

內(nèi)容優(yōu)化：關(guān)鍵字排名要做哪些方面的優(yōu)化，怎樣做

技巧：網(wǎng)站轉(zhuǎn)化率究竟是什么，有什么提升的技巧

一下吧：外貿(mào)站優(yōu)化有哪些基本的做法和注意事項(xiàng)

概要：競(jìng)價(jià)推廣費(fèi)用大概要多少呢，競(jìng)價(jià)推廣好不好

一下吧：SEO中site是什么意思，作用和應(yīng)用是怎樣的

郵箱：付費(fèi)郵箱有哪些優(yōu)勢(shì)，付費(fèi)郵箱挑選要考慮什么

集群是什么意思：集群是什么意思，都有哪些優(yōu)勢(shì)呢