Python深度學(xué)習(xí)線性代數(shù)示例詳解
標(biāo)量
標(biāo)量由普通小寫字母表示(例如,x、y和z)。我們用 R \mathbb{R} R表示所有(連續(xù))實(shí)數(shù)標(biāo)量的空間。
標(biāo)量由只有一個(gè)元素的張量表示。下面代碼,我們實(shí)例化了兩個(gè)標(biāo)量,并使用它們執(zhí)行一些熟悉的算數(shù)運(yùn)算,即加法、乘法、除法和指數(shù)。
import torch x = torch.tensor([3.0]) y = torch.tensor([2.0]) x + y, x * y, x / y, x ** y
tensor([5]), tensor([6]), tensor([1.5]), tensor([9])
向量
向量是標(biāo)量值組成的列表,我們將這些標(biāo)量值稱為向量的元素或分量。
在數(shù)學(xué)表示法中,我們通常將向量記為粗體、小寫的符號(hào)(例如, x \mathbf{x} x、 y \mathbf{y} y和 z \mathbf{z} z)
我們通過一維張量處理向量。一般來說,張量可以具有任意長度,最大長度取決于機(jī)器的內(nèi)存限制。
x = torch.arange(4)
tensor([0, 1, 2, 3])
大量文獻(xiàn)認(rèn)為列向量是向量的默認(rèn)方向。在數(shù)學(xué)中,向量 x \mathbf{x} x可以寫為:
我們可以通過張量的索引來訪問任一元素。
x[3]
tensor(3)
長度、維度和形狀
在數(shù)學(xué)表示法中,如果我們想說一個(gè)向量 x \mathbf{x} x由 n n n個(gè)實(shí)值標(biāo)量組成,我們可以將其表示為 x ∈ R n \mathbf{x} \in \mathbb{R}^{n} x∈Rn。向量的長度通常稱為向量的維度。
與普通的Python數(shù)組一樣,我們可以通過調(diào)用Python的內(nèi)置len()函數(shù)來訪問張量的長度。
len(x)
4
當(dāng)用張量表示一個(gè)向量(只有一個(gè)軸)時(shí),我們也可以通過.shape屬性訪問向量的長度。形狀(shape)是一個(gè)元組,列出了張量沿每個(gè)軸的長度(維數(shù))。對(duì)于只有一個(gè)軸的張量,形狀只有一個(gè)元素。
x.shape
torch.Size([4])
注意,維度(dimension)這個(gè)詞在不同上下文時(shí)往往會(huì)有不同的含義,這經(jīng)常會(huì)使人感到困惑。為了清楚起見,我們?cè)诖嗣鞔_一下。向量或軸的維度被用來表示向量或軸的長度,即向量或軸的元素?cái)?shù)量。然而,張量的維度用來表示張量具有的軸數(shù)。在這個(gè)意義上,張量的某個(gè)軸的維數(shù)就是這個(gè)軸的長度。
矩陣
當(dāng)矩陣具有相同數(shù)量的行和列時(shí),其形狀將變?yōu)檎叫危灰虼?,它被稱為方矩陣。
當(dāng)調(diào)用函數(shù)來實(shí)例化張量時(shí),我們可以通過指定兩個(gè)分量m和n來創(chuàng)建一個(gè)形狀為 m×n的矩陣。
A = torch.arange(20).reshape(5, 4)
tensor([[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11], [12, 13, 14, 15], [16, 17, 18, 19]])
A.T
tensor([[0, 4, 8, 12, 16], [1, 5, 9, 13, 17], [2, 6, 10, 14, 18], [3, 7, 11, 15, 19]])
矩陣是有用的數(shù)據(jù)結(jié)構(gòu):它們?cè)试S我們組織具有不同變化模式的數(shù)據(jù)。例如,我們矩陣中的行可能對(duì)應(yīng)于不同的房屋(數(shù)據(jù)樣本),而列可能對(duì)應(yīng)于不同的屬性。因此,盡管單個(gè)向量的默認(rèn)方向是列向量,但在表示表格數(shù)據(jù)集的矩陣中,將每個(gè)數(shù)據(jù)樣本作為矩陣中的行向量更為常見。
張量
張量為我們提供了描述具有任意數(shù)量軸的 n n n維數(shù)組的通用方法。
當(dāng)我們開始處理圖像時(shí),張量將變得更加重要,圖像以 n n n維數(shù)組形式出現(xiàn),其中3個(gè)軸對(duì)應(yīng)于高度、寬度以及一個(gè)通道(channel)軸,用于堆疊顏色通道(紅色、綠色和藍(lán)色)?,F(xiàn)在,我們將跳過高階張量,集中在基礎(chǔ)知識(shí)上。
X = torch.arange(24).reshape(2, 3, 4)
tensor([[[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11]], [[12, 13, 14, 15], [16, 17, 18, 19], [20, 21, 22, 23]]])
張量算法的基本性質(zhì)
任何按元素的一元運(yùn)算都不會(huì)改變其操作數(shù)的形狀。同樣,給定具有相同形狀的任意兩個(gè)張量,任何按元素二元運(yùn)算的結(jié)果都將是相同形狀的張量。例如,將兩個(gè)相同形狀的矩陣相加會(huì)在這兩個(gè)矩陣上執(zhí)行元素的加法。
A = torch.arange(20, dtype=torch.float32).reshape(5,4) B = A.clone A, A + B
tensor([[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11], [12, 13, 14, 15], [16, 17, 18, 19]]), tensor([[0, 2, 4, 6], [8, 10, 12, 14], [16, 18, 20, 22], [24, 26, 28, 30], [32, 34, 36, 38]])
具體而言,兩個(gè)矩陣按元素乘法稱為哈達(dá)瑪積。
A * B
tensor([[0, 1, 4, 9], [16, 25, 36, 49], [64, 81, 100, 121], [144, 169, 196, 225], [256, 289, 324, 361]])
將張量乘以或加上一個(gè)標(biāo)量不會(huì)改變張量的形狀,其中張量的每個(gè)元素都將與標(biāo)量相加或相乘。
降維
我們可以對(duì)任意張量進(jìn)行一個(gè)有用的操作是計(jì)算其元素的和。在代碼中,我們可以調(diào)用計(jì)算求和的函數(shù):
x = torch.arange(4, dtype = torch.float32) x.sum()
tensor(6)
默認(rèn)的情況下,調(diào)用求和函數(shù)會(huì)沿所有的軸降低張量的維度,使它變?yōu)橐粋€(gè)標(biāo)量。我們還可以指定張量沿哪一個(gè)軸來通過求和降低維度。以矩陣為例,為了通過求和所有行的元素來降維(軸0),我們可以在調(diào)用函數(shù)時(shí)指定axis = 0。由于輸入矩陣沿著0軸降維以生成輸出張量,因此輸入的軸0的維數(shù)在輸出形狀中丟失。
A.shape
torch.Size([5, 4])
A_sum_axis0 = A.sum(axis = 0) A_sum_axis0, A_sum_axis0.shape
tensor([40, 45, 50, 55]), torch.Size([4])
指定axis = 1將通過匯總所有列的元素降維(軸1)。因此,輸入的軸1的維數(shù)在輸出形狀中消失。
A_sum_axis1 = A.sum(axis = 1) A_sum_axis1, A_sum_axis1.shape
tensor([6, 22, 38, 54, 70]), torch.Size([5])
沿著行和列對(duì)矩陣求和,等價(jià)于對(duì)矩陣的所有元素進(jìn)行求和。
A.sum(axis=[0, 1])
tensor(190)
一個(gè)與求和相關(guān)的量是平均值。在代碼中,我們可以調(diào)用函數(shù)來計(jì)算任意形狀張量的平均值。
A.mean()
同樣,計(jì)算平均值的函數(shù)也可以沿指定軸降低張量的維度。
A.mean(axis = 0)
點(diǎn)積
最基本的操作是點(diǎn)積。
給定兩個(gè)向量,點(diǎn)積是它們相同位置的按元素乘積的和。
y = torch.ones(4, dtype = torch.float32) x, y, torch.dot(x, y)
tensor([0, 1, 2, 3]), tensor([1, 1, 1, 1]), tensor(6)
矩陣-矩陣乘法
在下面的代碼中,我們?cè)贏和B上執(zhí)行矩陣乘法。這里的A是一個(gè)5行4列的矩陣,B是一個(gè)4行3列的矩陣。相乘后,我們得到一個(gè)5行3列的矩陣。
B = torch.ones(4, 3) torch.mm(A, B)
范數(shù)
線性代數(shù)中最有用的一些運(yùn)算符是范數(shù)。非正式地說,一個(gè)向量的范數(shù)告訴我們一個(gè)向量有多大。這里考慮的大?。╯ize)概念不涉及維度,而是分量的大小。
在線性代數(shù)中,向量范數(shù)是將向量映射到標(biāo)量的函數(shù) f f f。向量范數(shù)要滿足一些屬性。給定任意向量 x \mathbf{x} x,第一個(gè)性質(zhì)來說,如果我們按常數(shù)因子 α \alpha α縮放向量的所有元素,其范數(shù)也會(huì)按相同常數(shù)因子的絕對(duì)值縮放:
第二個(gè)性質(zhì)是我們熟悉的三角不等式:
第三個(gè)性質(zhì)簡單地說范數(shù)必須是非負(fù)的。
最后一個(gè)性質(zhì)要求范數(shù)最小為0,當(dāng)且僅當(dāng)向量全由0組成。
u = torch.tensor([3, 4]) torch.norm(u)
u = torch.tensor([3, 4]) torch.abs(u).sum()
tensor(7)
torch.norm(torch.ones((4, 9)))
范數(shù)和目標(biāo):
在深度學(xué)習(xí)中,我們經(jīng)常試圖解決優(yōu)化問題:最大化分配給觀測(cè)數(shù)據(jù)的概率;最小化預(yù)測(cè)和真實(shí)觀測(cè)之間的距離。用向量表示物品(如單詞、產(chǎn)品或新聞文章),以便最小化相似項(xiàng)目之間的距離,最大化不同項(xiàng)目之間的距離。通常,目標(biāo),或許是深度學(xué)習(xí)算法最終要的組成部分(除了數(shù)據(jù)),被表達(dá)為范數(shù)。
以上就是Python深度學(xué)習(xí)線性代數(shù)示例詳解的詳細(xì)內(nèi)容,更多關(guān)于Python線性代數(shù)的資料請(qǐng)關(guān)注本站其它相關(guān)文章!
版權(quán)聲明:本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請(qǐng)保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學(xué)習(xí)參考,不代表本站立場(chǎng),如有內(nèi)容涉嫌侵權(quán),請(qǐng)聯(lián)系alex-e#qq.com處理。