Python深度學習pytorch神經(jīng)網(wǎng)絡填充和步幅的理解
上圖中,輸入的高度和寬度都為3,卷積核的高度和寬度都為2,生成的輸出表征的維度為 2 × 2 2\times2 2×2。從上圖可看出卷積的輸出形狀取決于輸入形狀和卷積核的形狀。
填充
以上面的圖為例,在應用多層卷積時,我們常常丟失邊緣像素。
解決這個問題的簡單方法即為填充(padding):在輸入圖像的邊界填充元素(通常填充元素是0)。
例如,在上圖中我們將 3 × 3 3\times3 3×3輸入填充到 5 × 5 5\times5 5×5,那么它的輸出就增加為 4 × 4 4\times4 4×4。變換如下圖所示:
步幅
在計算互相關時,卷積窗口從輸入張量的左上角開始,向下和向右滑動。在前面的例子中,我們默認每次滑動一個元素。但是,有時候為了高效計算或是縮減采樣次數(shù),卷積窗口可以跳過中間位置,每次滑動多個元素。
我們將每次滑動元素的數(shù)量稱為步幅(stride)。下圖展現(xiàn)的是垂直步幅為3,水平步幅為2的二維互相關運算。
以上就是Python深度學習pytorch神經(jīng)網(wǎng)絡填充和步幅的理解的詳細內(nèi)容,更多關于pytorch神經(jīng)網(wǎng)絡填充和步幅的資料請關注本站其它相關文章!
版權聲明:本站文章來源標注為YINGSOO的內(nèi)容版權均為本站所有,歡迎引用、轉載,請保持原文完整并注明來源及原文鏈接。禁止復制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務器上建立鏡像,否則將依法追究法律責任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學習參考,不代表本站立場,如有內(nèi)容涉嫌侵權,請聯(lián)系alex-e#qq.com處理。