NVIDIA RTX 3080 Ti顯卡怎么樣 NVIDIA RTX 3080 Ti顯卡全面評(píng)測(cè)
受到芯片短缺以及礦潮影響,近一年的DIY市場(chǎng)尤其混亂,其中又以顯卡最為畸形,原本5499元首發(fā)的GeForce RTX 3080已經(jīng)被炒到了15000左右,價(jià)格翻了3倍。而不久前NVIDIA在官方博客中再次宣布,后續(xù)推出的RTX 30系顯卡,除了RTX 3090外將全部從芯片層面限制挖礦,包括之前已經(jīng)推出的RTX 3060/3060 Ti/3070/3080,以及后續(xù)將要推出的顯卡,今天大家期待已久的GeForce RTX 3080 Ti終于來了。
此次我們根據(jù)9個(gè)方面來全面分析一下NVIDIA的顯卡能力,趕緊看看吧
GeForce RTX 3080 Ti
GeForce RTX 3080 Ti細(xì)節(jié)特寫
關(guān)于此次發(fā)布的GeForce RTX 3080 Ti顯卡,想必大家主要關(guān)心的有這幾點(diǎn),首先是價(jià)格和性能,其次是供貨量,能不能買到。由于此次的顯卡全部限制了哈希率,也就是以太坊挖礦,所以會(huì)減少礦工的涌入。在6月1日臺(tái)北電腦展發(fā)布會(huì)上,已經(jīng)公布了售價(jià)為8999元,但國內(nèi)目前買不到,所以只能期待一波非公版的顯卡了,不同廠商會(huì)根據(jù)公版定價(jià)酌情加價(jià),但首發(fā)價(jià)格一定是比較低的,大家不妨去搶一波。
01GA102核心的第三張卡
下面我們先來看看在架構(gòu)上有哪些改動(dòng),官方白皮書上對(duì)比的對(duì)象為GeForce RTX 2080 Ti,相較于上一代的NVIDIA Turing架構(gòu),NVIDIA Ampere架構(gòu)下的GeForce RTX 3080 Ti每個(gè)時(shí)鐘執(zhí)行2次著色器運(yùn)算,而Turing為1次,RTX 3080 Ti的著色器性能達(dá)到34 TFLOPS單精度性能,而Turing為14 TFLOPS。
第一代NVIDIA RTX架構(gòu) Turing下的RTX 2080 Ti
第二代NVIDIA RTX架構(gòu) Ampere下的RTX 3080 Ti
NVIDIAAmpere架構(gòu)翻倍了光線與三角形的相交吞吐量,RT Core達(dá)到67 RTTFLOPS,而Turing為43 RT TFLOPS。而且第二代光線追蹤最重要的不僅僅是性能提升,還增加了對(duì)游戲中運(yùn)動(dòng)模糊部分場(chǎng)景的光線追蹤計(jì)算加速。
第三代Tensor Core可自動(dòng)識(shí)別并消除不太重要的DNN權(quán)重,處理稀疏網(wǎng)絡(luò)的速率是Turing的兩倍,算力高達(dá)273 TensorTFLOPS,而Turing為114 TensorTFLOPS。
GeForce RTX 3080 Ti仍然采用了GA102核心,與GeForce RTX 3080/3090相同,下面我們來看一看RTX 3080 Ti在GA102中做了哪些改動(dòng)。
完整的GA102核心
完整的GA102 GPU包含7個(gè)GPC(圖形處理集群)42個(gè)TPC(紋理處理集群)以及84個(gè)SM(流處理器)組成,而RTX 3080 Ti的CUDA數(shù)量是10240個(gè),所以可以推斷RTX 3080 Ti屏蔽了兩組TPC,所以只有80個(gè)SM單元,而完整GA102核心的CUDA數(shù)量應(yīng)該是10752個(gè)。
為了查詢方便,筆者將這幾款顯卡的核心參數(shù)列出,可以看到RTX 3080 Ti與RTX 3090的核心參數(shù)非常接近。相差的兩個(gè)SM單元,也就是1組TPC,256個(gè)CUDA,其實(shí)在實(shí)際應(yīng)用中來講差距并不是很大,最重要的是RTX 3090相比RTX 3080 Ti多了12GB的顯存;而相比RTX 3080來說提升就非常大了。
可能有用戶會(huì)問,既然和RTX 3090的差距如此小,那這張卡的定位是什么?筆者個(gè)人感覺RTX 3080 Ti更多的還是為游戲玩家而準(zhǔn)備,24GB的顯存其實(shí)大部分游戲是用不到的,當(dāng)然8K除外。
渲染8K素材占用了17GB顯存
但在專業(yè)渲染軟件中,渲染8K或4K素材的顯存占用率非常高,能達(dá)到17GB甚至更高,這對(duì)于只有12GB顯存的RTX 3080 Ti就完全不夠了,爆顯存的危害想必大家也知道,可以導(dǎo)致游戲或軟件崩潰,從而進(jìn)程丟失。
02NVIDIA Ampere架構(gòu)GA102解析
GeForce RTX 3080 Ti采用了GA102核心,擁有280億(28000 million)個(gè)晶體管,628平方毫米的面積,基于三星的8nm NVIDIA定制工藝,來自Micron的GDDR6X顯存。
本次NVIDIAAmpere的SM在Turing基礎(chǔ)上增加了一倍的FP32運(yùn)算單元,這使得每個(gè)SM的FP32運(yùn)算單元數(shù)量提高了一倍,同時(shí)吞吐量也就變?yōu)榱艘槐丁?/p>
而通常我們計(jì)算顯卡的CUDA數(shù)量,并不是把SM中的所有單元加起來計(jì)數(shù),而是只統(tǒng)計(jì)FP32單元的數(shù)量,所以這樣一來,SM中的【FP32 : INT32】 從 1:1 變?yōu)?2:1。
GeForce RTX 3080 Ti共有10240個(gè)CUDA,其實(shí)它有5120個(gè)INT32單元,但由于內(nèi)部的FP32數(shù)量翻了一倍,所以最終實(shí)現(xiàn)了10240的CUDA數(shù)量。
而這樣粗暴的提升CUDA數(shù)量對(duì)于游戲其實(shí)有著非常大的幫助,通常在游戲中浮點(diǎn)運(yùn)算相比整數(shù)計(jì)算要常用的多,圖形、算法以及各種計(jì)算操作中著色器工作負(fù)載通常需要混合使用FP32算數(shù)指令,而FP32的加速也有助于光線追蹤降噪著色器。
在去年與GeForce RTX 30系顯卡一同發(fā)布的還有一項(xiàng)新技術(shù)——RTX IO。目前很多游戲動(dòng)輒幾十G甚至百G的安裝空間,對(duì)于存儲(chǔ)空間的負(fù)擔(dān)暫且不提,但存放在硬盤中的數(shù)據(jù),如果顯卡想要讀取到,需要先由CPU從硬盤中讀取壓縮過的數(shù)據(jù),經(jīng)過解壓縮再發(fā)送到顯存中。
雖然隨著NVMe SSD的推出,讀取速度相較機(jī)械硬盤能夠快20倍,但受制于傳統(tǒng)I/O限制,NVMe高達(dá)7GB/秒的高速讀寫對(duì)于CPU是極大的負(fù)擔(dān)。
傳統(tǒng)的數(shù)據(jù)交換
在這個(gè)過程中,會(huì)占用多個(gè)CPU核心,壓力急劇增大,占用較多的內(nèi)存,而此時(shí)其實(shí)GPU是處于閑置狀態(tài)的。RTX IO的作用就是越過CPU解壓再傳輸數(shù)據(jù)這一步,直接從PCIE總線讀取硬盤上經(jīng)過壓縮的數(shù)據(jù),并且完成無損GPU解壓,降低CPU占用,變向提升了性能。
RTX IO可以極大解放CPU負(fù)擔(dān)
當(dāng)然這項(xiàng)技術(shù)作為系統(tǒng)底層的運(yùn)行方式改變,還需要借助微軟發(fā)布的DirectStorage來實(shí)現(xiàn),對(duì)于目前容量的游戲來說,RTX IO的改善效果有限,但假以時(shí)日等游戲容量上百G成為常態(tài)的時(shí)候,這項(xiàng)技術(shù)將會(huì)發(fā)揮巨大的功效。
同時(shí)搭配新增的HDMI 2.1接口,可以支持單線8K的視頻輸出,而上一代HDMI 2.0僅支持4K 98Hz的視頻輸出,如果想要連接8K電視,則需要更多的線纜支持。
03GeForce RTX 3080 Ti外觀
首先還是來看一下外觀,在外包裝上相比之前的公版沒有變化,不過GeForce RTX 3080 Ti這款顯卡本身相比GeForce RTX 3080在細(xì)節(jié)上還是有不少變化的。
GeForce RTX 3080 Ti
GeForce RTX 3080 Ti配件盒展示
外包裝依舊是禮盒形式的,收藏感滿滿,在拿出顯卡后下方是轉(zhuǎn)接線和說明書的配件盒,因?yàn)榇舜喂嫒圆捎脝?2pin的供電插槽,所以需要轉(zhuǎn)換成雙8pin的接口才能使用。
GeForce RTX 3080 Ti 正面
拿出顯卡后我們先來看一下正面(由于公版軸流式設(shè)計(jì),兩側(cè)均有風(fēng)扇,我們以插入機(jī)箱后的方向來區(qū)分反正面),相比GeForce RTX 3080的設(shè)計(jì)整體基本無改動(dòng),不過邊框部分的內(nèi)角從啞光改為了鏡面,這種略帶跳躍的視覺效果相比之前的設(shè)計(jì)更好看。
GeForce RTX 3080 Ti 內(nèi)角的金屬光澤
GeForce RTX 3080 Ti上機(jī)后燈光效果
另外在這次GeForce RTX 3080 Ti中出了顯卡側(cè)面的GeForce RTX的logo燈,在正面還增加了一個(gè)“X”的燈光效果,不過由于是顯卡自內(nèi)而外發(fā)出的燈效,所以并不明顯,需要在較暗的環(huán)境下才能看出。
GeForce RTX 3080 Ti背面
GeForce RTX 3080 Ti邊框部位NVIDIA logo
顯卡背面部分(雖然這看起來更像正面),基本沒有改動(dòng),邊框配色為淡淡的玫瑰金,包括極細(xì)微的NVIDIA logo。
GeForce RTX 3080 Ti 單12pin供電接口
在GeForce RTX 3080 Ti顯卡的側(cè)面,可以看到單12pin的供電接口,從整體來看它比較靠近中間部位,但我們都知道公版卡采用了高度緊湊的PCB板,長度也小于一般尺寸,所以其實(shí)供電接口已經(jīng)位于板子的尾部,沒有往右挪的空間了。根據(jù)NVIDIA官方說明,GeForce RTX 3080 Ti的單卡功耗為350W,下面我們也會(huì)詳細(xì)測(cè)試。
GeForce RTX 3080 Ti視頻接口
GeForce RTX 3080 Ti的擋板部位顏色也和GeForce RTX 3080不同,后者采用了與散熱鰭片相同的黑色,而在新版的GeForce RTX 3080 Ti中也改為了正常的金屬色,未作特殊處理。接口方面的配置依舊為DP 1.4*3+HDMI 2.1*1的4接口設(shè)計(jì),另外由于新的HDMI 2.1協(xié)議,最高已可支持單線8K的視頻輸出。
散熱系統(tǒng)示意
另外如果是第一次了解公版顯卡的朋友們,這里再給大家說一下?lián)醢宀课贿@個(gè)奇怪的“柵欄”的用處,由于公版卡采用了雙軸流式設(shè)計(jì),正面及背面均有散熱風(fēng)扇,正面風(fēng)扇為主動(dòng)吸入冷空氣為GPU降溫,擋板部位則是排出熱空氣的“出風(fēng)口”,而背面的風(fēng)扇則是向上排出顯卡內(nèi)熱空氣的作用。
043DMARK 理論性能測(cè)試
首先介紹一下測(cè)試平臺(tái),為了保證此次評(píng)測(cè)能夠發(fā)揮GeForce RTX 3080 Ti顯卡的最佳性能,主板和CPU采用了目前桌面旗艦級(jí)配置,具體如下。
在測(cè)試成績上,基準(zhǔn)測(cè)試采用3DMARK,游戲性能測(cè)試使用游戲自帶Benchmark,同時(shí)為了減小誤差,每項(xiàng)測(cè)試成績均測(cè)試3遍取平均值。
GPU-Z參數(shù)
首先看一下GPU-Z的參數(shù),GeForce RTX 3080 Ti采用GA102核心,三星8nm工藝,芯片面積628平方毫米,擁有10240個(gè)CUDA,1665MHz頻率。采用12GB GDDR6X顯存,位寬為384bit,顯存帶寬達(dá)到了912.4 GB/s,光柵單元和紋理單元為112和320。
下面先進(jìn)行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對(duì)應(yīng)顯卡在1080P、2K、4K的理論性能,取顯卡分?jǐn)?shù)實(shí)際測(cè)試結(jié)果如下:
3D MARK FS套裝測(cè)試
在針對(duì)顯卡DX11性能的3DMARK FS套裝測(cè)試中,我們選擇了上代和本代的4張顯卡進(jìn)行分值對(duì)比,以便能更好的反應(yīng)GeForce RTX 3080 Ti的性能水平。
可以看到GeForce RTX 3080 Ti的性能基本與GeForce RTX 3090相同,差距微乎其微。另外對(duì)比GeForce RTX 3080則提高了不少,整體差距在11%左右。而對(duì)比上一代旗艦GeForce RTX 2080 Ti整體提升約為40%。
3D MARK TS套裝測(cè)試
而在針對(duì)DX12環(huán)境下的Time Spy和Time Spy Extreme測(cè)試中,GeForce RTX 3080 Ti的分?jǐn)?shù)與GeForce RTX 3090的分?jǐn)?shù)差距則要大一些,達(dá)到4%左右。而對(duì)比GeForce RTX 3080的分?jǐn)?shù)要高出7%左右;對(duì)比上一代GeForce RTX 2080 Ti的分?jǐn)?shù)要高出43%左右。
3D MARK 光追測(cè)試
PortRoyal是3DMARK中專門針對(duì)光追性能的測(cè)試項(xiàng),在這組測(cè)試中GeForce RTX 3080 Ti的表現(xiàn)依舊緊咬GeForce RTX 3090,分?jǐn)?shù)差距不超過1%;對(duì)比GeForce RTX 3080的分?jǐn)?shù)提升約為11%;對(duì)比上一代GeForce RTX 2080 Ti的分?jǐn)?shù)提升則非常大,約為60%。
05游戲性能測(cè)試
在游戲性能測(cè)試中,我們選擇了《德軍總部新血脈》、《孤島驚魂5》、《刺客信條:英靈殿》、《無主之地》,國產(chǎn)游戲《邊境》、《光明記憶:無限》的benchmark跑分軟件。
另外在游戲測(cè)試中,由于顯卡驅(qū)動(dòng)的版本更新和游戲更新非常影響游戲幀數(shù),所有benchmark跑分成績均以本次成績?yōu)闇?zhǔn)。
《刺客信條:英靈殿》游戲測(cè)試
在游戲?qū)崪y(cè)中我們更印證了前面的說法,GeForce RTX 3080 Ti和GeForce RTX 3090的大部分分?jǐn)?shù)相同,僅有1-2幀的差距。而GeForce RTX 3080的分?jǐn)?shù)差距在1080P和2K分辨率下也并不大,主要是4K分辨率會(huì)有10%左右的差距。
《德軍總部新血脈》游戲測(cè)試
《德軍總部新血脈》并且由于自帶兩個(gè)benchmark,所以我們的數(shù)據(jù)取跑分均值,另外這款游戲幾乎每更新一次驅(qū)動(dòng)或者游戲版本升級(jí)都會(huì)導(dǎo)致分?jǐn)?shù)的巨大差異,在本次重新測(cè)試中,GeForce RTX 3080 Ti與GeForce RTX 3090的差距依舊微乎其微,而相比GeForce RTX 3080的提升約為4%左右。
《孤島驚魂5》游戲測(cè)試
《孤島驚魂5》同樣算是優(yōu)化比較到位的3A大作,GeForce RTX 3080 Ti均能達(dá)到100幀以上的流暢運(yùn)行標(biāo)準(zhǔn),其中4K分辨率下的成績要領(lǐng)先GeForce RTX 3080 15%左右。
《無主之地3》游戲測(cè)試
《無主之地3》是一款采用了卡通渲染風(fēng)格的游戲,它對(duì)于性能要求的下限很低而上限又很高,在1080P分辨率下GeForce RTX 3080 Ti能夠跑到147幀,而在4K分辨率下打了對(duì)折僅有70幀。
《光明記憶:無限》游戲測(cè)試
《光明記憶:無限》是由飛燕群島工作室開發(fā)的《光明記憶》新系列,目前還沒有游戲提供試玩,不過benchmark的跑分軟件官方已經(jīng)提供,玩家可以在steam上自行下載。另外我們?cè)跍y(cè)試的時(shí)候由于無法關(guān)閉光追選項(xiàng),故所有測(cè)試成績均為“RTX 最高/DLSS 質(zhì)量”模式下進(jìn)行。在這款游戲的benchmark中出現(xiàn)了驚人的分?jǐn)?shù)一致情況,雖然多測(cè)試幾遍肯定會(huì)有所不同,但在整體趨同的情況下意義不大。
版權(quán)聲明:本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請(qǐng)保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學(xué)習(xí)參考,不代表本站立場(chǎng),如有內(nèi)容涉嫌侵權(quán),請(qǐng)聯(lián)系alex-e#qq.com處理。