NVIDIA RTX 3070 Ti顯卡怎么樣 NVIDIA RTX 3070 Ti顯卡評(píng)測(cè)
NVIDIA RTX 3070 Ti顯卡今日首發(fā),想買的小伙伴可以準(zhǔn)備開搶了,那么這款顯卡各方面性能怎么樣呢?感興趣的朋友不要錯(cuò)過這篇評(píng)測(cè)了。
GeForce RTX 3070 Ti
而RTX 30系顯卡截止目前還未宣布哪款顯卡將停產(chǎn),如果說NVIDIA是覺得去年發(fā)布的RTX 30系顯卡定價(jià)過低,想推出Ti系列來提高售價(jià),但從已發(fā)布的GeForce RTX 3080 Ti來看,雖然價(jià)格上去了,但性能同樣約等于GeForce RTX 3090,換算過來其實(shí)價(jià)格并沒有變化。
GeForce RTX 3070 Ti
在之前的臺(tái)北電腦展上,GeForce RTX 3070 Ti的價(jià)格已經(jīng)曝光,為4499元起。在看過了GeForce RTX 3080 Ti的性能提升后,相信大家已經(jīng)迫不及待了,今天我們就來看看這款GeForce RTX 3070 Ti的性能提升如何。
01GA104核心的第二張顯卡
在核心架構(gòu)上,GeForce RTX 3070 Ti是采用GA104核心的第二張卡,官方白皮書上對(duì)比的對(duì)象為GeForce RTX 2070 SUPER,相較于上一代的NVIDIA Turing架構(gòu),NVIDIA Ampere架構(gòu)下的GeForce RTX 3070 Ti每個(gè)時(shí)鐘執(zhí)行2次著色器運(yùn)算,而Turing為1次,RTX 3070 Ti的著色器性能達(dá)到22 TFLOPS單精度性能,而Turing為9 TFLOPS。
新老兩代顯卡算力對(duì)比
NVIDIAAmpere架構(gòu)翻倍了光線與三角形的相交吞吐量,RT Core達(dá)到42 RTTFLOPS,而Turing為24 RT TFLOPS。而且第二代光線追蹤最重要的不僅僅是性能提升,還增加了對(duì)游戲中運(yùn)動(dòng)模糊部分場(chǎng)景的光線追蹤計(jì)算加速。
第三代Tensor Core可自動(dòng)識(shí)別并消除不太重要的DNN權(quán)重,處理稀疏網(wǎng)絡(luò)的速率是Turing的兩倍,算力高達(dá)174 TensorTFLOPS,而Turing為72 TensorTFLOPS。
GeForce RTX 3070 Ti采用了GA104核心,與GeForce RTX 3070相同,不過NVIDIA官方并沒有給出GA104核心架構(gòu)圖,我們?nèi)砸訥A102來做講解。
完整的GA102核心
完整的GA102 GPU包含7個(gè)GPC(圖形處理集群)42個(gè)TPC(紋理處理集群)以及84個(gè)SM(流處理器)組成,而GeForce RTX 3070 Ti的CUDA數(shù)量是6144個(gè),共有48個(gè)SM單元,也就是3個(gè)GPC 24個(gè)TPC,而剛剛發(fā)布的GeForce RTX 3080 Ti共有40個(gè)TPC 80個(gè)SM單元,這也是兩款芯片的差距所在。
公版顯卡參數(shù)表
為了查詢方便,筆者將這幾款顯卡的核心參數(shù)列出,可以看到GeForce RTX 3070與GeForce RTX 3070 Ti的差距不大,相差的兩個(gè)SM單元,和剛剛發(fā)布的GeForce RTX 3080 Ti情況基本相同,也就是1組TPC,256個(gè)CUDA。只不過GeForce RTX 3080 Ti更接近GeForce RTX 3090,而根據(jù)參數(shù)來看GeForce RTX 3070 Ti與GeForce RTX 3080還有一定差距。
GDDR6X
另外GeForce RTX 3070 Ti的顯存雖然依舊是8GB,但已經(jīng)由GDDR6更換為GDDR6X,兩者的區(qū)別主要在于頻率和帶寬上,同頻下實(shí)現(xiàn)更高的顯存帶寬可以降低成本和功耗,另外在相同時(shí)間內(nèi)GDDR6X可以比GDDR6傳輸多2倍的數(shù)據(jù)。這對(duì)于需要大量數(shù)據(jù)負(fù)載的工作尤為重要,如光線追蹤的游戲、AI學(xué)習(xí)和8K視頻渲染。
02NVIDIA Ampere架構(gòu)GA104解析
GeForce RTX 3070 Ti采用了GA104核心,擁有174億(17400 million)個(gè)晶體管,392平方毫米的面積,基于三星的8nm NVIDIA定制工藝,來自Micron的GDDR6X顯存,這里與GeForce RTX 3070的GDDR6有所區(qū)別。
本次NVIDIAAmpere的SM在Turing基礎(chǔ)上增加了一倍的FP32運(yùn)算單元,這使得每個(gè)SM的FP32運(yùn)算單元數(shù)量提高了一倍,同時(shí)吞吐量也就變?yōu)榱艘槐丁?/p>
而通常我們計(jì)算顯卡的CUDA數(shù)量,并不是把SM中的所有單元加起來計(jì)數(shù),而是只統(tǒng)計(jì)FP32單元的數(shù)量,所以這樣一來,SM中的【FP32 : INT32】 從 1:1 變?yōu)?2:1。
GeForce RTX 3070 Ti共有6144個(gè)CUDA,其實(shí)它有3072個(gè)INT32單元,但由于內(nèi)部的FP32數(shù)量翻了一倍,所以最終實(shí)現(xiàn)了6144的CUDA數(shù)量。
而這樣粗暴的提升CUDA數(shù)量對(duì)于游戲其實(shí)有著非常大的幫助,通常在游戲中浮點(diǎn)運(yùn)算相比整數(shù)計(jì)算要常用的多,圖形、算法以及各種計(jì)算操作中著色器工作負(fù)載通常需要混合使用FP32算數(shù)指令,而FP32的加速也有助于光線追蹤降噪著色器。
在去年與GeForce RTX 30系顯卡一同發(fā)布的還有一項(xiàng)新技術(shù)——RTX IO。目前很多游戲動(dòng)輒幾十G甚至百G的安裝空間,對(duì)于存儲(chǔ)空間的負(fù)擔(dān)暫且不提,但存放在硬盤中的數(shù)據(jù),如果顯卡想要讀取到,需要先由CPU從硬盤中讀取壓縮過的數(shù)據(jù),經(jīng)過解壓縮再發(fā)送到顯存中。
雖然隨著NVMe SSD的推出,讀取速度相較機(jī)械硬盤能夠快20倍,但受制于傳統(tǒng)I/O限制,NVMe高達(dá)7GB/秒的高速讀寫對(duì)于CPU是極大的負(fù)擔(dān)。
傳統(tǒng)的數(shù)據(jù)交換
在這個(gè)過程中,會(huì)占用多個(gè)CPU核心,壓力急劇增大,占用較多的內(nèi)存,而此時(shí)其實(shí)GPU是處于閑置狀態(tài)的。RTX IO的作用就是越過CPU解壓再傳輸數(shù)據(jù)這一步,直接從PCIE總線讀取硬盤上經(jīng)過壓縮的數(shù)據(jù),并且完成無損GPU解壓,降低CPU占用,變向提升了性能。
RTX IO可以極大解放CPU負(fù)擔(dān)
當(dāng)然這項(xiàng)技術(shù)作為系統(tǒng)底層的運(yùn)行方式改變,還需要借助微軟發(fā)布的DirectStorage來實(shí)現(xiàn),對(duì)于目前容量的游戲來說,RTX IO的改善效果有限,但假以時(shí)日等游戲容量上百G成為常態(tài)的時(shí)候,這項(xiàng)技術(shù)將會(huì)發(fā)揮巨大的功效。
同時(shí)搭配新增的HDMI 2.1接口,可以支持單線8K的視頻輸出,而上一代HDMI 2.0僅支持4K 98Hz的視頻輸出,如果想要連接8K電視,則需要更多的線纜支持。
03GeForce RTX 3070 Ti外觀
首先還是來看一下外觀,在外包裝上相比之前的公版沒有變化,不過顯卡本身GeForce RTX 3070 Ti更像是GeForce RTX 3080的mini版,與GeForce RTX 3070相距甚遠(yuǎn)。
GeForce RTX 3070 Ti配件盒展示
外包裝依舊是禮盒形式的,收藏感滿滿,在拿出顯卡后下方是轉(zhuǎn)接線和說明書的配件盒,因?yàn)榇舜喂嫒圆捎脝?2pin的供電插槽,所以需要轉(zhuǎn)換成雙8pin的接口才能使用。
GeForce RTX 3070 Ti
GeForce RTX 3070
顯卡正面我們對(duì)比一下GeForce RTX 3070,可以看到GeForce RTX 3070仍然采用了單面雙風(fēng)扇的設(shè)計(jì),而GeForce RTX 3070 Ti則是采用了軸流式設(shè)計(jì),兩側(cè)均有風(fēng)扇。除此之外,顯卡的整體外邊框設(shè)計(jì)基本相似。
GeForce RTX 3070 Ti
GeForce RTX 3070
GeForce RTX 3070 Ti的背面其實(shí)更像GeForce RTX 3080,包括金屬邊框以及表面的磨砂質(zhì)感,只是從體積上略小一號(hào)。
GeForce RTX 3070 Ti 內(nèi)角的金屬光澤
與GeForce RTX 3080 Ti在邊框部位的改動(dòng)相同,GeForce RTX 3070 Ti的內(nèi)角從啞光改為了鏡面,這種略帶跳躍的視覺效果相比之前的設(shè)計(jì)更好看。
GeForce RTX 3070 Ti 單12pin供電接口
在GeForce RTX 3070 Ti顯卡的側(cè)面,可以看到單12pin的供電接口,從整體來看它比較靠近中間部位,但我們都知道公版卡采用了高度緊湊的PCB板,長(zhǎng)度也小于一般尺寸,所以其實(shí)供電接口已經(jīng)位于板子的尾部,沒有往右挪的空間了。根據(jù)NVIDIA官方說明,GeForce RTX 3070 Ti的單卡功耗為290W,推薦750W及以上電源。
另外在邊框的配色上GeForce RTX 3070 Ti的顏色幾乎為純銀色,而GeForce RTX 3080和GeForce RTX 3080 Ti則為玫瑰金。
GeForce RTX 3070 Ti視頻接口
GeForce RTX 3070 Ti的擋板部位整體設(shè)計(jì)與GeForce RTX 3070相同。接口方面的配置依舊為DP 1.4a*3+HDMI 2.1*1的4接口設(shè)計(jì),另外由于新的HDMI 2.1協(xié)議,最高已可支持單線8K的視頻輸出。
043DMARK 理論性能測(cè)試
首先介紹一下測(cè)試平臺(tái),為了保證此次評(píng)測(cè)能夠發(fā)揮GeForce RTX 3080 Ti顯卡的最佳性能,主板和CPU采用了目前桌面旗艦級(jí)配置,具體如下。
在測(cè)試成績(jī)上,基準(zhǔn)測(cè)試采用3DMARK,游戲性能測(cè)試使用游戲自帶Benchmark,同時(shí)為了減小誤差,每項(xiàng)測(cè)試成績(jī)均測(cè)試3遍取平均值。
GPU-Z參數(shù)
首先看一下GPU-Z的參數(shù),GeForce RTX 3070 Ti采用GA104核心,三星8nm工藝,芯片面積392平方毫米,擁有6144個(gè)CUDA,1770MHz頻率。采用8GB GDDR6X顯存,位寬為256bit,顯存帶寬達(dá)到了608.3 GB/s,光柵單元和紋理單元為96和192。
下面先進(jìn)行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對(duì)應(yīng)顯卡在1080P、2K、4K的理論性能,取顯卡分?jǐn)?shù)實(shí)際測(cè)試結(jié)果如下:
3D MARK FS套裝測(cè)試
在針對(duì)顯卡DX11性能的3DMARK FS套裝測(cè)試中,我們選擇了上代和本代的4張顯卡進(jìn)行分值對(duì)比,以便能更好的反應(yīng)GeForce RTX 3070 Ti的性能水平。
可以看到GeForce RTX 3070 Ti的性能顯然更接近GeForce RTX 3070,整體提升10%左右;對(duì)比GeForce RTX 3080的差距為17%左右;相比上一代的GeForce RTX 2070 SUPER提升45%左右。
3D MARK TS套裝測(cè)試
而在針對(duì)DX12環(huán)境下的Time Spy和Time Spy Extreme測(cè)試中,GeForce RTX 3070 Ti的分?jǐn)?shù)提升稍弱,相比GeForce RTX 3070提升7%左右。而對(duì)比GeForce RTX 3080的分?jǐn)?shù)差距為23%左右;對(duì)比上一代GeForce RTX 2070 SUPER的分?jǐn)?shù)要高出42%左右。
3D MARK 光追測(cè)試
PortRoyal是3DMARK中專門針對(duì)光追性能的測(cè)試項(xiàng),在這組測(cè)試中GeForce RTX 3070 Ti的表現(xiàn)更貼近GeForce RTX 3070,分?jǐn)?shù)提升為6%左右;對(duì)比GeForce RTX 3080的分?jǐn)?shù)差距為31%左右;對(duì)比上一代GeForce RTX 2070 SUPER的分?jǐn)?shù)提升則非常大,約為50%。
這是比較理想的等差數(shù)列
另外我們對(duì)比了一組比較有意思的數(shù)據(jù),綜合來看目前GeForce RTX 30系顯卡性能,形成等差數(shù)列的游戲卡型號(hào)分別為RTX 3060、RTX 3060 Ti、RTX 3070 Ti以及RTX 3080,所以個(gè)人來看GeForce RTX 3070與GeForce RTX 3070 Ti的型號(hào)會(huì)有些許沖突,不知道NVIDIA后續(xù)是否會(huì)有停產(chǎn)GeForce RTX 3070的打算。
05游戲性能測(cè)試
在游戲性能測(cè)試中,我們選擇了《德軍總部新血脈》、《孤島驚魂5》、《刺客信條:英靈殿》、《無主之地》,國產(chǎn)游戲《邊境》、《光明記憶:無限》的benchmark跑分軟件。
另外在游戲測(cè)試中,由于顯卡驅(qū)動(dòng)的版本更新和游戲更新非常影響游戲幀數(shù),所有benchmark跑分成績(jī)均以本次成績(jī)?yōu)闇?zhǔn)。
《刺客信條:英靈殿》游戲測(cè)試
在游戲?qū)崪y(cè)中可以看到GeForce RTX 3070 Ti和GeForce RTX 3070的幀數(shù)差距并不明顯,平均下來為2%左右。而對(duì)比GeForce RTX 3080的分?jǐn)?shù)差距整體在12%左右。
《德軍總部新血脈》游戲測(cè)試
版權(quán)聲明:本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請(qǐng)保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學(xué)習(xí)參考,不代表本站立場(chǎng),如有內(nèi)容涉嫌侵權(quán),請(qǐng)聯(lián)系alex-e#qq.com處理。