云南電腦|昆明電腦|電腦批發(fā)|it行業(yè)聯(lián)盟
RTX40 SUPER系列新品共有三款,分別為RTX 4070 SUPER、RTX 4070 Ti SUPER以及RTX 4080 SUPER,RTX 4080 SUPER是唯一一款加量減價(jià)的型號(hào)。規(guī)格相比RTX 4080更強(qiáng),但起售價(jià)更低。如果從這個(gè)角度出發(fā)的話,那么RTX 4080 SUPER可以說是三款中最良心的型號(hào)。今天給大家?guī)淼氖牵瑏碜匀A碩的TUF GeForce RTX 4080 SUPER O16G GAMING(后簡(jiǎn)稱TUF RTX 4080 SUPER OC)顯卡的評(píng)測(cè)。
一、外觀設(shè)計(jì)
TUF RTX 4080 SUPER OC的包裝盒與自家RTX 4080保持一致,四個(gè)角均“切”了一刀,八邊形的設(shè)計(jì)在一眾新卡中還是很有特點(diǎn)的。
來到顯卡本體,TUF RTX 4080 SUPER OC采用的是啞黑配色,表面有磨砂處理。整體并不是特別高調(diào),很有質(zhì)感。導(dǎo)流罩與上一代保持一致,線條凌厲,棱角分明。
TUF RTX 4080 SUPER OC為三風(fēng)扇設(shè)計(jì),均為軸流風(fēng)扇。左右扇葉朝向和轉(zhuǎn)向與中間不同。左右風(fēng)扇為逆時(shí)針旋轉(zhuǎn),中間風(fēng)扇則為順時(shí)針旋轉(zhuǎn)。如此設(shè)計(jì)的原因是,可以減少亂流,提升散熱器風(fēng)量。左右風(fēng)扇中央為TUF的Logo,中央風(fēng)扇為華碩的Logo。三把風(fēng)扇均為7扇葉,支持智能停轉(zhuǎn)。
TUF RTX 4080 SUPER OC的背面采用一塊鋁制背板,最外側(cè)對(duì)應(yīng)風(fēng)扇位置為鏤空設(shè)計(jì),提升散熱能力。對(duì)應(yīng)核心、靠近頂部位置還有性能模式和安靜模式切換撥桿。這張顯卡需占用3.65槽,從頂部可以看到非常厚的散熱鰭片,內(nèi)部則有8根熱管貫穿其中,散熱規(guī)格妥妥高端水平。中央位置有12VHPWR供電接口,一側(cè)有可發(fā)光TUF的Logo,旁邊還有一條可發(fā)光的燈帶,兩者均支持ARGB。
接口方面,TUF RTX 4080 SUPER OC提供了3個(gè)DP1.4a和2個(gè)HDMI2.1a,最大支持分辨率為7680x4320。
總體來看,TUF RTX 4080 SUPER OC的外觀設(shè)計(jì)頗有一種西裝暴徒的感覺,屬于人狠話不多的角色。
二、NVIDIA GeForce RTX 4080 SUPER架構(gòu)淺析
此次新發(fā)布的三款GeForce RTX 40 SUPER顯卡依舊采用NVIDIA Ada Lovelace架構(gòu),TSMC4N英偉達(dá)定制工藝。與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可達(dá)到90-TFLOPS的著色器數(shù)據(jù)吞吐量。
RTX 4080 SUPER的核心代號(hào)為AD103-400-A1,共有10240個(gè)CUDA核心,提供了52-TFLOPS算力;80個(gè)第三代Ada RT Core擁有121RT-TFLOPS;320個(gè)第四代Tensor Core可提供836Tensor-TFLOPS(AITOPS)。
RTX 4080 SUPER的L2 Cache容量為64MB,帶寬為736GB/s。NVIDIA官方也強(qiáng)調(diào)了L2 Cache的重要性,我們以兩張圖來簡(jiǎn)單說明L2緩存的作用。
GPU獲取數(shù)據(jù)的路徑,依次是L1緩存、L2緩存、顯存和系統(tǒng)內(nèi)存。L1緩存緊鄰處理內(nèi)核,延遲非常低。GPU尋找數(shù)據(jù)的首選就是L1緩存。如果目標(biāo)數(shù)據(jù)不在L1緩存,GPU會(huì)在L2緩存中尋找。相比較L1緩存,L2緩存的延遲雖然無法做到L1緩存那么低,但容量可以做大。如果數(shù)據(jù)也不在L2緩存中,那么GPU會(huì)從顯存中尋找。再找不到就會(huì)從系統(tǒng)內(nèi)存中獲取。
其實(shí)可以看到,GPU越早獲取到數(shù)據(jù),性能和效率就會(huì)越高。由于核心和L1緩存兩者位置太近,所以L1緩存的容量不可能很大。所以,更大的L2緩存,將有效提高數(shù)據(jù)命中率,從而提高整體運(yùn)行效率。RTX 4080 SUPER擁有更大的L2緩存容量,所以命中數(shù)據(jù)的概率更高。
更多詳細(xì)的參數(shù),我們?yōu)榇蠹铱偨Y(jié)出了一張表格,可以看到,RTX 4080 SUPER的規(guī)格相比RTX 4080,CUDA增加了512個(gè),RT Core、Tensor Core和紋理單元也有所增加,提升幅度約5.2%,另外頻率和顯存帶寬稍有提升。
下面我們看一下具體的測(cè)試成績(jī)。
三、測(cè)試平臺(tái)簡(jiǎn)介
首先看一下測(cè)試平臺(tái)。
為了保證TUF RTX 4080 SUPER OC的性能表現(xiàn),處理器選擇的是英特爾14代酷睿i7-14700K,并在主板BIOS中關(guān)閉能效核。主板是來自華碩的ROG MAXIMUS Z790 DAKR HERO;內(nèi)存為兩條16GB DDR5 7200內(nèi)存,組成32GB容量;電源為華碩ROG雷神2代1600W鈦金。運(yùn)行系統(tǒng)為Windows 11 23H2。
通過GPU-Z(2.57.0)可以看到TUF RTX 4080 SUPER OC的規(guī)格。其擁有10240個(gè)CUDA核心,基礎(chǔ)頻率為2295MHz,Boost頻率為2610MHz。光柵和紋理單元分別為112個(gè)和320個(gè)。采用16GB GDDR6X顯存,顯存位寬256bit,帶寬736.3GB/s。驅(qū)動(dòng)版本為551.22。
四、理論性能測(cè)試
本次測(cè)試TUF RTX 4080 SUPER OC,主要對(duì)比RTX 4080和RTX 3080 Ti兩款顯卡。由于部分測(cè)試項(xiàng)較新,可能會(huì)缺失對(duì)比顯卡數(shù)據(jù)。
下面先進(jìn)行的是用來衡量顯卡DX11理論性能的3DMARK FS套裝:FS、FSE和FSU三者分別對(duì)應(yīng)顯卡在1080P、2K和4K的理論性能,取顯卡分?jǐn)?shù)實(shí)際測(cè)試結(jié)果如下:
在FS測(cè)試中,TUF RTX 4080 SUPER OC相比RTX 4080,其中FS提升3%;FSE提升3.7%;FUS提升3.2%,綜合提升3.3%,提升幅度略小于核心規(guī)模差距。對(duì)比RTX 3080 Ti,綜合成績(jī)提升48%左右。
而在針對(duì)DX12環(huán)境下的Time Spy和Time Spy Extreme測(cè)試中,TUF RTX 4080 SUPER OC相較RTX 4080的提升分別為:TS提升1.7%;TSE提升2%,綜合約為1.85%,提升幅度同樣略低于核心規(guī)模差距。對(duì)比RTX 3080 Ti,綜合成績(jī)提升49%左右。
Port Royal是3DMARK中專門針對(duì)光追性能的測(cè)試項(xiàng),TUF RTX 4080 SUPER OC相較RTX 4080的提升約為2.7%。對(duì)比RTX 3080 Ti,提升45%左右。
下面我們?cè)賮砜纯?DMARK中新增的一些具體應(yīng)用場(chǎng)景的測(cè)試。
Speed Way這項(xiàng)測(cè)試結(jié)合了實(shí)時(shí)光線追蹤和傳統(tǒng)渲染技術(shù)來測(cè)量顯卡性能。場(chǎng)景含有光線追蹤反射、實(shí)時(shí)全局光照、網(wǎng)格著色器、體積照明、粒子和后處理效果。所以SW的測(cè)試基本可以看做次世代3A游戲基準(zhǔn)。
TUF RTX 4080 SUPER OC對(duì)比RTX 4080,從2K和4K分辨率提升依次為:3.4%和4.4%,與實(shí)際的核心規(guī)模差距比較接近。
另外我們使用3DMARK剛剛更新的DLSS3進(jìn)行了相關(guān)性能測(cè)試。TUF RTX 4080 SUPER OC相比RTX 4080的提升為:開啟下提升2%,關(guān)閉下提升4.6%。
從整體的理論測(cè)試成績(jī)來看,TUF RTX 4080 SUPER OC相比RTX4080的綜合提升幅度并不大,DX11下提升超過3%,DX12下接近2%。而最新的SW綜合測(cè)試的提升幅度在4%左右??吹贸鰜?,RTX 4080 SUPER在規(guī)模上與RTX 4080相差不大,再加上兩者在架構(gòu)方面保持一致,最終導(dǎo)致兩者的理論性能差距是比較小的。
五、常規(guī)游戲性能測(cè)試
由于本次RTX40系加入了DLSS3新技術(shù),所以后面會(huì)進(jìn)行單獨(dú)測(cè)試,這里依然選擇主流的幾款3A大作進(jìn)行游戲性能對(duì)比。
在《極限競(jìng)速:地平線5》中,其中TUF RTX 4080 SUPER OC相比RTX 4080,在2K分辨率提升3.8%;4K分辨率提升2.5%,綜合提升3.1%。相比RTX 3080 Ti提升幅度較大,綜合提升超過66%。
在《無主之地3》中,TUF RTX 4080 SUPER OC相比RTX 4080的提升分別為:2K提升6%;4K分辨率提升4.5%,綜合提升超過5%。相比RTX 3080 Ti綜合提升38%。
《光明記憶:無限》光追測(cè)試軟件是獨(dú)立于游戲的測(cè)試工具,實(shí)測(cè)TUF RTX 4080 SUPER OC相比RTX 4080的提升分別為:2K提升5.5%;4K提升1.8%,綜合提升3.6%。相比RTX 3080 Ti綜合提升46%。
另外一款國(guó)產(chǎn)游戲《邊境》的跑分軟件中,TUF RTX 4080 SUPER OC相比RTX 4080的提升分別為:2K提升4.9%;4K提升5%,綜合提升5%。相比RTX 3080 Ti綜合提升56%。
在《賽博朋克2077》中,TUF RTX 4080 SUPER OC在超級(jí)畫質(zhì)下,4K分辨率下的幀率超過80幀,流暢運(yùn)行完全沒有問題;即使在光追超級(jí)畫質(zhì)下,4K分辨率下的幀率甚至也能超過70幀,游戲體驗(yàn)完全沒有問題。2K分辨率更不用說了,輕松超過百幀,實(shí)力非常強(qiáng)悍。
另外我們還測(cè)試了DLSS3的性能表現(xiàn)。
在《極限競(jìng)速:地平線5》這款游戲中,TUF RTX 4080 SUPER OC在2K和4K分辨率中,開啟DLSS3相比DLSS2的提升分別為33%和12%,效果非常明顯。
如今越來越多的游戲開始支持RTX和DLSS技術(shù),其中已經(jīng)超過500款游戲和應(yīng)用支持RTX技術(shù),支持DLSS3的游戲數(shù)量也在快速攀升,目前已經(jīng)有72款游戲和應(yīng)用支持DLSS3,未來包括《龍之信條2》、《灰區(qū)戰(zhàn)爭(zhēng)》、《半條命2》RTX版、《地平線:西之絕境》和《層層恐懼》等游戲,也將支持DLSS3技術(shù),為配備GeForce RTX 40 系列顯卡的游戲玩家?guī)砬八从械男阅芎透叩膱D像質(zhì)量。
六、生產(chǎn)力工具測(cè)試
在生產(chǎn)力工具上,我們測(cè)試了V-Ray渲染器,選擇使用GPU渲染的CUDA測(cè)試和RTX測(cè)試,成績(jī)分別為4992vpaths、7278vpaths。
Blender是一款專業(yè)的三維渲染軟件,我們使用的是官方的Benchmark跑分軟件。軟件會(huì)自動(dòng)渲染測(cè)試
monster/junkshop/classroom共三個(gè)場(chǎng)景。TUF RTX 4080 SUPER OC顯卡得分分別為4623/2163/2267分。
七、AIGC測(cè)試
目前AI的應(yīng)用范圍越來越廣泛,相關(guān)算力也得到了大家的重視。目前NVIDIA推出了全新的TensorRT插件,可以充分調(diào)用Tensor算力。此次我們使用Stable Diffusion對(duì)TUF RTX 4080 SUPER OC在AIGC方面的性能進(jìn)行測(cè)試。所有測(cè)試默認(rèn)開啟xformers優(yōu)化方案。
首先是較為基礎(chǔ)的SD1.5模型測(cè)試,在SD1.5中模型的輸出分辨率為512x512和768x768。我們將導(dǎo)出【TRT】引擎,并記錄使用默認(rèn)模型渲染,以及【TRT】模型渲染的批次時(shí)間。
根據(jù)NVIDIA提供的統(tǒng)一參數(shù)進(jìn)行輸出,以便記錄結(jié)果。其中采樣方式為:Eulera;采樣步驟:50;Batch Count:10。
【默認(rèn)SD1.5模型】TUF RTX 4080 SUPER OC 運(yùn)算時(shí)間22.2s,約合2.22秒一張圖。
【TRTSD1.5模型】TUF RTX 4080 SUPER OC 運(yùn)算時(shí)間14.9s,約合1.49秒一張圖。
第二次測(cè)試為的SDXL模型測(cè)試,SDXL模型將在1024x1024分辨率進(jìn)行訓(xùn)練,相比SD1.5來說圖像大了2倍,它可以提供更準(zhǔn)確的關(guān)鍵字匹配,從而獲得更真實(shí)的結(jié)果。但由于更高的原生分辨率和模型復(fù)雜性,SDXL模型的計(jì)算強(qiáng)度明顯更高。
我們按照相同的參數(shù)進(jìn)行設(shè)置,但尺寸規(guī)定為1024x1024,下面看看TUF RTX 4080 SUPER OC的表現(xiàn)如何。
【默認(rèn)SDXL模型】TUF RTX 4080 SUPER OC 運(yùn)算時(shí)間1m44.4s,約合10.44秒一張圖。
【TRT SDXL模型】TUF RTX 4080 SUPER OC 運(yùn)算時(shí)間1m4.4s,約合6.44秒一張圖。
在更復(fù)雜的模型中,Tensor RT引擎的優(yōu)勢(shì)愈發(fā)明顯,并且大顯存的特點(diǎn)得到充分體現(xiàn),實(shí)測(cè)最高占用達(dá)到了12GB顯存,TUF RTX 4080 SUPER OC的16GB顯存還有一定余量。
本次測(cè)試新增了ON1 Resize AI 2023的測(cè)試,這是一款A(yù)I圖像修復(fù)軟件,包括圖片縮放,內(nèi)容填充等功能,同時(shí)它也可以作為PS等軟件的插件形式存在,非常方便快捷。
測(cè)試選擇NVIDIA提供的5張高分辨率圖片進(jìn)行,我們將在原圖片的尺寸上直接放大200%,可以看到放大后的圖片尺寸已經(jīng)達(dá)到了12000x8000。
使用TUF RTX 4080 SUPER OC進(jìn)行AI計(jì)算后,5張圖片最終用時(shí)34641ms,即35秒左右。
放大后使用NVIDIA ICAT進(jìn)行對(duì)比,左側(cè)為使用ON1 Resize AI 2023進(jìn)行放大200%的圖片,可以看到在樹葉的紋理更加清晰。而右側(cè)則已經(jīng)有一些模糊了。
AI對(duì)于日常生活的應(yīng)用的確更加方便,在我們以往的認(rèn)知中,圖片尺寸放大必然會(huì)損失質(zhì)量。但經(jīng)由AI的加持,反而更清晰,這對(duì)于老照片的修復(fù),起到了更加便捷的作用。
八、RTX視頻超分辨率測(cè)試
另外我們還測(cè)試了RTX視頻超分辨率(RTX Video Super Resolution)這項(xiàng)功能,目前這項(xiàng)功能在B站和YouTube已經(jīng)可以生效。當(dāng)然,首先顯卡必須是RTX40或30系列GPU,并且驅(qū)動(dòng)更新至最新版;其次,使用最新版的Google Chrome和Microsoft Edge瀏覽器。兩者都滿足之后,就可以體驗(yàn)RTX視頻超分辨率帶來的優(yōu)勢(shì)。
在NVIDIA控制面板中的【調(diào)整視頻圖像設(shè)置】,可以看到最新的RTX視頻增強(qiáng),點(diǎn)擊質(zhì)量下方的選框就可以選擇不同級(jí)別。在視頻全屏播放的時(shí)候,通過任務(wù)管理器看到GPU的負(fù)載提高,說明開啟成功。
在YouTube隨意觀看視頻,打開RTX VSR后,可以清晰明顯的看到水下珊瑚的質(zhì)量明顯提高,邊緣更為清晰,并且極大減少了失真現(xiàn)象。
不過需要說明一點(diǎn)的是,RTX視頻超分辨率對(duì)于低分辨率視頻的效果是比較明顯的,比如480P或720P,能夠明顯感知到RTX視頻超分辨率帶來的提升。但如果視頻分辨率在1080P以上,那么實(shí)際RTX視頻超分辨率帶來的提升,并不會(huì)特別明顯。
所以RTX視頻超分辨率功能比較適合應(yīng)對(duì)網(wǎng)絡(luò)較差,或者視頻源本身并不清晰的情況。
九、溫度及功耗測(cè)試
功耗測(cè)試中,我們選擇FurMark軟件進(jìn)行拷機(jī)測(cè)試,并采用GPU-Z檢測(cè)溫度,功耗僅計(jì)算顯卡自身。
可以看到TUF RTX 4080 SUPER OC這張顯卡的溫度穩(wěn)定在62℃左右,熱點(diǎn)溫度在74℃左右;顯卡總功耗在313.6W。
考慮到實(shí)際游戲負(fù)載不同,功耗是實(shí)時(shí)變化的,所以通過《光明記憶:無限》自帶的Benchmark,在光追最高、DLSS質(zhì)量、2K分辨率下,記錄運(yùn)行過程中顯卡的實(shí)際功耗表現(xiàn)。
從記錄的功耗曲線可以看到,TUF RTX 4080 SUPER OC在《光明記憶:無限》游戲的Benchmark中,功耗基本可以穩(wěn)定在300W左右,平均功耗為293W。對(duì)于高端定位的顯卡來說,特別是對(duì)比上一代RTX30系顯卡,功耗并不算高。
十、總結(jié)
通過測(cè)試,其實(shí)大家也能夠看到,RTX 4080 SUPER的性能,相較于RTX4080,提升幅度其實(shí)并不大,綜合理論和游戲?qū)崪y(cè),性能的提升幅度大約在4%左右。但這并不影響它會(huì)成為未來一年高端顯卡中,消費(fèi)者首選的那款。原因主要有兩個(gè)。
第一,RTX 4080 SUPER的性能,應(yīng)對(duì)4K游戲是完全沒有問題的,其性能表現(xiàn)可以說相當(dāng)強(qiáng)悍,是目前能夠流暢運(yùn)行4K游戲的性能猛獸。同時(shí)在AI性能方面,表現(xiàn)強(qiáng)勁,16GB顯存也能夠應(yīng)對(duì)絕大多數(shù)AIGC需求;
第二,RTX 4080 SUPER的定價(jià),可以說是很多人沒有想到的,起售價(jià)居然比RTX 4080便宜了1400元。即使兩者在性能方面差距并不大,但便宜的1400元足以讓這款產(chǎn)品成為更多玩家的高端首選。
?
回到TUF RTX 4080 SUPER OC身上。這款顯卡有著西裝暴徒的外觀設(shè)計(jì),在性能表現(xiàn)方面可以完美應(yīng)對(duì)4K游戲,同時(shí)強(qiáng)悍的散熱設(shè)計(jì)讓其在壓力測(cè)試下,核心和熱點(diǎn)溫度也沒有超過75℃,整體表現(xiàn)可以說非常亮眼,是首批上市的RTX 4080 SUPER中不可忽視的一款產(chǎn)品。