云南電腦|昆明電腦|電腦批發(fā)|it行業(yè)聯(lián)盟
在2023年1月,NVIDIA解禁了RTX4070Ti顯卡的性能表現(xiàn)。CUDA核心數(shù)量不到RTX4090的一半,并且還采用的是192bit位寬的顯存,這兩點(diǎn)都是玩家們熱議的焦點(diǎn)。
此次評測,選用的RTX4070Ti顯卡為映眾RTX4070Ti冰龍超級版。
RTX4070Ti的性能到底如何?映眾RTX4070Ti冰龍超級版又能夠帶來怎樣的性能體驗(yàn)?精彩即將開啟,大家往下看便是了!
全新的Ada Lovelace架構(gòu)與RTX4070Ti
RTX40系列顯卡基于英偉達(dá)新一代的Ada Lovelace架構(gòu)設(shè)計(jì)。為了讓大家更好地了解到這一顯卡的升級,筆者首先會對Ada Lovelace架構(gòu)以及所支持的一些重要技術(shù)進(jìn)行介紹。
(一) Ada Lovelace架構(gòu)核心
(Ada Lovelace架構(gòu)核心)
(完整規(guī)格的AD102顯示核心,具備144組SM單元)
(Ada Lovelace架構(gòu)核心GPC單元)
Ada Lovelace架構(gòu)核心配備了全新的第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流式多處理器)。根據(jù)NVIDIA官方的介紹,Ada Lovelace架構(gòu)核心所采用的第3代RT Core不僅將光線與三角形求交性能提高了一倍,還將RT-TFLOP峰值性能提高了一倍之多。第3代RT Core還配備了全新的Opacity Micromap (OMM)引擎和Displaced Micro-Mesh (DMM)引擎,進(jìn)一步提升了光追計(jì)算的性能以及減少計(jì)算開銷,帶來了更好的光線追蹤效果表現(xiàn)。Ada Lovelace架構(gòu)核心配備的第四代Tensor Core引入了來自級H100數(shù)據(jù)中心GPU的FP8 Transformer引擎帶來了更加強(qiáng)悍的AI算力。
(第三代RT Core結(jié)構(gòu)示意圖,相比前代,增加了2個(gè)功能)
Ada Lovelace架構(gòu)核心在SM單元上引入了Shader Execution Reordering(SER著色器執(zhí)行重排序)技術(shù)來更好的對于著色器的工作進(jìn)行調(diào)度排序,在使用上可以根據(jù)不同的負(fù)載需求來執(zhí)行渲染,可對負(fù)載較為統(tǒng)一的畫面進(jìn)行渲染,降低工作開銷。根據(jù)英偉達(dá)官方的介紹,這一個(gè)SER功能將作為API開放給使用。英偉達(dá)官方宣稱,SER功能的加入至高可帶來兩倍RT Core性能上的改善,對于光追游戲來說更可帶來體驗(yàn)的升級。根據(jù)NVIDIA官方的數(shù)據(jù),全新的SM(流式單元處理器)可帶來至高兩倍的性能以及能效升級,這一項(xiàng)升級不可謂不小。
(Ada Lovelace架構(gòu)核心SM結(jié)構(gòu)圖)
Ada Lovelace架構(gòu)核心除了第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流式多處理器)的升級以外,帶來了全新的第八代NVENC雙硬件編碼器,這一全新的第八代NVENC雙硬件編碼器整合了對AV1視頻編碼格式的支持,可以在傳統(tǒng)的H.264等格式之外,加入了對AV1這一主流新標(biāo)準(zhǔn)的支持,可以進(jìn)行對于AV1格式的編碼與解碼,有效提升了生產(chǎn)力方面的表現(xiàn),對于創(chuàng)作型用戶、游戲主播等群體來說更是如虎添翼。來自NVIDIA官方的數(shù)據(jù)顯示,第八代NVENC雙硬件編碼器在AV1的效率上比H.264編碼器的效率提高了40%,這一提升非常明顯。
而除了核心上的升級以外,Ada Lovelace架構(gòu)核心還大幅度提升了其L2緩存,完成版的Ada Lovelace架構(gòu)核心(AD102)擁有96MB的L2緩存,大容量的L2緩存帶來了數(shù)據(jù)命中率的有效提升。在現(xiàn)階段顯存帶寬提升有效的情況下,通過升級更大容量的L2緩存,可以進(jìn)一步提升數(shù)據(jù)命中表現(xiàn),帶來性能方面的升級,根據(jù)NVIDIA官方的說法,大容量L2緩存的加入為GPU的一系列操作到帶來了更高的收益,尤其是在光線追蹤等場景下,表現(xiàn)更為明顯。
(二) DLSS 3與NVIDIA Reflex
Ada Lovelace架構(gòu)的一系列升級還帶來了全新的DLSS 3技術(shù)的獨(dú)占以及NVIDIA Reflex方面的體驗(yàn)提升。
DLSS 3包含有DLSS 2(DLSS超分辨率技術(shù)),以及全新加入的DLSS幀生成技術(shù),這一項(xiàng)DLSS幀生成技術(shù)依托于Ada Lovelace架構(gòu)的獨(dú)立光流處理器以及Tensor Core的AI算力。在一項(xiàng)技術(shù)在運(yùn)行過程中,其通過光流處理器所得到的一系列數(shù)據(jù)后,以光流加速技術(shù)(Optical Flow Acceleration,簡稱為OFA)來生成畫面信息,而AI算力則負(fù)責(zé)來對畫面進(jìn)行進(jìn)一步的優(yōu)化,從而在游戲中加入了更多的幀畫面,進(jìn)行幀數(shù)的提升。
DLSS 3可直接生成游戲第1幀3/4的像素以及整個(gè)游戲第2幀,相當(dāng)于使用1/8的算力,就完成了整個(gè)計(jì)算過程,而通過這一個(gè)流程的循環(huán),可在提升幀數(shù)的同時(shí)節(jié)省資源開銷,進(jìn)一步帶來更好游戲體驗(yàn)。
而在DLSS 3的幀生成技術(shù)上,由于可能帶來延遲的增加,因此DLSS 3在使用上也將通過整合NVIDIA Reflex這一技術(shù)來降低渲染以及操作的延遲。而根據(jù)NVIDIA官方的說法,DLSS 3通過整合NVIDIA Reflex以及一系列的技術(shù),可以使得游戲體驗(yàn)擁有媲美甚至是超越原生級的渲染、操作體驗(yàn)。
(三) 40系顯卡第三彈——RTX4070Ti
(RTX4070Ti顯示核心架構(gòu)圖,具備60組SM單元)
RTX4070Ti采用的是AD104-400顯示核心,擁有7680個(gè)CUDA核心。此外,RTX4070Ti還搭配12GB容量、192bit位寬的GDDR6X顯存。
映眾RTX4070Ti冰龍超級版的Boost默認(rèn)設(shè)置為2670MHz,相比RTX4070Ti創(chuàng)始人版的2610MHz高出了60MHz。
映眾RTX4070Ti冰龍超級版顯卡欣賞
映眾RTX4070Ti冰龍超級版延續(xù)了冰龍系列的酷黑外觀設(shè)計(jì)。三風(fēng)扇散熱設(shè)計(jì),三插槽厚度。
顯卡背面設(shè)計(jì)了金屬背板,其上面有一些鏤空設(shè)計(jì),以便兼顧散熱效果。
輸出接口為三個(gè)DP 1.4a以及一個(gè)HDMI 2.1。
散熱器頂部上面印有“GEFORCE RTX”的字樣。
顯卡供電接口為12VHPWR接口。玩家在裝機(jī)時(shí)一定要接上這部分的供電線纜。
將散熱器拆卸下來,露出顯卡PCB,我們來接著瞧一瞧它的用料。
這款顯卡雖然長度接近33.5cm,但是它的PCB并不長。通過對比明顯能夠看出散熱器和背板比PCB長出很多。
畢竟是顯卡,映眾RTX4070Ti冰龍超級版的供電設(shè)計(jì)依舊不錯。GPU左右周圍共設(shè)計(jì)了13相供電,搭配電容鐵素體電感、固態(tài)電容、Dr.MOS等高品質(zhì)元器件,用料值得信賴。
全新的AD104-400顯示核心,芯片面積為294.5平方毫米,看上去尺寸比較小。
顯存是來自美光的GDDR6X,單顆2GB容量。這款顯卡PCB正面共設(shè)計(jì)有6顆顯存,組建了12GB顯存容量。
再來瞧瞧它的冰龍散熱器。這款第八代冰龍散熱系統(tǒng)采用三枚直徑約10cm的大尺寸散熱風(fēng)扇。同時(shí),這款散熱器支持智能風(fēng)扇停轉(zhuǎn)功能,在待機(jī)狀態(tài)下或者輕負(fù)載狀態(tài)下,它的這3枚風(fēng)扇會全部停轉(zhuǎn),以便實(shí)現(xiàn)安靜的運(yùn)行效果。
還有,中間風(fēng)扇與兩側(cè)風(fēng)扇設(shè)計(jì)方向相反,這樣能夠減少冷卻陣列內(nèi)部的氣流紊流,從而進(jìn)一步提高顯卡的整體散熱性能。
這款散熱器的金屬主體也是相當(dāng)?shù)凝嫶?,不僅能夠?yàn)镚PU進(jìn)行散熱,而還能夠?yàn)轱@存、電感以及MOS管進(jìn)行散熱。
8根純銅復(fù)合熱管以及大面積純銅底座一體式散熱,其中7根熱管為核心散熱,另外還有一根熱管則用于連接供電部位的鰭片,搭配高達(dá)6cm的超大散熱鰭片矩陣,可以快速發(fā)散熱量。
這款顯卡的散熱器上面還采用大面積IML模內(nèi)印刷RGB燈箱設(shè)計(jì),令這款顯卡運(yùn)行時(shí)炫酷有型。
RGB燈效可以利用映眾研發(fā)的INNO3D TuneIT軟件進(jìn)行調(diào)節(jié)。
包裝盒附件里面還帶有一根顯卡支架。
測試平臺介紹
筆者組建了一套性能出色的13代酷睿i5測試平臺,用來測試顯卡的性能。為了對比映眾RTX4070Ti冰龍超級版的性能,筆者此次測試還加入RTX4080以及上一代卡皇RTX3090Ti的成績。
此次測試所選用的這款RTX4080是一款非公版顯卡,其GPU頻率為2205MHz,Boost頻率為2565MHz,顯存頻率為1400MHz(等效22400MHz)。
此次測試所選用的這款RTX3090Ti是一款非公版顯卡,其GPU頻率為1560MHz,Boost頻率為1890MHz,顯存頻率為1313MHz(等效21008MHz)。
英特爾13代酷睿處理器搭配RTX40系列獨(dú)立顯卡是支持Resizable BAR技術(shù)的。為了充分發(fā)揮映眾RTX4070Ti冰龍超級版顯卡的性能表現(xiàn),以下測試環(huán)節(jié)均是在Resizable BAR開啟狀態(tài)下進(jìn)行的。
DLSS 3是RTX40系列顯卡帶來的全新技術(shù),在維持高畫質(zhì)的情況下也可以實(shí)現(xiàn)更為流暢的游戲表現(xiàn),這也讓玩家可以更好的享受4K光追游戲帶來的出色畫質(zhì)體驗(yàn)。為了更好的感受RTX40系列顯卡在游戲方面的升級,我們在測試RTX40系列顯卡時(shí)特意選擇了愛攻&保時(shí)捷(Porsche Design)聯(lián)合設(shè)計(jì)的PD32M顯示器。
這款顯示器為31.5英寸,采用MIni LED背光技術(shù),擁有1152個(gè)獨(dú)立分區(qū),擁有1600尼特峰值亮度,8000萬:1動態(tài)對比度,并通過HDR1400認(rèn)證,在畫質(zhì)上有著更為出色的表現(xiàn)。此外,PD32M擁有4K分辨率以及144Hz的刷新率,支持97%DCI-P3色域以及99% Adobe RGB覆蓋,并且擁有HDMI 2.1接口,是一款旗艦級電競顯示器。
俗話說好馬配好鞍,此次測試平臺的主板部分,筆者選用的是華碩ROG MAXIMUS Z790 HERO。華碩ROG新一代Z790主板采用了整合的供電設(shè)計(jì),以及散熱及解決方案,同時(shí)還擁有全新的AEMP 2.0、AI智能優(yōu)化和EZ DIY貼心設(shè)計(jì),帶來更強(qiáng)的性能、更智能的優(yōu)化和更好的裝機(jī)體驗(yàn)。
游戲性能測試
(一) 3DMark基準(zhǔn)測試
讓我們先來瞧瞧映眾RTX4070Ti冰龍超級版在3DMark基準(zhǔn)測試當(dāng)中的表現(xiàn)。性能到底有多強(qiáng),大家一看便知。
在3DMark測試項(xiàng)目中,這款RTX4070Ti與上一代卡皇RTX3090Ti互有勝負(fù)。
(二) DLSS 3基準(zhǔn)測試
3DMark基準(zhǔn)測試新增加了DLSS功能測試(DLSS 3)。
根據(jù)實(shí)測來看,在開啟DLSS 3之后,RTX40系列顯卡實(shí)現(xiàn)了巨大的FPS提升。
(三) DLSS 3游戲?qū)崪y
目前已有《賽博朋克2077》、《逆水寒》、《瘟疫傳說:安魂曲》、《光明記憶:無線》、《生死輪回》等熱門游戲大作支持DLSS 3技術(shù)。此次DLSS 3游戲?qū)崪y,筆者將利用《賽博朋克2077》、《瘟疫傳說:安魂曲》等4款游戲進(jìn)行測試。注意,《賽博朋克2077》的DLSS 3版本目前均處于測試階段,進(jìn)行測試的話需要下載NVIDIA提供的測試版游戲。
DLSS 3游戲測試版——《賽博朋克2077》
DLSS 3游戲——《瘟疫傳說:安魂曲》
DLSS 3游戲——《巫師3:狂獵》
DLSS 3游戲——《傳送門:光追版》
通過上述4款DLSS 3游戲來看,DLSS 3技術(shù)為RTX40系列顯卡帶來的游戲幀數(shù)提升是巨大的。
(四) 其它游戲?qū)崪y
接下來,筆者再測試一些非DLSS 3游戲。
游戲?qū)崪y——《地鐵:離去》
游戲?qū)崪y——《刺客信條:奧德賽》
游戲?qū)崪y——《戰(zhàn)爭機(jī)器5》
游戲?qū)崪y——《幽靈行動:荒野》
游戲?qū)崪y——《古墓麗影:暗影》
游戲?qū)崪y——《無主之地3》
非DLSS游戲中,款RTX4070Ti與上一代卡皇RTX3090Ti依舊互有勝負(fù)。
生產(chǎn)力性能測試
(一) AV1硬件加速編解碼測試
為什么AV1編解碼技術(shù)越來越受歡迎?理由很簡單,采用AV1編解碼的視頻能夠以更低的碼率,實(shí)現(xiàn)其它主流編解碼視頻相同的畫質(zhì)。說白了,在視頻畫質(zhì)相同的情況下,采用AV1編解碼的視頻文件體積會更小,以至于能夠?yàn)橐曨l創(chuàng)作者們節(jié)省大量的硬盤空間。
目前萬興喵影、達(dá)芬奇等視頻軟件已可支持AV1硬件加速編/解碼功能。接下來筆者利用達(dá)芬奇這款軟件,將一部12GB容量的4K視頻,利用N卡AV1硬件加速編解碼導(dǎo)出一部MP4視頻。
終,RTX4070Ti和RTX4080的加速效果都是相當(dāng)快的。
(二) H.265硬件加速編解碼測試
繼續(xù)利用達(dá)芬奇這款軟件,將一部12GB容量的4K視頻,利用H.265編解碼導(dǎo)出一部MP4視頻。此項(xiàng)測試對比了RTX3090Ti的成績。
相比上代卡皇RTX3090Ti,RTX4070Ti和RTX4080的加速效果都是要更快的。
散熱器測試
(注:筆者所處的室溫維持在26℃)
利用FurMark,筆者將對映眾RTX4070Ti冰龍超級版顯卡進(jìn)行壓力測試。
通過10分鐘的烤機(jī),默認(rèn)頻率下滿載時(shí)GPU溫度穩(wěn)定在約64℃,GPU頻率穩(wěn)定在約2820MHz。這款冰龍散熱器的散熱性能確實(shí)很棒,靜音效果也很不錯,令筆者很滿意。
全文總結(jié)
別看RTX4070Ti的CUDA核心數(shù)量還不到RTX4090的一半,別看RTX4070Ti僅采用了192bit位寬的顯存,但是論性能,這款新顯卡還是挺不錯的。特別是在DLSS 3技術(shù)的加持下,RTX4070Ti整體上是要超越上一代卡皇RTX3090Ti的。