
RTX 4060 Ti 8G顯卡的發(fā)布,讓6000元主流攢機(jī)的用戶終于也能用上RTX 40系顯卡了。今天帶來的評(píng)測(cè)是耕升GeForce RTX 4060 Ti 追風(fēng)EX3顯卡的評(píng)測(cè)。
距離RTX 4060 Ti 8G發(fā)布也已經(jīng)有一段時(shí)間,想必大家也清楚其性能定位,這張顯卡雖然光柵化性能提升相對(duì)較小,但在光追線追蹤和AI加速計(jì)算方面想必RTX 30系提升較大。
另外我們也測(cè)試了近期爆火的《暗黑破壞神4》游戲,這張顯卡可以完美駕馭2K分辨率下的高幀率游戲,下面先簡(jiǎn)單來看一下外觀。
1 耕升GeForce RTX 4060 Ti 追風(fēng)EX3顯卡概覽
耕升GeForce RTX 4060 Ti 追風(fēng)EX3顯卡主打?qū)嵱弥辽希彩歉煜碌钠絻r(jià)顯卡。與不帶“EX3”后綴的追風(fēng)相比,采用三風(fēng)扇散熱。
耕升GeForce RTX 4060 Ti 追風(fēng)EX3整體尺寸為278×113×40mm,作為一張?zhí)鹌房?,長(zhǎng)度和厚度有所縮減,兼容性好的ITX機(jī)箱也可裝下。
耕升GeForce RTX 4060 Ti 追風(fēng)EX3采用該系列經(jīng)典的紅黑設(shè)計(jì),正面導(dǎo)流罩采用三個(gè)82mm的9葉炫風(fēng)之刃風(fēng)扇。內(nèi)部為2根6mm復(fù)合式熱管,搭配大面積散熱鰭片,對(duì)于這張RTX 4060 Ti來說綽綽有余。
耕升GeForce RTX 4060 Ti 追風(fēng)EX3采用一體成型金屬背板,經(jīng)典的黑白配色。這個(gè)角度可以看到尾部大量裸露的散熱鰭片,而PCB板只有整卡一半左右的長(zhǎng)度,其余部分均為散熱模組。
耕升GeForce RTX 4060 Ti 追風(fēng)EX3采用單8pin供電接口,TDP 160W,建議電源450W及以上??梢哉f任何玩家都可以毫無顧慮的升級(jí)。
視頻輸出接口上,依舊采用了HDMI 2.1 + DP 1.4a*3的四接口設(shè)計(jì)。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。
2 NVIDIA GeForce RTX 4060 Ti 8GB架構(gòu)淺析
本次發(fā)布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構(gòu)打造,采用TSMC 4N NVIDIA定制工藝,旗艦核心AD102達(dá)到了恐怖的760億個(gè)晶體管,而在RTX 30系顯卡中為280億個(gè)。
與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可達(dá)到90-TFLOPS的著色器數(shù)據(jù)吞吐量。
本次發(fā)布的RTX 4060 Ti 8GB共有4352個(gè)CUDA核心,提供了22-TFLOPS算力;34個(gè)第三代Ada RT Core擁有51 RT-TFLOPS;136個(gè)第四代Tensor Core可提供353 Tensor-TFLOPS。
另外在本次的規(guī)格說明上,NVIDIA官方也特別表明了L2 Cache容量以及最終的等效帶寬,這是RTX 40在架構(gòu)中變化比較大的地方,同時(shí)也是玩家對(duì)位寬減小有爭(zhēng)議的“罪魁禍?zhǔn)住薄?/p>
我們以兩張圖來簡(jiǎn)單說明L2緩存的作用。
如果把GPU內(nèi)核比作網(wǎng)店店主,那么L1緩存就是在日常工作的屋子中堆放的可發(fā)貨產(chǎn)品,但由于所有工作都要在這間屋子進(jìn)行,堆放產(chǎn)品的空間有限;所以大部分產(chǎn)品就需要到L2緩存中,它就好比在工作室隔壁的倉(cāng)庫(kù),雖然需要走出去,但仍然是很近的路程。
如果這個(gè)倉(cāng)庫(kù)還是放不下,那么只能到更遠(yuǎn)的顯存中去調(diào)取產(chǎn)品。當(dāng)然如果有爆顯存的情況,那么這位“店主”可能還要打車去更遠(yuǎn)的系統(tǒng)內(nèi)存區(qū)調(diào)取數(shù)據(jù)。
這中間的路程和耗費(fèi)時(shí)間就好比GPU額外的工作量,如果絕大部分?jǐn)?shù)據(jù)只存放在L2緩存就可以拿到,那么將極大節(jié)省功耗。并且由于不再需要頻繁調(diào)取顯存中的數(shù)據(jù),所以顯存位寬適當(dāng)降低,對(duì)于運(yùn)行效率也是沒有影響的。
在真正的GPU中,內(nèi)核是所有計(jì)算發(fā)生的地方,而這就是L1數(shù)據(jù)緩存的作用所在。每個(gè)SM都有一個(gè)超低延遲的L1數(shù)據(jù)緩存,緊挨其處理內(nèi)核,使L1成為GPU尋找信息的首選。
然而,由于L1緩存需要離內(nèi)核非常近,不可能非常大。
如果在L1緩存中找不到內(nèi)核計(jì)算所需的數(shù)據(jù),GPU將在L2數(shù)據(jù)緩存中尋找。這個(gè)顯存系統(tǒng)位于GPU芯片上,并通過一個(gè)非常高速的橫梁系統(tǒng)連接到所有的GPC(圖形處理集群),每個(gè)GPC包括多個(gè)SM。如果在L2緩存中找到了信息,那么GPU就挑出這些數(shù)據(jù)并將其放入內(nèi)核。
如果在L2緩存中找不到信息(被稱為緩存缺失),那么GPU將通過顯存接口在VRAM中尋找。這在整個(gè)GPU存儲(chǔ)子系統(tǒng)中產(chǎn)生了很多額外的工作量,并降低了性能和功耗效率。
其實(shí)如果只對(duì)比傳統(tǒng)的光柵性能,RTX 4060 Ti 8GB的進(jìn)步并沒有很大,但在AI逐漸發(fā)展的今天,需要大量邏輯推理運(yùn)算,所以可以看到相比30系的Tensor算力,幾乎達(dá)到1.7倍的提升。
完整的AD102核心
完整的AD106核心
RTX 4060 Ti 8GB使用的AD106核心
本次RTX 4060 Ti 8GB使用了AD106芯片,采用了3組GPC,其中1組少了1組TPC,并且NVENC單元變?yōu)?個(gè)。
這張RTX 4060 Ti 8GB的L2緩存為32MB,而上一代RTX 3060 Ti為4MB,達(dá)到了8倍的差距。增加L2緩存的大小可以提高性能,降低延遲,并提高續(xù)航時(shí)長(zhǎng),數(shù)據(jù)訪問在GPU上即可完成(否則GPU就要頻繁從顯存讀取數(shù)據(jù),過分依賴顯存帶寬)。所以,這也是為什么在RTX 40系顯卡中,位寬帶寬普遍偏小的原因。
3 測(cè)試平臺(tái)簡(jiǎn)介
首先介紹一下測(cè)試平臺(tái),為了保障耕升GeForce RTX 4060 Ti 追風(fēng)EX3的性能發(fā)揮,我們的平臺(tái)也進(jìn)行了全面更新。
目前GPU-Z版本尚未更新,部分信息無法識(shí)別,簡(jiǎn)單參考即可。
耕升GeForce RTX 4060 Ti 追風(fēng)EX3采用AD106核心,擁有4352個(gè)CUDA,Boost頻率為2580MHz,與公版相同,相比RTX 3060 Ti的1665MHz,有很大提升。
采用8GB GDDR6顯存,位寬為128bit,顯存帶寬288 GB/s(最終等效帶寬554 GB/s),光柵單元和紋理單元為48和136。
4 理論性能測(cè)試
下面先進(jìn)行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對(duì)應(yīng)顯卡在1080P、2K、4K的理論性能,取顯卡分?jǐn)?shù)實(shí)際測(cè)試結(jié)果如下:
在針對(duì)顯卡DX11性能的3DMARKFS套裝測(cè)試中,耕升GeForce RTX 4060 Ti 追風(fēng)EX3主要對(duì)比上一代RTX 3060 Ti,其中FS提升了18%;FSE提升了15%;FSU提升了2%,綜合來看相比RTX 3060 Ti的性能提升約為12%。
而對(duì)比剛剛發(fā)布的RTX 4070,綜合成績(jī)相差24%左右。
而在針對(duì)DX12環(huán)境下的Time Spy和Time Spy Extreme測(cè)試中,耕升GeForce RTX 4060 Ti 追風(fēng)EX3相較RTX 3060 Ti的提升分別為:TS提升13%;TSE提升7%,綜合約為10%。
PortRoyal是3DMARK中專門針對(duì)光追性能的測(cè)試項(xiàng),耕升GeForce RTX 4060 Ti 追風(fēng)EX3相較RTX 3060 Ti的提升約為16%。
綜合來看,耕升GeForce RTX 4060 Ti 追風(fēng)EX3的傳統(tǒng)理論性能相較RTX 3060 Ti的提升約為13%。
Speed Way測(cè)試是3DMARK最新更新的用于測(cè)試DirectX12 Ultimate 性能的顯卡基準(zhǔn)測(cè)試。要運(yùn)行此測(cè)試,顯卡必須支持 DirectX 12 Ultimate 并包含 6GB 及以上顯存。
這項(xiàng)測(cè)試結(jié)合了實(shí)時(shí)光線追蹤和傳統(tǒng)渲染技術(shù)來測(cè)量顯卡性能。場(chǎng)景含有光線追蹤反射、實(shí)時(shí)全局光照、網(wǎng)格著色器、體積照明、粒子和后處理效果。
簡(jiǎn)單來說,該項(xiàng)測(cè)試是對(duì)近年來新技術(shù),及未來游戲的綜合測(cè)試。對(duì)比RTX 3060 Ti顯卡,從1080p分辨率到4K提升依次為:12%/10%/6%。
另外我們使用3DMARK剛剛更新的DLSS 3進(jìn)行了相關(guān)性能測(cè)試。不過由于RTX 3060 Ti無法開啟,這里使用DLSS2進(jìn)行對(duì)比測(cè)試。
在2K分辨率下DLSS開關(guān)相比RTX 3060 Ti的提升為23%/16%;4K分辨率由于關(guān)閉情況下顯卡幾乎無法正常運(yùn)行,僅看開啟狀態(tài),提升約為51%。
5 游戲 性能測(cè)試
下面我們對(duì)這款顯卡分別進(jìn)行了不同類別的游戲測(cè)試,其中包含傳統(tǒng)光柵化游戲,也有純光追+DLSS的benchmark跑分測(cè)試。
在《極限競(jìng)速:地平線5》中,耕升GeForce RTX 4060 Ti 追風(fēng)EX3相比RTX 3060 Ti的提升分別為:1080p提升12%;2K提升9%;4K提升8%,綜合提升10%。
由于RTX 4060 Ti 8GB這張顯卡本身定位1080p分辨率,在部分2K游戲中會(huì)爆顯存,所以在越高的分辨率下其實(shí)對(duì)比RTX 3060 Ti的優(yōu)勢(shì)不大。
在新游《暗黑破壞神4》中,耕升GeForce RTX 4060 Ti 追風(fēng)EX3表現(xiàn)亮眼,由于這款游戲面向的是更多主流配置玩家,在配置上相當(dāng)親民,不過本代暗黑中的畫質(zhì)提升卻非常大,堪稱優(yōu)化典范。
這里我們僅使用RTX 4060 Ti做了測(cè)試,在2K分辨率下開啟DLSS后能夠達(dá)到180幀的完美體驗(yàn)。不過目前DLSS 3的優(yōu)化似乎尚有問題,在4K分辨率下并沒有提升,反而降了不少。
在《刺客信條:英靈殿》中,耕升GeForce RTX 4060 Ti 追風(fēng)EX3相比RTX 3060 Ti的提升分別為:1080p提升12%;2K提升9%;4K提升4%,綜合提升8%。
在《無主之地3》中,耕升GeForce RTX 4060 Ti 追風(fēng)EX3相比RTX 3060 Ti的提升分別為:1080p提升13%;2K提升13%;4K提升3%,綜合提升10%。
《光明記憶:無限》的光追測(cè)試軟件是獨(dú)立于游戲的測(cè)試工具,比游戲中用到的光線追蹤技術(shù)更多,測(cè)試條件為“RTX最高/DLSS質(zhì)量”。所以測(cè)試幀數(shù)相對(duì)較低,但實(shí)際游戲配置相當(dāng)親民。
性能方面,耕升GeForce RTX 4060 Ti 追風(fēng)EX3相比RTX 3060 Ti的提升分別為:1080p提升25%;2K提升23%;4K提升5%,綜合提升18%。
在另外一款國(guó)產(chǎn)游戲《邊境》的跑分軟件中,情況基本與《光明記憶:無限》相同,測(cè)試條件均在“RTX最高/DLSS質(zhì)量”下進(jìn)行。
在《邊境》中,耕升GeForce RTX 4060 Ti 追風(fēng)EX3相比RTX 3060 Ti的提升分別為:1080p提升33%;2K提升25%;4K提升17%,綜合提升25%。
在《賽博朋克2077》中,游戲新增了光追過載畫質(zhì),我們分別進(jìn)行了測(cè)試。
在超級(jí)畫質(zhì)中,耕升GeForce RTX 4060 Ti 追風(fēng)EX3相比RTX 3060 Ti的提升分別為,1080p提升14%;2K提升6%;4K提升6%,綜合提升9%。
在光追超級(jí)畫質(zhì)中,提升分別為,1080p提升19%;2K提升19%;4K提升15%,綜合提升18%。
在光追過載畫質(zhì)中,由于對(duì)性能需求實(shí)在變態(tài),所以僅測(cè)試1080p及2K分辨率,提升分別為,1080p提升26%;2K提升41%。
這里分別為大家展示一下三種不同畫質(zhì),從上至下依次為超級(jí)畫質(zhì)/光追超級(jí)/光追過載??梢钥吹焦庾愤^載相比光追超級(jí)更貼近于真實(shí)效果。它模擬了真實(shí)的光線路徑,其實(shí)相比之前的光線追蹤模擬了更多光線在不同表面的反射,完整的計(jì)算出了場(chǎng)景的真實(shí)光照,避免了上一代光追中出現(xiàn)“死黑”的情況。
這也是NVIDIA致力于打造的下一代光追場(chǎng)景,但是截止目前它對(duì)硬件計(jì)算的需求太過龐大,即便是旗艦顯卡,也無法在4K分辨率下流暢運(yùn)行。
6 Stable Diffusion AI繪畫測(cè)試
除了游戲之外,AI也是目前大火的領(lǐng)域,尤其以Stable Diffusion為最,現(xiàn)在很多AI生成的圖片完全能夠以假亂真,下面我們也來測(cè)試一下RTX 4060 Ti 8GB在這方面的表現(xiàn)。
Stable Diffusion可以說幾乎沒有門檻,但本地部署的繁瑣程度勸退了很多用戶。上圖為操作界面用戶可根據(jù)自己想要生成的圖片細(xì)節(jié)豐富關(guān)鍵詞。
按照NVIDIA提供的關(guān)鍵詞,我們生成了10批,共20張圖片。并對(duì)比了剛剛發(fā)布的RTX 4070和上一代RTX 3060 Ti顯卡。
RTX 4070運(yùn)算時(shí)間 2m24.79s 約合 7.2秒一張圖
RTX 4060 Ti 8GB運(yùn)算時(shí)間3m18.26s 約合 9.9秒一張圖
RTX 3060 Ti運(yùn)算時(shí)間3m40.86s 約合 11秒一張圖
Stable Diffusion對(duì)于顯卡的要求比較高,這就需要顯卡擁有較強(qiáng)的CUDA算力。
另外它對(duì)于顯存的要求非常高,此次RTX 4060 Ti 8GB顯存使用率已達(dá)到97%,如果有條件的話盡量選擇大容量顯存的顯卡。
我們對(duì)比了RTX 4060 Ti 8GB和RTX 3060 Ti在相同設(shè)置下的運(yùn)算時(shí)間,兩款顯卡在生成20張圖片的時(shí)間差距為22秒,差距還是比較大的。
另外我們也測(cè)試了使用CPU,在相同設(shè)置下生成圖片,但如圖片所示,保守估計(jì)需要3小時(shí)30分左右。
7 AV1編碼測(cè)試
本次AV1編碼測(cè)試選擇了剪映專業(yè)版,它可以輸出H.264/HEVC/AV1三種編碼格式的視頻。
剪映專業(yè)版目前自帶AV1編碼輸出,在實(shí)際測(cè)試中,我們導(dǎo)出一段1分鐘左右的視頻??梢钥吹絻蓚€(gè)文件容量相差103MB。
由于AV1編碼特性,生成文件的比特率更低,但視頻清晰度則完全相同。所以如果生成同比特率,同容量的文件,AV1將會(huì)更清晰。
我們通過NVIDIA ICAT來進(jìn)行兩段視頻的畫面對(duì)比,圖中左側(cè)為H.264編碼,右側(cè)為AV1編碼,幾乎看不出任何區(qū)別。
8 RTX VSR(RTX Video Super Resolution)測(cè)試
目前RTX VSR(RTX Video Super Resolution)已經(jīng)在部分瀏覽器中進(jìn)行測(cè)試,首先玩家需要更新到NVIDIA最新驅(qū)動(dòng),在NVIDIA控制面板中的【調(diào)整視頻圖像設(shè)置】可以看到最新的RTX 視頻增強(qiáng)超分辨率。
RTX VSR是 AI 圖像處理的突破,它超越了傳統(tǒng)的邊緣檢測(cè)和特征銳化技術(shù),極大地提升直播視頻內(nèi)容的質(zhì)量。
開啟RTX VSR不僅需要最新版驅(qū)動(dòng),還需要使用RTX 40或30系列GPU,并且?guī)缀踹m用于Google Chrome和Microsoft Edge瀏覽器中的所有視頻內(nèi)容(瀏覽器也需要更新到最新版本)。
開啟后,目前已知的打開YouTube或者B站,都可以享受到RTX VSR效果的加成。
如果不確定,在全屏播放視頻時(shí),可以打開任務(wù)管理器,看到GPU負(fù)載增加,即為開啟成功。
(點(diǎn)擊放大查看原圖)
我們打開YouTube隨意觀看視頻,在打開RTX VSR后,可以清晰明顯的看到水下珊瑚的質(zhì)量明顯提高,邊緣更為清晰,并且極大減少了失真現(xiàn)象。
9 溫度及功耗測(cè)試
功耗測(cè)試中,我們選擇FurMark軟件進(jìn)行拷機(jī)測(cè)試,并采用GPU-Z檢測(cè)溫度,功耗僅計(jì)算顯卡自身。
可以看到耕升GeForce RTX 4060 Ti 追風(fēng)EX3這張顯卡但通過20分鐘左右的拷機(jī)測(cè)試,溫度控制在63℃左右,熱點(diǎn)溫度在73℃左右。
游戲動(dòng)態(tài)功耗測(cè)試
耕升GeForce RTX 4060 Ti 追風(fēng)EX3 3A游戲平均功耗
RTX 3060 Ti 3A游戲平均功耗
在實(shí)際的游戲功耗測(cè)試中,我們選擇《賽博朋克2077》自帶benchmark,畫面設(shè)置為光追超級(jí)、2K分辨率,來拉滿兩張顯卡的性能極限,檢測(cè)我們實(shí)際應(yīng)用場(chǎng)景的功耗。
可以看到兩款顯卡雖然均為60級(jí)別,但這款耕升GeForce RTX 4060 Ti 追風(fēng)EX3平均功耗為150W,而RTX 3060 Ti則是219W,低了69W。
10 入門首選 實(shí)用至上
耕升的追風(fēng)系列一直秉承著實(shí)用至上的原則,在近幾代的外觀中變化不大。這張耕升GeForce RTX 4060 Ti 追風(fēng)EX3在理論測(cè)試的成績(jī)基本與公版相當(dāng),雖然與一些旗艦系列相比有一定差距。不過在實(shí)際游戲測(cè)試中,這些也只有1-2幀的區(qū)別。而且相對(duì)雙風(fēng)扇顯卡,EX3在散熱上更出色,無愧于主打?qū)嵱孟盗械漠a(chǎn)品。
RTX 4060 Ti相比RTX 3060 Ti的傳統(tǒng)性能提升13%左右,說實(shí)在這一點(diǎn)提升確實(shí)稱不上迭代,但在RTX 40系顯卡中光追和AI算力才是主要發(fā)力的地方。
如加入了光追和DLSS的測(cè)試中,《光明記憶無限》、《邊境》、《賽博朋克2077》中,相比RTX 3060 Ti的提升就達(dá)到了25-35%左右。
如果你想在1080p分辨率下體驗(yàn)光線追蹤帶來的極致畫面,那么這張RTX 4060 Ti則非常適合。
另外目前火熱的SD畫圖中,兩代甜品卡在單張圖片的差距為1.1秒左右,看似不大,但在批量生成時(shí),仍能節(jié)省不少時(shí)間。
功耗上也是RTX 40系顯卡進(jìn)步非常大的地方,這張耕升GeForce RTX 4060 Ti 追風(fēng)EX3的TDP僅有140W,采用單8pin供電,推薦電源450W,任何用戶都能輕松升級(jí),無需更換電源。
目前耕升GeForce RTX 4060 Ti 追風(fēng)EX3售價(jià)3299元,有興趣的朋友不妨關(guān)注起來。
