北京时间5月23日晚上9点,NVIDIA正式解禁了RTX4060Ti 8GB台式机显卡的性能表现。3199元起售,将RTX40系列台式机显卡的价格进一步拉低。想花2、3千元就能够拥有一块RTX40系列显卡,可以说在2023年这个夏天已基本实现!
(相关资料图)
价格下来了,性能又会如何?对于这一代4060系列显卡,128bit位宽的显存规格在之前已引起了不小的热议,这也让更多人对其性能产生了好奇心。此次新品首发评测,笔者便带大家一探究竟。
此次首发评测选用的RTX4060Ti 8GB显卡为映众RTX4060Ti 8GB曜夜,它采用双风扇散热设计,标准双槽厚度,显卡尺寸较小,辅助供电接口为单8pin。在频率设置上,它与RTX4060Ti 8GB创始人版保持一致。
Ada Lovelace架构与RTX4060Ti 8GB
RTX40系列显卡基于英伟达新一代的Ada Lovelace架构设计。为了让大家更好地了解到这一显卡的升级,笔者首先会对Ada Lovelace架构以及所支持的一些重要技术进行介绍。
(一) Ada Lovelace架构核心
(Ada Lovelace架构核心)
(完整规格的AD102显示核心,具备144组SM单元)
(Ada Lovelace架构核心GPC单元)
Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)。根据NVIDIA官方的介绍,Ada Lovelace架构核心所采用的第3代RT Core不仅将光线与三角形求交性能提高了一倍,还将RT-TFLOP峰值性能提高了一倍之多。第3代RT Core还配备了全新的Opacity Micromap (OMM)引擎和Displaced Micro-Mesh (DMM)引擎,进一步提升了光追计算的性能以及减少计算开销,带来了更好的光线追踪效果表现。Ada Lovelace架构核心配备的第四代Tensor Core引入了来自专业级H100数据中心GPU的FP8 Transformer引擎带来了更加强悍的AI算力。
(第三代RT Core结构示意图,相比前代,增加了2个功能)
Ada Lovelace架构核心在SM单元上引入了Shader Execution Reordering(SER着色器执行重排序)技术来更好的对于着色器的工作进行调度排序,在使用上可以根据不同的负载需求来执行渲染,可对负载较为统一的画面进行渲染,降低工作开销。根据英伟达官方的介绍,这一个SER功能将作为API开放给开发者使用。英伟达官方宣称,SER功能的加入至高可带来两倍RT Core性能上的改善,对于光追游戏来说更可带来体验的升级。根据NVIDIA官方的数据,全新的SM(流式单元处理器)可带来至高两倍的性能以及能效升级,这一项升级不可谓不小。
(Ada Lovelace架构核心SM结构图)
Ada Lovelace架构核心除了第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)的升级以外,带来了全新的第八代NVENC双硬件编码器,这一全新的第八代NVENC双硬件编码器整合了对AV1视频编码格式的支持,可以在传统的H.264等格式之外,加入了对AV1这一主流新标准的支持,可以进行对于AV1格式的编码与解码,有效提升了生产力方面的表现,对于创作型用户、游戏主播等群体来说更是如虎添翼。来自NVIDIA官方的数据显示,第八代NVENC双硬件编码器在AV1的效率上比H.264编码器的效率提高了40%,这一提升非常明显。
而除了核心上的升级以外,Ada Lovelace架构核心还大幅度提升了其L2缓存,完成版的Ada Lovelace架构核心(AD102)拥有96MB的L2缓存,大容量的L2缓存带来了数据命中率的有效提升。在现阶段显存带宽提升有效的情况下,通过升级更大容量的L2缓存,可以进一步提升数据命中表现,带来性能方面的升级,根据NVIDIA官方的说法,大容量L2缓存的加入为GPU的一系列操作到带来了更高的收益,尤其是在光线追踪等场景下,表现更为明显。
(二) DLSS 3与NVIDIA Reflex
Ada Lovelace架构的一系列升级还带来了全新的DLSS 3技术的独占以及NVIDIA Reflex方面的体验提升。
DLSS 3包含有DLSS 2(DLSS超分辨率技术),以及全新加入的DLSS帧生成技术,这一项DLSS帧生成技术依托于Ada Lovelace架构的独立光流处理器以及Tensor Core的AI算力。在一项技术在运行过程中,其通过光流处理器所得到的一系列数据后,以光流加速技术(Optical Flow Acceleration,简称为OFA)来生成画面信息,而AI算力则负责来对画面进行进一步的优化,从而在游戏中加入了更多的帧画面,进行帧数的提升。
DLSS 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧,相当于使用1/8的算力,就完成了整个计算过程,而通过这一个流程的循环,可在提升帧数的同时节省资源开销,进一步带来更好游戏体验。
而在DLSS 3的帧生成技术上,由于可能带来延迟的增加,因此DLSS 3在使用上也将通过整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟。而根据NVIDIA官方的说法,DLSS 3通过整合NVIDIA Reflex以及一系列的技术,可以使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。
(三)RTX40系列台式机显卡第5弹——RTX4060Ti 8GB
(完整规格的AD106显示核心,具备36组SM单元)
基于AD106显示核心,NVIDIA现已推出了三款RTX4060系列显卡,包括RTX4060Ti 8GB、RTX4060Ti 16GB、RTX4060。
RTX4060Ti 16GB、RTX4060将于稍后上市,敬请关注。
(RTX4060Ti 8GB基于AD106-350显示核心设计,具备34组SM单元)
RTX4060Ti采用的是AD106-350显示核心,拥有4352个CUDA核心,搭配8GB容量、128bit位宽的GDDR6显存。
回看今年四月份上市的RTX4070,其采用的是AD104-250显示核心,拥有5888个CUDA核心,搭配12GB容量、192bit位宽的GDDR6X显存。
相比更高端的RTX4070,全新的RTX4060Ti 8GB在核心规格、显存规格方面均是有所削减的。
(映众RTX4060Ti 8GB曜夜显卡的GPU-Z信息)
在频率设置上,本文选用的映众RTX4060Ti 8GB曜夜显卡与RTX4060Ti 8GB创始人版保持一致,GPU频率为2310MHz,Boost频率为2535MHz,显存频率为2250MHz(等效18000MHz)。
对于RTX4060Ti 8GB还需要注意一点,这款显卡支持的是PCIe4.0 x8。
映众RTX4060Ti 8GB曜夜显卡欣赏
在外观设计上,映众RTX4060Ti 8GB曜夜与笔者之前评测过的映众RTX4070曜夜几乎一致,还是熟悉的样子。
映众RTX4060Ti 8GB曜夜以黑、灰色为主色调,主打轻薄双槽特色。该显卡没有设计RGB灯效,也没有什么花里胡哨的设计,低调不张扬。
由于采用的是双风扇散热设计,这款显卡的尺寸比较短,实测约25cm。加上标准双槽厚度设计,令这款显卡的安装兼容性很不错。
显卡背面设计了金属背板,上面有一些镂空设计,以便兼顾散热效果。
输出接口为三个DP 1.4a以及一个HDMI 2.1。
散热器顶部上面印有“INNO3D GEFORCE RTX”的字样。
显卡供电接口为熟悉的单8pin设计。
从RTX4070显卡开始,NVIDIA开始允许厂商选用传统的8pin外接供电接口设计。对于定位更低的RTX4060系列显卡,8pin外接供电接口设计自然会更多。
将散热器拆卸下来,露出显卡PCB,继续欣赏一下它的用料。
这款显卡虽然长度为25cm,但是它的PCB并不长。通过对比明显能够看出散热器和背板比PCB长出很多。
映众RTX4060Ti 8GB曜夜显卡采用了5+1相供电设计,搭配电容铁素体电感、固态电容等高品质元器件,用料比较扎实。
全新的AD106-350显示核心,芯片面积为190平方毫米,尺寸看上去很小。
显存是来自三星的GDDR6,单颗2GB容量。这款显卡PCB正面共设计有4颗显存,组建了8GB显存容量。
这款显卡采用的是HERCULEZ X2散热器,搭配有两枚直径约9cm散热风扇。风扇支持可拆洗 ,便于用户们日常保养清灰。此外,这款散热器支持智能风扇停转功能,在待机状态下或者轻负载状态下,它的这2枚风扇会全部停转,以便实现安静的运行效果。
这款散热器的金属主体部分比较大,不仅能够为GPU进行散热,而且还能够为显存以及MOS管进行散热。
纯铜镀镍底座,3根纯铜镀镍热管,加上大面积散热鳍片矩阵,可实现高效的散热。
测试平台介绍
笔者组建了一套性能出色的13代酷睿i5测试平台,用来测试显卡的性能。为了对比映众RTX4060Ti 8GB曜夜的性能,笔者此次测试还加入RTX4070以及上一代RTX3060Ti的成绩。
此次测试所选用的这款RTX4070是一款非公版显卡,其GPU频率为1920MHz,Boost频率为2475MHz,显存频率为1313MHz(等效21000MHz)。
此次测试所选用的这款RTX3060Ti同样是一款非公版显卡,其GPU频率为1410MHz,Boost频率为1680MHz,显存频率为1750MHz(等效14000MHz)。
英特尔13代酷睿处理器搭配RTX40系列独立显卡是支持Resizable BAR技术的。为了充分发挥映众RTX4060Ti 8GB曜夜显卡的性能表现,以下测试环节均是在Resizable BAR开启状态下进行的。
游戏性能测试
(一) 3DMark基准测试
首先是映众RTX4060Ti 8GB曜夜在3DMark基准测试当中的表现。性能到底有多强,大家一看便知。
在3DMark Time Spy测试项目中,这款RTX4060Ti 8GB的性能约为RTX4070的73.9%。
在3DMark Port Royal光线追踪测试项目中,这款RTX4060Ti 8GB的性能约为RTX4070的71.7%。
显而易见,RTX4060Ti 8GB相比RTX4070是存在明显性能差距的。
对比上一代RTX3060Ti,RTX4060Ti 8GB的性能则要高出一些。
(二) DLSS 3游戏实测
目前已有《赛博朋克2077》、《逆水寒》、《瘟疫传说:安魂曲》、《光明记忆:无线》、《生死轮回》等热门游戏大作支持DLSS 3技术。此次DLSS 3游戏实测,笔者将利用3款游戏进行测试。
DLSS 3游戏测试版——《赛博朋克2077》
DLSS 3游戏——《瘟疫传说:安魂曲》
DLSS 3游戏——《F1 22》
通过上述3款DLSS 3游戏来看,DLSS 3技术为RTX40系列显卡带来的游戏帧数提升是巨大的。
其中在1080p分辨率下,借助DLSS 3技术,RTX4060Ti 8GB已可畅玩当今大量光追游戏,轻松实现100+的FPS。
将分辨率提升至2K后,RTX4060Ti 8GB的性能表现也不错,大量光追游戏也能实现超过60FPS的帧速率。
此外,开启DLSS技术之后,不论DLSS 3还是DLSS 2,PC延迟也会明显降低,这也是DLSS技术的一大优势。
PC延迟越低,游戏画面流畅度自然也就越好。
(三) 其它游戏实测
接下来,笔者再测试一些非DLSS 3游戏。
游戏实测——《中土世界:暗影之战》
游戏实测——《战争机器5》
游戏实测——《幽灵行动:荒野》
游戏实测——《古墓丽影:暗影》
非DLSS 3游戏中,RTX4060Ti 8GB在多数游戏当中也要明显强于上代RTX3060Ti。
(四) 实际游戏过程中的显卡功耗测试
除了性能更强之外,RTX4060Ti 8GB在功耗表现方面也要明显优于上代RTX3060Ti。
通过实测来看,实际游戏过程中,映众RTX4060Ti 8GB曜夜显卡的运行功耗普遍控制在了160W以内,确实比较的省电。
生产力性能测试
(一) AV1硬件加速编解码测试
为什么AV1编解码技术越来越受欢迎?理由很简单,采用AV1编解码的视频能够以更低的码率,实现其它主流编解码视频相同的画质。说白了,在视频画质相同的情况下,采用AV1编解码的视频文件体积会更小,以至于能够为视频创作者们节省大量的硬盘空间。
目前剪映、万兴喵影、达芬奇等视频软件已可支持AV1硬件加速编/解码功能。接下来笔者利用剪映这款软件,将一部H264编码的MP4视频,导出为一部AV1编码的MP4视频。
显而易见,在RTX40系列显卡AV1视频编码加速的助力之下,转换时间比单用处理器转换大幅缩短,加速效果相当显著。
(二) VSR功能测试
NVIDIA在近期推出了一项重磅更新——RTX Video Super Resolution,这一项功能翻译过来就是视频超分辨率技术,简称VSR。它可以允许用户在播放视频时,以GPU配备的Tensor Core以及强悍的AI算力来进行内容的计算,从而提升画面分辨率,带来至高4K分辨率视频输出,为用户带来视频观感的提升。
VSR功能目前可在30/40系列显卡上进行开启,用户能在英伟达控制面板内开启这一项功能的使用,其在70级别以上显卡提供了4档的VSR增强选项可供调整。这一项VSR功能可在Google Chrome(110.0.5481.105版本以上)或者Microsoft Edge(110.0.1587.56版本以上)播放视频时进行调用。
我们也采用映众RTX4060Ti 8GB曜夜显卡对英伟达推出的VSR功能进行了实际的体验,首先选取的是在网页上播放480P的经典动画《猫和老鼠》,这一动画由于成片年代较早,因此画面在4K分辨率屏幕上的播放存在许多瑕疵。而通过开启VSR进行增强后,画面的细节有了明显的改善,并且画面的噪点有了明显的降低。在这里我们也通过截取同一帧画面,通过英伟达ICAT进行画面对比,方便各位感受到VSR带来的画面效果提升。
△左480P原生画面,右 480P RTX VSR 4X画面
△左480P原生画面,右 480P RTX VSR 4X画面
除了在网页端可以进行VSR的调用外,英伟达也是在和不少的本地播放器进行合作,让用户在本地播放器也可以体验到VSR功能带来的提升。
根据了解到的信息,知名的开源播放软件VLC将会提供到VSR的功能支持,而我们也是提前拿到了VLC的内部测试版本进行了本地VSR播放的体验。
在通过VLC本地播放《少女与战车》720P画面时,没开启VSR的情况下,整体画面在4K的显示器中显示并不是很清晰,而在开启VSR功能后,其在4K分辨率显示器的播放中也是显示出了更好的画面观感,对于观看体验有所提升。
笔者也是截取到了VLC本地播放《少女与战车》720P视频时,关闭与开启VSR功能的画面,通过ICAT进行了A/B画面对比。从对比中可看到,在VLC播放时开启VSR功能后,画面的噪点被进行了明显的压制,并且画面的线条整体更为锐利清晰,对于观感加成不少。
△左720P原生画面,右 720P RTX VSR 4X画面
△左720P原生画面,右 720P VSR 4X画面
从画面的对比上,我们可以看到VSR功能带来了更好的画面观感,对于用户的体验是有明显的加分的。而有朋友会好奇,开启VSR后GPU会进行相关的内容计算,这部分计算会不会带来更高的功耗?因此我们也是针对这一问题进行了功耗测试。
在4K分辨率屏幕下通过网页端播放1080P《某科学的超电磁炮》时,RTX4060Ti 8GB在不同的VSR档位设置中的功耗区间如下:
在4K分辨率屏幕下通过本地VLC播放器播放720P《少女与战车》时,RTX4060Ti 8GB在不同VSR档位设置中的功耗区间如下:
从功耗来看,RTX4060Ti 8GB在开启VSR功能后,其功耗的增长并不大,但是却可以带来更好的画面观感,因此推荐用户开启这一项功能。因为VSR 4档增强可以带来更好的画面效果,所以在1档和4档VSR增强功耗差距并不大的情况下,我们更为推荐用户开启到4档的VSR画面增强。
散热器测试
(注:笔者所处的室温维持在26℃)
利用FurMark,笔者将对映众RTX4060Ti 8GB曜夜显卡进行压力测试。
通过10分钟的烤机,默认频率下满载时GPU温度稳定在约66℃,GPU频率稳定在约2745MHz左右,散热设计可靠,同时静音效果也不错,令人放心。
全文总结
通过本文的一系列实测来看,RTX4060Ti 8GB的价格是下来了,但是其性能也削减了不少,与更高端的RTX4070相比,RTX4060Ti 8GB性能差距明显。如果想畅玩2K游戏,那么RTX4060Ti 8GB无疑是不错的新选择。如果你想追求更出色的4K游戏体验,那么RTX4060Ti 8GB则不适合你。
RTX4060Ti 8GB到底值不值得拥有,笔者认为关键看价格,对于3199元起步这个定价,笔者个人认为略贵。好在马上就到618年中大促了,不到3000元入手RTX4060Ti 8GB应该不难,到时候这款新显卡自然就更香了!
对于本文的主角映众RTX4060Ti 8GB曜夜,这款显卡表现可靠,小身材也带来了更好的兼容性,值得主流玩家们关注。