华硕TUF RTX 4080 SUPER O16G GAMING首测 高端首选 比4080更强但价格更低

RTX40SUPER系列新品共有三款,分别为RTX4070SUPER、RTX4070TiSUPER以及RTX4080SUPER,RTX4080SUPER是唯一一款加量减价的型号。规格相比RTX4080更强,但起售价更低。如果从这个角度出发的话,那么RTX4080SUPER可以说是三款中最良心的型号。今天给大家带来的是,来自华硕的TUFGeForceRTX4080SUPERO16GGAMING(后简称TUFRTX4080SUPEROC)显卡的评测。


一、外观设计

TUFRTX4080SUPEROC的包装盒与自家RTX4080保持一致,四个角均“切”了一刀,八边形的设计在一众新卡中还是很有特点的。

来到显卡本体,TUFRTX4080SUPEROC采用的是哑黑配色,表面有磨砂处理。整体并不是特别高调,很有质感。导流罩与上一代保持一致,线条凌厉,棱角分明。

TUFRTX4080SUPEROC为三风扇设计,均为轴流风扇。左右扇叶朝向和转向与中间不同。左右风扇为逆时针旋转,中间风扇则为顺时针旋转。如此设计的原因是,可以减少乱流,提升散热器风量。左右风扇中央为TUF的Logo,中央风扇为华硕的Logo。三把风扇均为7扇叶,支持智能停转。

接口方面,TUFRTX4080SUPEROC提供了3个和2个,最大支持分辨率为7680x4320。

总体来看,TUFRTX4080SUPEROC的外观设计颇有一种西装暴徒的感觉,属于人狠话不多的角色。

二、NVIDIAGeForceRTX4080SUPER架构浅析

此次新发布的三款GeForceRTX40SUPER显卡依旧采用NVIDIAAdaLovelace架构,TSMC4N英伟达定制工艺。与上一代NVIDIAAmpere相比,NVIDIAAdaLovelace在相同功率下,具有2倍以上的性能提升,最高可达到90-TFLOPS的着色器数据吞吐量。

RTX4080SUPER的核心代号为AD103-400-A1,共有10240个CUDA核心,提供了52-TFLOPS算力;80个第三代AdaRTCore拥有121RT-TFLOPS;320个第四代TensorCore可提供836Tensor-TFLOPS(AITOPS)。

RTX4080SUPER的L2Cache容量为64MB,带宽为736GB/s。NVIDIA官方也强调了L2Cache的重要性,我们以两张图来简单说明L2缓存的作用。

GPU获取数据的路径,依次是L1缓存、L2缓存、显存和系统内存。L1缓存紧邻处理内核,延迟非常低。GPU寻找数据的首选就是L1缓存。如果目标数据不在L1缓存,GPU会在L2缓存中寻找。相比较L1缓存,L2缓存的延迟虽然无法做到L1缓存那么低,但容量可以做大。如果数据也不在L2缓存中,那么GPU会从显存中寻找。再找不到就会从系统内存中获取。

其实可以看到,GPU越早获取到数据,性能和效率就会越高。由于核心和L1缓存两者位置太近,所以L1缓存的容量不可能很大。所以,更大的L2缓存,将有效提高数据命中率,从而提高整体运行效率。RTX4080SUPER拥有更大的L2缓存容量,所以命中数据的概率更高。

更多详细的参数,我们为大家总结出了一张表格,可以看到,RTX4080SUPER的规格相比RTX4080,CUDA增加了512个,RTCore、TensorCore和纹理单元也有所增加,提升幅度约5.2%,另外频率和显存带宽稍有提升。不过建议零售价却直接便宜了1400元,非常良心,可谓加量大减价。

下面我们看一下具体的测试成绩。

三、测试平台简介

首先看一下测试平台。

为了保证TUFRTX4080SUPEROC的性能表现,处理器选择的是英特尔14代酷睿i7-14700K,并在主板BIOS中关闭能效核。主板是来自华硕的ROGMAXIMUSZ790DAKRHERO;内存为两条16GBDDR57200内存,组成32GB容量;电源为华硕ROG雷神2代1600W钛金。运行系统为Windows1123H2。

通过GPU-Z(2.57.0)可以看到TUFRTX4080SUPEROC的规格。其拥有10240个CUDA核心,基础频率为2295MHz,Boost频率为2610MHz。光栅和纹理单元分别为112个和320个。采用16GBGDDR6X显存,显存位宽256bit,带宽736.3GB/s。驱动版本为551.22。

四、理论性能测试

本次测试TUFRTX4080SUPEROC,主要对比RTX4080和RTX3080Ti两款显卡。由于部分测试项较新,可能会缺失对比显卡数据。

下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS、FSE和FSU三者分别对应显卡在1080P、2K和4K的理论性能,取显卡分数实际测试结果如下:

在FS测试中,TUFRTX4080SUPEROC相比RTX4080,其中FS提升3%;FSE提升3.7%;FUS提升3.2%,综合提升3.3%,提升幅度略小于核心规模差距。对比RTX3080Ti,综合成绩提升48%左右。

而在针对DX12环境下的TimeSpy和TimeSpyExtreme测试中,TUFRTX4080SUPEROC相较RTX4080的提升分别为:TS提升1.7%;TSE提升2%,综合约为1.85%,提升幅度同样略低于核心规模差距。对比RTX3080Ti,综合成绩提升49%左右。

PortRoyal是3DMARK中专门针对光追性能的测试项,TUFRTX4080SUPEROC相较RTX4080的提升约为2.7%。对比RTX3080Ti,提升45%左右。

下面我们再来看看3DMARK中新增的一些具体应用场景的测试。

SpeedWay这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以SW的测试基本可以看做次世代3A游戏基准。

TUFRTX4080SUPEROC对比RTX4080,从2K和4K分辨率提升依次为:3.4%和4.4%,与实际的核心规模差距比较接近。

另外我们使用3DMARK刚刚更新的DLSS3进行了相关性能测试。TUFRTX4080SUPEROC相比RTX4080的提升为:开启下提升2%,关闭下提升4.6%。

从整体的理论测试成绩来看,TUFRTX4080SUPEROC相比RTX4080的综合提升幅度并不大,DX11下提升超过3%,DX12下接近2%。而最新的SW综合测试的提升幅度在4%左右。看得出来,RTX4080SUPER在规模上与RTX4080相差不大,再加上两者在架构方面保持一致,最终导致两者的理论性能差距是比较小的。

五、常规游戏性能测试

由于本次RTX40系加入了DLSS3新技术,所以后面会进行单独测试,这里依然选择主流的几款3A大作进行游戏性能对比。

在《极限竞速:地平线5》中,其中TUFRTX4080SUPEROC相比RTX4080,在2K分辨率提升3.8%;4K分辨率提升2.5%,综合提升3.1%。相比RTX3080Ti提升幅度较大,综合提升超过66%。

在《无主之地3》中,TUFRTX4080SUPEROC相比RTX4080的提升分别为:2K提升6%;4K分辨率提升4.5%,综合提升超过5%。相比RTX3080Ti综合提升38%。

《光明记忆:无限》光追测试软件是独立于游戏的测试工具,实测TUFRTX4080SUPEROC相比RTX4080的提升分别为:2K提升5.5%;4K提升1.8%,综合提升3.6%。相比RTX3080Ti综合提升46%。

另外一款国产游戏《边境》的跑分软件中,TUFRTX4080SUPEROC相比RTX4080的提升分别为:2K提升4.9%;4K提升5%,综合提升5%。相比RTX3080Ti综合提升56%。

在《赛博朋克2077》中,TUFRTX4080SUPEROC在超级画质下,4K分辨率下的帧率超过80帧,流畅运行完全没有问题;即使在光追超级画质下,4K分辨率下的帧率甚至也能超过70帧,游戏体验完全没有问题。2K分辨率更不用说了,轻松超过百帧,实力非常强悍。

另外我们还测试了DLSS3的性能表现。

在《极限竞速:地平线5》这款游戏中,TUFRTX4080SUPEROC在2K和4K分辨率中,开启DLSS3相比DLSS2的提升分别为33%和12%,效果非常明显。

如今越来越多的游戏开始支持RTX和DLSS技术,其中已经超过500款游戏和应用支持RTX技术,支持DLSS3的游戏数量也在快速攀升,目前已经有72款游戏和应用支持DLSS3,未来包括《龙之信条2》、《灰区战争》、《半条命2》RTX版、《地平线:西之绝境》和《层层恐惧》等游戏,也将支持DLSS3技术,为配备GeForceRTX40系列显卡的游戏玩家带来前所未有的性能和更高的图像质量。

六、生产力工具测试

在生产力工具上,我们测试了V-Ray渲染器,选择使用GPU渲染的CUDA测试和RTX测试,成绩分别为4992vpaths、7278vpaths。

Bler是一款专业的三维渲染软件,我们使用的是官方的Benchmark跑分软件。软件会自动渲染测试monster/junkshop/classroom共三个场景。TUFRTX4080SUPEROC显卡得分分别为4623/2163/2267分。

七、AIGC测试

目前AI的应用范围越来越广泛,相关算力也得到了大家的重视。目前NVIDIA推出了全新的TensorRT插件,可以充分调用Tensor算力。此次我们使用StableDiffusion对TUFRTX4080SUPEROC在AIGC方面的性能进行测试。所有测试默认开启xformers优化方案。

首先是较为基础的模型测试,在中模型的输出分辨率为512x512和768x768。我们将导出【TRT】引擎,并记录使用默认模型渲染,以及【TRT】模型渲染的批次时间。

根据NVIDIA提供的统一参数进行输出,以便记录结果。其中采样方式为:Eulera;采样步骤:50;BatchCount:10。

【默认模型】TUFRTX4080SUPEROC运算时间22.2s,约合2.22秒一张图。

【模型】TUFRTX4080SUPEROC运算时间14.9s,约合1.49秒一张图。

第二次测试为的SDXL模型测试,SDXL模型将在1024x1024分辨率进行训练,相比来说图像大了2倍,它可以提供更准确的关键字匹配,从而获得更真实的结果。但由于更高的原生分辨率和模型复杂性,SDXL模型的计算强度明显更高。

我们按照相同的参数进行设置,但尺寸规定为1024x1024,下面看看TUFRTX4080SUPEROC的表现如何。

【默认SDXL模型】TUFRTX4080SUPEROC运算时间1,约合10.44秒一张图。

【TRTSDXL模型】TUFRTX4080SUPEROC运算时间1,约合6.44秒一张图。

在更复杂的模型中,TensorRT引擎的优势愈发明显,并且大显存的特点得到充分体现,实测最高占用达到了12GB显存,TUFRTX4080SUPEROC的16GB显存还有一定余量。

本次测试新增了ON1ResizeAI2023的测试,这是一款AI图像修复软件,包括图片缩放,内容填充等功能,同时它也可以作为PS等软件的插件形式存在,非常方便快捷。

测试选择NVIDIA提供的5张高分辨率图片进行,我们将在原图片的尺寸上直接放大200%,可以看到放大后的图片尺寸已经达到了12000x8000。

使用TUFRTX4080SUPEROC进行AI计算后,5张图片最终用时34641ms,即35秒左右。

放大后使用NVIDIAICAT进行对比,左侧为使用ON1ResizeAI2023进行放大200%的图片,可以看到在树叶的纹理更加清晰。而右侧则已经有一些模糊了。

AI对于日常生活的应用的确更加方便,在我们以往的认知中,图片尺寸放大必然会损失质量。但经由AI的加持,反而更清晰,这对于老照片的修复,起到了更加便捷的作用。

九、温度及功耗测试

功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。

可以看到TUFRTX4080SUPEROC这张显卡的温度稳定在62℃左右,热点温度在74℃左右;显卡总功耗在313.6W。

考虑到实际游戏负载不同,功耗是实时变化的,所以通过《光明记忆:无限》自带的Benchmark,在光追最高、DLSS质量、2K分辨率下,记录运行过程中显卡的实际功耗表现。

从记录的功耗曲线可以看到,TUFRTX4080SUPEROC在《光明记忆:无限》游戏的Benchmark中,功耗基本可以稳定在300W左右,平均功耗为293W。对于高端定位的显卡来说,特别是对比上一代RTX30系显卡,功耗并不算高。

十、总结

通过测试,其实大家也能够看到,RTX4080SUPER的性能,相较于RTX4080,提升幅度其实并不大,综合理论和游戏实测,性能的提升幅度大约在4%左右。但这并不影响它会成为未来一年高端显卡中,消费者首选的那款。原因主要有两个。

第一,RTX4080SUPER的性能,应对4K游戏是完全没有问题的,其性能表现可以说相当强悍,是目前能够流畅运行4K游戏的性能猛兽。同时在AI性能方面,表现强劲,16GB显存也能够应对绝大多数AIGC需求;

第二,RTX4080SUPER的定价,可以说是很多人没有想到的,起售价居然比RTX4080便宜了1400元。即使两者在性能方面差距并不大,但便宜的1400元足以让这款产品成为更多玩家的高端首选。

回到TUFRTX4080SUPEROC身上。这款显卡有着西装暴徒的外观设计,在性能表现方面可以完美应对4K游戏,同时强悍的散热设计让其在压力测试下,核心和热点温度也没有超过75℃,整体表现可以说非常亮眼,是首批上市的RTX4080SUPER中不可忽视的一款产品。

(8543478)

发布于 2025-05-09
165
上一篇:手机捕鱼器
目录

    推荐阅读