智驭先锋网

华硕TUF RTX 4080 SUPER O16G GAMING首测高端首选比4080更强但价格更低

RTX40SUPER系列新品共有三款，分别为RTX4070SUPER、RTX4070TiSUPER以及RTX4080SUPER，RTX4080SUPER是唯一一款加量减价的型号。规格相比RTX4080更强，但起售价更低。如果从这个角度出发的话，那么RTX4080SUPER可以说是三款中最良心的型号。今天给大家带来的是，来自华硕的TUFGeForceRTX4080SUPERO16GGAMING（后简称TUFRTX4080SUPEROC）显卡的评测。

一、外观设计

TUFRTX4080SUPEROC的包装盒与自家RTX4080保持一致，四个角均“切”了一刀，八边形的设计在一众新卡中还是很有特点的。

来到显卡本体，TUFRTX4080SUPEROC采用的是哑黑配色，表面有磨砂处理。整体并不是特别高调，很有质感。导流罩与上一代保持一致，线条凌厉，棱角分明。

TUFRTX4080SUPEROC为三风扇设计，均为轴流风扇。左右扇叶朝向和转向与中间不同。左右风扇为逆时针旋转，中间风扇则为顺时针旋转。如此设计的原因是，可以减少乱流，提升散热器风量。左右风扇中央为TUF的Logo，中央风扇为华硕的Logo。三把风扇均为7扇叶，支持智能停转。

接口方面，TUFRTX4080SUPEROC提供了3个和2个，最大支持分辨率为7680x4320。

总体来看，TUFRTX4080SUPEROC的外观设计颇有一种西装暴徒的感觉，属于人狠话不多的角色。

二、NVIDIAGeForceRTX4080SUPER架构浅析

此次新发布的三款GeForceRTX40SUPER显卡依旧采用NVIDIAAdaLovelace架构，TSMC4N英伟达定制工艺。与上一代NVIDIAAmpere相比，NVIDIAAdaLovelace在相同功率下，具有2倍以上的性能提升，最高可达到90-TFLOPS的着色器数据吞吐量。

RTX4080SUPER的核心代号为AD103-400-A1，共有10240个CUDA核心，提供了52-TFLOPS算力；80个第三代AdaRTCore拥有121RT-TFLOPS；320个第四代TensorCore可提供836Tensor-TFLOPS（AITOPS）。

RTX4080SUPER的L2Cache容量为64MB，带宽为736GB/s。NVIDIA官方也强调了L2Cache的重要性，我们以两张图来简单说明L2缓存的作用。

GPU获取数据的路径，依次是L1缓存、L2缓存、显存和系统内存。L1缓存紧邻处理内核，延迟非常低。GPU寻找数据的首选就是L1缓存。如果目标数据不在L1缓存，GPU会在L2缓存中寻找。相比较L1缓存，L2缓存的延迟虽然无法做到L1缓存那么低，但容量可以做大。如果数据也不在L2缓存中，那么GPU会从显存中寻找。再找不到就会从系统内存中获取。

其实可以看到，GPU越早获取到数据，性能和效率就会越高。由于核心和L1缓存两者位置太近，所以L1缓存的容量不可能很大。所以，更大的L2缓存，将有效提高数据命中率，从而提高整体运行效率。RTX4080SUPER拥有更大的L2缓存容量，所以命中数据的概率更高。

更多详细的参数，我们为大家总结出了一张表格，可以看到，RTX4080SUPER的规格相比RTX4080，CUDA增加了512个，RTCore、TensorCore和纹理单元也有所增加，提升幅度约5.2%，另外频率和显存带宽稍有提升。不过建议零售价却直接便宜了1400元，非常良心，可谓加量大减价。

下面我们看一下具体的测试成绩。

三、测试平台简介

首先看一下测试平台。

为了保证TUFRTX4080SUPEROC的性能表现，处理器选择的是英特尔14代酷睿i7-14700K，并在主板BIOS中关闭能效核。主板是来自华硕的ROGMAXIMUSZ790DAKRHERO；内存为两条16GBDDR57200内存，组成32GB容量；电源为华硕ROG雷神2代1600W钛金。运行系统为Windows1123H2。

通过GPU-Z（2.57.0）可以看到TUFRTX4080SUPEROC的规格。其拥有10240个CUDA核心，基础频率为2295MHz，Boost频率为2610MHz。光栅和纹理单元分别为112个和320个。采用16GBGDDR6X显存，显存位宽256bit，带宽736.3GB/s。驱动版本为551.22。

四、理论性能测试

本次测试TUFRTX4080SUPEROC，主要对比RTX4080和RTX3080Ti两款显卡。由于部分测试项较新，可能会缺失对比显卡数据。

下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装：FS、FSE和FSU三者分别对应显卡在1080P、2K和4K的理论性能，取显卡分数实际测试结果如下：

在FS测试中，TUFRTX4080SUPEROC相比RTX4080，其中FS提升3%；FSE提升3.7%；FUS提升3.2%，综合提升3.3%，提升幅度略小于核心规模差距。对比RTX3080Ti，综合成绩提升48%左右。

而在针对DX12环境下的TimeSpy和TimeSpyExtreme测试中，TUFRTX4080SUPEROC相较RTX4080的提升分别为：TS提升1.7%；TSE提升2%，综合约为1.85%，提升幅度同样略低于核心规模差距。对比RTX3080Ti，综合成绩提升49%左右。

PortRoyal是3DMARK中专门针对光追性能的测试项，TUFRTX4080SUPEROC相较RTX4080的提升约为2.7%。对比RTX3080Ti，提升45%左右。

下面我们再来看看3DMARK中新增的一些具体应用场景的测试。

SpeedWay这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以SW的测试基本可以看做次世代3A游戏基准。

TUFRTX4080SUPEROC对比RTX4080，从2K和4K分辨率提升依次为：3.4%和4.4%，与实际的核心规模差距比较接近。

另外我们使用3DMARK刚刚更新的DLSS3进行了相关性能测试。TUFRTX4080SUPEROC相比RTX4080的提升为：开启下提升2%，关闭下提升4.6%。

从整体的理论测试成绩来看，TUFRTX4080SUPEROC相比RTX4080的综合提升幅度并不大，DX11下提升超过3%，DX12下接近2%。而最新的SW综合测试的提升幅度在4%左右。看得出来，RTX4080SUPER在规模上与RTX4080相差不大，再加上两者在架构方面保持一致，最终导致两者的理论性能差距是比较小的。

五、常规游戏性能测试

由于本次RTX40系加入了DLSS3新技术，所以后面会进行单独测试，这里依然选择主流的几款3A大作进行游戏性能对比。

在《极限竞速：地平线5》中，其中TUFRTX4080SUPEROC相比RTX4080，在2K分辨率提升3.8%；4K分辨率提升2.5%，综合提升3.1%。相比RTX3080Ti提升幅度较大，综合提升超过66%。

在《无主之地3》中，TUFRTX4080SUPEROC相比RTX4080的提升分别为：2K提升6%；4K分辨率提升4.5%，综合提升超过5%。相比RTX3080Ti综合提升38%。

《光明记忆：无限》光追测试软件是独立于游戏的测试工具，实测TUFRTX4080SUPEROC相比RTX4080的提升分别为：2K提升5.5%；4K提升1.8%，综合提升3.6%。相比RTX3080Ti综合提升46%。

另外一款国产游戏《边境》的跑分软件中，TUFRTX4080SUPEROC相比RTX4080的提升分别为：2K提升4.9%；4K提升5%，综合提升5%。相比RTX3080Ti综合提升56%。

在《赛博朋克2077》中，TUFRTX4080SUPEROC在超级画质下，4K分辨率下的帧率超过80帧，流畅运行完全没有问题；即使在光追超级画质下，4K分辨率下的帧率甚至也能超过70帧，游戏体验完全没有问题。2K分辨率更不用说了，轻松超过百帧，实力非常强悍。

另外我们还测试了DLSS3的性能表现。

在《极限竞速：地平线5》这款游戏中，TUFRTX4080SUPEROC在2K和4K分辨率中，开启DLSS3相比DLSS2的提升分别为33%和12%，效果非常明显。

如今越来越多的游戏开始支持RTX和DLSS技术，其中已经超过500款游戏和应用支持RTX技术，支持DLSS3的游戏数量也在快速攀升，目前已经有72款游戏和应用支持DLSS3，未来包括《龙之信条2》、《灰区战争》、《半条命2》RTX版、《地平线：西之绝境》和《层层恐惧》等游戏，也将支持DLSS3技术，为配备GeForceRTX40系列显卡的游戏玩家带来前所未有的性能和更高的图像质量。

六、生产力工具测试

在生产力工具上，我们测试了V-Ray渲染器，选择使用GPU渲染的CUDA测试和RTX测试，成绩分别为4992vpaths、7278vpaths。

Bler是一款专业的三维渲染软件，我们使用的是官方的Benchmark跑分软件。软件会自动渲染测试monster/junkshop/classroom共三个场景。TUFRTX4080SUPEROC显卡得分分别为4623/2163/2267分。

七、AIGC测试

目前AI的应用范围越来越广泛，相关算力也得到了大家的重视。目前NVIDIA推出了全新的TensorRT插件，可以充分调用Tensor算力。此次我们使用StableDiffusion对TUFRTX4080SUPEROC在AIGC方面的性能进行测试。所有测试默认开启xformers优化方案。

首先是较为基础的模型测试，在中模型的输出分辨率为512x512和768x768。我们将导出【TRT】引擎，并记录使用默认模型渲染，以及【TRT】模型渲染的批次时间。

根据NVIDIA提供的统一参数进行输出，以便记录结果。其中采样方式为：Eulera；采样步骤：50；BatchCount：10。

【默认模型】TUFRTX4080SUPEROC运算时间22.2s，约合2.22秒一张图。

【模型】TUFRTX4080SUPEROC运算时间14.9s，约合1.49秒一张图。

第二次测试为的SDXL模型测试，SDXL模型将在1024x1024分辨率进行训练，相比来说图像大了2倍，它可以提供更准确的关键字匹配，从而获得更真实的结果。但由于更高的原生分辨率和模型复杂性，SDXL模型的计算强度明显更高。

我们按照相同的参数进行设置，但尺寸规定为1024x1024，下面看看TUFRTX4080SUPEROC的表现如何。

【默认SDXL模型】TUFRTX4080SUPEROC运算时间1，约合10.44秒一张图。

【TRTSDXL模型】TUFRTX4080SUPEROC运算时间1，约合6.44秒一张图。

在更复杂的模型中，TensorRT引擎的优势愈发明显，并且大显存的特点得到充分体现，实测最高占用达到了12GB显存，TUFRTX4080SUPEROC的16GB显存还有一定余量。

本次测试新增了ON1ResizeAI2023的测试，这是一款AI图像修复软件，包括图片缩放，内容填充等功能，同时它也可以作为PS等软件的插件形式存在，非常方便快捷。

测试选择NVIDIA提供的5张高分辨率图片进行，我们将在原图片的尺寸上直接放大200%，可以看到放大后的图片尺寸已经达到了12000x8000。

使用TUFRTX4080SUPEROC进行AI计算后，5张图片最终用时34641ms，即35秒左右。

放大后使用NVIDIAICAT进行对比，左侧为使用ON1ResizeAI2023进行放大200%的图片，可以看到在树叶的纹理更加清晰。而右侧则已经有一些模糊了。

AI对于日常生活的应用的确更加方便，在我们以往的认知中，图片尺寸放大必然会损失质量。但经由AI的加持，反而更清晰，这对于老照片的修复，起到了更加便捷的作用。

九、温度及功耗测试

功耗测试中，我们选择FurMark软件进行拷机测试，并采用GPU-Z检测温度，功耗仅计算显卡自身。

可以看到TUFRTX4080SUPEROC这张显卡的温度稳定在62℃左右，热点温度在74℃左右；显卡总功耗在313.6W。

考虑到实际游戏负载不同，功耗是实时变化的，所以通过《光明记忆：无限》自带的Benchmark，在光追最高、DLSS质量、2K分辨率下，记录运行过程中显卡的实际功耗表现。

从记录的功耗曲线可以看到，TUFRTX4080SUPEROC在《光明记忆：无限》游戏的Benchmark中，功耗基本可以稳定在300W左右，平均功耗为293W。对于高端定位的显卡来说，特别是对比上一代RTX30系显卡，功耗并不算高。

十、总结

通过测试，其实大家也能够看到，RTX4080SUPER的性能，相较于RTX4080，提升幅度其实并不大，综合理论和游戏实测，性能的提升幅度大约在4%左右。但这并不影响它会成为未来一年高端显卡中，消费者首选的那款。原因主要有两个。

第一，RTX4080SUPER的性能，应对4K游戏是完全没有问题的，其性能表现可以说相当强悍，是目前能够流畅运行4K游戏的性能猛兽。同时在AI性能方面，表现强劲，16GB显存也能够应对绝大多数AIGC需求；

第二，RTX4080SUPER的定价，可以说是很多人没有想到的，起售价居然比RTX4080便宜了1400元。即使两者在性能方面差距并不大，但便宜的1400元足以让这款产品成为更多玩家的高端首选。

回到TUFRTX4080SUPEROC身上。这款显卡有着西装暴徒的外观设计，在性能表现方面可以完美应对4K游戏，同时强悍的散热设计让其在压力测试下，核心和热点温度也没有超过75℃，整体表现可以说非常亮眼，是首批上市的RTX4080SUPER中不可忽视的一款产品。

(8543478)

阅读全文

发布于 2025-05-09

喜欢 19

139

上一篇：霸气侧漏——Cougar 700m

下一篇：有“芯”之人，有趣之人｜读＋

推荐阅读