一、前言:搭配顶级散热系统的RTX 3070 Ti超龙
在RTX 30出现之前,微星的产品线中,魔龙算是顶级型号。NVIDIA Ampere构架诞生之后,微星发布了全新的超龙系列显卡,目的是将自己家的顶级非公再向上提升一个层次(闪电已经很久不见了)。
微星RTX 3070 Ti SUPRIM X 8G超龙(下面简称RTX 3070 Ti超龙)在设计上十分暴力,直接沿用了RTX 3080 Ti超龙的散热系统,要知道前者可是370W TDP,而RTX 3070 Ti超龙“只有”310W。
RTX 3070 Ti超龙所采用的TriFrozr 2S散热器从顶级的RTX 3090/3080 Ti一直用到现在,其散热效能早已久经考验。为GPU核心部分设计了7热管,另外考虑到GDDR6X巨大的功耗,微星还特意设计了一条热管专门用于显存散热。
从GPU-Z的截图可以看到,微星RTX 3070 Ti超龙的Boost频率达到了恐怖的1860MHz,比公版的1770MHz高了90MHz,TDP也从公版的290W提升到310W,另外还有20W的空间可以让超频玩家自行发挥。
微星RTX 3070 Ti超龙有2个BIOS,可以通过背部的开关进行切换。2个BIOS的性能是一样的,只是风扇转速会有一些差异,静音模式下风扇转速更低,很难感受到噪音,但是温度会稍微高一些;游戏模式下,可以将370W的GPU的烤机温度压制在67度左右。
关于Ampere GPU的构架此前我们已经有过详细的介绍,在这里我们化繁为简,将其做了简单的归纳如下:
1、整合INT32与FP32单元
Turing架构的INT32单元只能做整数运算,闲置率很高。为了解决这个问题,提升INT32单元的利用率,NVIDIA Ampere改进了INT32单元,使之不仅可以运行整数运算,也能进行单精度浮点运算,相当于整合了INT32和FP32单元,因而使得以FP32单元计数的GPU流处理器数量直接翻倍,单精度浮点性能也同样翻倍。
2、RTX IO技术
这项技术可以让游戏在加载时完全规避CPU,直接将游戏数据包从SSD写入到GPU的显存中,由GPU替代CPU进行数据解包。GPU的整数/浮点性能数十倍于CPU,可以瞬间完成数据的解包工作。
不过这项技术需要微软DirectStorage API的支持,预计2022年会正式开始应用。
3、NVIDIA DLSS:备受欢迎的AI技术
从游戏内的物理和动画模拟到实时渲染和AI增强的直播功能,AI正在引发一场游戏革命。借助GeForce RTX GPU的专用AI处理器Tensor Cores,NVIDIA DLSS在提升帧率的同时,生成精美、清晰的游戏图像,为玩家提供更大的性能空间,以最大限度地提高光线追踪设置并提高输出分辨率。现在已有超25款游戏支持DLSS,并且数量还在逐月递增。
4、NVIDIA Reflex:降低输入延迟
NVIDIA Reflex技术可以降低系统延迟(或称输入延迟),使游戏的响应速度更快,使玩家在多人竞技游戏中占据优势。
在传统的PC体系中,虽然强力的显卡可以轻松渲染出足够高的帧率,但这些游戏画面都需要CPU进行调度分配,不合理的调度会使得CPU手忙脚乱,玩家鼠标发出的指令其实无法第一时间到达游戏世界,这个过程我们称之为延迟。
为了降低系统延迟,帮助GPU渲染的图像能够第一时间迅速呈现在屏幕,NVIDIA Reflex技术也随着RTX 30系列的发布而登场。NVIDIA Re flex SDK被直接植入到了游戏,
NVIDIA Reflex SDK能够更好的控制CPU的运行速度,允许及时向GPU提交例如点击鼠标的关键动作,同时还确保GPU没有间断运行,保证画面的流畅输出。
而最新发布的360Hz刷新率的电竞G-Sync显示器还内建了延迟分析器,可以让你更系统化的量化电竞游戏中的延迟数据。 NVIDIA Reflex技术是职业电竞选手和精英玩家唯一专业的选择。
5、第二代RT Core
光线追踪是一种在计算机世界中完美再现真实世界的渲染技术,它的算法符合物理规律,不会像传统光栅化渲染那样容易产生各种问题。比如一个典型的例子就是光栅化算法无法正确处理焦散这种光学现象,炎热的夏天阳光透过游泳池在水底投射得斑纹光影就是典型焦散,传统光栅化算法使用的是动态贴图,看起来虽然也像那么回事,但是无法和玩家互动,例如当角色进入泳池游泳就无法进行正确处理渲,画面往往出现不合理渲染效果,或者游戏中的阳光位置变化,天气变化对泳池光影的影响也无法正确表现。而光线追踪技术可以实时自动的演算焦散效果,让画面更加真实。
但是光线追踪最大的问题是需要消耗巨大的计算资源,显示器就像一块窗子,虚拟的每一条光线都会穿过屏幕像素直达场景,并从存储器中查找会被击中的三角形,而且每条射线都要做这个动作,如果希望效果好的话,每像素可能还需要若干条甚至上万条射线。
如果场景里有几千万个三角形,逐个三角形做遍历求交,就需要消耗大量的高速缓存和总线带宽,计算单元需要浪费大量时间等待三角形数据传输。
RTX 30系列显卡基于新一代NVIDIA Ampere架构,拥有第二代光线追踪计算核心,相比于第一代光线追踪计算核心,RTX 30系列的光线追踪核心性能足足提高了1.7倍。而且硬件上特别支持对运动模糊场景的光追效果计算。从而带给玩家更流畅的光线追踪游戏视觉体验。
特别是体验《赛博朋克2077 》这样支持光线追踪技术的新一代游戏,RTX 30系列能够轻松驾驭赛博朋克的颓废风格,流畅渲染都市夜晚霓虹灯下,大量的赛车,追逐,打斗等运动场景。为玩家带来最极致的视觉体验。
6、第三代Tensor Core
NVIDIA 自 Volta架构开始,在GPU中增加了针对深度学习加速设计的矩阵运算单元,并称之为 Tensor Core(张量计算核心)。
在图灵架构里,NVIDIA 引入了第二代 Tensor Core,而到了RTX 30系列所采用的Ampere架构,则进化到了第三代Tensor Core。
深度学习技术在图形图像各个领域都有着价值巨大的应用,而在游戏体验中则是被称为深度学习超采样的DLSS 技术。最新一代的DLSS 能够使得游戏画质极大提升,细节和锐度媲美、甚至超越原生分辨率
DLSS 本质是一种图像重建算法,其加原理其实也很简单。开启DLSS后,游戏引擎中的诸如动态光源、阴影的计算,封闭空间环境遮挡(SSAO)、屏幕空间反射(SSR),甚至实时光线追踪。都会被降低到1/2甚至1/4像素的低分辨率下运行,GPU的负担大幅度减轻。渲染得出的最终场景会通过Tensor Core结合DLSS进行高分辨率重建,从而用较低的GPU负载获得流畅且画质极佳的游戏体验效果。
和图灵相比,Ampere的张量性能可以最高达到 2.7 倍。这使得RTX 30系列可以轻松使用DLSS技术在4K 甚至8K分辨率下,依然带给玩家最极致的光线追踪游戏体验效果。
7、GeForce Experience功能
所有NVIDIA GeForce GPU都能从GeForce Experience中获益,数以千万计的玩家都在使用该工具来优化游戏设置、记录和上传游戏、直播游戏、拍摄屏幕截图,以及下载和安装Game Ready驱动。最新功能包括:
8、一键自动式GPU调校
GeForce Experience现已支持GPU调校,它能使用高级扫描算法自动创建GPU超频配置文件。
9、增强型游戏内监控悬浮窗
GeForce Experience强大的游戏内悬浮窗功能现已能让玩家查看更多详细的性能统计信息、温度和延迟指标,包括 NVIDIA Reflex的延迟分析器统计信息。
二、图赏:7+1条热管设计
微星RTX3070Ti SUPRIM X沿用了RTX 30系超龙的外框设计,外观简洁,棱角分明、金属质感十分强烈。
显卡三围335x140x61mm,体型较普通的非公卡大了不少,但是它的PCB板长度其实至于260mm。
显卡正面是3个92mm的刀锋6代风扇,11片环形扇叶可以有效提高风压并降低噪音。
全尺寸金属背板,尾部还镶嵌了龙盾Logo。
背板的尾端采用镂空设计,气流轻松吹透,可以提高散热效率。
刀锋6代风扇,支持低温自动启停,风扇中间的浮雕很精致。
显卡顶端视角图,双8pin供电接口。
3个DP 1.4、一个HDMI 2.1接口。
从这里可以看到散热器不论是高度还是厚度都要超出I/O挡板很多,显卡61mm的厚度需要占用3个槽位。
超龙祖传的TRI FROZR 2S散热系统,7+1条6mm纯铜镀镍热管设计,其中一条是专门用于显存导热。纯铜镀镍散热底座经过了镜面化处理,可以均匀的将热量传到至每条热管。
PCB的长度只有26cm,而且空着的地方挺多,其实可以做成短PCB板。
11+2相供电设计称不上豪华,但是应付310W的功耗依然绰绰有余。
GA104-400-A1核心,也是完整的GA104核心,6144个流处理器。核心面积392平方毫米,拥有174亿个晶体管。
GPU核心周围是美光的GDDR6X显存,一共有8颗,单颗容量1GB,总容量8GB。频率19GHz,位宽256Bit,显存带宽608GB/s。
三、理论性能测试:3Dmark运行频率可达1995MHz
1、3DMark
在2K分辨率3DMark Fire Strike Extreme测试中,RTX 3070 Ti超龙图形分数达到了17893分,核心温度最高70.9℃,核心运行最高频率为1995MHz,最高风扇转速2629RPM,最高功耗314W。
在4K分辨率3DMark Fire Strike Ultra测试中,RTX 3070 Ti超龙图形分数达到了9346分,核心温度最高70℃,核心运行最高频率为1995MHz,最高风扇转速2551RPM,最高功耗307W。
2、3DMark Time Spy
在2K分辨率3DMark Time Spy测试中,RTX 3070 Ti超龙图形分数达到了15123分,核心温度最高70℃,核心运行最高频率为1980MHz,最高风扇转速2386RPM,最高功耗314W。
在4K分辨率3DMark Time Spy Extreme测试中,RTX 3070 Ti超龙图形分数达到了7512分,核心温度最高70℃,核心运行最高频率为1995MHz,最高风扇转速2199RPM,最高功耗314W。
四、游戏性能测试:比公版强3~4%
1、刺客信条:奥德赛
2、德军总部:新血脉
3、地平线:零之曙光
4、孤岛惊魂5
5、古墓丽影:暗影
6、赛博朋克2077
7、战争机器5
五、温度与超频测试:烤机67度 boost频率可超至2000MHz
使用Furmark来对RTX 3070 Ti超龙进行烤机测试,测试时室温为28度。
将Furmark的参数设定为1920*1080分辨率、0AA,烤机测试进行了37分钟。
在烤机过程中,RTX 3070 Ti超龙的功耗保持在316W左右,烤机频率1710MHz,核心温度67度,显存温度84度,风扇转速2043RPM。
2、超频测试
RTX 3070 Ti超龙的Boost频率比公版的1860GHz要高90MHz,TGP锁定在310W,比公版高了20W,同时还能通过超频软件将功耗墙提升到330W。
经过多次尝试,RTX 3070 Ti超龙可以在核心频率提升140MHz的情况下通过各种测试,此时Boost频率达到了2000MHz;GDDR6X显存也能超频到20.8GHz,显存带宽为666GB/s。
超频之后3DMark Fire Strike Extreme图形分数从达到了19163,这相比默频时的17893提高了1270分,提升幅度约为7%。最高运行频率达到了2130MHz,最高功耗324瓦,最高温度达到了75度
六、总结:顶级非公的表现
在TDP提升了20W,Boost频率提升了90MHz之后,再加上强大的散热系统,微星RTX 3070 Ti超龙的性能比公版RTX 3070 Ti要强了3~4%左右。这个幅度看似不大,毕竟在规格大幅加强之后,RTX 3070 Ti也就比RTX 3070强了6%左右。
在温度控制方面,虽然RTX 3070 Ti超龙的预设功耗高达310W,但在拥有8条肉感的TRI FROZR 2S散热系统压制之下,满载37分钟烤机温度也就只有67度。
另外,由于有专门的热管用于显存散热,因此在烤机过程中,GDDR6X显存的温度最高也就只有84度。
RTX 3070 Ti在超频方面的表现也十分的出彩,虽然他的Boost频率已经比公版高了90MHz,但还能继续再超140MHz,此时的Boost频率已高达2000MHz。它所搭载的三星显存也能从19GHz大幅度超频到20.8GHz,超频后的性能提升幅度可达7%。
另外,如果你对静音有较高的需求,在切换到静音BIOS之后,RTX 3070 Ti超龙能将风扇的转速控制在1300RPM,几近无声,但是温度会有一些提升。游戏模式和静音模式,玩家根据自己的实际需求自由切换。
(王治强 HF013)