一、前言:老黄专为游戏玩家打造的GPU
对于这个阶段的游戏玩家而言,要以官方建议零售价买到一款游戏显卡似乎已经是不可能实现的事情!矿工的疯狂超乎所有人的想象,新一代显卡基本上已经被他们所垄断,高售价
+ 缺货断绝了很多玩家升级电脑甚至是玩游戏的念想。
也许是老黄看透了玩家的痛苦!为了准备足够多的库存,原定于2月初发布的NVIDIA GeForce RTX 3060被推迟到了25号。更重要的一点,这款GPU从物理层面阉割了挖矿能力,这是一款真正为游戏玩家准备的甜点显卡。
虽然型号看起来很积极恩,但GeForce RTX 3060并没有采用RTX 3060 Ti的GA104核心,NVIDIA重新设计了GA106核心来打造这款显卡。
完整的GA106核心拥有3组GPC,30组SM单元,3840个流处理器,48个ROP、30个光追单元和120个纹理单元,120个Tensor Core。
GeForce RTX 3060稍微做了一些阉割,砍掉了2组SM单元,流处理器变成了3584个。纹理单元和Tensor Core也同步减少到了112个。但是对于游戏性能至关重要的很ROP单元依然是48个。
下图是NVIDIA GeForce RTX 3060的详细规格参数:
RTX 3060的显存容量达到了12GB,这多少有些令人匪夷所思!毕竟更高端的RTX 3060 Ti/RTX 3070也才只有8GB,次旗舰级别的RTX 3080也就10GB显存。RTX 3060配备的12GB看似离谱,但是考虑到其售价仅为2499元,四舍五入,12GB显存等于白送。
另外实际上,目前对于CUDA支持非常完善的应用,比如Resolve,Photoshop等软件,会调用非常多的显存,因此从某些方面来说,NVIDIA GeForce RTX 3060反而更适合用于生产力创作。
RTX 3060的算例还不到22MH/s
关于安培GPU的构架此前我们已经有过详细的介绍,在这里我们化繁为简,将其做了简单的归纳如下:
1、8nm制程工艺:
图灵构架使用的三星12FFN工艺,在754mm2的面积内集成了186亿只晶体管。安培构架使用的是三星8N工艺,在628mm2的芯片内部集成了280亿只晶体管。算下来晶体管密度提升了83%之多。
2、整合INT32与FP32单元:
图灵的INT32单元只能做整数运算,闲置率很高。为了解决这个问题,提升INT32单元的利用率,NVIDIA改进了INT32单元,使之不仅可以运行整数运算,也能进行单精度浮点运算,相当于整合了INT32和FP32单元,因而使得以FP32单元计数的GPU流处理器数量直接翻倍,单精度浮点性能也同样翻倍。
3、将ROP单元从内存控制器中分离:
传统的ROP单元被集成在内存控制器中,阉割GPU位宽会降低ROP单元数量。而安培构架将ROP单元变成了GPC的一部分,每个GPC含有16个ROP单元,只要GPC数量不被阉割,ROP单元数量就不会减少。
比如即将发布的RTX 3070与RTX 3080一样都有6组GPC,ROP单元数量同样都是96个。
4、第二代RT Core:
NVIDIA通过提升插值算法,提升了光线追踪技术在动态模糊效果下的精确度,使得安培构架的光追性能得到了翻倍提升。第一代RT Core可以提供10Giga Rays/s的性能,第二代RT Core可以达到20Giga Rays/s。
5、第三代Tensor Core:
第三代Tensor Core的效率是第二代的4倍,即便安培构架将每个SM中的Tensor Core减半,它依然能达到图灵2倍的效能。
6、RTX IO技术:
这项技术可以让游戏在加载时完全规避CPU,直接将游戏数据包从SSD写入到GPU的显存中,由GPU替代CPU进行数据解包。GPU的整数/浮点性能数十倍于CPU,可以瞬间完成数据的解包工作。
不过这项技术需要微软DirectStorage API的支持,预计2022年会正式开始应用。
除了以上技术之外,安培构架还支持PCIe 4.0、NVIDIA Reflex等技术,就不再一一叙述了。
二、七彩虹RTX 3060 Ultra W图赏
由于此次NVIDIA GeForce RTX 3060并没有公版发售,我们找看一款在规格上与公版几乎完全相同的七彩虹RTX 3060 Ultra W来测试。
RTX 3060 Ultra W整体为白色设计,中间点缀了一些幻彩装饰。正面有3个风扇,中间的是80mm,2边各一个90mm风扇。
金属背板,主要作用是加固显卡并辅助散热。
底部视角图。
顶部视角图,可以看到非常厚的散热器。
双8Pin供电接口,其实应付170W的功耗单8Pin就绰绰有余了。
个DP 1.4a与1个HDMI 2.1接口,另外还有一个BIOS切换按钮,可以在2个BIOS之间自由切换,如果有BIOS损坏,可以直接切换到另外一个。
2段式散热器,2x6mm + 2x8mm共4条热管采用“回流焊”工艺设计,使得每一根热管都与散热鳍片成为一体,充分优化了散热效能,紧贴下部铜片散热底。
显卡PCB上面的主要发热部件—显存、MOSFET均有导热帖覆盖,可以迅速将温度传导至散热器。
拆掉散热片后的PCB本体,8+2相供电设计。
其实RTX 3060PCB可以做得很小,不过做成长PCB方便搭配强力的三风扇散热器。
PCB板背面。
供电模块特写,这里有8相供电,用于GPU核心的供电。在GPU右边还有2相是显存供电电路。
GA106-300-A1核心,明显比RTX 3060 Ti的GA104核心要小一圈。
GPU核心周围是三星GDDR6显存,一共有8颗,单颗容量1GB,总容量8GB。频率15GHz,位宽192Bit,显存带宽360GB/s。
三星颗粒可以很轻松的超频到16400MHz。
三、测试平台:全核5.2GHz的i9-10900K与ROG M12E主板压阵
暂时我们还是选择了i9-10900K处理器平台。为了降低CPU的瓶颈效应,我们将i9-10900K的核心频率超频到了5.2GHz,Ring频率超频到了4.8GHz。
主板用的是ROG MAXIMUS XII EXTREME。这款主板采用16+0供电,16相供电全部给了CPU核心,0相给核显。MosFET升级为TDA21490,这是目前最高规格的一体化MOSFET,导通电流也从55A提高到了90A,可以轻易提供超过1000W的输出功率。
内存必须32GB了,目前很多3A大作在16GB内存下运行时会出现各种问题。
芝奇皇家戟F4-4000C15D 8GBx4套装,不仅拥有4000MHz的频率,15-16-16-36的时序也是低的吓人,比绝大部分3000MHz频率的内存都要低,不过默认电压1.5V也算是比较高的了。
长江存储致钛PC005 Active 512GB SSD,顺序读写速度分别为3500MB/s,2900MB/s。不依赖模拟SLC缓存也能保持550MB/s的稳定写入速度,同时寿命远远高于市面上绝大多数TLC SSD。
酷冷至尊P360 ARGB水冷散热器,应该是市面上颜值最高也最易安装的水冷散热器,可以很轻松的压制5.2GHz的i9-10900K处理器。
XPG CORE REACTOR 850 GOLD电源,全模块化设计,单路12V输出电流70.8A,12V输出功率达到了850W。
120mm FDB液体动态轴承风扇。
华硕玩家国度PG27UQ ROG 27英寸IPS电竞显示器。
4K UHD(3840*2160)分辨率、4ms响应时间、144Hz刷新率、G-Sync 技术、IPS+量子点面板、10bit色彩、DisPlay HDR1000认证。依旧是目前市面上顶级的电竞显示器。
四、理论性能测试:3DMark SPY成绩亮眼
1、3DMark
在2K分辨率3DMark Fire Strike Extreme测试中,RTX 3060图形分数达到了10314,核心温度最高60℃,热点温度72度。核心运行最高频率为1950Hz,最高风扇转速1584RPM,最高功耗172W。
在4K分辨率3DMark Fire Strike Ultra测试中,RTX 3060图形分数为5004分,核心温度最高56℃,核心运行最高频率为1957MHz,最高风扇转速1459RPM,最高功耗172W。
RTX 3060在3DMark中的表吸纳并不好,2K分辨率下只比RTX 2060快了12%,4K分辨率也只有15%的优势。
和RTX 3060 Ti相比,RTX 3060在2个分辨率下分别落后29%和31%。
2、3DMark Time Spy
在2K分辨率3DMark Time Spy测试中,RTX 3060图形分数达到了8775分,核心温度最高58℃,核心运行最高频率为1935MHz,最高风扇转速1527RPM,最高功耗172W。
在4K分辨率3DMark Time Spy Extreme测试中,RTX 3060图形分数达到了4139分,核心温度最高58℃,核心运行最高频率为1942MHz,最高风扇转速1525RPM,最高功耗175W。
在3DMark Time Spy的测试中,RTX 3060可算是扬眉吐气,在2K分辨率下比RTX 2060快了25%,与RTX 3060 Ti的差距是20%。
在4K分辨率下,RTX 3060能比RTX 2060快26%,和RTX 3060 Ti的差距是23%。
五、1080P游戏性能测试:只比GTX 1080 Ti弱4%
1、APEX英雄
2、使命召唤:战区
3、GTA V
4、刺客信条:奥德赛
5、德军总部:新血脉
6、地平线:零之曙光
7、孤岛惊魂5
8、古墓丽影:暗影
9、绝地求生
10、微软模拟飞行 2020
11、赛博朋克2077
12、死亡搁浅
13、巫师3
14、无主之地3
14、战地5
16、战争机器5
以下是1080P分辨率下测试数据的汇总:
在1080P分辨率下,RTX 3060的游戏性能比RTX 2060快了20%,和RTX 3060 Ti的差距则是23%。另外RTX 3060的性能和GTX 1080 Ti十分接近,二者的差距只有4%。
六、2K游戏性能测试:比RTX 2060快了23%
1、APEX英雄
2、使命召唤16:战区
3、GTA V
4、刺客信条:奥德赛
5、德军总部:新血脉
6、地平线:零之曙光
7、孤岛惊魂5
8、古墓丽影:暗影
9、绝地求生
10、微软模拟飞行2020
11、赛博朋克2077
12、死亡搁浅
13、巫师3
14、无主之地3
15、战地5
16、战争机器5
下面2K分辨率下的测试数据汇总:
在2K分辨率下,RTX 3060在绝大多数中都能达到60FPS+的帧率。在性能上比RTX 2060要强了23%,比RTX 3060 Ti弱了26%,和GTX 1080 Ti的差距只有6%。
4K不是RTX 3060的目标所在,限于篇幅我们就只向大家展示汇总的成绩。
随着分辨率的提升,RTX 3060相对RTX 2060的领先优势进一步扩大到了27%,当然与RTX 3060 Ti的差距已到了28%。
不过和GTX 1080 Ti相比,而且的差距依然只有6%。
七、温度与功耗测试:长时间烤机不超过60度
1、温度测试
使用Furmark来对七彩虹RTX 3060 Ultra W进行烤机测试,测试是室温为26度。
将Furmark的参数设定为1920*1080分辨率、0AA。运行22分钟之后,RTX 3060 Ultra W的温度稳定在58度附近,显卡的功耗维持在170W上下,满载时风扇转速仅有1582RPM。
2、功耗测试
分别测试待机、与Furmark烤机功耗,另外我们还会加上游戏功耗测试,测试的游戏项目为《巫师3》
测试所用的电源为威刚XPG CORE REACTOR 850 GOLD金牌电源。
由于TDP仅比RTX 2060高了10W,不论是在游戏还是烤机测试中,2款显卡的差距均只有个位数。
在FurMark烤机时,RTX 3060整机功耗也仅仅只有297W,比RTX 3060 Ti低了23W,比RX 2060高出6W。
在运行《巫师3》时,RTX 3060 平台的整机功耗是292W,比RTX 3060 Ti低了20W,比RX 2060高9W。
八、超频测试:核心可超80MHz显存能上到16GHz
此前发布的几块安培GPU超频能力都很一般,RTX 3060的核心规模较小,温度和功耗都能很轻松的控制,超频能力可以稍微的期待一下。
经过多次尝试,RTX 3060 可以在核心频率提升140MHz的情况下通过各种测试,此时Boost频率达到了1917MHz;三星显存也能超频到16.4GHz,显存带宽为392GB/s。
另外七彩虹RTX 3060 Ultra W将功耗限制在了170W,无法改变。
超频之后3DMark Fire Strike Extreme图形分数从达到了10996分,这相比默频时的10551提高了455分,提升幅度达到了4.5%,最高运行频率达到了2085MHz。由于功耗依旧是170我,因此最高温度也只有59度。
同时我们也测试了超频后的显卡在《古墓丽影:暗影》中的帧率表现。
超频之后的RTX 3060在2K分辨率下能跑出86FPS的帧率,比默频的81FPS高了5帧,提升幅度是6%。
八、光线追踪与DLSS性能测试
1、堡垒之夜
2020年11月,《堡垒之夜》推送了支持光线追踪与DLSS技术的更新,该游戏采用了最新版的RTX的算法,光追画质更加惊艳的同时游戏的帧率也提升了。
RTX 3060在默认情况下能达到48FPS的帧率,开启光线追踪之后,帧率会暴跌至21FPS。开启DLSS技术之后帧率又回升到了47FPS,基本上可以等同于默认时的帧率。
2、古墓丽影:暗影
相对其他几款游戏来说,《古墓丽影:暗影》开启光追对于帧率没有太大的影响,RTX 3060只是从43FPS掉到了25FPS,打开DLSS后帧率提升到了37FPS。
3、光明记忆
《光明记忆:无限》开启光追之后帧率跌的也比较厉害,RTX 3060开启光追之后直接从57FPS掉到了19FPS。开启DLSS之后,游戏帧率又回到了52FPS。
4、控制
《控制》也同样能展示出新一代RTX核心与TENSOR核心的优势,开启DLSS + RTX之后,帧率比默认还高。
5、赛博朋克2077
《赛博朋克2077》应该是目前光追效果最好的游戏,开启光线追踪后帧率暴跌。RTX 3060从22FPS跌到了9帧,打开DLSS之后,帧率又回到了22FPS。
6、战地5
《战地5》开启光追之后帧率下降的并不多,RTX 3060只是从59FPS掉到了39FPS,不过开启DLSS之后帧率提升也非常有限,不到30%,毕竟还是第一代DLSS。
看起来RTX 3060的光追效率要稍好一些,开启光追后性能损失了53%,其他几块显卡损失的性能在55~57%之间。
想要玩光追游戏,RTX 3060比较合适的分辨率是1920*1080,另外总体而言,开启DLSS之后游戏帧率会有近乎100%的提升。
九、总结:玩家真正能买到的显卡
其实对于游戏玩家而言,RTX 3060的性能算不上非常惊艳,但是它是一款真正为游戏玩家推出的显卡。
在从物理层面砍掉挖矿性能之后,RTX 3060的22MH/s的挖矿算力甚至比GTX 1660 SUPER都差了很多,对于矿工而言实在是没有什么诱惑力了。相信只要RTX 3060大量上市,买到它的玩家绝大多数都会是真正的游戏玩家。
RTX 3060是一款为1080P分辨率而生的显卡,它能在目前绝大多数3A大作中开启最高画时用以后超过60FPS的帧率表现。
就性能而言,RTX 3060与GTX 1080 Ti/RTX 2070 SUPER非常接近,稍强于RTX 2070,比RTX 2060要强20~27%左右(不同分辨率下)。但是由于规格上与RTX 3060 Ti差的太多,在性能上也与后者有着30%左右的差距。这应该是NVIDIA历史上60Ti与60性能差距最大的一代。
在温度与功耗方面,由于RTX 3060并没有公版,我们测试的这款七彩虹RTX 3060 Ultra W的表现很是亮眼。在3DMark的测试还是进行长时间的FurMark烤机,GPU的最高温度没有超过60度,同时风扇转速也仅仅只有1500RPM。这样的表现也在我们预料之中,毕竟三风扇的大散热器压制170W的GPU不会有任何压力。
至于超频,和已经发布的几款安培GPU不同,RTX 3060可以通过超频轻松将核心频率提升140MHz,搭载的三星显存也能从15GHz超频到16.4GHz。这应该算是目前为止超频能力最强的安培GPU。
另外,RTX 3060还支持与AMD SAM(显存智取)类似的resizable BAR技术,理论上能够将部分游戏的提升10%左右,不过由于我们此次测试的数据不全,因此此次并未展示相关的测试内容。
NVIDIA GeForce RTX 3060将于北京时间2月26日1点正式开放购买,官方建议零售售价2499元,几乎所有的AIC都有2499元的型号。那么会有多少玩家熬夜到凌晨1点去抢这款GPU呢!
(王治强 HF013)