一、前言安培顶级旗舰降临 价格达1.2万
或许很同学对于这一次RTX 3080/3090在流处理器数量上翻倍的提升感到不可思议。毕竟从2013年的GTX 780 Ti到2019年的Titan RTX,流处理器数量仅仅只是从2880个提升到了4608个。也就是整整6年的时间,流处理器数量仅仅只是增加了60%而已。
而此次完整的GA102核心竟然有10752个流处理器,当于 Titan RTX的2.33倍,如此巨大的提升的确是很年没有出现过了!
PS上一次N卡大幅提升流处理器是8年前的GTX 680,1536个流处理器数量是GTX 580的三倍,性能则提升了30%!
较上一代图灵构架的RTX 20系列显卡,安培构架主要带来的如下改进
1、8nm制程工艺
图灵构架使用的三星12FFN工艺,在754mm2的面积内集成了186亿只晶体管。安培构架使用的是三星8N工艺,在628mm2的芯片内部集成了280亿只晶体管。算下来晶体管密度提升了83%之。
2、整合INT32与FP32单元
图灵的INT32单元只能做整数运算,闲置率很高。为了解决这个问题,提升INT32单元的利用率,NVIDIA改进了INT32单元,使之不仅可以运行整数运算,也能进行单精度浮点运算,当于整合了INT32和FP32单元,因而使得以FP32单元计数的GPU流处理器数量直接翻倍,单精度浮点性能也同样翻倍。
3、将ROP单元从内存控制器中分离
传统的ROP单元被集成在内存控制器中,阉割GPU位宽会降低ROP单元数量。而安培构架将ROP单元变成了GPC的一部分,每个GPC含有16个ROP单元,只要GPC数量不被阉割,ROP单元数量就不会减少。
比如即将发布的RTX 3070与RTX 3080一样都有6组GPC,ROP单元数量同样都是96个。
4、第二代RT Core
NVIDIA通过提升插值算法,提升了光线追踪技术在动态模糊效果下的精确度,使得安培构架的光追性能得到了翻倍提升。第一代RT Core可以提供10Giga Rays/s的性能,第二代RT Core可以达到20Giga Rays/s。
5、第三代Tensor Core
第三代Tensor Core的效率是第二代的4倍,即便安培构架将每个SM中的Tensor Core减半,它依然能达到图灵2倍的效能。
6、RTX IO技术
这项技术可以让游戏在加载时完全规避CPU,直接将游戏数据包从SSD写入到GPU的显存中,由GPU替代CPU进行数据解包。GPU的整数/浮点性能数十倍于CPU,可以瞬间完成数据的解包工作。
不过这项技术需要微软DirectStorage API的支持,预计2022年会正式开始应用。
除了以上技术之外,安培构架还支持PCIe 4.0、NVIDIA Reflex等技术,就不再一一叙述了。
9月初,NVIDIA一共发布了3款GA10X核心的显卡型号,此前已经解禁了RTX 3080,今天我们将向大家展示位于顶端的RTX 3090的详尽性能评测。
RTX 3090基于GA102-300-A1核心,拥有7组GPC,82组SM单元共计10496个流处理器、112个ROP、328个纹理单元、328个第三代Tensor Cores、82个第二代RT Cores。搭配24GB GDDR6X显存,显存频率19.5GHz、位宽384Bit、带宽936GB/s。
由于此次NVIDIA并未提供公版的RTX 3090 Founder Edition,我们拿规格与之完全一致的影驰RTX 3090金属大师来进行测试。
RTX 3090的详细规格如下
对比RTX 3080,RTX 3090的流处理器数量、Tensor Core、 ROP单元、显存带宽、纹理单元都提升了20%左右。
TDP也从RTX 3080的320W进一步提高到了350W,这恐怖是有史以来TDP最高的单芯片N卡。
而价格,也达到了史无前例的11999元起。