老黄如何下刀?解析架构规格
在之前的RTX 3070公版首测中笔者已经介绍过了,RTX 3070使用一颗GA104-300芯片,非满血,芯片完整度相当于上一代的RTX 2080。因此GA104一定还有一个满血的型号择机待发,本文我们先不讨论这个话题。
RTX 3070在原生规格的基础上只关闭了一组TPC,即256个SP单元,这个TPC内的8个纹理单元也随之失效。从上图可以看得出来,它离满血是咫尺之遥。
RTX 3060Ti是在RTX 3070的基础上再削减一整个GPC,芯片代号GA104-200,代表它是这一级别的末尾芯片,GA104不会再产生比它更低的显卡。
RTX 3060Ti的GPU芯片GA104-300规格示意图
GPC是NVIDIA架构中的最大计算单元区块,Ampere架构的GPU包含8个SM簇以及两组共16个负责填充像素的ROPs单元。所以RTX3060Ti比3070少了8×128=1024个流处理器,以及8×2=16个ROPs。但是这里的令人眼前一亮的是,显存控制器一刀未剪,依旧是32bit×8=256bit,沿袭了RTX 2060 Super的策略。NVIDIA为了对抗AMD从CPU中取经的Infinity Cache也是不惜血本了。
事实上,当Ampere架构将INT32计算功能改为INT32/PF32混合功能之后,相当于浮点性能原地增加一倍,而位宽配置还是老一套,笔者就开始顾虑在某些应用情形下ROPs像素填充到显存的带宽是否够用。现在RTX 3060Ti的配比似乎是一个均衡状态, 实际情况还要看测试结果。
104芯片时隔多年再次回到"60"显卡上,笔者对本次测试充满期待。在开始之前,先让我们瞻仰一下公版RTX 3060Ti的尊容。