RTX 4060 Ti显卡架构简析
GPU-Z检测下的索泰RTX 4060 Ti X-GAMING OC欧泊白参数信息
索泰RTX 4060 Ti X-GAMING OC欧泊白显卡拥有4352个流处理器、34个RT核心、136个纹理单元、48个ROP单元,32MB L2缓存,显卡核心频率为2310-2610MHz,电源输入接口为8pin。采用8GB GDDR6显存,显存位宽为128-bit,显存带宽288GB/s,等效速率为18Gbps。功耗方面,RTX 4060 TI FE版显卡的TDP为160W,索泰RTX 4060 Ti欧泊白显卡提供了15%的功耗上拉空间,其最大功耗为184W。
RTX 4060 TI所使用的AD106-350 GPU架构图
RTX 4060 TI所使用的AD106-350-A1 GPU实拍
RTX 4060 Ti使用的是AD106-350核心,与完整AD106核心相比,RTX 4060 Ti使用的AD106-350阉割了其中1个GPC中的1个TPC,即AD106-350由3个GPC构成,其中2个GPC包含6个TPC,1个GPC包含5个TPC,每个TPC拥有两组SM,共计为34组SM,即4352个CUDA。
和上代产品RTX 3060 Ti相比,RTX 4060 Ti的显存位宽减少了50%,显存带宽减少了36%。然而虽然RTX 4060 Ti的显存位宽、带宽降低,但该显卡拥有高达32MB的L2缓存,远超RTX 3060 Ti的4MB。
说到L2缓存就不得不提一下Ada GPU的存储子系统了。GPU在寻找信息时是按照L1缓存-L2缓存-显存-系统内存这一顺序逐层寻找的,层级清晰。显而易见的,越早寻找到内核所需要的信息就意味着效率越高。
RTX 4060 Ti增加的 L2缓存大小可以大幅提升GPU在L2缓存中找到需要信息的概率,大幅降低显卡对GPU显存交互的需求,从而提高性能和能效比。凭借32MB的L2缓存,RTX 4060 Ti显卡的实际等效显存带宽可达554GB/s,一举反超RTX 3060 Ti的448GB/s。
除了Ada GPU存储子系统之外,RTX 4060 Ti还拥有DLSS3这一给力技术的加持。DLSS3将光学多帧生成技术(插帧)、超级分辨率和NVIDIA Reflex整合到一起,再加上Ada架构各项提升,理论帧率提升可达4倍。
DLSS 3得到了许多全球领先的游戏开发者和游戏引擎的支持,目前已有33款已发布的DLSS 3游戏,并且有超过 300款游戏和应用支持 DLSS。