GTX1660Ti性能游民首测 比肩GTX1070的图灵新花

这款以图灵架构为基础的老树新花对比Pascal GTX显卡与RTX显卡能有怎样的性能表现,而GTX1660Ti是否代表着GTX显卡迎来真正意义上终章绝唱?就让我们从GTX1660Ti的角度上,深入解读NVIDIA在GTX与RTX时代间的抉择。

GTX1660Ti性能游民首测 比肩GTX1070的图灵新花

游民星空

下载游民App,掌握一手游戏情报

GTX1660Ti性能游民首测 比肩GTX1070的图灵新花

游民星空[原创] 尹晓峰 2019-02-22 22:01
0

  重制SM单元的TU116核心

游民星空

  60级显卡一直是“甜点”的代名词,而这款为GTX1060 6G的接棒者设计的核心,更是在性能、功耗与成本上做了更为精细得平衡。

  TU116由3个GPC构成,与RTX2060的TU-106-200核心相比每组GPC少了一组TPC,一共有12组TPC与24组SM,TU116中集成了66亿晶体管,拥有1536个流处理单元、48个ROPs单元与96个纹理单元,并没有集成RT Core与Tensor Core的SM单元也代表着GTX1660Ti无缘对光追踪与DLSS超采样技术的支持。

游民星空

  NVIDIA的工程师对TU116核心的SM做了一些小改动,如上图所示,SM被划分为四个处理块,每个处理块具有16个FP32核、16个INT32核、一个调度器和一个调度单元,原本为DLSS服务的两个Tensor核被替换成32个FP16核。每个块包括一个L0指令缓存和一个64KB寄存器文件。四个处理块共享组合的96KB L1数据高速缓存/共享存储器。

游民星空

  传统的图形工作负载将96KB L1共享缓存划分为64KB的专用图形着色器缓存以及32KB的纹理缓存和寄存器溢出区域。计算工作负载可以将96KB分成32KB共享缓存+64KB L1缓存,或者64KB共享缓存+32KB L1缓存。

游民星空

  与Pascal架构相比,图灵架构实现了核心执行数据通道的主要更新,就以《古墓丽影:暗影》为例,其中每100条指令中,平均62条浮点运算与38条整数运算指令,而Pascal显卡在面对这些运算指令时,每当非FP数学指令中的一个运行时,ATAPACH就会闲置。但Turing在每个CUDA核旁边添加第二个并行执行单元,该CUDA核与浮点数学并行执行这些指令,这也使得在《古墓丽影:暗影》中GTX1660Ti拥有相较于GTX1060 6G约1.5倍的性能提升。

责任编辑:Firebird

APP精彩推荐打开游民APP查看更多

相关内容 打开游民APP查看更多

在线玩推荐更多