光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧

记得上一代GeForce 10的Pascal架构首发,也就是GTX 1080显卡发布,还是2016年的五月份,NVIDIA的游戏显卡换代从来没有哪次像这样让人等得望眼欲穿。

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧

游民星空

下载游民App,掌握一手游戏情报

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧

游民星空[原创] Kalama 2018-09-19 21:26
0

深度学习单元Tensor Cores

  我们都知道Volta GV100中首次引入的张量核心Tensor Core,Turing架构中的张量核心是前者的增强版本。它设计增加了INT8和INT4精确模式来测算可接受的工作负载,FP16也完全支持这种工作负载的精确测算。

游民星空

  在基于Turing的GeForce游戏核心中引入张量内核首次将实时深度学习引入游戏应用程序。Turing张量核心加速了NVIDIA NGX神经服务的基于AI的特性,增强了图形、渲染和其他类型的客户端应用程序的效率。NGX AI特性的示例包括深度学习超级采样(DLSS)、AI绘画、AI Super Rez和AI Slow-Mo。

  Turing张量核加速了神经网络训练和推理函数的核心矩阵乘法。Turing张量核特别擅长于推理计算,其中有用的相关信息可以通过基于给定输入的训练有素的深层神经网络(DNN)来推断和传递。推理的例子包括识别Facebook照片中朋友的图像,识别和分类自驾车中不同类型的汽车、行人和道路危险,实时翻译人类语言,以及在线零售中创建个性化的用户建议,以及社交媒体系统。

  TU102包含576个张量核心,每个张量核心可以执行多达64个浮点熔点乘加(FMA)操作,每个时钟周期使用FP16输入。SM中的八个张量核每个时钟周期总共执行512次FP16相乘和相加操作,或者执行1024次总FP操作。新的INT8精度模式以双倍的速率运行,每个时钟周期可达到2048次整数运算。

游民星空
Pascal和Turing张量核心配置之间的对比

  Turing张量核为矩阵运算提供了显著的加速,并且除了新的神经图形函数之外,还用于深度学习训练和推理运算。

责任编辑:白菜控

APP精彩推荐打开游民APP查看更多

相关内容 打开游民APP查看更多

在线玩推荐更多