为什么说 RTX 系列显卡也能「战未来」？-苏宁头条

一直以来，NVIDIA 家每代 GeForce 系列显卡相比上一代都有着极大的性能提升，时隔两年总算发布的 RTX 系列显卡，带来的性能提升似乎远不如 Pascal 家族带来的提升明显，同时价格的提升幅度却非常大，对此不少玩家直呼「NVIDIA 黑心」。但不管是其首次将命名前缀从 GTX 更改为 RTX，还是跳过 Volta 架构直接选择 Turing 架构，似乎都在暗示着，NVIDIA 对这次显卡的更新抱有极大的信心。原因就在于，RTX 系列显卡算是 NVIDIA 在显卡领域重新开辟了一个新的战场，这个新战场里，有 AI 人工智能、有神经网络和深度学习、有实时光线追踪等等这些以前显卡所没有的东西。同时，也正是这些东西，让 RTX 系列显卡拥有了「战未来」的能力。

RTX 系列显卡，简单地来说有这么四个新特性：新的图灵 Turing 内核架构、Tensor Core、RT Core 以及更先进的着色技术。第一个和第四个其实都好理解，Tensor Core 和 RT Core 又是什么东西呢？

这次我们就来简单地聊一聊这两个核心。如果分别用一句话来概括它们的功能，那应该是这样的： RT Core，用以实现实时光线追踪技术，即 RTX 系列显卡的核心关键。 Tensor Core，用以实现 Neural Graphics Accelaration，即神经网络加速，简称为 NGX。 Pascal 架构的 GTX 10 系显卡称霸了显卡领域 2 年，想要打败它确实需要一番力气，也需要花费一些心思。NVIDIA 首先想到的便是一直没有突破的实时光线追踪技术，是以 RTX 系列显卡新加入了专门用于实现实时光线追踪技术的 RT Core。光线追踪，并不是一个罕见的技术。以往我们通常会借助光栅化来实现较为逼真的光影效果，但不管怎么说，它还是存在着不少局限，并且有可能出现违反现实的光影画面。而实时光线追踪技术，则是通过更真实的手法去还原光线在现实生活中的轨迹、阴影的效果、折射与反射等等。与此同时，「实时」也是它的重点之一，当「还原真实」加上「实时渲染」之后，计算量就变得非常可怕了，对于以往的显卡来说根本无法承受。

这种情况，是不是听起来很熟悉？当一个人有非常多的工作要做的时候，往往无法分心同时处理，最终可能导致每一件事都做不好。这时候如果有一个专门的人只负责这一个工作，那就可以专注而又高效地完成了。RT Core 就是这样一个「最佳人选」。它只针对实时光线追踪进行计算，不负责其他的运算工作，因此能比通用的 NVIDIA CUDA 单元来得更高效。话又说回来，尽管 RT Core 能够有效地计算实时光线追踪，并且效率比以往的计算单元要搞高很多，但总归有个上限。NVIDIA 将 RT Core 的计算能力量化成了一个 RTX-OPS 的值，RTX 系列各显卡的 RTX-OPS 光线追踪算力分别如下： RTX2080Ti：78T（公版） / 76T（建议） RTX2080：60T（公版） / 57T（建议） RTX2070：45T（公版） / 42T（建议） RTX2060：37T（公版）当然，这一代 RTX 系列显卡仅仅能当作是「先锋者」，随着产品线的迭代，RTX-OPS 算力将会越来越大，实时光线追踪的能力也将得到极大的提升。至于 Tensor Core，是个神奇的东西。Tensor 顾名思义是张量，与传统的标量、矢量、矩阵相比，它拥有着 3 维甚至更高维的数据，因此非常适合用于做神经网络计算和深度学习训练，这使得 RTX 系列显卡拥有了学习的能力 —— 就像人类一样，随着时间的推移，训练模型的增加，它会变得越来越熟练。最初 NVIDIA 设计 Tensor Core，其实是为了给计算卡提升算力的，但随着游戏领域的计算量以几何倍数增长，以显卡传统的算力增长趋势，根本无法覆盖到如此庞大的计算量。举个例子，现在我们玩的游戏，大多数还是以 1080p 分辨率为主，2K 分辨率的数量也在逐渐增长，4K 分辨率依旧较少，但未来游戏的分辨率会越来越高，加之还有 HDR 显示、更高的刷新率，显卡的压力势必越来越大，也因此 Tensor Core 应运而生。嗯，说白了就是靠「脑补」。只不过这次是计算机去脑补，而不是人。有了 Tensor Core，NVIDIA 可以训练 RTX 显卡去对游戏画面进行深度学习，并布置出一个神经网络，用于处理游戏中的一些需要巨大算力才可以实现的特性。

另一方面，NVIDIA 也设计了一个 NGX 软件开发套件，其中包含了 AI 增强功能，目前它的愿景是实现以下功能： DLSS 用于合成超高分辨率、锐利清晰无拖影的画面； AI InPainting 用于图片补全、合成、修复； AI Super Rez 用于合成更高分辨率的视频； AI Slow-Mo 用于计算插帧、合成更高帧率甚至是慢动作视频。目前我们见到比较多的是 DLSS 在游戏中的应用，最新的《战地 5》游戏已经支持 DLSS 技术，在同时开启 RTX 及 DLSS 情况下，能够达到开启 RTX 之前的游戏帧数，这对于游戏体验的提升是十分明显的。

可以看到，这些功能大多数标着 AI 或者深度学习，意味着它十分依赖于 Tensor Core，而这也是之前的显卡所没有的，因此这次的 RTX 系列显卡将是「未来」与「过去」最明显的分界线，随着深度学习模型的增多，RTX 系列显卡将会越来越具优势。而这，也是 NVIDIA 的新目标 —— 战未来。