二宗 二宗

为什么说 RTX 系列显卡也能「战未来」?

一直以来,NVIDIA 家每代 GeForce 系列显卡相比上一代都有着极大的性能提升,时隔两年总算发布的 RTX 系列显卡,带来的性能提升似乎远不如 Pascal 家族带来的提升明显,同时价格的提升幅度却非常大,对此不少玩家直呼「NVIDIA 黑心」。但不管是其首次将命名前缀从 GTX 更改为 RTX,还是跳过 Volta 架构直接选择 Turing 架构,似乎都在暗示着,NVIDIA 对这次显卡的更新抱有极大的信心。 原因就在于,RTX 系列显卡算是 NVIDIA 在显卡领域重新开辟了一个新的战场,这个新战场里,有 AI 人工智能、有神经网络和深度学习、有实时光线追踪等等这些以前显卡所没有的东西。同时,也正是这些东西,让 RTX 系列显卡拥有了「战未来」的能力。

RTX 系列显卡,简单地来说有这么四个新特性:新的图灵 Turing 内核架构、Tensor Core、RT Core 以及更先进的着色技术。第一个和第四个其实都好理解,Tensor Core 和 RT Core 又是什么东西呢?

这次我们就来简单地聊一聊这两个核心。如果分别用一句话来概括它们的功能,那应该是这样的: RT Core,用以实现实时光线追踪技术,即 RTX 系列显卡的核心关键。 Tensor Core,用以实现 Neural Graphics Accelaration,即神经网络加速,简称为 NGX。 Pascal 架构的 GTX 10 系显卡称霸了显卡领域 2 年,想要打败它确实需要一番力气,也需要花费一些心思。NVIDIA 首先想到的便是一直没有突破的实时光线追踪技术,是以 RTX 系列显卡新加入了专门用于实现实时光线追踪技术的 RT Core。 光线追踪,并不是一个罕见的技术。以往我们通常会借助光栅化来实现较为逼真的光影效果,但不管怎么说,它还是存在着不少局限,并且有可能出现违反现实的光影画面。而实时光线追踪技术,则是通过更真实的手法去还原光线在现实生活中的轨迹、阴影的效果、折射与反射等等。与此同时,「实时」也是它的重点之一,当「还原真实」加上「实时渲染」之后,计算量就变得非常可怕了,对于以往的显卡来说根本无法承受。

这种情况,是不是听起来很熟悉?当一个人有非常多的工作要做的时候,往往无法分心同时处理,最终可能导致每一件事都做不好。这时候如果有一个专门的人只负责这一个工作,那就可以专注而又高效地完成了。RT Core 就是这样一个「最佳人选」。它只针对实时光线追踪进行计算,不负责其他的运算工作,因此能比通用的 NVIDIA CUDA 单元来得更高效。 话又说回来,尽管 RT Core 能够有效地计算实时光线追踪,并且效率比以往的计算单元要搞高很多,但总归有个上限。NVIDIA 将 RT Core 的计算能力量化成了一个 RTX-OPS 的值,RTX 系列各显卡的 RTX-OPS 光线追踪算力分别如下: RTX2080Ti:78T(公版) / 76T(建议) RTX2080:60T(公版) / 57T(建议) RTX2070:45T(公版) / 42T(建议) RTX2060:37T(公版) 当然,这一代 RTX 系列显卡仅仅能当作是「先锋者」,随着产品线的迭代,RTX-OPS 算力将会越来越大,实时光线追踪的能力也将得到极大的提升。 至于 Tensor Core,是个神奇的东西。Tensor 顾名思义是张量,与传统的标量、矢量、矩阵相比,它拥有着 3 维甚至更高维的数据,因此非常适合用于做神经网络计算和深度学习训练,这使得 RTX 系列显卡拥有了学习的能力 —— 就像人类一样,随着时间的推移,训练模型的增加,它会变得越来越熟练。 最初 NVIDIA 设计 Tensor Core,其实是为了给计算卡提升算力的,但随着游戏领域的计算量以几何倍数增长,以显卡传统的算力增长趋势,根本无法覆盖到如此庞大的计算量。举个例子,现在我们玩的游戏,大多数还是以 1080p 分辨率为主,2K 分辨率的数量也在逐渐增长,4K 分辨率依旧较少,但未来游戏的分辨率会越来越高,加之还有 HDR 显示、更高的刷新率,显卡的压力势必越来越大,也因此 Tensor Core 应运而生。 嗯,说白了就是靠「脑补」。只不过这次是计算机去脑补,而不是人。 有了 Tensor Core,NVIDIA 可以训练 RTX 显卡去对游戏画面进行深度学习,并布置出一个神经网络,用于处理游戏中的一些需要巨大算力才可以实现的特性。

另一方面,NVIDIA 也设计了一个 NGX 软件开发套件,其中包含了 AI 增强功能,目前它的愿景是实现以下功能: DLSS 用于合成超高分辨率、锐利清晰无拖影的画面; AI InPainting 用于图片补全、合成、修复; AI Super Rez 用于合成更高分辨率的视频; AI Slow-Mo 用于计算插帧、合成更高帧率甚至是慢动作视频。 目前我们见到比较多的是 DLSS 在游戏中的应用,最新的《战地 5》游戏已经支持 DLSS 技术,在同时开启 RTX 及 DLSS 情况下,能够达到开启 RTX 之前的游戏帧数,这对于游戏体验的提升是十分明显的。

可以看到,这些功能大多数标着 AI 或者深度学习,意味着它十分依赖于 Tensor Core,而这也是之前的显卡所没有的,因此这次的 RTX 系列显卡将是「未来」与「过去」最明显的分界线,随着深度学习模型的增多,RTX 系列显卡将会越来越具优势。 而这,也是 NVIDIA 的新目标 —— 战未来。

热卖爆款
没有更多啦