Turing架构的另一个特殊功能是它具有Tensor Core,这是用于深度学习AI运算的计算单元。借助Tensor Cores,Turing图形卡的AI性能得到了极大的提高。
FP32浮点性能达到13.4TFLOPS。 FP16浮点性能甚至达到26.89TFLOPS,而INT8和INT4性能可以达到215.2TFLOPS和430.4TFLOPS。 Tensor Core AI加速技术涵盖了广泛的范围。
包括一系列模糊选项和30种功能,例如高质量放大图像的采样。在处理高质量图像时,其效率是使用i9-9900K的UHD 630集成显卡的近1.4倍,从而大大减少了等待时间并有效地提高了Creator的生产率。
换句话说,这是一种“智能”图形卡,可以使用AI来帮助您完成工作。
此外,NVIDIA长期的CUDA生态功能还使RTX GeForce显卡在生产力软件中获得出色的性能。这些新功能使RTX系列图形卡成为制作人员的宠儿。具体工作可以在下面的软件使用中得到反映。
Adobe Family Bucket的好帮手
Adobe Family Bucket是目前大多数内容创建者都会使用的软件。摄影师需要使用LR来编辑图像,图形设计师需要使用PS来图形,视频创作者需要使用PR来编辑视频,而AE需要添加特殊效果。
AI性能的增强使Turing图形卡在Adobe专业软件上的性能更加强大。现在,创作者约80%的工作实际上是重复而乏味的工作,例如寻找最佳照片,修饰和消除背景,装订和动画制作等等。
这些任务可以移交给AI,从而使AI可以帮助提高图像分辨率,增强照片细节并协助绘制,从而可以极大地提高创作者的工作效率,而这些只能通过基于Turing的图形卡来完成使用Tensor核心。
此外,NVIDIA在优化PR上的汞(CUDA)加速方面也做得非常出色。过去,软件的计算工作已移交给CPU执行。
但是,由于CPU的计算能力有限,尤其是并行计算效率低,因此处理图形和图像的效率不如GPU(图形卡)快。
近年来,图形卡已经发展到通用计算领域,通用计算将允许最初设计为显示内容的图形卡进行计算。
汞加速是Adobe为响应此更改而做出的更改,最初由CPU计算的功移交给了图形卡。
汞加速最直观的好处是速度更快,不再失速;原始的2小时渲染视频现在可以实时观看。
最初需要按Enter键进行预渲染的地方,现在可以实时进行计算;
这项更改对于编辑而言是非常重要的更改,它可以大大提高工作效率,使设计人员可以将更多的精力放在视频上,同时也有更多的机会尝试制作更好的作品。
同时,缩短渲染时间也提高了工作效率。
毕竟,这是实时渲染与预渲染之间的区别。使用NVIDIA显卡在PR中导出视频时,可以使用该显卡共享许多计算工作,从而使视频预览和渲染导出更加流畅和高效。
那么,测得的性能会如何?
在这里,我们仅使用技嘉RTX 2060 SUPER GAMING OC 3X导出11分钟长的视频。与仅使用i5-10600K单独导出视频相比,它的速度要快7倍,并且效率非常明显。
毫无疑问RTX显卡就是Adobe Family Bucket的好帮手。
现场直播
现场直播也是近几年比较红火的行业,随着电竞的兴起,PC行业和现场直播行业也受到辐射,越来越多人开始尝试做现场直播。
但是现场直播这件事本身就会占用极多的电脑性能资源与带宽资源,对于很多游戏主播来说,简直是一个绕不开的槛,现场直播的过程就是一边采集录制自己的屏幕画面,一边上传画面到现场直播平台的服务器。
当前,图像记录过程主要使用基于CPU计算的X264编码器,而该过程占用大量CPU资源。同时,游戏主播可以运行大型游戏或具有许多模型的复制型RPG在线游戏。
这些东西本身也非常占用CPU资源,导致两者在CPU资源方面相互竞争,这很容易造成延迟。
而NVIDIA也是针对这个需求,联合开源的现场直播串流软件OBS的厂商一同开发了一个基于NVIDIA显卡的编码器NVENC,这个编码器能直接调用N卡中的CUDA去串流,直接解放CPU与内存的负载压力,提高游戏过程中的游戏体验。
视频编码已添加到NVIDIA GPU增强并不断扩展的Premiere Pro功能列表中。现在,该列表包括通过CUDA实现的加速视频效果以及由GPU加速的AI辅助的自动重建。
除了Premiere Pro,NVIDIA硬件编码器还可以加速Adobe Media Encoder,After Effects和Audition中的视频导出功能。
当前版本还包括在Premiere Pro和After Effects中对Apple ProRes RAW的支持。
有了这个,创作者第一次可以直接在Windows中导入和编辑ProRes RAW文件,而无需进行转码。
NVIDIA GPU上的专用CUDA加快了此过程。
根据NVIDIA产品经理的说法,只要可以使用RTX20系列/ GTX16系列/ GTX10系列/ GTX9系列图形卡,就可以使用该技术,但是最佳体验将是RTX20系列,因为它是针对RTX20系列特别优化的。 RTX架构中的计算单元。编码可以最大程度地保留原始图像质量,高端RTX图形卡可以将游戏帧的损失控制在5%左右,端越高则越容易。
如今在现场直播行业,RTX显卡也成为各大主播的宠儿了。