RTX 30系最后一张旗舰卡皇RTX 3090 Ti的发布,宣告本代显卡画上了完美句号。各家也都卖力的“站好最后一班岗”,此刻估计也都在为下一代产品做着准备。而今天评测的产品——耕升GeForce RTX 3090 Ti 炫光·超OC有些特殊。它是耕升在RTX 30系,最后一张卡上发布的X系列中的最高规格型号。
本次发布的RTX 3090 Ti的供电接口均采用了全新的单16pin设计,结合Intel刚刚发布的电源新标准,不难猜测后续NVIDIA推出的下一代显卡将继续增大功耗。
规格方面,RTX 3090 Ti采用了满血GA102核心,84组SM单元,比RTX 3090多了2组,同时频率和功耗也都有所增高。
耕升GeForce RTX 3090 Ti 炫光·超OC
这张RTX 3090 Ti拥有24GB大显存,依然定位于内容创作者。但单就性能提升的幅度来说,这张RTX 3090 Ti在游戏方面的表现同样有非常高的提升。
耕升GeForce RTX 3090 Ti 炫光·超OC这张显卡的售价为15999元,可使用满5999-600元优惠券,而随着RTX 3090 Ti的推出,大部分市售RTX 3090价格也有一定程度下调。
在评测开始前,笔者先还是先将这款显卡的特点列出方便大家阅读:
1.新16pin供电设计,采用新ATX3.0电源标准,通过附赠转接线可兼容旧型号电源;
2.24GB大显存,轻松应对8K HDR游戏及内容创作软件
3.支持ECC校验,增加专业软件领域稳定性
4.1905MHz高频率,高于官方1860MHz标准频率
5.全新炫光·超系列外观设计
本次耕升炫光·超的发布,是所有AIC中外观重新设计改动最大的,通电后华丽的灯效是这款显卡最大的亮点,而在关机后,纯黑色的导流罩也如同黑曜石般璀璨。
另外在RTX 40系即将发布之际,这款RTX 3090 Ti其实来的多少有些晚了,但从定位上来说,它并不会参与常规游戏卡的性能“厮杀”,依旧主要定位于内容创作领域,所以竞争对手同样是RTX 40系的内容创作卡,影响不大。
01 NVIDIA Ampere架构的 满血GA102核心
耕升GeForce RTX 3090 Ti 炫光·超OC显卡采用了NVIDIA Ampere架构,我们首先来看一下这次的GA102核心。
RTX 3090 Ti算力对比TITAN RTX
相较于上一代Turing RTX架构的,NVIDIA Ampere架构在算力上有着成倍的增长,GeForce RTX 3090 Ti的着色器性能达到40 TFLOPS单精度性能,而搭载NVIDIA Turing架构的TITAN为16.3 TFLOPS。
RT Core达到78 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达320 Tensor TFLOPS。
RTX 3090 Ti显存对比TITAN RTX
同时在显存方面,RTX 3090 Ti也采用了24GB GDDR6X显存,显存频率达到了21 Gpbs,带宽则是史无前例的1 TB/s,让这款显卡可以畅玩8K 60帧游戏。
RTX 3090 Ti所采用的GA102核心
GA102的完整核心图NVIDIA在RTX 3080发布时就已经公布,现在终于有显卡应用到了未阉割的GA102。完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器),CUDA数量为10752个。下面我们再来看看几款显卡的核心参数对比。
GA102核心拥有280亿(28000 million)个晶体管,628m㎡的面积,基于三星的8nm NVIDIA定制工艺,来自Micron的GDDR6X显存。
02 耕升GeForce RTX 3090 Ti 炫光·超OC 概览
首先开箱,在配件方面,除了常见的金属显卡支架和灯光同步线,由于本次在非公版显卡中首次搭载了单16pin供电接口,所以还配备了一根单12pin转8pin*3的转接线(12pin兼容ATX电源3.0标准)。
包装内配件
目前Intel已经发布了ATX电源3.0的新标准,就是需要有新的单16pin的显卡供电,目前已经有部分旗舰电源应用到,但普及尚需要些时间。不过相信不久后即便是RTX 3090 Ti的450W功耗,只接一根外接供电就够了。
耕升GeForce RTX 3090 Ti 炫光·超OC
通电后默认效果
耕升GeForce RTX 3090 Ti 炫光·超OC的外观进行了重新设计,采用全新的“炫之黑曜石散热器”,进一步加强了灯效,其效果肉眼可见。并且搭配上波浪形的亮面钢琴外壳设计,即使在不点亮的情况下,也犹如黑曜石般璀璨。
并且由于这款显卡更是定位旗舰游戏,在散热方面也更加下功夫,主动散热部分由2个100mm和1个90mm风扇组成,其采用11叶锋刃造型设计,在相同转速下可进一步加强风流量,有效降低温度。
内部散热鳍片展示
内部的主动散热部分,耕升GeForce RTX 3090 Ti 炫光·超OC采用8根符合热管,24相供电,加密加大散热鳍片,提供更高的散热效率。
耕升GeForce RTX 3090 Ti 炫光·超OC背板展示
耕升GeForce RTX 3090 Ti 炫光·超OC的金属背板相较RTX 30系的其他几款产品有所不同,为了配合此次的“异形”PCB板,采用了大面积镂空的进气格栅,更有利于热空气排出。
单16pin供电接口
耕升GeForce RTX 3090 Ti 炫光·超OC是首次采用单16pin接口的非公型号,从视觉效果来看,更简洁更美观。
目前新的PCIe 5.0的电源规范为12+4pin的完整供电,其中最上面的4pin为讯号线,用于检测12V功耗是否可以满足显卡使用,新一代支持ATX 3.0标准的电源会自带16Pin的供电线。所以目前全部采用8*3pin转12pin的转换线。
DP1.4a*3+HDMI 2.1
视频输出接口依旧采用了DP1.4a*3+HDMI 2.1的四接口设计,另外由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出。
03 3DMARK理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥3DMARK理论性能测试显卡的最佳性能,主板和CPU采用了11代桌面旗舰级配置,并且将内存容量提升至32GB,具体如下:
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,耕升GeForce RTX 3090 Ti 炫光·超OC采用GA102核心,三星8nm工艺,芯片面积628平方毫米,拥有10752个CUDA,Boost频率达到1905MHz,相较公版的1860MHz有较大提升。采用24GB GDDR6X显存,位宽为384bit,显存带宽达到了1008.4 GB/s,光栅单元和纹理单元为112和336。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,RTX 3090 Ti的性能提升显著。耕升GeForce RTX 3090 Ti 炫光·超OC相较RTX 3090综合提升11%,作为本代Ti后缀的型号,除了RTX 3060 Ti,RTX 3090 Ti是提升最大的,而且这还是在没有更换核心的情况下。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,耕升GeForce RTX 3090 Ti 炫光·超OC相较RTX 3090提升约为10%。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,耕升GeForce RTX 3090 Ti 炫光·超OC相较RTX 3090提升约为12%。
综合来看,RTX 3090 Ti相较RTX 3090的提升几乎相当于更换了芯片,但其实两个型号的芯片只相差2组SM单元,更多的是暴力提升了功耗和核心频率,但结果也显而易见。
04 游戏性能测试
在游戏性能测试中,我们选择了《地平线5》、《刺客信条:英灵殿》、《无主之地3》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
虽然这张RTX 3090 Ti显卡并不是为游戏玩家所准备,但此次大幅度的理论性能提升,也不禁让人好奇,在游戏中这张卡会有怎样的表现。
《地平线5》游戏测试
首先在《地平线5》中,耕升GeForce RTX 3090 Ti 炫光·超OC显卡的1080P成绩相较RTX 3090再提升4%;2K分辨率成绩提升3%;4K分辨率成绩提升5%。
《刺客信条:英灵殿》游戏测试
在《刺客信条:英灵殿》中,可能由于驱动版本的更新和游戏更新,所有跑分相较以前的成绩均有大幅度提升,我们以本次跑分成绩为准。
耕升GeForce RTX 3090 Ti 炫光·超OC的1080P成绩相较RTX 3090提升5%;2K分辨率成绩提升12%;4K分辨率成绩提升9%。
《无主之地3》游戏测试
《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,耕升GeForce RTX 3090 Ti 炫光·超OC的1080P成绩相较RTX 3090提升13%;2K分辨率成绩提升7%;4K分辨率成绩提升7%。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,正式版已经在steam发售只要48元,属于小品级游戏中的大制作。
耕升GeForce RTX 3090 Ti 炫光·超OC的1080P成绩相较RTX 3090提升6%;2K分辨率成绩提升11%;4K分辨率成绩提升13%。
不过即便强如RTX 3090 Ti,在4K分辨率下也没有达到60帧。《光明记忆:无限》的benchmark测试似乎将光线追踪用到了极致。
《边境》游戏测试
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
耕升GeForce RTX 3090 Ti 炫光·超OC的1080P成绩相较RTX 3090提升6%;2K分辨率成绩提升8%;4K分辨率成绩提升10%。
在整体游戏方面,NVIDIA官方给出的游戏数据是在标频情况下提升约为4-8%,而我们测试的耕升GeForce RTX 3090 Ti 炫光·超OC在1905MHz频率下,综合提升约为10%,与理论成绩基本相符。
所以尽管RTX 3090 Ti的定位依然是内容创作显卡,但它的性能提升是实实在在的,如果不考虑性价比的话,入手一张绝对是本代最强游戏卡。
05 专业软件测试
除了光线追踪的强化,NVIDIA Ampere架构的Tensor Core也得到了极大地加强,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自动识别并消除不太重要的DNN(深度神经网络)权重,同时依然能保持不错的精度。首先原始的密集矩阵会经过训练,删除掉稀疏矩阵,再经过训练稀疏矩阵,从而实现稀疏优化,进而提高Tensor Core的性能。
同时,显卡的一个重要指标是显存容量和位宽,显存位宽越大,表示单位时间显卡能处理的数据的越多,RTX 3090 Ti拥有384bit 位宽,带宽为 1008.4 GB/s,以及24GB大显存,这都为内容创作提供了更好地助力。
NVIDIA控制面板中新增ECC开启功能
另外此次RTX 3090 Ti也是NVIDIA在RTX 30系中首次为消费级显卡开启ECC显存校验,开启这一功能后,显卡性能会有所下降,但稳定性会增加,更有助于在专业软件中长时间稳定工作。
NVIDIA Omniverse
在此次GTC 2022大会中NVIDIA也正式向开发者推出NVIDIA Omniverse实时设计协作和模拟平台,它可轻松构建自定义工具,以简化、加速和改进其开发工作流。更多关于Omniverse的使用体验和链接方法,可以参考笔者之前的文章“NVIDIA Omniverse体验 老板监工神器”,这里就不过多讲解了。
上图为笔者使用SPECviewperf 13这款工业、专业软件跑分测试。对比显卡为本代的游戏旗舰RTX 3080 Ti和生产力工具旗舰RTX 3090 Ti。
从结果来看,两款显卡相差不大,但测试环境都是在不爆显存的情况下得来,毕竟RTX 3080 Ti同样使用的GA102芯片,也是本代最强的游戏旗舰卡。另外如果在更高分辨率下的渲染中,大显存的优势才会突显,当显存溢出时,通常不像游戏只是卡不卡的问题,而是能不能用的问题。
KeyShot 9测试
KeyShot 意为“The Key to Amazing Shots”,是一个互动性的光线追踪与全域光渲染程序,无需复杂的设定即可产生相片般真实的 3D 渲染影像。
KeyShot 9有预设模型,进入软件后直接点击渲染,为了更考验大显存所带来的帮助,我们直接将渲染分辨率改为预设的7680×7680方形8K尺寸。
同时在选项中,选择GPU渲染,可以看到目前正在采用RTX 3090 Ti进行渲染,而GPU使用量为100%
耕升GeForce RTX 3090 Ti 炫光·超OC 渲染时间为1分42秒
在预设模型的渲染中,可以看到整个过程的渲染时常为1分42秒,其中在渲染时的显存占用为17.1GB,已经远远超出了RTX 3080 Ti的12GB,也让笔者不由得期待超出显存后会是什么样。
RTX 3080 Ti渲染崩溃
在使用RTX 3080 Ti后,由于渲染8K分辨率图片的显存严重溢出,会导致软件无法渲染,直接崩溃。虽然在KeyShot 9中软件崩溃没有比较明显的提示,但通过这重叠的窗口用户也能大体看出端倪了。
DaVinci(达芬奇)测试
DaVinci(达芬奇)是世界上专业8K编辑的唯一解决方案,集成颜色校正,视觉效果,音频编辑在一个软件中。
首先在偏好选项中,取消勾选自动的GPU配置,指定使用耕升GeForce RTX 3090 Ti 炫光·超OC显卡。
导入一段高清的8K素材后,在运动特效中增加时域降噪、时域阈值以及运动模糊的参数,下面先来看RTX 3090 Ti的演示效果。
耕升GeForce RTX 3090 Ti 炫光·超OC可流畅预览
这一段8K素材的可调色空间非常大,笔者增加了一层电影滤镜,可以看到在使用RTX 3090 Ti时,可以在实时预览时达到非常流畅的程度。
RTX 3080 Ti预览崩溃
在分辨率越高的情况下,实时预览对显卡显存的要求也就越高,RTX 3080 Ti采用12GB显存会出现报错,这就是因为显存不够。
在显存不够报错的情况下,解决办法基本只有创建代理进行剪辑,不过这样无法展示素材的最真实效果,所以在超高分辨率下,拥有24GB大显存的RTX 3090 Ti拥有绝对优势。
Blender测试
Blender是一个免费开放源码的3D创作套件。它支持整个三维编辑-建模,索具,动画,模拟 渲染,合成,运动跟踪,视频编辑和2D动画编辑。
首先还是设置渲染设备,Blender默认使用CPU渲染,这里选择RTX 3090 Ti。
在软件内的渲染设置内,勾选两项降噪,并且为了增加渲染时常,我们将采样率提升至400,渲染分辨率提升为200%。
耕升GeForce RTX 3090 Ti 炫光·超OC渲染时长为1分21秒
RTX 3080 Ti渲染时常为1分29秒
在第一组测试中,耕升GeForce RTX 3090 Ti 炫光·超OC的渲染时常为1分21秒,RTX 3080 Ti的渲染时常为1分29秒,单独来看差异似乎不大,不过我们对比的为RTX 3080 Ti显卡,刨除显存的因素,这也是一张旗舰游戏显卡,算力非常强悍。
耕升GeForce RTX 3090 Ti 炫光·超OC渲染时间为1分41秒
RTX 3080 Ti渲染时常为1分49秒
第二组对比中为一段900帧的循环动画,并且分为第三人称视角和第一人称视角双镜头。这组对比中,单帧的差距仍然为9秒。
不过可能是自带运动模糊,增加了一定的显存使用率,所以在渲染时RTX 3080 Ti偶尔有报错的情况,只能重新渲染。
耕升GeForce RTX 3090 Ti 炫光·超OC渲染时间为1分32秒
RTX 3080 Ti渲染时常约为1分39秒
在同一帧下,第一人称视角与之前的时间基本相同,这里不做过多阐述。
在这段动画中,我们按照每帧渲染时间相差18秒(双镜头)来计算,一段900帧的动画渲染时常就会相差16200秒,等于270分钟或者4.5小时。
如果按1秒24帧来计算,那么这段动画也只有37秒左右。而在大型的动画电影中,庞大的数据量往往需要电脑夜以继日的渲染,即便是崩溃一次,可能也会浪费很久的时间,所以大显存在内容创作领域的优势显而易见。
06 功耗及温度测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
功耗测试(点击查看大图)
耕升GeForce RTX 3090 Ti 炫光·超OC经过我们的实测在满载状态下单卡功耗为412W左右,但是可以看到下面新增的TDP项,GPU满载也只达到了86%的水平。所以根据这个来计算,如果达到100% TDP,实际为480W左右。
温度测试
温度方面,本次的耕升GeForce RTX 3090 Ti 炫光·超OC经过25分钟左右的拷机,温度稳定为72℃左右,峰值达到73℃,另外显存温度为80℃,处于正常工作范围内。
07 耕升扛鼎之作
本次RTX 3090 Ti的成绩进步显著,虽然相比RTX 3090只差了2组SM单元,但频率和功耗的拉高,让他在理论性能上综合提升10%。
前面我们也已经提到,在下一代显卡即将发布之际,RTX 3090 Ti的发布时间会不会太晚了一些?首先原本NVIDIA预定这张卡会在几个月前发布,但出于技术原因让这张卡“回炉重造”,所以比原定计划更晚。另外就是RTX 3090 Ti依然定位内容创作者,24GB的大显存即便在4K分辨率下的游戏都有很大浪费,所以即便下一代显卡发布,它的竞争对手依然是TITAN级别的。
另外NVIDIA官方已经宣布,即便日后发布RTX 40系显卡,RTX 30系也将同时售卖。所以个人猜测,两代显卡在价格和性能方面不会出现太多重叠。
在散热方面,由于RTX 3090采用了单颗容量1GB的显存,所以PCB版双面均有排布,发热量巨大,也更不好设计散热方案。而本次的RTX 3090 Ti也是首次采用了单颗2GB的GDDR6X显存,这也是为什么大家看到本次的RTX 3090 Ti拷机温度更容易控制。
对比此前发布的RTX A6000显卡,不难发现两款产品其实采用了完全相同的核心,都是GA102,都是10752个CUDA,甚至Boost频率都是1860MHz,而目前RTX A6000在京东的售价为34799元,那么这两款产品到底有什么区别?
RTX A6000参数一览
显存方面,RTX 3090 Ti相比RTX A6000少了24GB显存,但由于采用了GDDR6X显存,带宽更高了,整体速度更快。原本专业卡独有的ECC显存校验,本次在RTX 3090 Ti中也得到了支持。不过vGPU显存是不支持的,这也是RTX A6000在专业卡上得天独厚的优势。
另外最重要的,如RTX A6000这种专业卡,在FP64运算性能上都要比消费级显卡高很多RTX A6000为1210 GFLOPS;而RTX 3090 Ti为625 GFLOPS。
游戏方面,其实RTX A6000也有着不错的表现,如果你真的有钱,买一张A6000来打游戏也不是不可以,但它的帧数应该会比RTX 3090 Ti更低,同时散热表现也没有那么好。
但专业卡的长处在于各大专业软件的兼容和适配,以及内部调校。如Catia以及SW等软件针对专业卡都有非常好的优化,不过我们常见的3DSMAX和MAYA等软件,即使是消费级的RTX 3090 Ti同样有着出色的性能和稳定性表现。
RTX 3090 Ti这张显卡的定位依旧是主内容创作者,尽管NVIDIA在各方面的宣传都没有提及游戏性能,但不可否认的是,此次RTX 3090 Ti在理论和游戏测试性能有着大幅度提升,均达到10%左右。
如果你想用它来打游戏,不追求性价比,只要极致性能,那么买一张也没什么问题。
耕升GeForce RTX 3090 Ti 炫光·超OC可以说是本带显卡的扛鼎之作,外观设计我认为是本带之最,外观以及灯光效果都得到了极大加强。不过受制于高功耗和散热需求,卡身同样也比较厚重,这是无法避免的。
目前这张耕升GeForce RTX 3090 Ti 炫光·超OC显卡的售价为15999元,但是有满5999-600元优惠券,如果感兴趣的话可以前往官方旗舰店查看。
08 附录1-各游戏 光线追踪 效果对比
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《幽灵线:东京》RTX ON(点击查看大图)
《幽灵线:东京》RTX OFF(点击查看大图)
在这一组对比中,可以较为明显看出光线追踪的差别。它更为真实的渲染出光线本该有的样子。不过在本作中,是没有白天出现的!游戏中大量环境光实则是为玩家提供照明作用,开启光线追踪,虽然画面更真实了,但在部分昏暗场景下,会更看不清。
这一时间也说不好是游戏本身的问题还是光线追踪的问题,还是说游戏画面并不是越真实才越好?
《幽灵线:东京》RTX ON(点击查看大图)
《幽灵线:东京》RTX OFF(点击查看大图)
在第二组对比中,情况有所好转,水面的倒影更清晰。但同样的,可以看到建筑物上的光线更暗,确实给游戏增加了不少压抑成分。
《光明记忆:无限》RTX ON(点击查看大图)
《光明记忆:无限》RTX OFF(点击查看大图)
《光明记忆:无限》温泉场景中的光追效果是最为耗费显卡性能的。不难发现,最大的变化来自水中的倒影,而这一组倒影的计算难度非常高,由于并不是平静水面,所以要首先要考虑光线在水面的变化,其次与岸边鹅卵石的光线折射效果,最后则是综合前两种效果,将光线照射在水池底部。
《赛博朋克2077》RTX ON(点击查看大图)
《赛博朋克2077》RTX OFF(点击查看大图)
在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。
《逆水寒》RTX ON(点击图片查看大图)
《逆水寒》RTX OFF(点击图片查看大图)
在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。
《堡垒之夜》RTX ON(点击查看大图)
《堡垒之夜》RTX OFF(点击查看大图)
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》RTX ON(点击查看大图)
《魔兽世界9.0》RTX OFF(点击查看大图)
《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》RTX ON(点击查看大图)
《控制》RTX OFF(点击查看大图)
《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
09 附录2- 各游戏DLSS效果对比
《幽灵线:东京》DLSS对比(点击查看大图)
在《幽灵线:东京》的DLSS对比中,我们在4K分辨率下,放大水面倒影局部细节,由于倒影本身为光线追踪反射形成,所以在DLSS计算下,可以明显看到从清晰到模糊的渐变过程,不过在DLSS质量和DLSS平衡模式中,均有着不错的清晰度。
同时图片最上方的霓虹灯,可以看到在DLSS超级性能模式中有着较严重的逸散情况,这也是DLSS对于灯光边界,在AI计算中较难定位的表现。
不过对于游戏画面原生的贴图来说,如最远处墙壁上的“HSHS”字母涂鸦,即使是DLSS超级性能,也有着非常精准的还原能力。
帧数提升方面,五种模式分别为34/59/72/85/99,DLSS相较原生画质的提升为74%/112%/150%/191%,非常暴力。
《幽灵线:东京》DLSS对比(点击查看大图)
在这组对比中,DLSS超级性能模式依然会有边界模糊的问题,但整体来说效果令人惊讶。包括远处灯牌上的字,依然清晰可见。
帧数提升方面,五种模式分别为32/57/68/88/93,DLSS相较原生画质的提升为78%/113%/175%/191%,与上一处对比场景几乎相同。
《幽灵线:东京》DLSS对比(点击查看大图)
最后我们再来对比一下便利店中饮料上的文字,在这一组对比中到DLSS性能模式为止,都有非常好的画面表现,字体轮廓和物体的边界清晰。
帧数提升方面,五种模式分别为40/73/83/90/97,DLSS相较原生画质的提升为83%/108%/125%/143%。
在所有的DLSS超级性能模式中,给人的感觉是画面缺少锐利度,这也是由于超高的分辨率缩放,并不太适合4K分辨率下,如果换成8K分辨率,在基础信息较丰富的情况下,DLSS超级性能中会有不错的表现。
我们再来看看《彩虹六号:异种》各个DLSS模式下的画质表现。超级分辨率技术中,最难以把控的就是这种栅栏的细节部位,但是根据实测来看,即便是超级性能模式中,细节依旧清晰。可以看出较大差距的只有标识牌上的字体,在超级性能模式中,颜色边缘会有模糊的情况。
从帧数提升上来说,相比原生画质分别提升了55%/73%/88%/131%,对于游戏玩家来说,这简直是神迹!
接下来再提高难度,第一幅对比图的栅栏为独立建模,而此图中的棋盘格则是建筑中的花纹细节,可以看到在超级性能模式以上的细节把控都是比较到位的。而遍布地图中的菌毯在DLSS效果中也没有失真或模糊的情况。
帧数方面,相比原生画质分别提升了49%/85%/111%/162%。确实如NVIDIA所说,拥有了AI就拥有了未来,DLSS无论从画质表现还是帧数提升上来说,值得每一位玩家拥有。
《光明记忆:无限》在这一组对比中,在画面差距上,从DLSS关到DLSS性能依旧看不出什么变化,但是在超级性能模式中,墙壁的清晰度以及轮廓都有所下降。
当然总的来说,尽管DLSS贡献了非常大的功劳,但可以看得出《光明记忆:无限》在优化方面下了很大功夫,这对于靠一人主导的游戏来说难能可贵。
《赛博朋克2077》DLSS模式对比
《赛博朋克2077》这款游戏中,以2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。
《逆水寒》DLSS模式对比
画质说明
在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。
首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。
《永劫无间》DLSS模式对比
在《永劫无间》的DLSS对比中,原生画质大家可以注意角色发带的编制质感,每一根发丝边缘都较为清晰,同时肩部的服装花纹也有较为明显的凹凸感。在DLSS打开后,由于其工作原理就是缩放后,再由AI算法放大进行边缘重建,所以在质量模式中,发丝就会丢失部分细节,但如果不细看很难发现,同时发带的细节也保留的相当完好。
而在DLSS性能模式中,头发的质感则更差一些,并且发带的编织感有明显下降,另外腰间的配置边缘也会变模糊。最后在DLSS超级性能模式中,角色整体则会较糊,无论是头发还是服饰,所以如果不是非常追求高帧数的玩家,不建议开启DLSS超级性能模式。
10 附录3-Ampere新特性
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
宠物派对直播
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
(7905712)