NVIDIA RTX神经纹理压缩技术实测 显存占用爆降85%
随着3A大作对画面精度的要求持续升级,高精度材质纹理包的体积水涨船高。曾经的主流8GB显存显卡,如今动辄遭遇爆显存、画面卡顿、强制降画质的窘境,也被不少玩家调侃为“残废卡”。而NVIDIA全新的RTX神经纹理压缩技术(简称NTC),或许能彻底改变这一现状。

近日,Tom's Hardware对这项技术完成了多显卡、全平台的专项实测。NTC是随RTX50系列显卡一同发布的AI驱动技术,依托显卡Tensor核心(NVIDIA显卡内置的AI加速运算核心)完成纹理的压缩与解压,最高可将显存需求降低超80%,实测最高降幅达85%,同时画面画质还优于游戏行业沿用多年的传统压缩方案。这一结果,也让玩家对“8GB显卡再战十年”有了切实的期待。
从技术原理来看,NTC是基于机器学习的纹理压缩与解压方案,也是NVIDIA神经着色渲染新范式的核心技术之一。它跳出了传统BCn块压缩格式(游戏行业通用的传统区块纹理压缩标准)4×4像素的固定限制,在压缩阶段就将原始纹理转化为小型神经网络权重与潜在特征组合。
需要明确的是,NTC是确定性解码技术,并非生成式AI,不存在AI幻觉的风险。
为适配不同层级的硬件,NTC在DirectX 12接口下提供三种运行模式,另一主流接口Vulkan因无对应配套功能,仅支持其中两种(不支持Inference on Feedback )。
第一种是加载时推理模式(Inference on Load)。它会在游戏或地图加载阶段,全程在GPU内完成NTC纹理的解压,并同步转码为传统BCn格式。这种模式和原生BCn纹理的渲染性能完全一致,没有任何渲染阶段的性能开销,还能大幅缩小游戏的磁盘占用体积、降低PCIe总线传输压力,唯一的不足是无法降低运行时的显存占用。
第二种是采样时推理模式(Inference on Sample),这也是大众认知中神经纹理压缩的核心形态,更是显存压缩能力最强的模式。它会在纹理采样时,通过预训练的多层感知机(简称MLP,一种轻量化小型神经网络),实时解码当前所需的像素数据,最终实现最高85%的显存占用降幅。
第三种是反馈时推理模式(Inference on Feedback),仅支持DirectX12接口。它会通过采样器反馈(DirectX12专属图形功能,可精准识别渲染当前画面所需的纹理区块),仅解压渲染当前画面需要的纹理部分,是前两种模式的折中方案,显存降幅不如采样时推理模式,但性能开销更低,整体表现介于两者之间。
Tom's Hardware用行业通用的Intel Sponza标准场景完成了量化测试,实测数据完全贴合官方标称的压缩能力,原始无损参考材质的纹理显存占用为6830MB。加载时推理模式(Inference on Load)将纹理转码为BCn格式后,显存占用为2041MB。
而采样时推理模式(Inference on Sample)下,纹理显存占用仅为303MB。实现了85%以上的纹理显存占用。对比原始无损参考材质,显存降幅更是超过95%。
同时实测显示,该模式下的画面效果,比转码后的BCn纹理更接近原始参考材质,几乎能做到完美复刻。而在NVIDIA官方的托斯卡纳别墅场景测试中,同画质下的纹理显存占用,可从传统BCn格式的6.5GB直接降至NTC格式的970MB。
测试团队覆盖了从旗舰到入门级的多款NVIDIA显卡,以及笔记本移动平台,核心测试指标为帧时间(渲染单帧画面所需的时间,数值越低画面流畅度越高)。
RTX 5090在4K分辨率下,采样时推理模式搭配TAA(时间抗锯齿,主流的画面平滑技术,用于消除画面锯齿、提升画面纯净度),帧时间仅比零开销的加载时推理模式增加0.09ms,性能损耗几乎可以忽略。
主流RTX 5070在适配的1440P分辨率下,该模式的帧时间开销在0.50-0.70ms之间。入门级RTX 5060在适配的1080P分辨率下,帧时间开销稳定在0.60-0.70ms。即便是笔记本端的RTX 4060移动显卡(8GB显存),1080P下的帧时间开销也仅0.70-0.85ms。
测试团队同时明确,测试场景仅包含基础前向渲染与抗锯齿流程,实际3A游戏有大量不受NTC影响的渲染通道,因此这项技术在实际游戏中的相对性能损耗,会比测试数据更低。
对于8GB显存显卡来说,只要游戏基础帧率充足,用小幅性能开销换取不降级的纹理画质,是实打实的净收益。
这项技术也有明确的使用门槛。采样时推理模式必须开启随机纹理过滤(简称STF,用于优化纹理画质、减少画面瑕疵),关闭抗锯齿时会产生画面噪点。DLSS能完全消除这类噪点,TAA仅能完成大部分清理,无法彻底消除,因此该模式优先推荐搭配DLSS使用。
NTC技术开发者、NVIDIA资深工程师Alexey Panteleev表示,采样时推理模式更适合高性能显卡,加载时推理模式可覆盖全平台硬件。游戏厂商可按单纹理选择是否启用NTC,也能给玩家开放模式选择,让用户根据自身硬件情况决定。
值得一提的是,NTC并非NVIDIA专属技术,它可兼容AMD、Intel显卡的AI加速单元,行业爆料称索尼PS6主机也有望采用同类技术。
目前尚无游戏正式支持该技术,但全行业布局已落地,规模化商用近在眼前。它不仅能让小显存老显卡重获新生,也为实时图形渲染开辟了全新的技术方向。











