新年刚过,去年底刚刚公布的 RTX 50 系列显卡已经开始铺货,不过受限于产能目前想要首批买到新显卡还有点困难。IT之家近期会陆续给大家带来首批 RTX 50 系显卡的体验评测,本期聊一下高端定位的索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡,给大家先解解馋。
索泰近几年在显卡外观设计上非常大胆,并在高端和旗舰显卡产品上采用双 BIOS 的激进性能调度。本次我们就借助一套旗舰配置,看看它能的表现如何。测试平台具体配置如下:
一、外观设计
索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡的装甲部分采用了硬朗线条设计风格,辅以大量栅条元素装饰,使整体呈现出一种工业风美学。
看似无序的斜切线条装饰,实则蕴藏着对称和工整的内敛之道。黑金色搭配的环刃风扇,在光线下呈现的光泽更显质感。低饱和的灰色金属装甲,通过丰富的栅条呈现出独特的层次感和工业风。
全新设计的环刃风扇部分增加了环形倒流风罩,优化了扇叶曲率和结构稳定性,降低风噪的同时能够进一步增加风量和风压,提升散热效率。
显卡尺寸上,索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡的三围分别是 329.7mm x 137.8mm x 67.8mm(不含挡片),净重约 2.3kg 左右。
索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡背板同样采用了硬核工业风的设计,右侧提供了大面积的斜切细条开孔和不规则镂空开孔,两种很少出现在一起的开孔设计相互碰撞,反而让背板显得更有特色。
透过镂空开孔,能够看到卡身内部厚实的散热格栅,还有看不到的巨型 VC 均热板和镀镍符合热管加持,通过贯穿是散热设计,让风吹透鳍片,达到全方位立体散热效果。
显卡两侧同样被厚实的散热装甲包裹,并且在靠近显卡背板的一侧做了一圈金色的铝合金加固条。顶部侧面镂空字符的 ZOTAC GAMING 标志和旁边的索泰 Logo 支持 RGB 灯效,亮机后可实现炫酷的多彩 RGB 效果。
居中位置设有一大一小两个开孔,分别内置了幻光同步接口、双 BIOS 开关以及 16pin 显卡供电接口。其中幻光同步接口配合随箱附送的专属线材连接至主板 ARGB 端口,轻松控制显卡灯光,而双 BIOS 开关可提供加速模式和寂静模式两种风扇策略预设,兼顾满血性能和静音表现。
I/O 接口方面,索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡提供了 3 个 DP2.1b 接口以及 1 个 HDMI 接口,挡板中间还印有一个白色的索泰 Logo。
配件方面,包装内提供了一条 16pin 转 4*8pin 的供电转接线,幻光接口专属白色灯光线,可拆卸铝合金显卡之家以及一张彩色卡通形象卡片。
二、架构解析
NVIDIA GeForce RTX 5090 D 采用了全新的 Blackwell 架构,官网的介绍页面赫然写着一列“专为游戏玩家和创作者打造的致胜平台”,其中所代表的就是游戏性能和 AI 性能的暴增。英伟达称,目前对于画面质量的追求已大幅度超越了摩尔定律所能够提供的运算性能,加入神经网络渲染势在必行。
由于加入了神经网络渲染,Blackwell 的多单元流处理器 (SM) 具有更高的处理吞吐量,并与 Tensor Core 更紧密结合,从而优化神经网络着色器的性能。
为了满足下一代 DLSS 多帧生成的帧率稳定性需求,Blackwell 架构搭载了基于硬件的 Flip Metering,将帧率逻辑转移到显示引擎中,使得 GPU 能够更精确地管理显示时间。同时显示引擎还增强了两倍的像素处理能力,以支持更高的分辨率和刷新率,从而释放 DLSS 4 的性能潜力。
在第五代 Tensor Core 中新增了对 FP4 浮点运算精度的支持,FP4 是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率。FP4 使用显存不到 FP16 的一半,GPU 性能的提升却高达 2 倍。在生成式 AI 应用中,GeForce RTX 5090 D 的 FP4 图像生成速度是 RTX 4090 D 上 FP16 的 3 倍,显存消耗减少一半。
在 RT Core 方面,提升了检测光线、路径与三角形相交的效能,可以对大量几何图形细节进行光线追踪。在新一代 Blackwell 架构下光线、路径与三角形相交的检测效率为上一代的 2 倍,初代使用 RT Core 的 Turing 架构的 8 倍,并增强了压缩以减少内存占用,相比上代的显存使用率节省了 25%,光线追踪效果也得到了前所未有的细节提升。
除了技术上的提升,Blackwell 架构的 GPU 还搭载了 GDDR7 显存。GDDR7 采用的是 PAM3 信号编码机制,与 GDDR6 和 GDDR6X 有所区别。PAM3 每两周期的数据传输为 3 位,相比 GDDR6 和 GDDR6X 更省电,带宽也进一步提升,速度高达 30Gbps。
Blackwell 还通过 PCIe 5.0 和 DisplayPort 2.1b UHBR20 实现了增强,单一通道支持 20Gbps 带宽,从而支持高达 8K 165Hz 的显示器。Blackwell 架构 GPU 配备了第九代 NVENC,支持 H.264 / H.265 4:2:2 编码的 8 位和 10 位视频输出。
具体到产品规格上,索泰 GEFORCE RTX 5090 D 32GB SOLID OC 基于最新一代 GB202 核心和 TSMC 4N 架构制程工艺打造,内有 21760 个 CUDA 核心、680 个 Tensor 核心、170 个光追核心、680 个纹理单元、176 个 ROP 单元,核心规模相比 RTX 4090 大致相当,但解锁了完整的 GPC 单元,单元内的 SM 和 TPC 群组数量均有增加。
索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡默认的 GPU 频率范围是 2017MHz-2317MHz。显存方面升级为 512-bit 32GB GDDR7,带宽来到了 1792GB/s。TBP 功耗为 600W,相比上代 RTX 4090 增加了 150W。
三、理论跑分
接下来就进入理论测试环节,索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡属于高端定位,自带双 BIOS 切换和超频功能,所以测试之前必须先介绍一下索泰官方这次更新的 FireStorm 超频应用,它允许用户实时查看显卡状态,并进行自定义性能调节和双 BIOS 切换。
进入主页,FireStorm 应用整体采用了黑金配色,默认展示性能标签页内容。顶部显示有显卡的几个核心数据,下方则可以对显卡、显存频率,电压以及功耗等指标进行自定义调节。实际性能测试环节,我们会将核心频率关联 BOOST 频率这项拉满。