MCPLive > 杂志文章 > Maxwell和Volta NVIDIA下一代GPU猜想

Maxwell和Volta NVIDIA下一代GPU猜想

2013-06-21李实《微型计算机》2013年6月上

GPU能发展到什么地步,计算能力又能膨胀到怎样的高度呢?NVIDIA近发布了很多消息,特别是针对下一代Maxwell和下下代产品Volta,或许我们可以从中探寻一二。

Maxwell和Volta NVIDIA下一代GPU猜想

NVIDIA在GPU架构的设计上一直都给人稳扎稳打的印象。纵观其近5年的产品,从G80开始到GT200、再到Fermi、Kepler,NVIDIA的GPU架构从单纯的图形计算架构开始一步一步进化,逐渐进化成我们今天看到的通用计算、图形计算并重,能耗比和实际效能表现都还不错的产品。NVIDIA在产品的发展上没有停歇,在开普勒之后,Maxwell以及Maxwell的继任产品——Volta也出现在2013年的GTC大会上。这些新产品都有哪些特色呢?结合目前仅有的一些资料,本文将做出一定范围内的预测。对于这些预测是否可以实现,本文给出了一些判断。当然,依据惯例目前NVIDIA依旧守口如瓶不会多说一句,所有的信息都只有等到产品具体发布后才能真正确认了。

预测一:顶级Maxwell产品的性能较明显胜出GeForce GTX 690,和GeForce GTX Titan SLI基本相当
可信度:★★★★

GPU的性能是G PU发展的根本动力,那么Max well的性能表现如何呢?根据NVIDIA 2013年新的路线图,Max well每瓦特双精度性能将是Fermi的7~8倍,Kepler的2~3倍左右。当然,这些数据全都是概数。有意思的是,这个数据相比2010年NVIDIA估计Maxwell的每瓦特双精度性能是Fermi 的16倍要缩水不少,可能考虑到实际的研发难度以及工艺进展的可能性,NVIDIA不得不调低了目标。看来,不仅仅是业内人士的预测会出错,就算是NVIDIA预估自己的产品发展也会出现明显的误判。

在GTC2010大会上,NVIDIA的一些数据表示,Fermi的每瓦特双精度性能为1.5GFlops/W(*注释),Kepler的双精度性能为5.57GFlops/W(例如TeslaK20X,它的双精度性能为1.3TFlops,TDP为235W,每瓦特双精度性能为5.53GFlops/W)。在NVIDIA之前的路线图中,Kepler的双精度性能是Fermi的4倍左右,根据NVIDIA公布的数据来看,这个任务算是完成了。

*注释:NVIDIA并没有说明Fermi架构的每瓦特双精度性能为1.5GFlops/W的数据来源。从实际产品来看,Fermi家族的Tesla M2090双精度性能为665GFlops,TDP约为225W,每瓦特双精度能力约为2.95GFlops/W。如果说Tesla M2090属于刀片应用的产品,对功耗极其敏感,芯片体质极好仅为特例的话,那么更普通一些的Tesla C2070的双精度能力为515GFlops,TDP约为247W,每瓦特双精度能力约为2GFlops/W,也要大于NVIDIA给出的1.5GFlops/W。另外一种说法是,Tesla产品的频率在Fermi时代都非常低,不超过600MHz,因此才维持了不错的功耗情况,一旦Fermi的频率超过600MHz,并进行双精度计算时功耗将暴增,每瓦特性能会大幅下跌。因此,很有可能是保守的频率设定、极高的芯片品质和较低的电压让Fermi版本的Tesla产品维持在较低功耗上,从而提升每瓦特性能。但这并不意味着其架构本身每瓦特性能设计很优异。

Maxwell的每瓦特双精度能力将是Fermi的7~8倍,这意味着在估算的情况下,Max well的每瓦特双精度能力高大约在12/W~16GFlops/W(按照Fermi“正常”产品的每瓦特双精度性能1.5~2GFlops估计)。如果其功耗是250W的话,那么单颗芯片的双精度计算能力大约有3~4TFlops。

双精度性能高可达4TFlops是什么概念?一般玩家对双精度能力几乎没有任何参照,毕竟目前没有任何游戏使用双精度哪怕一丁点功能,绝大部分(超过99.5%)的民用应用也和双精度计算也无关。不过,根据Maxwell的双精度能力,可以估算一下它的单精度能力,再比较目前的游戏显卡,就可以得到它在主流游戏中的大概性能情况了。

在游戏显卡中,GeForceGTX680的单精度性能大约为3TFlops,GTX690的单精度计算能力大约为5.6TFlops(2.8TFlops×2)。在Maxwell上,如果单精度性能和双精度性能的比率依旧为1:3的话(Kepler的单精度和双精度的比率为1:3),那么Maxwell的单精度性能将达到12TFlops——这已经大大超越了GT X 690。换句话来说,Max well的顶级单核心显卡将拥有远超上代双芯产品的计算能力。退一步来说,即使像Fermi家族那样,Maxwell的双精度性能和单精度性能的比为1:2的话,其9TFlops的性能还是令人乍舌。

9TFlops的性能意味着如果架构设计不出意外的话,这款产品在实际游戏表现中胜出GeForceGTX690已经没有悬念,12TFlops更是几乎超出GTX690达100%还多。当然,GTX690是两颗小规模核心GK104的集合,使用GK110核心来比较的话,GK110单颗芯片4.5TFlops的单精度计算能力,两颗芯片就是9TFlops——这和Maxwell“非高估计”下的计算能力差不多。

当然,终实际产品的性能表现也并非和双精度、单精度计算能力呈直接等比例关系。GPU的计算能力和性能肯定是极大关系的,但这种相关性究竟有多大,具体产品还得具体分析,毕竟GPU本身也是复杂集群,影响它的因素太多。但仅仅从NVIDIA给出的模糊数据来看,顶级的Maxwell性能肯定令人乍舌。

图1:NVIDIA在GTC 2010展示的路线图
图1:NVIDIA在GTC 2010展示的路线图

图2:NVIDIA 2013的路线图,明显改动了产品发布时间,增加了Volta。
图2:NVIDIA 2013的路线图,明显改动了产品发布时间,增加了Volta。

图3:GTX 690的单精度能力达到了5.6TFlops,但在1080p分辨率下依旧难以实时渲染出“真实”的画面。
图3:GTX 690的单精度能力达到了5.6TFlops,但在1080p分辨率下依旧难以实时渲染出“真实”的画面。

小知识:不仅有Maxwell和Volta—NVIDIA曾使用过的物理学家名称

NVIDIA的GPU架构以物理学家的名字作为代号是“早已有之”的惯例了。NVIDIA从早期的NV04(TNT)时代开始,就采用物理学家作为产品架构的代号了。早期的Fahrenheit、Celsius、Kelvin、Rankine四位物理学家的成就主要集中在温度、热力学等学科中,分别代表NV04、NV10、NV20和N V30时代的产品;比较近的有Curie、Tesla、Fermi和Kepler,则涉及了核物理学、电磁学、以及天体力学等学科,分别代表的是NV40、G80、GF100和GK104等产品。紧接着将于明年发布的Maxwell,则以英国物理学家和数学家麦克斯韦进行命名,他的贡献主要是经典电磁理论。在更下一步的Volta,是以意大利物理学家伏打的名字命名,他的主要贡献是电力学,发明了目前广泛使用的电池。

从NVIDIA选择物理大师来命名产品架构和实际产品表现的情况来看,两者并没有任何相关性,仅仅只是产品代号而已。不过即使如此,这些物理学家的名称也随着新GPU的发布而被玩家熟知,甚至成为NVIDIA某代产品的代称。

Maxwell和Volta两位大师成为了NVIDIA下一代、下下代产品架构的代号,上图为Maxwell,下图为Volta。


Maxwell和Volta两位大师成为了NVIDIA下一代、下下代产品架构的代号,上图为Maxwell,下图为Volta。

分享到:

用户评论

共有评论(1)

用户名:

密码: