对曲面细分技术的支持一直是AMD显卡的弱项,受到不少外界的批评。AMD认为,曲面细分只是DirectX 11游戏的一个方面,对它的使用并非越高越好。在游戏中,过重的曲面细分系数并不会带来图形画质的明显提升,反而会由于过大的计算负荷导致显卡性能大跌。在之前的Cypress中,AMD设计了一个曲面细分单元。这样的设计只是达到了DirectX 11“拥有”曲面细分的基本需求。当然,在AMD推出第一代显卡时,DirectX 11游戏尚未发布,游戏要求也不高,因此AMD这样的设计也符合当时游戏的需求。在DirectX 11时代正式来临后,AMD就需要重新考虑显卡对DirectX 11的支持特别是对曲面细分的支持了。
因此在Cayman中,我们看到了AMD全面加强了DirectX 11设计。首当其冲的就是受关注的曲面细分性能。相比上代产品单曲面细分单元和NVIDIA的大量曲面细分设计而言,AMD经过衡量,确定了自己的曲面细分设计方法。AMD针对Cayman的曲面细分设计并不过于突出,而是有序加强。AMD将Cayman中负责曲面细分单元的图形引擎(Graphics Engine)由之前的Cypress的一个提升至2个,随之而来的则是负责曲面细分的几何单元、顶点单元以及曲面细分器数量也变成双份。除此之外,光栅器和多级Z缓冲设计也都变成双份。整个双图形引擎的设计,提高了Cayman在处理三角形时的能力。现在Cayman能够实现多三角形的并行处理,理论上可以得到相对Cypress高达3倍的曲面细分性能提升。
Cayman(上)、Barts(中)和Cypress(下)在曲面细分设计上的差异,Cayman的曲面细分性能强,Barts其次,Cypress垫底。
另外,Cayman在其他方面也有一定改进。比如后端单元的能力被进一步加强,能够实现合并操作,在16bit、32bit计算时的性能上都至少提升了2倍,其中32bit浮点性能提升了多4倍。后端单元的性能直接决定了显卡的抗锯齿性能,Cayman在抗锯齿性能上应该会更为优秀。
在通用计算方面,Cayman重要的变化就是双精度性能由之前单精度性能的1/5提升到现在的1/4,当然这种变化多数都是由架构4D+1D改进到4D带来的。另外一些在通用计算上的变化包括可以执行Shader合并读操作、改进了流控制、可以直接从LDS读取数据(之前需要先载入寄存器)、可以读写本地显存数据等。总之,这些改进提升了Cayman在通用计算上的表现,特别在一些特殊应用场合会有更为出色的表现。
AMD近在抗锯齿技术上的创新相当积极,在Barts系列上AMD推出了全新的MLAA技术。作为初次技术探索,AMD为我们展示了其在新技术研发上的实力。在新的Cayman显卡上,AMD又马不停蹄地带来了EQAA(Enhanced Quality Anti-Aliasing)技术。
从技术本质本身来说,EQAA并非AMD首创,在NVIDIA的G80上,我们就看到了和EQAA基本相当的CSAA技术。这两项技术都来源于MSAA,但通过覆盖采样和色彩采样分开选择,通过更多的覆盖采样点,获得更好的画质。
AMD的EQAA目前有2×EQAA、4×EQAA和8×EQAA三种模式,其中2×EQAA类似2×MSAA搭配2个额外的覆盖采样点(2×MSAA本身还包括2个覆盖采样点);4×EQAA则是4×MSAA搭配4个额外覆盖采样点(4×MSAA本身还包括4个覆盖采样点);8×EQAA是8×MSAA搭配额外8个覆盖采样点(8×MSAA本身还包括8个覆盖采样点)。相比NVIDIA的CSAA,AMD的EQAA增加了覆盖采样点的数量,比如8×CSAA只有8个覆盖采样点,和4×EQAA相同,但同级8xEQAA的覆盖采样点则多达16个,理论上EQAA的画质会稍微好一点。
在节能省电的大潮下,能耗管理、电源管理技术成为众多高端产品的特殊符号。在显卡方面,AMD的PowerPlay技术能很好让显卡在2D状态下节约电能,但AMD还不满足,在Cayman上,又引入了更为节能且能够让用户手动进行控制的PowerTune技术。
传统的PowerPlay设置了三种功耗状态:3D满载、3D轻载、2D待机,这三种功耗状态对应着高功耗、中等功耗和低功耗。在AMD看来,很多应用程序并不需要让显卡进行3D满载全负荷计算,但由于功耗设置的步进问题,在性能要求超过中等功耗后,显卡就工作在功耗高的满载状态,这对节能来说是不利的。
因此,AMD引入了PowerTune技术,PowerTune通过在中等功耗和满载功耗两档次之间引入更多的工作模式,让显卡在一些3D负荷较低的场景中自动降低频率。以Radeon HD 6950为例,核心频率波动频率范围是650MHz~780MHz,在3D应用中显卡频率会自动在此范围内切换,起到智能节能的作用。
除此之外,PowerTune还能监控显卡的功耗情况,当显卡功耗超出设定上限后,PowerTune会自动降低显卡频率,将显卡功耗控制在限定值之内,保证显卡不会由于过热而烧毁。当然,为了让显卡可玩性更高,满足一些玩家和功耗敏感用户的需求,AMD在催化剂控制中心中还特别对PowerTune给出了上下限设置,其中上限为+20%,下限为-20%,默认为0。当用户调整这个数值时,显卡的核心频率会有波动幅度的变化。
总的来说,PowerTune是一种相当先进的功耗控制方式,和NVIDIA在GeForce GTX 580/570上引入的功耗检测和控制系统类似,但它功能又更为全面一些。PowerTune通过对显卡核心各个部分的监控,在性能、频率和功耗之间作出合适的取舍,可以智能调节动态功耗。我们认为,这种能耗控制的方法必将成为未来显卡的主流设计。