冤家聚头 GTX260直面HD4870
● 第二代DX10显卡 A/N思路分道扬镳?
在显卡进入DirectX 10时代后,AMD-ATI和NVIDIA两家GPU芯片级厂商都加快了产品的更新换代速度,几乎是以半年一代的频率的发布新品。这样的做法不仅加强了自身竞争能力,还能为用户带来功能更多、性能更强的显卡。
目前,AMD-ATI的全新代表作为Radeon HD 4800系列,它们的优势在于明显改进了的架构设计和庞大的流处理器。当然直击底价的田忌赛马式行销策略,再次帮助AMD-ATI成功掠取用户关注,目前1399元的Radeon HD 4850成为了中高端产品中极具性价比的产品之一,备受玩家追捧。
而NVIDIA在第二代DirectX 10产品中,主攻产品的绝对综合性能,例如已经大量铺货的Geforce GTX 280/260,这两款产品综合性能毋庸置疑,不过它们需要面对的敌人并非Radeon HD 4800系列,而是自己本身的价格,上市之初设定5000元和3000元零售价确实令很多消费者望而却步,这也给对手的Radeon HD 4800有机可乘。
● 好戏还在后面 第2回合对决揭幕
Radeon HD 4870 vs GeForce GTX 260 正如前文提及过的价格因素,NVIDIA决定调整Geforce GTX 280和Geforce GTX 260的价格,用以增强产品竞争力。目前Geforce GTX 280官方定价559美元,Geforce GTX 260定价369美元,折合成人民币后已经抵达2500元左右,和Radeon HD 4870价格十分接近,形成短兵相接之势。在Radeon HD 4850和GeForce 9800 GTX/GTX+的第一轮大战之后,AMD和NVIDIA的第二轮厮杀现在正式开始。
最近一年来的中高端显卡市场格外热闹 不过,无论AMD-ATI和NVIDIA在产品定位和市场策略上有何相同、有何不同,用户更为关心的是在自己能够承受的价格区间内什么产品最适合自己。而且当前正值新老两代产品交替之际,很多用户在价格、性能、功能、规格等多方面权衡,所以有些无从下手,本文将围绕AMD-ATI和NVIDIA两家的全新产品和上一代顶级产品展开,让广大用户能够更加直观的了解到产品综合性能,以便选出适合自己的产品。本文将选择AMD-ATI和NVIDIA的如下产品进行对比: AMD-ATI产品:Radeon HD 4870、Radeon HD 4850、Radeon HD 3870x2和Radeon HD 3870 NVIDIA产品:Geforce GTX 280、Geforce GTX 260、Geforce 9800GX2和Geforce 9800GTX+
RV770 GT200核心架构大比拼 AMD-ATI和NVIDIA两家公司的产品在设计思路上迥异,下面就让我们浅析一下GT200和RV770二者的架构。 首先,新一代的产品势必会要争取更强大的性能,在进入DirectX 10时代后,显卡除了增加自身频率外,大规模增加流处理器数量是一个立竿见影的做法。RV770就是如此,相对于上一代RV670的320个流处理器,其翻倍增至800个。 其次,增加显存位宽和显存容量。RV770在这点上相对RV670没有做改动,也许是吸取了在Radeon HD 2900系列产品中教训。反观GT200核心不仅着手增加流处理器,还激进的首次采用512bit显存位宽,这样通过增加流处理器和显存位宽,从而降低显卡对频率的依赖,毕竟14亿晶体管构建的576mm2核心发热量、功耗太大了。 ● 以组为单位 性能浅析
AMD-ATI产品SP架构设计 众所周知,现在在进入DirectX 10时代后启用了统一架构,但是AMD-ATI和NVIDIA在设计上略有差别,例如上图中的架构可以看出AMD-ATI的产品采用4D+1D的SIMD方式,而NVIDIA再用1D标量MIMID方式,这就是很多网友为什么说AMD-ATI产品流处理器要除以5再和NVIDIA产品比较的原因。
AMD-ATI(左)NVIDIA(右)每组流处理器架构 我们可以把4D+1D的组合看做一个SP(Streaming Processor 流处理器),AMD-ATI每16个SP构成一个叫做SIMD Core的组,这点与NVIDIA的SM(Streaming Multiprocessor)结构相类似,其是由8个SP构成一组SM。
RV670核心共有4组SIMD Core
RV770核心共有10组SIMD Core
GT200核心流处理器阵列共有10组TPC 在核心宏观角度考虑,RV770相对于RV670仅是增加了2.5倍的SIDM Core,基本宏观设计思路变化不大。反观GT200的核心架构,首先大刀阔斧的将每组TPC扩容至3组SM(之前产品为2组SM),从而增加线程管理作用。 那么,GT200的1D标量MIMD架构和RV770的4D+1D向量SIMD架构在运算上分别有何长处呢? | NVIDIA GT200 | AMD RV770 | AMD RV670 | SP Issue Width | 1-way(1D) | 5-way(4D+1D) | 5-way(4D+1D) | # of SPs | 240 | 160 | 64 | Worst Case Dependent Instruction Throughput | 240 | 160 | 64 | Maximum Scalar Instruction Throughput | 480 | 800 | 320 |
从表中不难看出,GT200的1D标量MIMD架构相对而言更加适合单线程运算,此时相对于RV670和RV770有更多的执行线程。而在运行负载运算时,AMD-ATI的4D+1D向量SIMD架构得以发挥,例如RV770此时800流处理器运算,而GT200即使调用SFU实现Dual-Issue技术,也仅有480线程计算量。
NVIDIA Geforce GTX 280
AMD-ATI Radeon HD 4870 对比RV770和GT200核心中每组流处理器架构,我们能够很容易看出RV770共有160个SIMD Core(每SIMD Core由5个流处理器组成,即160*5=800个流处理器)分成10组,每组SIMD Core有16个SP。反观GT200核心的240个流处理器,由于NVIDIA采用MIMD的流处理器形式,所以每个流处理器拥有独立的指令发射器。而这240个流处理器分为10组TPC,每组TPC又分成3组SM,每组SM拥有8个流处理器。 两款核心及产品在宏观架构设计上平分秋色,在微观单元设计及技术应用上二者都较上一代产品有了大踏步的前进,尤其是RV770融入了很多AMD在通用处理器上的技术,使其工作效率更佳。 RV770威力极限—HD4870整装待发 全球的Radeon阵营支持者最近一个月无疑都沉浸在Radeon HD 4850阶段性胜利的喜悦中,AMD及Radeon依靠这款性价比极高的产品重新得到了PC图形硬件玩家们的关注,它准确的击中了目前NVIDIA产品布局的软肋,并使其不得不大幅降价GeForce 9800 GTX并追加GeForce 9800 GTX+来应对。现在,Radeon HD 4850的兄弟产品Radeon HD 4870也来到了我们面前,和上代的xx50/xx70产品编号相似,Radeon HD 4870是Radeon HD 4850的极限版本,发生的主要变化是提升GPU频率并换用了速度超快的GDDR5本地内存,但它仍然基于RV770 GPU。 ● 首款GDDR5显卡 Radeon系列显卡一直是新式内存芯片的先锋验证者,这一代的Radeon HD 4870也当仁不让的在业内率先使用最新显示内存GDDR5,让显卡的内存带宽提升幅度逼近100%!
Qimonda GDDR5内存芯片 目前AMD统一出货的第一批官方版本Radeon HD 4870上均使用了Qimonda IDGV51-05A1F1C-40X GDDR5内存芯片。和GDDR3相比,GDDR5内存芯片内的预读取I/O翻番,以同样的内核频率前提下实现加倍的外部频率,当然同时也付出延迟更高的代价,但在庞大带宽支持下获得性能提升仍然是十分明显。 Radeon HD 4870 BIOS设定的内存频率为3600MHz(QDR),远远超出现有其他显卡的内存频率,十分夸张。GDDR5的默认工作电压为1.5V,目前工艺下整体功率较GDDR3稍高。 ● 回顾RV770 GPU
AMD RV770 GPU RV770由台积电以55nm工艺制造,晶体管数目9.56亿、核心表面积260平方毫米,在Radeon HD 4870的750MHz频率设定上,它需要比较强力的散热器来进行散热。RV770的其他特点还有内置256bit位宽的内存控制器及符合PCI Express 2.0规范的I/O接口,其800个流处理器和整个GPU运行频率同步。RV770也内置了符合HD Audio规格的音频逻辑,可以直接输出完整的HDMI信号。
在3D架构方面RV770不是从某个顶级GPU精简规模而来,是在RV670基础上开发的加强版本。
RV770核心架构 >>着色器
以上是RV770核心架构图,它仍然基于R600/RV670的4D+1D模式1D*5基本着色器组结构,每5个标量着色器组成一个类似以前的向量着色器样式拥有自己的基本资源进行操作。
>>纹理单元
和着色器树木比例递增的是纹理单元,RV770的纹理单元也增加到了10组,在结构上和RV670完全相同。
>>ROPs
但是在端部分,RV770虽然仍旧使用4组16个ROPs,但这些部分却得到了AMD的改良以增强抗锯齿能力,改良的关键是加倍了Z模板的采样数。
RV770相对于RV670的底层结构变化并不算很大,增进的主要是着色器的规模,这将直接提升GPU面对着色器编程类图形及其他计算类应用程序时的性能,最主要的改善就是最新的复杂3D游戏速度。同时剧增的着色器规模用于MSAA的计算配合ROPs的改进,Radeon HD 4000系列的抗锯齿性能也得到了加强。
AMD图案乍现—HD4870显卡PCB详解
● Radeon HD 4870公版
目前我们拿到的Radeon HD 4870均为AMD设计定制分派到各个品牌的官方版本,拥有完全相同的硬件设计和性能规格,这些Radeon HD 4870均为512MB本地内存配置版本。
按照惯例,这款显卡整个PCB仍采用典型ATI风格的火红色涂装,绝大部分元件安装在PCB正面,包括8枚内存芯片,背面元件为少量小型贴片型,没有预留更多的内存芯片焊位,扩展成1GB本地容量需要换装1Gb的内存芯片。其BIOS默认核心/内存频率设定为官方规格的750MHz/3600MHz。
Radeon HD 4870 PCB状况 Radeon HD 4870的GPU/内存频率更高,对布线和供电的要求急剧提升,PCB整体设计和元件的使用也复杂更昂贵了,以下是Radeon HD 4870和Radeon HD 4850的PCB正面对比,两者的区别一目了然,Radeon HD 4870的PCB较大,使用更强力的供电元件和双6pin外部电力输入接口。
Radeon HD 4850和Radeon HD 4870的PCB对比
AMD logo清晰可见 另一个细微的变化是“AMD”的logo,自ATI被AMD收购以来,Radeon系列显卡的外部特征和品牌标识一直都还保持着原来的样式几乎没有变化,这第一次在Radeon显卡PCB上出现的“AMD”意味着什么呢? ● 3+2 豪华供电电路 为了支持高频GPU和内存芯片的稳定运行,并保持低矮外形便于整体散热,AMD给Radeon HD 4870使用了成本不菲的一体式电感和小型化CSP封装的高性能电源元件,类似的方案在Radeon HD 2900 XT上曾经出现过。 给750MHz RV770 GPU供电的是三枚VOLTERRA VT1195SF PWM/MOSFET整合电源芯片外加一只VITEC并联一体式电感,共可以同40A*3最高达120A的电流支持。 给3600MHz GDDR5供电的是两枚VOLTERRA VT235MF PWM/MOSFET整合电源芯片外加两只PULSE电感,应付8颗内存所需的大电流绰绰有余。 ● 设计精良的散热方案 因为需要照顾内存芯片和供电元件散热,Radeon HD 4870的散热器相对复杂,主要一块铝质内存、供电元件散热兼固定板+铜质GPU吸热散热块和鳍片组+离心式风扇及导流罩构成,完全拆解它们也并不麻烦。
显卡散热器拆解 GPU吸热散热块部分和我们熟悉的CPU散热器结构类似,和GPU核心表面接触的铜底吸热储热,通过热管元件内部工质相变迅速把热量传递给密集的铜鳍片,由离心式风扇提供流动空气,把热量排出机箱。 散热器带来了整块显卡的双槽厚度,配置Radeon HD 4870需要主板有较为宽阔的空间。产品介绍部分到此为止,接下来我们来对这款显卡的性能进行初步的探索。
[ 本帖最后由 共相语 于 2008-7-31 12:43 编辑 ] |