中级程序员
|
1#
大中
小发表于 2007-9-26 20:56 显示全部帖子
教你千元也玩DX10-最新游戏体验测试
2007-06-05 10:45:08 作者:一期一会 来源: HTPC源动力
关键字:教你千元也玩DX10-最新游戏体验测试
06年底,微软公司新一代操作系统Windows Vista发布。为了增加Vista的吸引力,新一代API——DirectX 10被微软定义为Vista独占。PC市场近年来的持续疲软,业界的确非常需要Vista和DX10这两针强心剂。对于在图形市场酣战的Nvidia和ATi-AMD来说同样如此。不过,Vista带来的操作系统和图形渲染API双重换代也将整个战场大大复杂化。在Vista和DX10提出的新一代标准的刺激下,图形市场面临新一轮洗牌。
[图1 VISTA发布给饱受PC市场疲软困扰的硬件厂商带来了新的契机]
NV第一款基于G80架构的DX10旗舰产品GeFoece 8800已经不再需要谁来证明它的强大,甚至连ATi-AMD最近发布的新一代高端产品也选择避开G80家族中旗舰的锋芒,转而进攻高阶玩家市场。市场调查报告表明,GeForce 8800四兄弟已经称霸高端市场有半年之久。
最近,正如微软公司所承诺的,陆续有几款DX10游戏的试玩DEMO放出,随着时间的推移,DX10游戏必将大行其道。玩家的注意力焦点也转移到了DX10硬件身上。
VISTA发布给饱受PC市场疲软困扰的硬件厂商带来了新的契机
Nvidia第一款基于G80架构的DX10旗舰产品GeFoece 8800已经不再需要谁来证明它的强大,甚至连ATi-AMD最近发布的新一代高端产品也不得不避开G80家族中旗舰GTX和Ultra的锋芒,转而进攻由GTS把持的高阶玩家市场。市场调查报告表明,GeForce 8800四兄弟已经称霸高端市场有半年之久。
最近,正如微软公司所承诺的,陆续有几款DX10游戏的试玩DEMO放出,随着时间的推移,DX10游戏必将大行其道。玩家的注意力焦点也转移到了DX10硬件身上。
DX10每一个细节的改变都为未来的游戏打下了坚实的基础
不过,对国内的主流消费者而言,超过1500元以上的显示卡不具太多吸引力。目前国内主流游戏玩家图形卡市场的价格,仍停留在700与1500元之间。在这个价位,Nvidia旗下的GeForce 7系列面对ATi-AMD Radeon X1000系列的竞争并不占有太多优势。而Vista的发布又再次对PC的图形子系统提出了新的要求,改朝换代已经迫在眉睫。为了抢先一步在即将到来的DX10大战中站稳脚跟,Nvidia在今年4月就抢先于对手宣布了自己旗下基于GeForce8架构的新一代DX10中端产品线。这是一个庞大的家族,它们包括:针对中高端游戏玩家的GeForce 8600GTS,针对主流玩家的GeForce 8600GT,针对HTPC和家庭数字用户的8500GT,以及针对OEM市场的8400GS。NVIDIA不仅仅要用这一GeForce8系列产品作为廉价芯片杀入主流市场,成为即将退出的的GeForce 7家族的替代者,而且它还要以这款产品巩固这部分市场,建立低价DX10解决方案新的性能标准。更重要的是,要向市场中注入包含DX10特性和统一渲染体系的主流GPU。对于消费者而言,这些并不是很重要,关键的问题是:它的是否能像NVIDIA所宣称的那样好?
在API和操作系统更新换代的情况下,代表了大部分市场份额的主流玩家又急切希望能有一款合适他们的主流DX图形芯片问世,因此人们自然对新一代产品寄予了很高的期望。或许是因为上一代DX9中端硬件的表现实在是太出色,在G84/G86发布之初,各大媒体的测试表明,它们在那些较老的游戏中似乎不能对自己的前辈们树立绝对的优势,这未免让这些人感到失望。很多人发出了这样的疑问:第一代DX10主流硬件,到底能否适应DX10游戏的需求?
目前以公布的几个支持DX10的游戏中,最具王者风范的毫无疑问当属《孤岛危机》。相信该作也是大部分玩家升级到DX10硬件的动力。《孤岛惊魂》的Cryengine2引擎可以说是集当今即时演算图形技术之大成于一身,真正做到将real-time跟offline之间的界限模糊化。它的大量先进特性诸如实时光照和动态柔和阴影系统、容积化、多层次以及远视距雾化技术、2.5D地形环境光照遮蔽贴图、法线贴图和视差映射、次表面散射、视觉适应和高动态范围光照以及面向DX10统一shader架构的高级着色器技术,能够实现诸如海洋shader、河流shadr、容积雾化shader等等甚至初具“电影画质”的影子。
《World in Conflict》,这是由Massive娱乐公司以DirectX 10 API开发的一款RTS即时战略大作。众多即将上市的D10游戏中的一款。预计在今年第3季度推出。从这些截图中可以看到DX10游戏惊人的效果。
在最近出现的一些要求较高的新DX9游戏或者新DX10游戏的试玩demo里,我们已经发现了一些有意思的变化。例如刚发布试玩demo的科林麦克雷:尘埃(简称DiRT)这个游戏。我们发现如果将阴影特效设置到最高,它会对shadow map使用大小为4096×4096的纹理。这超过了最大支持2048×2048的DX9 SM2.0硬件的要求,DX9 SM3.0的GPU也有些勉为其难。只有新一代支持最大纹理尺寸为8192×8192的DX10硬件,才能比较好的以最高设置来跑这个DEMO。实际上,DiRT这个DEMO并不是特例。随着时间的推移,那些老旧的游戏终究会慢慢淘汰,而真正适合新一代硬件发挥的舞台正在慢慢新城。那么,新一代的GF8中端家族,在这些最新适合它们的环境的考验下,能够背负大家的期望吗?为了得到答案,我们特意挑选了最近发布的2个热门DX10游戏的试玩DEMO——刚刚推出DX10画质强化补丁的英雄连(Company of Heroes)和正宗DX10游戏失落星球(Lost Planet)来对新一代DX10主流图形芯片进行测试。
在开始测试之前,了解一下新一代主流DX10硬件的规格和架构是非常有必要的。
用红线标出的就是G84的渲染架构
从核心代号就能够看出,G84/G86继承了高端G80的血统,属于NV的主流DX10产品线。简单的说,新的GeForce 8600/8500芯片使用了GeForce 8800的设计,拥有全新的统一渲染单元(Unified Shader), 同样能够支持DX10。但针对多功能性、价格和主流消费者的需要作了一些改动。G84/G86由新的TSMC 80nm工艺制造,拥有较高的核心频率,渲染单元上相对高端的G80做了精简。这减少了耗电量和生产成本,但同时也削弱了GPU的性能。
我们已经知道,G80具有128个1D scalar流处理单元 ,每16个一组构成一个TPC,每个TPC搭配8个浮点纹理过滤单元(Texture Filtering Unit)和4个浮点纹理寻址单元(Texture address Unit)。单元的工作频率为1.35GHz,外围的TF和TA以及L2 Cache以低于一半的速度(575MHz)工作。所有这些单元配合设计合理的Cache和管理仲裁架构结合在一起就成为一个强力渲染引擎。不过,到了G84身上,负责主要算术运算功能的流处理单元被削减为32个,与之搭配的TFU和TAU分别为16个和8个,都只有G80的1/4。它们一共被分成2个TCP,工作在1.45GHz。面向最低端和OEM市场的G86在这个基础上将所有的资源再度减半,也就是说它只有G80的1/8,SP/TF/TA/ROP分别是16、8、4、8个。不过G86依然保持了128bit的显存位宽。
让我们感到欣慰的是,与运算单元方面的缩水不同,G84和G86都完全继承了G8X在流水线管理和运算单元效率方面的优秀基因。GeFoecr 8家族最重要的4个特性:基于多执行诸体系(Multi-Threading)控制的统一渲染单元(Unified Shader)、标量化ALU、大规模的片内缓存(Shared Memory)、双倍速动态逻辑电路(也就是Shader相对于核心频率加倍),一个都没有少。G84和G86是按G80等比例缩水而已,功能并没有减少。这样它们等于也都继承了G8X高效出色的架构设计。
G84 G86的TCP结构与G80是一样的
G84/86最大的特色还是在中低端GPU上提供了对DX10的支持。也许有人会指出它们本身的处理能力限制将导致它们难以运行那些要求极高的DX10游戏,但必须明白DX10带来的不只是特效的升级。DX10引入的很多新特性都将为游戏推波助澜。比如更多的临时寄存器(Temp Register)能让程序员使用更长更复杂的shader的时候减少性能损失;DX10丰富的浮点纹理格式支持,使HDR效果能更加广泛的被使用;更加灵活、可编程度更高的流水线让在DX9时代受到限制的各种shader都能顺利运行。即使是DX9游戏,也会因为DX10硬件更加丰富的辅助资源而受益。而G8X系列本身的新特性也对性能提升有所帮助。如硬件化的通用渲染架构平衡了流水线中不同指令的分布,全新的1D scalar流处理单元能减少指令之间的依存性,提高指令的执行效率。更强的分支新性能让通用计算受益,等等。一个典型的例子就是,理论浮点运算能力相近的G80和R580图形芯片,在执行一些新游戏,如彩虹6号拉斯维加斯,上古卷轴4等游戏时产生了巨大差别。
DX10提供更多的通用寄存器能显著提高流水线效率
不过,DX10的引入也为主流芯片带来了一些麻烦。微软在DX10重新定义了很多标准,比如新的几何着色器(Geometry shader),硬件化的RGBE浮点纹理格式,每个shader支持最多4096个Temp Register,渲染流水线能支持8MRT的多重渲染目标(Multiple Render Targets),等等。这些都会挤占不少晶体管。另外,DX10所要求的通用化的着色单元虽然本身不会增加多少晶体管,但传统流水线模式因此改变而带来的调度控制体系的改变却要吃掉很大一部分晶体管资源。这意味着,对于成本受到限制的产品来说,工艺制程进步所带来的好处将会被DX10 API的改变所抵消一部分。说白了,就是性能/晶体管比下降。为了支持DX10并保持较高的性能,G84塞进了大约2.9亿个晶体管,G86也大概有2亿个晶体管,这已经接近了上一代高端产品的规模。
|