要知道,当今的CPU主频、系统前端总线和内存性能都已经远远超越了硬盘的数据传输率,很多游戏、应用程序一旦用完了物理内存,不得不借助硬盘作虚拟内存的时候,就会明显慢下来。如果配置只注意热门概念和新技术,而忽略了磁盘性能,那么这点很有可能成为系统最大的瓶颈。
也许有不少人认为,提高磁盘性能主要就是选高指标的串口硬盘。其实要充分发挥系统的磁盘性能,需要主板芯片组、硬盘乃至操作系统共同协作,真要获得高性能,需要掌握相关的使用经验以及投入一定的资金,尤其是当你资金预算比较充裕的时候,更应该将提升系统的磁盘性能作为重点考虑。
一、硬件篇
1.芯片组
众所周知,除了硬盘本身外,一台机器的磁盘性能,很大程度是由主板芯片组决定的。在不组建磁盘阵列的情况下,一般Intel芯片组的磁盘性能比较突出;而在AMD平台方面,SiS在磁盘性能上也总能给人惊喜,VIA则显得比较中规中矩。硬盘和芯片组的性能指标,大家可以看《电脑报》的相关评测,此处就不一一列举了。WwW.iTCOmPuteR.cOm.CN
2.组建RAID 0提高磁盘性能
目前的硬盘主要是受到内部传输率和电机固定速率的限制,无论接口标准速度有多快,单个硬盘内部传送数据实际都只有每秒30MB~70MB的速度──这就是所谓的“瓶颈”。既然普通情况下单个硬盘性能提高有限,在新一代万转硬盘普及之前,笔者的个人意见是,最好选用附带RAID功能的主板,组建RAID 0磁盘阵列,借助RAID的功能提升硬盘读写效率。因为磁盘阵列是采用数据分段的,就是将数据写到多个硬盘,同时利用2~N个硬盘的马达工作,效率肯定比单个硬盘明显提高。
IDE硬盘经过好几代的改进,现在磁盘阵列性能已经不再只是摆设了,如图1就是2块腾龙IDE硬盘阵列性能的测试。SATA硬盘的出现,又让民用级别的磁盘阵列性能有了一定提高。如图2、3、4,SATA磁盘阵列的性能对比单个硬盘,还是相当突出的,尤其是读数据的产品速度,超出一大截。当然你要注意具体的产品型号,有些硬盘组合在一起当阵列是没什么效能提高的,是设计上的BUG,像酷鱼4的IDE硬盘刚出来就有这种问题,几个组成RAID 0的效果和单个硬盘性能差不多。硬盘的相关信息和指标,网上很容易查到。
图1 两块IBM腾龙IDE硬盘阵列性能
图2 Maxtor金钻7代80GB硬盘的平均读取传输率可达到35.9MB/s
图3 Maxtor金钻9代120GB硬盘的平均读取传输率可达到47.8MB/s
图4 两块日立7K250 80GB SATA硬盘组成RAID 0后,平均读取传输率为98.9MB/s
现在比较典型的支持RAID阵列功能的主板,有Intel系列芯片组中采用ICH5R(82801ER)的产品,像i865PE、i875P等;AMD平台上的采用VT8237南桥的产品,如KT600、KT800。当然,也有在主板上集成第三方芯片支持RAID功能的,这在早期主板中比较常见,如PROMISE的PDC20378芯片。这些产品的技术已经比较成熟,都支持串行硬盘,价格也不算很贵。当然你选购主板的时候,要注意看技术参数,到底是不是支持阵列功能的,因为IT产品分类很细,即使同一芯片组、同一厂家,也会分不同功能和档次。
3.RAID 0方案性价比分析
我们可以算一笔小账:一个800MHz FSB的主流P4始终保持在1500元左右,AMD的 333MHz FSB CPU则是700~1000元之间,购买了以后,还要考虑配套的内存性能──稳定的双通道支持,名牌DDR400价格都不菲,如果不搭配双通道的高速内存,CPU性能又显得浪费了。其实对多数人来说,大部分软件真正用到这些产品峰值指标性能的时候不多,常规应用都在等硬盘读写数据,速度就在那里慢下来了。在同等预算下,如果不是需要处理视频编码等对CPU要求很高的应用,有时可以考虑把CPU和内存档次放低一格,能节省200多元,加上现在主板趋势是低价不低质,不必非选择千元的时髦配置,用600~700元的成熟产品,两项相加省下的钱基本足够多买一个硬盘组成RAID 0了。提高了磁盘性能后,很多频繁读盘的应用速度会高一个档次。这样的配置,往往会比千兆网卡等暂时还发挥不出优势的噱头实用很多。
当然,也不能因此否定CPU等关键配件的作用,本来DIY机器就要根据不同的用途灵活变化,这里只是提供一个参考的思路。另外,RAID 0的数据安全也弱一点,但现在刻录机已经普及了,要备份数据并不难,所以说组建IDE或SATA阵列还是值得一试的。至于RAID 0+1、RAID1等模式,一般需要3个硬盘以上才能组建,性价比不突出,这里就不推荐了。另外Intel最新的i915/925芯片组上的Matrix RAID模式,可以只使用两块硬盘就能建立出RAID 0+1的环境,有兴趣的朋友可以看看相关资料。
软硬兼施提高磁盘性能(下) 二、软件篇1.系统、驱动和软RAID
直到今天,依然有不少人说WinXP花哨、浪费资源,死抱着Win98不放。其实根据测试,Win2000和WinXP的磁盘性能比Win98明显要高出一截的。如果不是为了兼容老程序非用Win98,建议还是升级操作系统为好。笔者相信最近两年装的机器,不会有哪台跑不动WinXP的。
驱动对磁盘功能的影响也是相当明显的。像Intel著名的IAA驱动,还有VIA的4in1驱动,安装与否都能看出磁盘性能的差异来。驱动版本不同,效果也不一样,这方面的内容,有不少文章都说过很多次了,此处不再重复。
另外,如果Win2000和WinXP的用户,有几块不同的硬盘,又不愿意购买RAID卡,可尝试组建软RAID,性能也有一定的提高(图1、2)。软 RAID 通过核心磁盘(块设备)代码来执行不同的RAID级别,主要依赖CPU的性能。如果你的CPU很强劲,软RAID的磁盘性能有时甚至能超越比较老的RAID硬件控制芯片。
2.分区和虚拟内存设置的影响
硬盘是机械设备,硬盘转速是定死的,没法“超频”,所以有效对硬盘优化的工具软件不多──目前只有磁头上能做点文章,如果能减少磁头移动的次数,将会有效地提高系统磁盘性能。另一方面,用户平时安装删除软件多了,磁盘碎片难免增多,特别是虚拟内存交换文件──这是系统读写频率最高的文件之一,它也混在碎片中。目前3.5英寸IDE硬盘平均寻道时间大概要9毫秒,你算算9毫秒CPU、内存、显卡能完成多少事情了?磁头要跳好几次才能读完一个文件,能不成为瓶颈么。
现在的硬盘,在采用LBA模式后,各磁道扇区数量不相等,外圈磁道比内圈磁道长很多,扇区比内圈多很多;而硬盘主轴旋转速度是恒定的,在磁盘外圈,磁头相对磁盘的线速度大,磁盘转一圈,磁头经过的扇区比在内圈经过的扇区多,差不多要多上一倍,这样算起来,外圈读写的速度差不多快上一倍。在分区上来讲,对应的就是最靠前的C、D两个分区,你需要同时兼顾系统文件的读取和虚拟内存的运行──当你把虚拟内存放在C盘上,本身可以得到更快的读写速度,但和Windows在同一个分区,会产生比较多的文件碎片;而如果你放在C盘以外的专用分区,就会由于离开了磁盘外圈导致读写性能下降。这里需要你根据自己常用的程序和操作习惯来取舍了:如果你的工作是3D作图一类的应用,需要很大的页面文件,还是放独立分区好;如果只是日常应用,那么设在C盘读写效果比较好,没有一概而论的优化模式。
3.有关碎片整理和镜像的提示
①对碎片做到防患于未然
电脑使用时间一长,磁盘上难免存在碎片,甚至是逻辑错误(交叉链、丢失簇等),会造成磁盘读写环境的恶化。很多人使用磁盘整理工具的时候,会追求整理的速度,不过通常磁盘整理速度跟效果是相反的,也要受到驱动器速度的限制。第三方的磁盘整理工具像VoptXP速度很快,但只是简单地把文件摆放一下,实际上并没进行多大的整理优化。
在WindowsNT内核的操作系统里,如果真要达到优化文件结构的效果,最好还是使用微软自家的工具──MS的BOOTVIS,和Windows里的DEFRAG配合,把文件顺序排好,然后用诺顿的SPEEDISK(如果你没另外设独立页面文件交换分区的话),它可把虚拟内存交换文件存放到C盘前面部分,那是速度最快的位置,把临时文件TEMP放到分区末尾。也就是按BOOTVIS→DEFRAG→SPEEDISK的顺序整理,能够获得很好的效果。
当然,按这种方式第一次整理,时间会很长,但折腾一次后基本上半年都不会受碎片问题困扰。这是因为微软的BOOTVIS会仔细分析文件怎么存放,去掉哪些不必要的步骤,让电脑引导最快;而DEFRAG会按照平时你用软件的习惯和BOOTVIS的指引,把文件顺序排一排再整理,诺顿的SPEEDISK会自动把虚拟内存交换文件放到读写速度最快的位置,把临时文件等目录下的文件都扔到分区尾部,最大程度优化了读取结构,同时有效推迟了新的碎片产生。
②可以尝试用镜像功能代替磁盘整理
Windows运行的速度,基本就是看所在分区的状态,而大家一般都是把系统装在C盘的。如果你像笔者一样,养成重要数据不放在C盘的习惯,系统分区里只有一个光光的Windows,那么利用像GHOST一类磁盘镜像工具整理碎片是最快捷的方式。以现在机器的速度,一般3分钟内就能恢复一个4GB~5GB的分区,里面的文件会排列得整整齐齐,一个月做一次GHOST的话,基本不需要专门再抽时间整理磁盘,顺带连潜在木马和病毒都清理了。当然,装MP3、电影数据的分区就不能那么弄了。其实那些装大个媒体文件的分区即使不整理,关系也不大。
三、小结
1.平衡性不可忽略
提高了系统的磁盘性能以后,所有的应用程序都会从中受益,尤其是读取大量数据的时候。比如DVD刻录,时间也会缩短──以16倍速刻录,磁盘性能不同的配置有时差异可能达到1分钟左右,当然这跟CPU也有一定关系。不能因为说要提高磁盘性能,就忽略了配置的平衡性。
2.硬盘采购有窍门
普通的观念,一般认为应该同时注重单碟容量和缓存两个指标。不过根据测试,单碟容量大的硬盘拥有最快的平均写入速度,但反而在寻道时间上花费的时间更长;在小数据块操作时,配备大缓存的硬盘拥有无可争议的优势,但随着数据块的增大,硬盘密度大的产品后来居上。
另外有一点很多人容易忽略,就是很多人追求性能指标,把硬盘容量放在次要的位置考虑。其实如果你善于利用,容量大的硬盘,也可以发挥出很多优势来。例如你可把常用的软件如Office系列、大型游戏等做成虚拟光驱,放在硬盘上随时调用。一来不用找光盘浪费时间,二来硬盘读取数据的速度怎么都是比光驱快的。这种方案比小容量高指标硬盘的方案有更大的优势。
3.注意阵列的协调性
组建硬件上的磁盘阵列,最好选用同型号同容量的硬盘,不然芯片会自动按最低速、容量最小的硬盘组建,这样高指标的硬盘就浪费了。另外,组建阵列会清空原有单个硬盘里的数据,各位朋友应当事先策划好,怎么分区、怎么备份和拷贝,以免造成数据的损失。
游戏软硬优化全攻略炎炎夏日,忙碌了一学期,莘莘学子放下包袱,痛快地玩吧。暑期里的游戏节目真多,可是我们的电脑能玩《实况足球7》、《极品飞车》、《魔兽争霸3》、《天堂2》……这些好玩但硬件性能要求高的游戏吗?不过这对于我们DIYer来说,并不是什么难题。我们最擅长的就是对于硬件的优化,在现有的平台上,玩最新最酷的游戏!
既能动手学硬件知识,又能玩游戏,还等什么呢,跟我们一起来体验激情夏日吧。
我们的优化对象──主流硬件平台介绍
这里的优化就是发掘硬件潜力来使游戏在保证画质的前提下,让运行速度得到最大提升!在介绍游戏软硬件的优化全攻略之前,首先要说说我们这次主要针对哪些硬件平台进行优化。那些使用Pentium 4 3GHz以上CPU,使用GeForce FX5950、Radeon9800XT的高端平台可以将游戏各项设置都设为最高,尽可以打开抗锯齿和各向异性过滤;而那些使用1.2GHz以下的CPU,使用主板集成显卡和GeForce2 MX的低端平台也不是我们这次重点照顾的对象,因为巧妇难为无米之炊。这些低端平台要想玩好当前新游戏的关键问题是升级硬件平台。
我们这次主要针对的对象是:2GHz左右的CPU(AMD平台包括Athlon XP1700+至2500+;Intel平台包括赛扬2GHz至P4 2.4C GHz),显卡在千元级以下的中端硬件平台,这个档次的电脑基本上可以应付最新的游戏,但有时又会有吃力的感觉,也许一个新游戏可以正常运行在30帧/秒,优化后可以达到40帧/秒,甚至更高。所以中端硬件平台正是硬件和软件优化最能发挥作用的领域。其实话又说回来,对低、中、高平台来说很多优化方法都是通用的,低端平台和高端平台的优化也都是必要的,只不过效果和所起的作用没有中端平台那么明显罢了。所以我们这次的优化之旅以主流中端硬件平台为主,兼顾低端平台和高端硬件平台。后面的游戏优化测试也是在中端硬件平台上进行。
虽然这次的文章不是选购指南,但考虑到低端平台的升级需要,尤其是玩家显卡的采购和更新需要,我们仍要对中低端平台的CPU和显卡做一个简单的点评。
由于两大CPU厂商不同的商业策略,造成了产品性价比的不同。如果目前组建一套中档游戏平台,AMD的Athlon XP 2500+的盒装售价在620元左右,与之游戏性能相当的Intel P4 2.4C GHz售价在1300元上下。两者都有一定的超频能力,分别是AMD和Intel平台的中端主力,但相比之下Athlon XP 2500+的性价比要更好一些。此外市场上还有一款新出的采用Prescott核心的Celeron D,性能也不错,已经逼近相同标称频率的Athlon XP,是Intel爱好者的好选择,只是上市初期价格有些高,盒装2.53GHz大约为730元。
2.显卡
显卡在某种程度上可以说是一分价钱一分货,所以这里我们拿价格来划分档次。在1300元以下NVIDIA和ATi的产品是捉对厮杀。我们这里简单介绍一下市面上可以买到的1300元以下的中低端显卡。
①NVIDIA 显卡
GeForce FX 5200,这是NVIDIA的入门级DirectX 9(简称DX9)显卡,核心频率250MHz,显存工作频率为400MHz。它的显存位宽就有128位和64位两种规格,购买时需要注意。还有一种GeForce FX 5200 Ultra,本来只在GeForce FX发布初期销售过一定数量,后来就因为成本问题销声匿迹了。但近来国内不少显卡厂商拿到了一批库存芯片后,又开始销售这个产品,它的核心/显存频率是325/550MHz,在低端中是相当强悍的。至于NVIDIA新推出的GeForce FX 5500,别看产品名称上了一个台阶,但实际核心和GeForce FX 5200是一样的,都基于NV34核心,只不过核心频率高了20MHz而已。虽然GeForce FX 5200和5500理论上可以支持DX9的所有特效,但因为它毕竟是低端显卡,设定频率低,核心设计也经过大大简化,所以在应付DX9游戏时就会比较吃力。
GeForce FX 5700系列,这是NVIDIA力推的中端产品,它支持DX9,支持CineFX2.0的全部特性。它分为LE、标准、Ultra三个版本。其中Ultra版还具有DDR3显存的产品,它们的核心/显存频率分别是:250MHz/400MHz、425MHz/550MHz、475MHz/900MHz。从频率上我们就可以看出它们的性能和价格差距也必然是巨大的。GeForce FX 5700 Ultra虽然性能最强,但其价格已经超过1300元。在高端DX9游戏中,LE版适当地关闭一些游戏特效来换取流畅的游戏速度还是必要的。而标准版性能已经有了大大提升,在优化的前提下,可以尽可能多的保留游戏特效。至于GeForce FX 5700 Ultra在很多游戏中已经可以将特效全部打开了。
此外还有GeForce FX 5600,虽然市面上仍能见到,但它早已停产多时,而且价格和性能也不比GeForce FX 5700LE占优,所以我们不再推荐。
②ATi显卡
我们再来看看ATi的产品,它的低端主力是Radeon9200系列,包括Radeon9200标准版和Radeon9200SE,核心/显存频率是250MHz/400MHz,其中Radeon9200标准版显存频率是128位,而Radeon9200SE就是64位显存的官方版。Radeon9200还有一个问题是它仅仅支持DX8.1,在DX9游戏大潮来临的今天这就意味有众多精彩特效无法呈现出来。
Radeon9550,这可是眼下显卡市场的当红小生,以其完整的DX9特效支持、不错的性能、适中的价格成为ATi中低端的利器。其核心/显存频率是250MHz/400MHz,虽然看起来频率并不高,但得益于RV350LX的优异DX9设计,游戏性能相当不错。
Radeon9600系列,它分为9600SE、9600标准版、9600PRO和最新的9600XT。9600标准版、9600PRO是同期发布的,采用的核心是RV350,核心/显存频率是:325MHz/400MHz、400MHz/600MHz。9600SE和9600XT采用的是RV360核心,核心/显存频率是:325MHz/400MHz、500MHz/600MHz。其中9600SE又是一款显存位宽是64位的产品,所以虽然它核心频率超过Radeon9550,但实际性能反而不如Radeon9550。RV350和RV360在特性支持上并没有什么大的差别,我们只要观察频率就能判断出几款Radeon9600的性能。不过其中9600XT的价格已经超出了1300元。
Radeon9800SE,这款产品颇有传奇色彩,传说它是和高端的Radeon 9800系列在一个生产线下来的,有很大的成功几率破解成Radeon9800,但后来证明这个破解有很大的商业运作成分在里面。Radeon9800SE早期的核心是R350的,现在的是R360的,核心/显存频率是325 MHz /500 MHz,显存位宽128位。
重点提示:这里要特别说明一下显卡显存位宽问题。
显存位宽(bit)即一个时钟周期传送数据的位数,位数越大,传输效率越高。显存带宽是指GPU与显存之间的数据传输速率,它以字节/秒为单位。
例如:在1024×768×32的显示模式下,进行像素渲染时每一帧需要的数据传输量 = 水平分辨率×垂直分辨率×(基本渲染数据读写+纹理数据读取)=1024×768×(16+32)=38MB。如果帧刷新速度为60帧/秒,则显存带宽需求为38MB×60=2.3 GB/s。而这仅仅是像素渲染所需的带宽,要是使用更高的分辨率、更高的刷新率和打开全屏抗锯齿、各异性向过滤时,带宽的消耗将更惊人!由此可见,只有足够大的显存带宽才能带来更精细(高分辨率)、色彩更逼真(32位真彩)、和更流畅(高刷新速度)的3D画面!
而显存带宽跟显示卡的显存速度和显存架构有关,其计算公式为:显存带宽=显存工作频率×显存位宽/8。因此,在工作频率一定的情况下,显存位宽的大小决定了显存带宽的大小。
目前的主流显卡核心都是128位的,发布时展示的公版显卡显存也都是128位的,但NVIDIA和ATi为了低端芯片的销路,也为了迎合显卡厂商的需求,往往把芯片设计成既可以使用128位显存,也可以使用64位显存。这样到了大量生产时,为了降低生产成本和销售价格,显卡厂商往往会生产128位核心搭载64位显存的“阉割”产品,它的理论显存带宽仅仅是128位显存的一半,性能下降是十分巨大的,而产品价格往往只是降低了几十元,所以从性价比考虑我们不推荐这种产品。
在进入游戏实战优化之前,我们先给大家介绍一些基础的软硬件优化知识以及和显卡有关的背景资料,为我们的实战优化做好准备。
From: