CPU 频道

8大全新项目曝光 Intel8核心平台测试

    【IT168评测中心】随着7月底Intel四核心CPU的降价以及FSB 1333MHz规格的E6X50、Q6X50系列CPU的上市,Intel原有优异或高端产品价位突然低的惊人。Q6600,四核心CPU竟然也只要2600元。与此同时,Intel面向个人的优异平台也再度升级,不但将四核心QX6800升级至FSB 1333的QX6850(333MHzX9),而且将服务器平台的双路优异产品面向个人用户出售,八核心的Intel PC应运而生。

    虽然对于一般人来说,这个8核心的平台是消费不起的,尤其是在中国市场。但优异平台从来都是为少数人准备的,至少它可以让我们看到许多多核心CPU应用的新方向。而在国外市场,Intel将这套8核心平台装进了Coolermaster 雷神塔里,魅力绝非一般!

    另一方面,Intel再次表现出近年来他们少有的谨慎。前不久AMD关于Phenom等8核心平台的消息频频放出,算上去年AMD 4X4平台的闹剧,Intel终于忍不住,向大家展示一下8核心的魅力。也许大家要问,8核心魅力何在?还有很多人抱怨双核的效率都不够,8核怎么用呢?

    说到这套八核心平台,Intel将其命名为Intel V8平台,有借汽车发动机V8的威猛之意。但从技术来看,这是将服务器平台面向个人销售的一个市场策略转变的产物。不过大家千万不要误会,是不是将落后过时的服务器平台给个人用呢?完全不是。两颗Xeon5365 CPU组成双路八核心系统以及Intel 5000X芯片组,搭配4GB FBDIMM,仍具有较高的规格。除了内存子系统和磁盘子系统服务器过瘾外,CPU代表了双路产品的最高水准。

    我们看到,CPU-Z信息对于这款CPU的命名仍有一点小问题,但是技术规格基本是正确的。从单颗CPU看,这与Intel Core2 Quad系列的Extreme Q6850规格一致,只不过QX6850的步进已经来到了G0,功耗更低。

    另一方面,Intel 5000X芯片组目前在内存方面仍要求FBDIMM的支援,这其实对于个人用户来说并不是什么好消息和优点。FBDIMM诞生初衷简单来说,是为了解决每通道容量限制,并解决由于通道、容量、带宽和稳定性带来的服务器平台的综合问题(具体文章参考《FB-DIMM内存性能初探》)。

4GB FBDIMM

    有趣的是,Intel在今年的规划中也包括在服务器平台使用DDR2内存(或者DDR3?),这样似乎对于个人用户来说,在性能表现上更有意义。

    就如两年前,甚至一年前酷睿刚刚问世时一样,为了体现双核心的优势我们不得不为他们量身定做全新的测试项目。一方面因为这些测试项目使用的软件是对先进技术优化较为积极,所以它们可以体现出多核心CPU的优势;另一方面,这些软件基本可以代表某个特定领域的应用,对于用户来说也可以选用它们,而不是选用那些不支持多核心应用的软件产品。当然,有人也打趣地说,这是“作弊”!

硬件平台
CPU Intel Core2 Quad Extreme Q6850
Intel Xeon 5365 X2
主板 Intel 5000XVP
ASUS P5K Deluxe
显卡 NVIDIA Quadro FX3500(G71:460/1200)
NVIDIA GeForce8800GTX
内存 FBDIMM 1GBX4 @ 667MHz
Corsair DDR2 1066 1GBX2 @1066MHz 4-4-4-12
硬盘 Seagate 7200.10 320GB
电源 Coolermaster 850W
软件环境
操作系统 Windows Vista 64bit
WindowsXP SP2
驱动程序 Intel Chipset Software Installation Utility 8.3.1.1013
NVIDIA Forceware 158.24WHQL For Vista64
Quadro:Forceware 91.85 For XP/160.02 For Vista
测试软件 3DMark06 V110
PCMark05 V120
LostPlanet DX10 Demo(Game)
Everest 2007 Benchmark
SisoftSandra2007
Sonar 6.2(Audio)
Divx6.6.1 Encoder(Video)
3D渲染测试 Cinebench 9.5 64bit
POV 3.7
3DsMax8

    本次测试除了包括传统Benchmark类测试,如3DMark06、PCMark05和SisoftSandra外,有很多我们新加入的测试项目。按应用类型我们可以分为5类。如,游戏:Lostplanet,这是一款全新的DirectX10游戏;办公应用:Excel2007,本测试的测试脚本非常具有代表性;音频,Sonar6.2:改名很久但是仍没有原名Cakewalk出名的音频全能处理软件,测试脚本也非常庞大;视频,DivX6.6.1:不要看它还是DivX,新版本对于多核心支持完全不同!3D渲染:Cinebench和POV都是常用的渲染测试软件,而3DSMax8,我们使用了专门测试脚本,测试项目多达48项。

    在3D渲染测试中,Cinebench和POV的脚本仍是以测试CPU为主,所以没有选用Quadro显卡。而3DSMax8的测试,我们不得不选用了Quadro FX3500,因为对于这样的测试来说,GeForce8800GTX很可能要比它慢3倍。

    当然,除了上面的项目,我们还进行了包括Sysmark2004、和SpecViewpref 10.0等测试,测试中发现了一些问题,我们在最后会谈到。

    从Sisoft的CPU整数、浮点性能以及多媒体指令集下的浮点性能来看(注SSE4是Sisoft的叫法,其实是SSSE3),两颗CPU性能优势明显。在缓存的测试中,由于两颗CPU和它们分别独立享用的FSB通道导致优势非常明显。只是单颗Xeon5365似乎在16M Blocks的性能下降趋势要明显大于QX6850,估计是由于内存带宽差别太大导致。

    在传统Futuremark测试中,虽然这两个版本的测试在双核心、四核心得分都要明显比单核心产品高出许多,但显然测试软件设计没有想到会有8个核心的CPU加入。无论从测试成绩还是我们监控CPU占用情况以及功耗来看,它们对8核心应用负荷很小,所以四核心的QX6850依靠内存子系统的优势取得小小胜利。

    说到Excel,大家应该经常使用,而我们的测试数据也需要通过它来实现图表的表现。在我们前不久的电池测试当中,由于放电时间多达数十个小时,采样数据点数按每10秒采样,也是量大的惊人。在制作该曲线时,我们已经发现Excel此时对系统资源的惊人要求。此次测试的两个脚本,其实就是普通的Excel文件,只不过里面数据大的惊人。其中一个达到30万行9列。测试主要是对指定公式进行复杂运算,测试图表中数据为运算所耗时间,数据越小越好。

点击放大察看30万行数据
千余行数据计算

    我们看到,8核心平台优势明显,相对单颗Xeon5365来说,提速近1倍。不过QX6850构成的优异平台似乎落后幅度并不大。

 

    Cienbench9.5和POV3.7这两款以3D渲染为脚本的测试软件并不难得到,读者朋友们有兴趣可以下载到共享版本。两者测试主要为多核心多线程而生,测试非常直观,我们可以看到在打开多核心测试后,渲染会按照不同多个区域或多个块,分配给对应的多个线程来工作,但实际效果如何?

   图表中测试成绩1代表单颗Xeon5365单核心工作时的成绩,其他数字代表单核心渲染速度的倍数。由于二级缓存、FSB和多核心架构组成原因,我们发现POV测试中,8核心表现较好。而Cinebench9.5就很一般了。

    为了测试专业渲染,我们请到了NVIDIA Quadro FX3500显卡,在这部分测试我们发现了不少问题。首先,在著名的Specviewpref10.0测试中,大多数测试对多核心CPU无法利用。而简单的同一工作双线程、四线程(即相同的渲染,打开4个同样窗口同时进行),显卡又会形成瓶颈。估计在Quadro FX5600下,四线程渲染也同样会是8核心平台的瓶颈所在。

    最后我们选用了在3DSMax8下的测试,测试共有48个子项,据我们统计其中36个子项目对8核心平台没有优化,QX6850的成绩会更好。大概有25个项目,QX6850领先幅度明显。我们抽出了5个项目,是8核心平台领先部分。从测试内容看,这主要与Cinebench和POV的渲染相似,可见在复杂的光线追踪渲染中(反射、漫反射、多层漫反射),CPU工作很重要。而包括骨骼运动、复杂材质贴图并不需要8核心如此强大的CPU系统支持。

    对于音频制作来说,Sonar、Cubase等软件并不陌生。由于一般的音乐都会有不同的声音、乐器、声部组成,所以几十条音轨是家常便饭。而在输出时,输出成常规的44.1KHz\16bit甚至更高规格的Wave格式更是不可避免。此时,先不论算法运算量问题,仅仅数据流量就非常大。

    测试中我们使用一个具有80条音轨的Sonar制作脚本,进行导出时间的测试。导出格式为常规Wave 44.1KHz、16bit和24bit两种,以及VBR 320KBps,最高质量Lame编码器 MP3的输出。

    我们看到,8核心平台输出优势仍是非常明显的。而QX6850对于如此大数据量处理时也体现不出内存子系统的优势。另外,我们推测此测试普通的磁盘子系统可能会是8核心CPU平台的瓶颈。

    在视频压缩中,我们使用了DivX编码格式,对一个1080i的MPG文件进行压缩。DiVX我们测试时最新版本为6.6.2(内置Codec版本为6.6.1)。虽然从6系版本开始,DivX便可以支持多线程工作,而且我们在一年前使用6.2版本的DivX进行双核心测试效果也非常好,但是在8核心测试中,DivX6.6.1的Encoder比原有版本明显改善。CPU占用率可以普遍达到60%以上,而原有版本很可能无法起用所有8个核心。

    如上图,我们指定了输出码率为恒定7800kbps,画质最高,并启用SSE2指令。

    从测试情况看,在4核心(单颗CPU)工作时,CPU占用率会保持在65%以上,而8核心时则大多在60%左右。所以测试成绩来看,8核心平台并没有成倍提升幅度。其实类似的软件还有很多,在编码过程中他们虽然对多线程支持,但是也许是策略原因,一般不会去占满所有的资源。

   

    Everest Ultimate 2007这个测试软件常被大家用来测试内存,但是其中内置的Benchmark脚本更加出色,它可以充分调动CPU满负荷工作。其中大部分更加偏重数学测试。

    例如,Queen一项,是指著名的“n皇后”问题。皇后,是说国际象棋中的皇后棋,它可以斜线直线吃掉其他棋子,n皇后问题便是说在nXn规格的棋盘上,如何摆放皇后让互相不被吃掉,且n最小。而此测试为n=10时的运算。

    Photoworxxx,是对图片进行填充、旋转、切割等操作的一项测试,我们看到该测试内存子系统要求很高,8核心平台绝不是QX6850的对手。

    Zlib是Zlib公司的一种压缩文件算法,Everest没有具体说明如何压缩怎样规格的文件,测试可以看到8核心平台在压缩Zlib时优势明显。

    Julia与Mandel(Mandelbrot缩写,分形几何由此人提出,Julia集合是Mandelbrot集合子集)是指分形几何运算测试。分形几何是非常有趣的数学,分形大概是说在不规则中存在规则。例如,通过Z <- Z^2 + C在复平面进行迭代运算,生成的图形是不规则的,但是从运算来看显然是有规律的(如下图)。

    这三项测试对CPU消耗极大,后面的功耗测试大家也会看到在此测试中平台功耗达到了最大值。我们从此也可以看出,当CPU被充分利用时,8核心平台优势明显。

  

    LostPlanet游戏已经发布了两个月的时间,该游戏的Demo中有两个测试场景,其中第二个测试场景对CPU要求很高,我们在以往的测试中进行过对比。不过我们也发现,即便是8800GTX级别的显卡,在720P以上分辨率下,都有可能在此项测试中对4核心QX6850平台形成瓶颈。

    从测试情况看,虽然两颗Xeon 5365要比一颗强了不少(主要对比Cave场景),但是QX6850平台的成绩要比8核心的还好。需要说明的是,我们测试中已经将所有细节关闭,分辨率在640X480,但显卡瓶颈仍明显,且这样的设置其实实际意义很小。所以,如果在可玩分辨率下进行测试,那么要发挥8核心甚至4核心CPU的威力,显卡的性能至少提高3倍以上。

    在功耗测试中,我们选用了待机、3DMark06运行以及Everest Julia几何运算的功耗来进行对比。除了3DMark06中显卡处于高负荷(不是满负荷)运算外,Julia分形几何运算中显卡是出于最低功耗状态的,但是我们发现功耗已经达到了540W。

    我们看到,QX6850平台功耗远低于Intel V8平台。而由于我们测试功耗测量的是电源前端输出值,这样我们的读数是包括了电源损耗在内的。一般情况下,开关电源在此负荷下输出效率大概在75%左右,这样Intel V8平台在无3D运算情况下,功耗在400W出头。有趣的是,我们曾经使用台达650W电源对该平台供电,由于功耗接近满载,开关电源效率大大降低,功耗读数已经达到了惊人的597W。显然,这个平台是需要一个非常好的电源的。

总结

     Intel V8平台的来意,大家各有理解,当然向竞争对手示威的作用是最为重要的。在45nm Penryn到来之前,FSB1333的攻势以及双路8核心平台的推出让Intel在中高端至优异平台,毫无敌手。AMD1年前的优异产品,现在正在以千元的价格攻占主流市场,AMD的压力不可谓不大。

    从技术和应用来看,除传统测试的项目外,DivX6.2.1、Sonar6.2、Excel、Julia分形几何计算、3DSMax渲染、POV、Cinebench渲染以及DX10游戏等8个项目3大类应用测试结果表明。Intel V8平台更适用于数学运算、光线渲染类运算,尤其是在数学运算中性能优秀。在音频视频压缩中,有较好表现,大提高比例不大。而在游戏、普通办公(如Sysmark)中几乎没有作为。

    如果Intel愿意坚持推广双路系统给个人用户的话,Intel V8平台有很多地方值得改进。DDR2内存的起用将会是一大突破,不但成本较FBDIMM下降,性能在个人应用项目中也会大幅提升。另外,近日有消息称,NVIDIA和Intel已经达成协议,在5000系列芯片组上可以使用Quadro FX4600、5600显卡构成SLI系统。这对于V8平台同样是一个好消息,因为在图形相关的测试中,GPU显然已经是明显瓶颈。

    另一方面,如果Intel真有心推广双路系统,那么我们也希望有较低频率的四核心CPU可以加入其中,我们知道在服务器CPU市场,Intel已经早早的将四核心价格与双核拉平。向V8这样的优异平台也许会离我们越来越近。

0
相关文章