卓越“芯”动力 Intel全新酷睿首发测试-CPU专区

卓越“芯”动力 Intel全新酷睿首发测试

作者：IT168 Kyle 编辑：刘一非 2010-01-05 05:41 来源：IT168�

　　【IT168 CPU频道】三年前的65纳米Core芯片让Intel开始了偶数年更新芯片架构，奇数年更新芯片制程的Tick-Tock运转。在我们熟悉的那些Intel的竞争对手中，除了AMD一直不愿松嘴外，NVIDIA的老板黄仁勋和VIA的老板王雪红都承认了Intel的强大。我想说的是，即便是强大的Intel，几乎是一年一个样的芯片更新对他们来说也不是容易的事，好在三年过去了，从2006年的65纳米Core，到2007年的45纳米Penryn，再到2008年的45纳米Nehalem，Intel都兑现了自己的Tick-Tock承诺。

Intel的Tick-Tock路线图已经画到了22纳米

　　接下来的32纳米Westmere芯片也早已不是什么秘密了，Intel的Tick-Tock路线图甚至已经画到了22纳米。32纳米Westmere芯片的正式发布时间被定在了下个月的7号，中国区的发布仪式则会在8号举行。届时将会是台式版本的Clarkdale和移动版本的Arrandale齐发，型号多达17款。当然，这并不是32纳米Westmere芯片的全部，再晚两个月，包括台式版本Core i7-980X和服务器版本Xeon 5600系列的六核心Gulftown处理器也会发布。

　　我要测试的是台式版本Clarkdale核心的Core i5-6xx和Core i3-5xx处理器，它们都是双核心四线程的，不过Core i5的睿频技术是Core i3不支持的。Intel先期给32纳米Clarkdale芯片规划了七个型号，除了Core i5-661和Pentium G6950的图形芯片频率分别为900MHz和533MHz外，其它五个型号的图形芯片频率都是733MHz。除此之外，Core i5-661和Core i3-5xx以及Pentium G6950都不支持Intel的v-Pro、SIPP、VT-d、TXT技术，而Core i5-661却支持后两者都没有的AES-NI指令集。

以智变应万变 Intel新酷睿CPU首发测试

　　这一轮Tick-Tock过后Intel Core 2 Duo/Quad品牌和LGA775插座已经成为过去式，取而代之的是新的Core i品牌和LGA1366/1156插座。你可以这样区分i7、i5、i3三个系列：八线程+睿频技术的是i7，四线程+睿频技术的是i5，四线程没有睿频技术的就是i3了。值得一提的是，Intel还是舍不得扔掉Pentium这个他们历史上最成功的品牌，不过32纳米Clarkdale核心Pentium G6950处理器的规格就比较寒酸了，不但不支持第三代超线程和睿频技术，内存频率和图形芯片频率也分别缩水至DDR3-1066和533MHz。

友情提示：本文以新酷睿CPU的技术和测试为主，更多产品信息请参阅《32nm+整合显卡 Intel新酷睿CPU全面解禁》

70至80亿美元造32纳米，比AMD市值都高

Intel在美国本土的四座晶圆厂将陆续开始32纳米芯片的生产

　　我在想这篇文章到底是应该从32纳米芯片制程还是CPU+GPU架构说起，不过既然这一轮的更新落在了代表芯片制程的Tick上，那我想就还是从前者开始吧。70亿至80亿美元，这是Intel在美国本土转产32纳米制造工艺要花掉的钱，现在位于俄勒冈州的两座晶圆厂D1D和D1C已经完成了32纳米制造工艺的转产工作，而位于亚利桑那州和新墨西哥州的两座晶圆厂Fab 32和Fab 11X也预计会在2010年下半年完成32纳米制造工艺的转产工作。

研发代号P1268的32纳米制造工艺

　　虽然Intel的Tick-Tock运转是从2006年的65纳米Core芯片才开始的，不过每两年更新芯片制造工艺的周期从1989年开始就一直被Intel保持着，这也就是我们所说的广义上的摩尔定律。Intel在上一轮的Tick更新，也就是代号P1266的45纳米Penryn芯片上首次采用了High-K和Metal Gate材料的晶体管，这也让45纳米Penryn芯片成为Intel历史上从研发到量产周期最短的芯片，其中研发周期则更是只有代号P1264的65纳米芯片的一半而已。

　　代号P1268的32纳米芯片仍然是基于High-K和Metal Gate材料的晶体管设计的，不过其High-K介质层的厚度已经从45纳米的1纳米变薄至0.9纳米（65纳米制造工艺下采用传统二氧化硅材料做到1.2纳米的厚度已经是极限了），Metal Gate介质层的厚度也变薄至30纳米。除此之外，晶体管栅极之间的距离也正在以每两年0.7倍的速度变窄，Intel 32纳米Westmere芯片112.5纳米的晶体管栅极宽度是现在所有相同芯片制造工艺上最窄的了。

NMOS和PMOS晶体管的效能较之45纳米制造工艺时分别提高了14%和22%

　　Intel 32纳米制造工艺更薄的High-K介质层和Metal Gate介质层让NMOS和PMOS晶体管的效能较之45纳米制造工艺时分别提高了14%和22%，漏电流也分别降低了5倍和10倍。Intel 32纳米Westmere芯片的重要金属层仍然采用193纳米浸没式光刻技术，非重要金属层采用193纳米或248纳米干式光刻技术，芯片面积相当于45纳米制造工艺时的70%。处理器本身采用9层铜基板和主要材料是铜的Low-K内部连接线，并采用无铅无卤封装。

　　除此之外，Intel 32纳米制造工艺还应用到了第四代应变硅材料。利用硅锗、双应力应变硅以及应变记忆技术，能够提高晶体管的开关速度和电源效率，这反映在处理器身上就是时钟频率和工作效能的提高。值得一提的是，像是第四代应变硅材料和浸没式光刻技术也已经被AMD用在了他们的45纳米制造工艺上，而像是High-K和Metal Gate材料介质以及Low-K介质的铜连接线，AMD也都有提及，不过暂时还没有用在已经量产的芯片上。

Intel 32纳米制造工艺技术特性

与其说内建显卡，倒不如说内建北桥

Nehalem平台重新划分，图形芯片移入处理器内部

　　虽然说“Intel Clarkdale/Arrandale处理器内建了图形芯片”这句话并没有错，但是有两点Intel也是直言不讳的。一方面是这颗图形芯片并没有采用和处理器芯片一样的32纳米制造工艺，也没有和处理器芯片采用同一颗硅晶片；另一方面则是这颗45纳米的芯片不仅仅包括了图形处理单元的部分，还提供了对内存控制器和PCIe控制器这两大传统北桥功能的支持。因此与其说“Clarkdale/Arrandale处理器内建了图形芯片”，倒不如说是和之前的Lynnfield芯片一样内建了传统北桥芯片的功能。

Clarkdale处理器架构图

　　事实上Intel在32纳米制造工艺下，已经完全可以把CPU和GPU做在一颗芯片上，因为下一轮Tock更新的产物Sandy Bridge芯片就是这样的，而且它还会是32纳米的。对此，Intel现任总裁兼首席执行官Paul Otellini曾公开表示，现在CPU和GPU的研发是分开进行的，这有利于加快Intel新产品的市场化进程，其实Intel在45纳米Havendale芯片的时候就可以交出和现在一样的产品，不过因为32纳米制造工艺成熟度喜人，故直接采用了32纳米CPU+45纳米GPU的方案。

英特尔高清显卡与前一代产品的架构和3D特性比较

英特尔高清显卡与前一代产品的媒体特性比较

　　Clarkdale/Arrandale芯片上的图形处理单元是由G45北桥芯片上内建的GMA X4500HD图形芯片改良而来，硬件上还是一颗采用统一渲染架构的DirectX 10级别GPU，不过渲染单元的数量和流处理器的个数分别从5组/15个增加至6组/18个，缓存的大小也随之有所增加。不过，这颗图形芯片依然只支持单体采样渲染，还是和反锯齿技术无缘。当然，我从来不奢求Intel的整合图形芯片能流畅的运行那些大型3D游戏，因为即便是NVIDIA和ATI的同级别产品也无法做到这一点。

　　Clarkdale/Arrandale芯片上的图形核心并没有一个具体的型号，Intel也只是叫它GMA HD高清图形媒体加速器而已。和你相对更熟悉的NVIDIA PureVideo HD或ATI UVD技术类似，Intel的GMA HD图形芯片也有着名为Clear Video HD的高清解码技术，影像方面可以完全实现MPEG-2、VC-1以及AVC（H.264）三种编码格式的硬件解码，支持高达40Mbps码率的全帧率蓝光影片回放。声效方面则追加Dolby True-HD和DTS-HD的无损源码输出。

　　说到在PC上播放蓝光影片时源码输出无损音轨，那张华硕的Xonar HDAV1.3豪华版声卡应该算是先行者，接着ATI也在Radeon HD 5000系列显卡上实现了这一功能，而Intel则率先在内建图形芯片GMA HD上实现了这一功能。不管怎么说，Intel和ATI的图形芯片都已经实现了无损音轨的源码输出，而NVIDIA则刚刚实现了内建声效单元，并且没有公开表示过可以实现源码输出无损音轨。至少在这点上，NVIDIA的图形芯片被落在了后面。

Clarkdale+H57/H55，最好的HTPC平台？

Clarkdale处理器+H57/H55主板连接示意图

　　32纳米Clarkdale处理器和45纳米Lynnfield处理器一样都是LGA1156插座的，也就是说前者也可以在现有的P55主板上使用。不过比较“杯具”的是，这样做是不能用到Clarkdale处理器内建的GMA HD图形芯片的。众所周知，从LGA1156插座的Lynnfield处理器/P55主板组合开始，Intel用一颗PCH主板芯片取代了传统的MCH/ICH南北桥芯片组，处理器芯片和PCH主板芯片之间采用一条2GB/s带宽的DMI总线连接。不知道是不是为了不给本就不富裕的DMI带宽增添压力，Clarkdale处理器内建的GMA HD图形芯片是用一条新的FDI（Flexible Display Interface）总线和PCH主板芯片连的，而没有这条FDI总线的P55 PCH芯片自然是无法激活内建显卡的。

　　新的H57/H55主板芯片提供了这条FDI总线。32纳米Clarkdale处理器上只是内建了传统北桥芯片上的内存控制器、PCIe控制器以及图形芯片，而图像输出端则还是要H57/H55芯片负责的，它提供了一组模拟输出和两组数字输出的能力，基本上不再需要第三方芯片的补充了。数字输出方面DVI、HDMI以及DisplayPort三者都是原生支持的，并且已经内建了HDCP密钥。不过值得一提的是，和上代G4x主板芯片一样，H57/H55主板芯片提供的数字输出是DisplayPort规格的，也就是说主板若要实现DVI和HDMI的输出，还需要增添一颗电压调节芯片把DisplayPort的规格转化为DVI和HDMI的规格，而这颗电压调节芯片需要主板厂商多付出1个美元左右的成本。

　　没有人会指望着拿内建图形核心去玩大型3D游戏，不过Intel的GMA HD芯片是现在唯一可以实现MPEG-2、VC-1以及AVC（H.264）三种编码格式硬件解码且支持无损音轨源码输出的整合图形引擎，加之32纳米处理器部分的高效能，Clarkdale+H57/H55的组合无疑可以去角逐最好的HTPC平台了。HTPC并不像传统PC只连接显示器那么简单，它需要和电视机、功放机甚至是投影机等多种输出设备相连接，对设备的管理和配置能力较高。

Intel GMA HD图形引擎驱动程序上的电视机向导设置

支持自定义分辨率，调节过扫描等选项

　　除了对GMA HD图形单元的硬件架构进行改良外，Intel也在其驱动程序上下足功夫，外观方面暗蓝色的控制面板界面看上去相当养眼，从左到右的排布方式和NVIDIA/ATI类似。对于HTPC平台来说，新的Intel显示驱动程序增加了电视机向导设置，你可以根据自己的需要自动或手动配置电视机的输出配置，并且支持自定义分辨率，调节过扫描等选项，而像是16-235/0-255灰阶输出控制选项等设置也会随着驱动程序版本的更新陆续加入。

“美国政府批准和支持”的硬件加速技术

新增了六条针对加密和解密运算的指令——AES（Advanced Encryption Standard）

　　上代Nehalem架构在上上代Penryn芯片SSE 4.1指令集的基础上新增了七条SSE 4.2指令，主要对字符和文本处理能力做出强化，而新的32纳米Westmere芯片在这方面也有动作，新增了六条针对加密和解密运算的指令——AES（Advanced Encryption Standard），其运算标准是根据美国联邦信息处理标准（FIPS）第197号文件制定的，是分组密码（Block Cipher）运算最为主流的规范，这意味着Intel AES-NI指令的应用范围会很广。

　　这六条AES指令中包括了四条的加密解密指令（AESENC、AESENCLAST、AESDEC、AESDECLAST）和两条的密钥生成（AESIMC 、 AESKEYGENASSIST）指令，Intel宣称硬件支持AES加速可以比软件快四倍以上。Intel AES-NI指令不但支持三种符合AES官方规范的密钥长度（ASE128 、 ASE192 、 ASE256）和所有符合AES官方规范的运算模式，甚至还可以支持若干种并不在AES官方规范中的算法。除此之外，数据的安全性也可因AES-NI指令而获益。

　　另外，32纳米Westmere芯片还支持一组名为Carryless Multiply（PCLMULQDQ）的指令，它可以让处理器在一个周期内处理两组64-Bit的Carry-less Multiplication，这是很多加密标准所必须要处理到的部分，采用伽罗瓦计数器模式（GCM）。这一模式在2006年4月份得到了美国政府的批准和支持，和AES规范混合使用，是美国国家安全机构（NSA）发布的Suite B加密算法集的子集，也是美国电气和电子工程师协会IEEE 802.1AE的标准。

　　我们可以通过两个测试来看到硬件AES加速的效果。一个是比较理论的Sandra，你可以看到在ASE256这项测试上，支持AES-NI指令的Core i5-6xx处理器可以比不支持该指令的Core i3-5xx处理器快上十几倍；另一个则是比较模拟实际的PCMark Vantage了，硬件AES加速还是可以帮助同样主频的Core i5-6xx处理器比Core i3-5xx处理器快60%以上。商业用户往往用不上四核心甚至是八线程的处理器，而像Core i5-6xx处理器这样的产品，AES-NI加速的确给了他们一个从Core 2 Duo/Quad升级的理由。

我们的测试平台

　　Intel和Core i5-6xx处理器一起送来的H55主板DH55TC 'Tom Cove'用来测试再合适不过了，因为不太可能会有主板比Intel自有品牌的主板还稳定了。不过拿它来超频Clarkdale处理器就肯定是不行了，“寒酸”的供电和散热用料不说，BIOS超频选项上除了高至240MHz的BCLK频率（预设133MHz）外，你就再也找不到和频率或者电压相关的调节选项了，因此对于Core i5-6xx和Core i3-5xx的超频测试，是在一张华硕H57主板上完成。

Intel DH55TC 'Tom Cove'主板

华硕H57主板

相当“尴尬”的内存子系统性能

　　你不得不面对Clarkdale处理器如此“尴尬”的内存子系统性能。Core i7-9xx处理器的内存控制器还是放在北桥芯片里的，Core i7-8xx和Core i5-7xx的内存控制器则是真的被处理器“内建”了，而Clarkdale处理器的内存控制器并不是在CPU芯片里的，而是在那颗45纳米的所谓“图形芯片”里，两颗芯片间还是依靠QPI总线通信。不过从理论上的内存读写测试上来看，这种设计的性能表现并不理想，我希望这个短板只是停留在理论上的。

成功！源码输出无损音轨

勾选红框中的选项是在Corel WinDVD播放器上开启源码输出无损音轨的条件

Corel WinDVD播放器已经可以实现Dolby True-HD源码输出

输出到安桥功放上

输出到天龙功放上

　　源码输出无损音轨的测试也比较有趣。在PC播放蓝光影片方面几乎快被人遗忘的Corel WinDVD反倒是做的最好的，无论是Dolby True-HD和DTS-HD都可以分别在我们使用的天龙和安桥功放上输出，而更为人所熟悉的ArcSoft Total Media Theatre 3则只是可以开启硬件支持。虽然播放器方面已经可以实现直通输出，但是在我们的天龙和安桥功放上却都听不到声音。至于最大牌的Cyberlink Power DVD 9，这个版本暂时还无法工作。

ArcSoft Total Media Theatre 3只是可以开启硬件支持

这个版本的Cyberlink Power DVD 9索性没有支持

软硬解码蓝光影片均不在话下

硬盘读取AVC（H.264）硬件解码（VC-1相同）

蓝光光驱读取AVC（H.264）硬件解码

硬盘读取AVC（H.264）软件解码

硬盘读取VC-1软件解码

　　我们习惯用CPU使用率来衡量图形芯片的蓝光影片解码能力。Intel宣称GMA HD图形芯片可以完全实现MPEG-2、VC-1以及AVC（H.264）三种编码格式的硬件解码，而2%的CPU使用率也足以说明其做到了这一点。在用蓝光光驱直接播放蓝光光盘上的高清电影时，20%左右的CPU使用率也和NVIDIA以及ATI的产品处于同一水准上。至于软解播放，15%左右的CPU使用率是比较理想的，这对于多线程且高频率的Clarkdale来说不算什么。

整合显卡跑大型3D游戏，不是比谁更好，而是比谁更差

　　Intel的GMA HD图形芯片依然只支持单体采样渲染，还是和反锯齿技术无缘，事实上你也没有打开反锯齿技术的机会，因为即便是在1024x768的分辨率和最低的画面质量下，Intel和AMD两家最好的整合平台也不能说运行的十分流畅。不过值得一提的倒是，Intel Core i5-661/H57和AMD Phenom II X4 965/785G这两套整合平台在价格上应该是相仿的，在跑大型3D游戏不能比谁更好只能比谁更差的前提下，Intel的功耗优势相当明显。

整机性能测试

　　Core i5-661/660和Core i5-750定价都是196美元，前者有着高达3.33GHz的预设主频和双核心（四线程），而后者则是四核心的，只是预设主频为相对较低的2.66GH。总的来说，两者的整机性能表现是比较接近的。

影音转码性能测试

　　苹果的iTunes 9基本上是频率说了算的，3.06GHz双核心（四线程）的Core i3-540也不会比四核心的Core i5-750慢多少。视频转码方面则是核心数量说了算的，因此四核Core i5-750虽然只有2.66GHz，但表现最好。

3D渲染性能测试

　　多线程3D渲染基本上也都是核心数量说了算的，因此你可以看到即便Core i5-750的预设主频只有2.66GHz，但是拥有四组物理核心的它总是可以比预设主频高达3.33GHz却只有双核心（四线程）的Core i5-661快些。

办公性能测试

　　办公性能测试说表现出的结果和多线程3D渲染是一样的，相对较高的预设主频并不能弥补Clarkdale处理器核心数量的不足，四核心Core i5-750处理器在更多时候都是最快的，不过不要忘了睿频也可以让它到3.2GHz。

3D游戏性能测试

　　我们所测试的大型3D游戏都是一些代表作，你可以看到它们对于四核心处理器的支持都已经比较好了。值得一提的是在孤岛惊魂2上，超线程技术似乎并没有发挥作用，四核心Core i5-750遥遥领先了双核心的i5-661。

超频性能测试：5GHz开机

Core i5-661可以获得180x26=4.7GHz的频率

Core i3-540可以获得200x23=4.6GHz的频率

　　使用华硕P7H57D-V EVO主板和利民Ultra 120 eXtreme散热器，我们分别尝试着对Core i5-661和Core i3-540进行了轻量级的超频测试。我们让华硕P7H57D-V EVO主板自动给两颗处理器分配电压至1.392V，其中Core i5-661可以获得180x26=4.7GHz的频率，而Core i3-540则可以获得200x23=4.6GHz的频率。对于32纳米Clarkdale来说，拿下4.6GHz左右的主频或200MHz左右的BCLK频率是比较轻松的，再加电压就可上到5GHz。

5GHz开机……

电力消耗测试：比45纳米低30%以上

　　Core i5-661和Core i5-750在空负载状态下的功耗表现是不会有什么差别的，不过到了满负载的时候就不一样了。虽然Clarkdale处理器比Lynnfield还多了一颗芯片，不过此时它的满载功耗比45纳米的后者低了30%多。

结语

Core i5-600系列处理器的定价比较“杯具”

　　虽然Core i5-661/660处理器的国内售价还没有出来，但其196美元的千颗价格和Core i5-750处理器是一样的。Intel也预计前者并不会传出太大的市场声音，毕竟同样的价钱后者的性能要更好些，除非你真的是想在第一时间就体验到或者真的需要GMA HD图形引擎和AES加速技术。类似的情况也发生在Core i5-670处理器身上（国内售价同样未定），在284美元的千颗价格上Core i7-920和Core i7-860都应该是比Core i5-670更好的选择。

　　而Core i3-540/530处理器（国内售价同样未定）到绝对是值得关注的，这应该是Intel第一次把新的芯片制程和架构设计用在100美元左右的主流产品上。在此之前，AMD以牺牲三级缓存为代价把四核心处理器的价格拉到了这个区间上，Intel只能尴尬的用双核心Core 2 Duo E7000系列来应对。而Core i3系列虽然较之Core i5系列拿掉了睿频加速和AES加速技术，不过第三代超线程技术和GMA HD图形引擎还是足够吸引人的，3GHz左右的预设主频也是AMD的三、四核心处理器不容易做到的。

　　既然Core i3-540/530处理器不能通过睿频加速技术获得那266MHz的“免费”频率提升了，那么我们不妨多关注一下它的超频表现。虽然我在超频手上这颗Core i3-540处理器的时候使用了比较好的华硕H57主板和利民Ultra 120 eXtreme散热器，但是拿到200x23=4.6GHz的工作主频还是相当轻松的，除了拉高BCLK频率到200MHz外，我就没有再进行任何BIOS设置了。相信即便你使用的是盒装散热器，至少把一颗Core i3处理器超频到4GHz工作主频还是比较容易的。

MINI-ITX H57主板让Clarkdale处理器有了性能、功耗和体积比较完美的平衡

　　Intel这家依靠庞大处理器出货量坐上图形芯片（整合主板）头把交椅的公司现在可以说，他们的GMA HD图形芯片是全球首款支持MPEG-2、VC-1以及AVC（H.264）三种编码格式硬件解码和Dolby True-HD、DTS-HD无损音轨源码输出的整合产品。如果你想在2010年搭配一台HTPC或超小型PC，那么Clarkdale处理器+H57/H55主板的组合绝对应该是首选，因为无论是性能、功耗还是体积，它已经可以达成一个比较完美的平衡了。

明年年底的32纳米Sandy Bridge芯片则会把CPU和GPU放在一枚die下面

　　我不知道在Clarkdale/Arrandale芯片正式发布后AMD会怎么评价它，因为后者从三年前并购ATI后就一直宣传的CPU+GPU架构让Intel先实现了，而AMD自己的CPU+GPU芯片则被推迟到了2011年。做为Intel的首枚CPU+GPU芯片，Clarkdale/Arrandale是把一枚32纳米的CPU和一枚45纳米的GPU封装在一块基板上的，而明年年底的32纳米Sandy Bridge芯片则会把CPU和GPU放在一枚die下面，那个时侯AMD的CPU+GPU芯片也应该可以有样本出来了。

关注我们