【IT168 CPU频道】三年前的65纳米Core芯片让Intel开始了偶数年更新芯片架构,奇数年更新芯片制程的Tick-Tock运转。在我们熟悉的那些Intel的竞争对手中,除了AMD一直不愿松嘴外,NVIDIA的老板黄仁勋和VIA的老板王雪红都承认了Intel的强大。我想说的是,即便是强大的Intel,几乎是一年一个样的芯片更新对他们来说也不是容易的事,好在三年过去了,从2006年的65纳米Core,到2007年的45纳米Penryn,再到2008年的45纳米Nehalem,Intel都兑现了自己的Tick-Tock承诺。
Intel的Tick-Tock路线图已经画到了22纳米
接下来的32纳米Westmere芯片也早已不是什么秘密了,Intel的Tick-Tock路线图甚至已经画到了22纳米。32纳米Westmere芯片的正式发布时间被定在了下个月的7号,中国区的发布仪式则会在8号举行。届时将会是台式版本的Clarkdale和移动版本的Arrandale齐发,型号多达17款。当然,这并不是32纳米Westmere芯片的全部,再晚两个月,包括台式版本Core i7-980X和服务器版本Xeon 5600系列的六核心Gulftown处理器也会发布。
我要测试的是台式版本Clarkdale核心的Core i5-6xx和Core i3-5xx处理器,它们都是双核心四线程的,不过Core i5的睿频技术是Core i3不支持的。Intel先期给32纳米Clarkdale芯片规划了七个型号,除了Core i5-661和Pentium G6950的图形芯片频率分别为900MHz和533MHz外,其它五个型号的图形芯片频率都是733MHz。除此之外,Core i5-661和Core i3-5xx以及Pentium G6950都不支持Intel的v-Pro、SIPP、VT-d、TXT技术,而Core i5-661却支持后两者都没有的AES-NI指令集。
以智变 应万变 Intel新酷睿CPU首发测试
这一轮Tick-Tock过后Intel Core 2 Duo/Quad品牌和LGA775插座已经成为过去式,取而代之的是新的Core i品牌和LGA1366/1156插座。你可以这样区分i7、i5、i3三个系列:八线程+睿频技术的是i7,四线程+睿频技术的是i5,四线程没有睿频技术的就是i3了。值得一提的是,Intel还是舍不得扔掉Pentium这个他们历史上最成功的品牌,不过32纳米Clarkdale核心Pentium G6950处理器的规格就比较寒酸了,不但不支持第三代超线程和睿频技术,内存频率和图形芯片频率也分别缩水至DDR3-1066和533MHz。
友情提示:本文以新酷睿CPU的技术和测试为主,更多产品信息请参阅《32nm+整合显卡 Intel新酷睿CPU全面解禁》
70至80亿美元造32纳米,比AMD市值都高
Intel在美国本土的四座晶圆厂将陆续开始32纳米芯片的生产
我在想这篇文章到底是应该从32纳米芯片制程还是CPU+GPU架构说起,不过既然这一轮的更新落在了代表芯片制程的Tick上,那我想就还是从前者开始吧。70亿至80亿美元,这是Intel在美国本土转产32纳米制造工艺要花掉的钱,现在位于俄勒冈州的两座晶圆厂D1D和D1C已经完成了32纳米制造工艺的转产工作,而位于亚利桑那州和新墨西哥州的两座晶圆厂Fab 32和Fab 11X也预计会在2010年下半年完成32纳米制造工艺的转产工作。
研发代号P1268的32纳米制造工艺
虽然Intel的Tick-Tock运转是从2006年的65纳米Core芯片才开始的,不过每两年更新芯片制造工艺的周期从1989年开始就一直被Intel保持着,这也就是我们所说的广义上的摩尔定律。Intel在上一轮的Tick更新,也就是代号P1266的45纳米Penryn芯片上首次采用了High-K和Metal Gate材料的晶体管,这也让45纳米Penryn芯片成为Intel历史上从研发到量产周期最短的芯片,其中研发周期则更是只有代号P1264的65纳米芯片的一半而已。
代号P1268的32纳米芯片仍然是基于High-K和Metal Gate材料的晶体管设计的,不过其High-K介质层的厚度已经从45纳米的1纳米变薄至0.9纳米(65纳米制造工艺下采用传统二氧化硅材料做到1.2纳米的厚度已经是极限了),Metal Gate介质层的厚度也变薄至30纳米。除此之外,晶体管栅极之间的距离也正在以每两年0.7倍的速度变窄,Intel 32纳米Westmere芯片112.5纳米的晶体管栅极宽度是现在所有相同芯片制造工艺上最窄的了。
NMOS和PMOS晶体管的效能较之45纳米制造工艺时分别提高了14%和22%
Intel 32纳米制造工艺更薄的High-K介质层和Metal Gate介质层让NMOS和PMOS晶体管的效能较之45纳米制造工艺时分别提高了14%和22%,漏电流也分别降低了5倍和10倍。Intel 32纳米Westmere芯片的重要金属层仍然采用193纳米浸没式光刻技术,非重要金属层采用193纳米或248纳米干式光刻技术,芯片面积相当于45纳米制造工艺时的70%。处理器本身采用9层铜基板和主要材料是铜的Low-K内部连接线,并采用无铅无卤封装。
除此之外,Intel 32纳米制造工艺还应用到了第四代应变硅材料。利用硅锗、双应力应变硅以及应变记忆技术,能够提高晶体管的开关速度和电源效率,这反映在处理器身上就是时钟频率和工作效能的提高。值得一提的是,像是第四代应变硅材料和浸没式光刻技术也已经被AMD用在了他们的45纳米制造工艺上,而像是High-K和Metal Gate材料介质以及Low-K介质的铜连接线,AMD也都有提及,不过暂时还没有用在已经量产的芯片上。
Intel 32纳米制造工艺技术特性
与其说内建显卡,倒不如说内建北桥
Nehalem平台重新划分,图形芯片移入处理器内部
虽然说“Intel Clarkdale/Arrandale处理器内建了图形芯片”这句话并没有错,但是有两点Intel也是直言不讳的。一方面是这颗图形芯片并没有采用和处理器芯片一样的32纳米制造工艺,也没有和处理器芯片采用同一颗硅晶片;另一方面则是这颗45纳米的芯片不仅仅包括了图形处理单元的部分,还提供了对内存控制器和PCIe控制器这两大传统北桥功能的支持。因此与其说“Clarkdale/Arrandale处理器内建了图形芯片”,倒不如说是和之前的Lynnfield芯片一样内建了传统北桥芯片的功能。
Clarkdale处理器架构图
事实上Intel在32纳米制造工艺下,已经完全可以把CPU和GPU做在一颗芯片上,因为下一轮Tock更新的产物Sandy Bridge芯片就是这样的,而且它还会是32纳米的。对此,Intel现任总裁兼首席执行官Paul Otellini曾公开表示,现在CPU和GPU的研发是分开进行的,这有利于加快Intel新产品的市场化进程,其实Intel在45纳米Havendale芯片的时候就可以交出和现在一样的产品,不过因为32纳米制造工艺成熟度喜人,故直接采用了32纳米CPU+45纳米GPU的方案。
英特尔高清显卡与前一代产品的架构和3D特性比较
英特尔高清显卡与前一代产品的媒体特性比较
Clarkdale/Arrandale芯片上的图形处理单元是由G45北桥芯片上内建的GMA X4500HD图形芯片改良而来,硬件上还是一颗采用统一渲染架构的DirectX 10级别GPU,不过渲染单元的数量和流处理器的个数分别从5组/15个增加至6组/18个,缓存的大小也随之有所增加。不过,这颗图形芯片依然只支持单体采样渲染,还是和反锯齿技术无缘。当然,我从来不奢求Intel的整合图形芯片能流畅的运行那些大型3D游戏,因为即便是NVIDIA和ATI的同级别产品也无法做到这一点。
Clarkdale/Arrandale芯片上的图形核心并没有一个具体的型号,Intel也只是叫它GMA HD高清图形媒体加速器而已。和你相对更熟悉的NVIDIA PureVideo HD或ATI UVD技术类似,Intel的GMA HD图形芯片也有着名为Clear Video HD的高清解码技术,影像方面可以完全实现MPEG-2、VC-1以及AVC(H.264)三种编码格式的硬件解码,支持高达40Mbps码率的全帧率蓝光影片回放。声效方面则追加Dolby True-HD和DTS-HD的无损源码输出。
说到在PC上播放蓝光影片时源码输出无损音轨,那张华硕的Xonar HDAV1.3豪华版声卡应该算是先行者,接着ATI也在Radeon HD 5000系列显卡上实现了这一功能,而Intel则率先在内建图形芯片GMA HD上实现了这一功能。不管怎么说,Intel和ATI的图形芯片都已经实现了无损音轨的源码输出,而NVIDIA则刚刚实现了内建声效单元,并且没有公开表示过可以实现源码输出无损音轨。至少在这点上,NVIDIA的图形芯片被落在了后面。
Clarkdale+H57/H55,最好的HTPC平台?
Clarkdale处理器+H57/H55主板连接示意图
32纳米Clarkdale处理器和45纳米Lynnfield处理器一样都是LGA1156插座的,也就是说前者也可以在现有的P55主板上使用。不过比较“杯具”的是,这样做是不能用到Clarkdale处理器内建的GMA HD图形芯片的。众所周知,从LGA1156插座的Lynnfield处理器/P55主板组合开始,Intel用一颗PCH主板芯片取代了传统的MCH/ICH南北桥芯片组,处理器芯片和PCH主板芯片之间采用一条2GB/s带宽的DMI总线连接。不知道是不是为了不给本就不富裕的DMI带宽增添压力,Clarkdale处理器内建的GMA HD图形芯片是用一条新的FDI(Flexible Display Interface)总线和PCH主板芯片连的,而没有这条FDI总线的P55 PCH芯片自然是无法激活内建显卡的。
新的H57/H55主板芯片提供了这条FDI总线。32纳米Clarkdale处理器上只是内建了传统北桥芯片上的内存控制器、PCIe控制器以及图形芯片,而图像输出端则还是要H57/H55芯片负责的,它提供了一组模拟输出和两组数字输出的能力,基本上不再需要第三方芯片的补充了。数字输出方面DVI、HDMI以及DisplayPort三者都是原生支持的,并且已经内建了HDCP密钥。不过值得一提的是,和上代G4x主板芯片一样,H57/H55主板芯片提供的数字输出是DisplayPort规格的,也就是说主板若要实现DVI和HDMI的输出,还需要增添一颗电压调节芯片把DisplayPort的规格转化为DVI和HDMI的规格,而这颗电压调节芯片需要主板厂商多付出1个美元左右的成本。
没有人会指望着拿内建图形核心去玩大型3D游戏,不过Intel的GMA HD芯片是现在唯一可以实现MPEG-2、VC-1以及AVC(H.264)三种编码格式硬件解码且支持无损音轨源码输出的整合图形引擎,加之32纳米处理器部分的高效能,Clarkdale+H57/H55的组合无疑可以去角逐最好的HTPC平台了。HTPC并不像传统PC只连接显示器那么简单,它需要和电视机、功放机甚至是投影机等多种输出设备相连接,对设备的管理和配置能力较高。
Intel GMA HD图形引擎驱动程序上的电视机向导设置
支持自定义分辨率,调节过扫描等选项
除了对GMA HD图形单元的硬件架构进行改良外,Intel也在其驱动程序上下足功夫,外观方面暗蓝色的控制面板界面看上去相当养眼,从左到右的排布方式和NVIDIA/ATI类似。对于HTPC平台来说,新的Intel显示驱动程序增加了电视机向导设置,你可以根据自己的需要自动或手动配置电视机的输出配置,并且支持自定义分辨率,调节过扫描等选项,而像是16-235/0-255灰阶输出控制选项等设置也会随着驱动程序版本的更新陆续加入。
“美国政府批准和支持”的硬件加速技术
新增了六条针对加密和解密运算的指令——AES(Advanced Encryption Standard)
上代Nehalem架构在上上代Penryn芯片SSE 4.1指令集的基础上新增了七条SSE 4.2指令,主要对字符和文本处理能力做出强化,而新的32纳米Westmere芯片在这方面也有动作,新增了六条针对加密和解密运算的指令——AES(Advanced Encryption Standard),其运算标准是根据美国联邦信息处理标准(FIPS)第197号文件制定的,是分组密码(Block Cipher)运算最为主流的规范,这意味着Intel AES-NI指令的应用范围会很广。
这六条AES指令中包括了四条的加密解密指令(AESENC、AESENCLAST、AESDEC、AESDECLAST)和两条的密钥生成(AESIMC 、 AESKEYGENASSIST)指令,Intel宣称硬件支持AES加速可以比软件快四倍以上。Intel AES-NI指令不但支持三种符合AES官方规范的密钥长度(ASE128 、 ASE192 、 ASE256)和所有符合AES官方规范的运算模式,甚至还可以支持若干种并不在AES官方规范中的算法。除此之外,数据的安全性也可因AES-NI指令而获益。
另外,32纳米Westmere芯片还支持一组名为Carryless Multiply(PCLMULQDQ)的指令,它可以让处理器在一个周期内处理两组64-Bit的Carry-less Multiplication,这是很多加密标准所必须要处理到的部分,采用伽罗瓦 计数器模式(GCM)。这一模式在2006年4月份得到了美国政府的批准和支持,和AES规范混合使用,是美国国家安全机构(NSA)发布的Suite B加密算法集的子集,也是美国电气和电子工程师协会IEEE 802.1AE的标准。
我们可以通过两个测试来看到硬件AES加速的效果。一个是比较理论的Sandra,你可以看到在ASE256这项测试上,支持AES-NI指令的Core i5-6xx处理器可以比不支持该指令的Core i3-5xx处理器快上十几倍;另一个则是比较模拟实际的PCMark Vantage了,硬件AES加速还是可以帮助同样主频的Core i5-6xx处理器比Core i3-5xx处理器快60%以上。商业用户往往用不上四核心甚至是八线程的处理器,而像Core i5-6xx处理器这样的产品,AES-NI加速的确给了他们一个从Core 2 Duo/Quad升级的理由。
我们的测试平台
Intel和Core i5-6xx处理器一起送来的H55主板DH55TC 'Tom Cove'用来测试再合适不过了,因为不太可能会有主板比Intel自有品牌的主板还稳定了。不过拿它来超频Clarkdale处理器就肯定是不行了,“寒酸”的供电和散热用料不说,BIOS超频选项上除了高至240MHz的BCLK频率(预设133MHz)外,你就再也找不到和频率或者电压相关的调节选项了,因此对于Core i5-6xx和Core i3-5xx的超频测试,是在一张华硕H57主板上完成。
Intel DH55TC 'Tom Cove'主板
华硕H57主板
相当“尴尬”的内存子系统性能
你不得不面对Clarkdale处理器如此“尴尬”的内存子系统性能。Core i7-9xx处理器的内存控制器还是放在北桥芯片里的,Core i7-8xx和Core i5-7xx的内存控制器则是真的被处理器“内建”了,而Clarkdale处理器的内存控制器并不是在CPU芯片里的,而是在那颗45纳米的所谓“图形芯片”里,两颗芯片间还是依靠QPI总线通信。不过从理论上的内存读写测试上来看,这种设计的性能表现并不理想,我希望这个短板只是停留在理论上的。
成功!源码输出无损音轨
勾选红框中的选项是在Corel WinDVD播放器上开启源码输出无损音轨的条件
Corel WinDVD播放器已经可以实现Dolby True-HD源码输出
输出到安桥功放上
输出到天龙功放上
源码输出无损音轨的测试也比较有趣。在PC播放蓝光影片方面几乎快被人遗忘的Corel WinDVD反倒是做的最好的,无论是Dolby True-HD和DTS-HD都可以分别在我们使用的天龙和安桥功放上输出,而更为人所熟悉的ArcSoft Total Media Theatre 3则只是可以开启硬件支持。虽然播放器方面已经可以实现直通输出,但是在我们的天龙和安桥功放上却都听不到声音。至于最大牌的Cyberlink Power DVD 9,这个版本暂时还无法工作。
ArcSoft Total Media Theatre 3只是可以开启硬件支持
这个版本的Cyberlink Power DVD 9索性没有支持
软硬解码蓝光影片均不在话下
硬盘读取AVC(H.264)硬件解码(VC-1相同)
蓝光光驱读取AVC(H.264)硬件解码
硬盘读取AVC(H.264)软件解码
硬盘读取VC-1软件解码
我们习惯用CPU使用率来衡量图形芯片的蓝光影片解码能力。Intel宣称GMA HD图形芯片可以完全实现MPEG-2、VC-1以及AVC(H.264)三种编码格式的硬件解码,而2%的CPU使用率也足以说明其做到了这一点。在用蓝光光驱直接播放蓝光光盘上的高清电影时,20%左右的CPU使用率也和NVIDIA以及ATI的产品处于同一水准上。至于软解播放,15%左右的CPU使用率是比较理想的,这对于多线程且高频率的Clarkdale来说不算什么。
整合显卡跑大型3D游戏,不是比谁更好,而是比谁更差
Intel的GMA HD图形芯片依然只支持单体采样渲染,还是和反锯齿技术无缘,事实上你也没有打开反锯齿技术的机会,因为即便是在1024x768的分辨率和最低的画面质量下,Intel和AMD两家最好的整合平台也不能说运行的十分流畅。不过值得一提的倒是,Intel Core i5-661/H57和AMD Phenom II X4 965/785G这两套整合平台在价格上应该是相仿的,在跑大型3D游戏不能比谁更好只能比谁更差的前提下,Intel的功耗优势相当明显。
整机性能测试
Core i5-661/660和Core i5-750定价都是196美元,前者有着高达3.33GHz的预设主频和双核心(四线程),而后者则是四核心的,只是预设主频为相对较低的2.66GH。总的来说,两者的整机性能表现是比较接近的。
影音转码性能测试
苹果的iTunes 9基本上是频率说了算的,3.06GHz双核心(四线程)的Core i3-540也不会比四核心的Core i5-750慢多少。视频转码方面则是核心数量说了算的,因此四核Core i5-750虽然只有2.66GHz,但表现最好。
3D渲染性能测试
多线程3D渲染基本上也都是核心数量说了算的,因此你可以看到即便Core i5-750的预设主频只有2.66GHz,但是拥有四组物理核心的它总是可以比预设主频高达3.33GHz却只有双核心(四线程)的Core i5-661快些。
办公性能测试
办公性能测试说表现出的结果和多线程3D渲染是一样的,相对较高的预设主频并不能弥补Clarkdale处理器核心数量的不足,四核心Core i5-750处理器在更多时候都是最快的,不过不要忘了睿频也可以让它到3.2GHz。
3D游戏性能测试
我们所测试的大型3D游戏都是一些代表作,你可以看到它们对于四核心处理器的支持都已经比较好了。值得一提的是在孤岛惊魂2上,超线程技术似乎并没有发挥作用,四核心Core i5-750遥遥领先了双核心的i5-661。
超频性能测试:5GHz开机
Core i5-661可以获得180x26=4.7GHz的频率
Core i3-540可以获得200x23=4.6GHz的频率
使用华硕P7H57D-V EVO主板和利民Ultra 120 eXtreme散热器,我们分别尝试着对Core i5-661和Core i3-540进行了轻量级的超频测试。我们让华硕P7H57D-V EVO主板自动给两颗处理器分配电压至1.392V,其中Core i5-661可以获得180x26=4.7GHz的频率,而Core i3-540则可以获得200x23=4.6GHz的频率。对于32纳米Clarkdale来说,拿下4.6GHz左右的主频或200MHz左右的BCLK频率是比较轻松的,再加电压就可上到5GHz。
5GHz开机……
电力消耗测试:比45纳米低30%以上
Core i5-661和Core i5-750在空负载状态下的功耗表现是不会有什么差别的,不过到了满负载的时候就不一样了。虽然Clarkdale处理器比Lynnfield还多了一颗芯片,不过此时它的满载功耗比45纳米的后者低了30%多。
结语
Core i5-600系列处理器的定价比较“杯具”
虽然Core i5-661/660处理器的国内售价还没有出来,但其196美元的千颗价格和Core i5-750处理器是一样的。Intel也预计前者并不会传出太大的市场声音,毕竟同样的价钱后者的性能要更好些,除非你真的是想在第一时间就体验到或者真的需要GMA HD图形引擎和AES加速技术。类似的情况也发生在Core i5-670处理器身上(国内售价同样未定),在284美元的千颗价格上Core i7-920和Core i7-860都应该是比Core i5-670更好的选择。
而Core i3-540/530处理器(国内售价同样未定)到绝对是值得关注的,这应该是Intel第一次把新的芯片制程和架构设计用在100美元左右的主流产品上。在此之前,AMD以牺牲三级缓存为代价把四核心处理器的价格拉到了这个区间上,Intel只能尴尬的用双核心Core 2 Duo E7000系列来应对。而Core i3系列虽然较之Core i5系列拿掉了睿频加速和AES加速技术,不过第三代超线程技术和GMA HD图形引擎还是足够吸引人的,3GHz左右的预设主频也是AMD的三、四核心处理器不容易做到的。
既然Core i3-540/530处理器不能通过睿频加速技术获得那266MHz的“免费”频率提升了,那么我们不妨多关注一下它的超频表现。虽然我在超频手上这颗Core i3-540处理器的时候使用了比较好的华硕H57主板和利民Ultra 120 eXtreme散热器,但是拿到200x23=4.6GHz的工作主频还是相当轻松的,除了拉高BCLK频率到200MHz外,我就没有再进行任何BIOS设置了。相信即便你使用的是盒装散热器,至少把一颗Core i3处理器超频到4GHz工作主频还是比较容易的。
MINI-ITX H57主板让Clarkdale处理器有了性能、功耗和体积比较完美的平衡
Intel这家依靠庞大处理器出货量坐上图形芯片(整合主板)头把交椅的公司现在可以说,他们的GMA HD图形芯片是全球首款支持MPEG-2、VC-1以及AVC(H.264)三种编码格式硬件解码和Dolby True-HD、DTS-HD无损音轨源码输出的整合产品。如果你想在2010年搭配一台HTPC或超小型PC,那么Clarkdale处理器+H57/H55主板的组合绝对应该是首选,因为无论是性能、功耗还是体积,它已经可以达成一个比较完美的平衡了。
明年年底的32纳米Sandy Bridge芯片则会把CPU和GPU放在一枚die下面
我不知道在Clarkdale/Arrandale芯片正式发布后AMD会怎么评价它,因为后者从三年前并购ATI后就一直宣传的CPU+GPU架构让Intel先实现了,而AMD自己的CPU+GPU芯片则被推迟到了2011年。做为Intel的首枚CPU+GPU芯片,Clarkdale/Arrandale是把一枚32纳米的CPU和一枚45纳米的GPU封装在一块基板上的,而明年年底的32纳米Sandy Bridge芯片则会把CPU和GPU放在一枚die下面,那个时侯AMD的CPU+GPU芯片也应该可以有样本出来了。