【IT168 CPU频道】Intel并没有把新的32nm HKMG制造工艺首先用到高端的酷睿i7系列上,毕竟AMD对它完全够不成威胁,不过Intel还是在32nm Clarkdale芯片发布后的两个月把新的制造工艺带到了酷睿i7系列上,它的影响力并不亚于CPU+GPU的Clarkdale芯片,这就是业界首枚台式机六核心处理器芯片——Gulftown,产品型号是酷睿i7-980X至尊版(酷睿i9的命名方式不攻自破),台式电脑也由此开启了六核心计算时代的大门。
业界首颗六核心台式机处理器Intel酷睿i7-980X至尊版要用什么主板和内存?它会有怎样的性能表现?十二线程的空前规格能发挥多大作用?电力消耗表现会水涨船高吗?超频能力又如何?本文将会为您一一揭晓答案。
Intel转产32nm HKMG花80亿美元,比AMD市值都高
Intel在美国本土的四座晶圆厂将陆续开始32纳米芯片的生产
70亿至80亿美元,这是Intel在美国本土转产32nm制造工艺要花掉的钱,现在位于俄勒冈州的两座晶圆厂D1D和D1C已经完成了32nm制造工艺的转产工作,而位于亚利桑那州和新墨西哥州的两座晶圆厂Fab 32和Fab11X也预计会在2010年下半年完成32nm制造工艺的转产工作。六核心Gulftown芯片的面积有248平方毫米,晶体管数量有11.7亿个,基本上就是双核心Clarkdale芯片81平方毫米和3.84亿个(不包括45nm GPU)的三倍。
研发代号P1268的32纳米制造工艺
虽然Intel的Tick-Tock运转是从2006年的65纳米Core芯片才开始的,不过每两年更新芯片制造工艺的周期从1989年开始就一直被Intel保持着,这也就是我们所说的广义上的摩尔定律。Intel在上一轮的Tick更新,也就是代号P1266的45纳米Penryn芯片上首次采用了High-K和Metal Gate材料的晶体管,这也让45纳米Penryn芯片成为Intel历史上从研发到量产周期最短的芯片,其中研发周期则更是只有代号P1264的65纳米芯片的一半而已。
NMOS和PMOS晶体管的效能较之45纳米制造工艺时分别提高了14%和22%
代号P1268的32纳米芯片仍然是基于High-K和Metal Gate材料的晶体管设计的,不过其High-K介质层的厚度已经从45纳米的1纳米变薄至0.9纳米(65纳米制造工艺下采用传统二氧化硅材料做到1.2纳米的厚度已经是极限了),Metal Gate介质层的厚度也变薄至30纳米。除此之外,晶体管栅极之间的距离也正在以每两年0.7倍的速度变窄,Intel 32纳米Westmere芯片112.5纳米的晶体管栅极宽度是现在所有相同芯片制造工艺上最窄的了。
Intel 32纳米制造工艺更薄的High-K介质层和Metal Gate介质层让NMOS和PMOS晶体管的效能较之45纳米制造工艺时分别提高了14%和22%,漏电流也分别降低了5倍和10倍。Intel 32纳米Westmere芯片的重要金属层仍然采用193纳米浸没式光刻技术,非重要金属层采用193纳米或248纳米干式光刻技术,芯片面积相当于45纳米制造工艺时的70%。处理器本身采用9层铜基板和主要材料是铜的Low-K内部连接线,并采用无铅无卤封装。
Intel 32纳米制造工艺技术特性
除此之外,Intel 32纳米制造工艺还应用到了第四代应变硅材料。利用硅锗、双应力应变硅以及应变记忆技术,能够提高晶体管的开关速度和电源效率,这反映在处理器身上就是时钟频率和工作效能的提高。值得一提的是,像是第四代应变硅材料和浸没式光刻技术也已经被AMD用在了他们的45纳米制造工艺上,而像是High-K和Metal Gate材料介质以及Low-K介质的铜连接线,AMD也都有提及,不过暂时还没有用在已经量产的芯片上。
重温Nehalem架构的模块化设计
做为全球最大的芯片供应商,Intel是要同时兼顾到台式机、笔记本以及工作站/服务器这三大市场的,缺一不可。坦白说在65nm Core架构到45nm Penryn这轮Tick-Tock上,虽然Intel在台式机和工作站/服务器这两大市场上斩获颇丰,但最大的受益者还是笔记本平台。而在Nehalem架构的设计上,Intel的工程师们不再向某一平台倾斜,而是力求设计出能同时满足台式机、笔记本以及工作站/服务器三大平台新型应用需求的处理器产品。
Nehalem架构的设计精髓所在,即模块化的设计(Building Block)
这也就是Nehalem架构的设计精髓所在,即模块化的设计(Building Block)。正如这个设计思路的名字那样,Intel把Nehalem架构分成了若干个单元,他们可以根据不同市场对处理器产品的不同需求对这些单元进行任意组合,从而形成最符合那个市场的处理器产品。这些单元包括了核心/线程数量、系统总线控制器/内存控制器数量、共享缓存容量、节电单元模块甚至是内建图形芯片(32nm Westmere架构的Clarkdale芯片)等等。
这样做的好处是显而易见的。在Nehalem架构设计成型后,Intel就可以像“搭积木”一样在最短的时间里迎合市场对处理器产品的需求,因为在这个时候只需要增减对应的功能模块来满足效能需求就好了,并不像旧有的酷睿2四核和酷睿2双核那样,只能依靠芯片的工作频率和二级缓存容量来定位产品,从而避免产品定位重叠的“尴尬”。市场反应更快、定位更加精准且更丰富的产品对于Intel这样一家商业公司来说无疑是相当重要的。
Bloomfield芯片
Gulftown芯片
Nehalem架构可扩充的设计初衷让Gulftown芯片不需要进行重新设计。得益于32nm第二代HKMG制造工艺,Gulftown芯片在Bloomfield芯片的基础上增加了两个物理核心,加之第三代超线程技术,从而达成6核心12线程的空前规格。Gulftown芯片也继续贯彻了Nehalem架构首席设计师Ronak Singhal每个核心至少有2MB三级缓存的政策,因此你可以看到六核心Gulftown芯片的三级缓存是12MB,而四核心Bloomfield芯片是8MB。
Nehalem/Westmere架构也是在Core/Penryn架构上改良而来的
45nm Nehalem到32nm Westmere,就像65nm Core到45nm Penryn,后者都是在带来新的芯片制造工艺的同时对前者的架构进行改良。实际上Nehalem/Westmere架构也是在Core/Penryn架构上改良而来的,诸如四个解码指令的宽位动态执行、128-Bit SSE执行单元、SSE 4.x指令集、智能内存访问以及智能高速缓存等等都出现在Core/Penryn架构的设计上,而Nehalem/Westmere架构则对它们进行了改良,进一步释放其优势。
“失而复得”的AES-NI指令
新的32纳米Westmere芯片在这方面也有动作,新增了六条针对加密和解密运算的指令
上代Nehalem架构在上上代Penryn芯片SSE 4.1指令集的基础上新增了七条SSE 4.2指令,主要对字符和文本处理能力做出强化,而新的32纳米Westmere芯片在这方面也有动作,新增了六条针对加密和解密运算的指令——AES(Advanced Encryption Standard),其运算标准是根据美国联邦信息处理标准(FIPS)第197号文件制定的,是分组密码(Block Cipher)运算最为主流的规范,这意味着Intel AES-NI指令的应用范围会很广。
这六条AES指令中包括了四条的加密解密指令(AESENC、AESENCLAST、AESDEC、AESDECLAST)和两条的密钥生成(AESIMC 、AESKEYGENASSIST)指令,Intel宣称硬件支持AES加速可以比软件快四倍以上。Intel AES-NI指令不但支持三种符合AES官方规范的密钥长度(ASE128 、ASE192 、ASE256)和所有符合AES官方规范的运算模式,甚至还可以支持若干种并不在AES官方规范中的算法,数据的安全性也可以因其而获益。
另外,Westmere芯片还支持一组名为Carryless Multiply(PCLMULQDQ)的指令,它可以让处理器在一个周期内处理两组64-Bit的Carry-less Multiplication,这是很多加密标准所必须要处理到的部分,采用伽罗瓦计数器模式(GCM)。这一模式在2006年4月份得到了美国政府的批准和支持,和AES规范混合使用,是美国国家安全机构(NSA)发布的Suite B加密算法集的子集,也是美国电气和电子工程师协会IEEE 802.1AE的标准。
A1版本上还看不到AES-NI指令
B1版本上已经有了AES-NI指令
有助于提高处理器的AES加密和解密运算性能
在迎来Intel下一代Sandy Bridge架构革命性的AVX指令集之前,32nm Westmere架构也提供了12个新的AES-NI指令,这有助于提高处理器的AES加密和解密运算性能。值得一提的是,Intel曾经表示Gulftown处理器将不会支持AES-NI指令,我们在A1步进版本的工程样本和最新的Intel Roadmap上也没有找到它的影子,不过我们可以确定最终出货的Core i7-980X处理器(B1)是可以支持AES-NI指令的,测试结果是可以证明这一点。
最终定名酷睿i7-980X,酷睿i9说法不攻自破
八线程+睿频技术的是i7,四线程+睿频技术的是i5,四线程没有睿频技术的就是i3
从45nm Nehalem芯片开始,Intel台式机处理器启用了新的“Core i”品牌。当时正值Microsoft Windows 7发布,加之Intel的新品牌叫Core i7,因此很容易让人把两者联系在一起,就像当年AMD借Windows XP发布之势拿出的Athlon XP品牌一样。不过随着Core i5和Core i3品牌的相继到来,人们才知道Core i7里的7和Windows 7里的7没有半点关系,Core i品牌里的数字只不过是和BMW车一样用来划分产品定位高低的型号罢了。
在我看来,“Core i”品牌里的“Core”还是核心、芯片的意思,而“i”则是智能、智慧(Intelligence)的意思。我不知道Intel在其他国家是怎么宣传“Core i”品牌的,至少在中国“Core i”的确像我所说被宣传为“智能芯片”。记得当时有人问Intel为什么要用“Core i”这个品牌,他们只是说在过去的一年里他们一直在对旗下的品牌结构进行探索,力求让其更能简洁的反映出产品定位,而新的“Core i”会比旧的“Core 2”更好。
英特尔酷睿i7处理器家族对比
这一轮Tick-Tock过后Intel Core 2 Duo/Quad品牌和LGA775插座已经成为过去式,取而代之的是新的Core i品牌和LGA1366/1156插座。你可以这样区分i7、i5、i3三个系列:八线程+睿频技术的是i7,四线程+睿频技术的是i5,四线程没有睿频技术的就是i3了。如果按照这样的划分依据,那么980X至尊版的确不应该被放在酷睿i7品牌下,难怪也会出现所谓酷睿i9的猜想。不过Intel也明确放话了,酷睿i7(至尊版)就是他们的高端品牌。
起初Intel向合作伙伴透露出打算用酷睿i7-1000系列命名Gulftown处理器的意愿,和已有Bloomfield核心的酷睿i7-900系列相区隔,不过Gulftown处理器最终还是被划分到酷睿i7-900系列下。值得一提的是,在最近一份Intel Roadmap上出现了一个名为“酷睿i7-970”的型号。除了使用32nm Westmere架构和LGA1366插座,我们还并不知道关于它的其它规格参数,不过看样子这应该是一颗锁定了倍频上限的六核心Gulftown处理器。
酷睿i7-980X/975合照,都是LGA1366电容有区别
图左为酷睿i7-980X,右为酷睿i7-975
图左为酷睿i7-980X,右为酷睿i7-975
图左为酷睿i7-980X,右为酷睿i7-975,可以看到两者的电容有明显的不同
处理器基板上面那些密密麻麻的触点,Intel告诉我们说那是用来进行内部检测用的
Gulftown核心的酷睿i7-980X处理器的正面和Bloomfield核心的酷睿i7-900系列并无不同,至于处理器基板上面那些密密麻麻的触点,Intel告诉我们说那是用来进行内部检测用的,对最终使用者来说并没有什么用处。背面的话两者虽然都是LGA1366插座的,但是Gulftown处理器的电容数量明显要少于Bloomfield处理器。32nm Westmere处理器本身采用9层铜基板和主要材料是铜的Low-K内部连接线,并且采用了无铅无卤封装技术。
X58/ICH10R主板接着用,更新BIOS文件即可
X58/ICH10R主板接着用,更新BIOS文件即可
Intel在2008年底发布Bloomfield核心处理器和X58/ICH10R主板的LGA1366平台时,我们还不知道六核心Gulftown处理器的事情,以至于我们还会怀疑高端的LGA1366平台到底可以有多长的生命周期。不过我们当时的这种疑虑随着六核心Gulftown处理器的发布被打消掉了,酷睿i7-980X沿用了LGA1366插槽,也就是说它可以继续在X58/ICH10R主板上使用,你所要做的只是更新主板的BIOS文件让它可以识别i7-980X的CPUID就好。
处理器支持列表上依然没有酷睿i7-980X处理器
不过这并不影响它对这颗处理器的识别
1201版BIOS文件的华硕P6T主板
或许是我们在测试酷睿i7-980X处理器时它还没有正式解禁的缘故,我们在测试时使用的华硕P6T主板的最新1201版BIOS文件的处理器支持列表上依然没有酷睿i7-980X处理器,不过这并不影响它对这颗处理器的识别。
官方DDR3-1066内存规格不遗憾,实际要高的多
官方DDR3-1066内存规格不遗憾,实际要高的多
可以透过Intel官方的XMP内存技术来获得更快的内存频率
DDR3-1600
内存支持方面,Gulftown处理器和Bloomfield处理器一样官方只是支持到DDR3-1066,我记得当时在Bloomfield处理器发布的时候Intel对此的解释是说DDR3-1333及以上的规格暂时还没有通过官方认证。事实上无论是透过Intel官方的XMP内存技术,还是各家主板厂商的BIOS支持,Core i7-980X处理器都可以获得DDR3-1600甚至是更高的内存规格支持。像是华硕基本款的X58主板PT6在BIOS中也可以给到预设DDR3-2400的选项。
按照Intel的设计规范,DDR3内存工作在1.65V以上的电压时就会出现警告
需要说明的是,虽然X58/ICH10R主板还是比较传统的南北桥双芯片设计,但是内存控制器的供给工作已经从北桥芯片转交给了处理器本身。按照Intel的设计规范,DDR3内存工作在1.65V以上的电压时就会出现警告。
用LGA1366平台不差钱,首选三通道DDR3-1600内存
很多桌面应用程序还用不到三通道DDR3内存的带宽,加之延迟因素的影响,同频率/时序的三通道确是不会比双通道来的快多少。不过如果有条件搭载三通道DDR3-1600内存,那么还是可以看到比较明显的性能提升。
空前强大的原厂散热器——Intel DBX-B
全新Intel DBX-B散热解决方案
盒装Core i7-980X处理器内会搭载一个名为“Intel DBX-B”的塔式散热器来支持提高超频性能,它可以承受50倍的重力冲击(相当于从3 英尺多的高度落下),闲置状态下的CPU(800 RPM)噪音低于20分贝,承担繁重负载时的CPU(1800 RPM)最大噪音低于35分贝。散热器顶部设有调速开关,“Q”档为较低转速,“P”档为较高转速,我们在后面测试Core i7-980X处理器超频能力的时候就使用了这个自带的DBX-B塔式散热器。
散热器顶部设有调速开关,“Q”档为较低转速,“P”档为较高转速
抛光处理的接触面
我们的测试平台
基准测试软件方面优先选择了我们最为看重的BAPCo SYSMark 2007 Preview,其次是是Futuremark PCMark/3DMark Vantage。随着Microsoft Windows 7的上马,我们所做的应用测试基本上也都是在x64版本的Windows 7下进行的。除了整体性能的SYSMark 2007,我们也加入更多的项目在处理器测试上,其中包括音、视频的转档,3D渲染,办公应用以及3D游戏这几个方面,处理器在功耗和超频方面的表现也是我门要测试的。
你能相信这是一台桌面级电脑的线程数量吗?
SYSMark 2007整机性能
偏商用的SYSMark 2007不能明显的反映出i7-980X的性能优势是在预料之中的,这里面没什么重量级的处理器应用,而是若干个日常应用的集合。不过在强度相对较大的视频创作和3D建模子项上980X还是有优势的。
PCMark/3DMark Vantage整机性能
Futuremark公司的PCMark/3DMark Vantage是比较偏理论的整机性能测试软件。虽然时钟频率没有变,但是酷睿i7-980X处理器更多的核心/线程数量,更大的缓存容量以及新增的AES-NI指令都在这里发挥了作用。
视频转档/编辑性能测试
对于我们所测试的这些典型视频转档/编辑应用来说,处理器的核心/线程数量自然是越多越好,因此你也可以看到虽然时钟频率相同,但是6核心12线程12MB缓存的i7-980X会比4核心8线程8MB缓存的i7-975快不少。
3D渲染性能测试
和视频转档/编辑应用一样,3D渲染也是多线程应用的排头兵。在这里你不用担心酷睿i7-980X处理器6核心/12线程的配置无用武之地。值得一提的是,即便是在单线程的时候,更大的缓存也可以带来10%的性能提升。
办公应用性能测试
在这里值得一提的是WinZip 14的应用,这个版本已经提供了对于Intel AES-NI指令集的支持,加之更多的核心/线程数量和更大的缓存容量,你可以看到酷睿i7-980X处理器较之酷睿i7-975有着250%的夸张性能提升。
3D游戏性能测试
3D游戏也许是对多线程最不敏感的一类应用。在时钟频率相同的情况下,酷睿i7-980X处理器在我们测试的几款游戏上的性能提升并不是来自于更多的核心/线程数量的,而是来自于随之多出来的,共计12MB的缓存。
电力消耗表现
酷睿Core i7-980X处理器在待机时会自动降频至1.6GHz
Core i7-980X处理器的空负载功耗和Core i7-975相差无几,满负载功耗也只是比后者高了10几瓦而已,应该说这是一个让人比较满意的结果。较之Core i7-975处理器,Core i7-980X在性能上的提升要比功耗多的多。
超频能力表现
140MHz x 31 = 4.35GHz
直接拉升Core i7-980X处理器的倍频从x25到x31,BCLK频率也从133MHz微调至140MHz,比较轻松的拿到4.35GHz的时钟频率,这个时候处理器的工作电压是由主板自动分配的,有1.344V,而预设的电压是1.24V。
134MHz x 35 = 4.7GHz
手动拉升Core i7-980X处理器的工作电压到1.6V左右的高点,倍频可以接着从x31来到x35,而BCLK频率则只能从133MHz微调1MHz到134MHz,最后拿到4.7GHz左右的时钟频率,比预设的3.33GHz提高了40%左右。
酷睿i7-980X绝非纸面发布,Intel至尊地带渠道助力
酷睿i7-980X是x86处理器市场上运作速度最快、表现最智能、功能最强大的台式机产品
如果在x86服务器/工作站领域谈六核心处理器,那确实不算什么新鲜玩意,Intel的Dunnington和AMD的Istanbul都早已经是这样的产品了。尽管台式电脑对于并行计算能力的需求远不及服务器/工作站来的迫切,但x86双雄还是都打算在今年把六核心处理器推向台式机市场。不过,Intel的Gulftown已经和当年的Dunnington完全不是一回事,新的制造工艺、新的架构设计……,而AMD的Thuban则基本上就是Istanbul的台式机版本。
其实Gulftown芯片的主战场还是应该在x86服务器/工作站领域,因为在台式机市场上,酷睿i7-980X至尊版处理器不可能会有对手,无论是在效能上还是在价格上,一颗酷睿i5-750就让AMD难以逾越了。所以说与其把酷睿i7-980X看成一颗台式机处理器,倒不如说它是至强W3680(单路的Gulftown,除此之外还有双路的X5600系列和低电压的L5640)的台式机版本。当然,酷睿i7-980X无倍频上限的至尊版概念在台式机处理器上才有。
其实给酷睿i7-980X处理器下结论反倒简单了——它是x86处理器市场上运作速度最快、表现最智能、功能最强大的台式机产品,主要面向DIY发烧友、极限游戏及超频玩家、3D内容创建者等,或许也只有Intel自己才知道什么时候能有新的产品超过它。我们在肯定酷睿i7-980X处理器巅峰性能的同时,更称道它在电力消耗方面的表现,在轻松刷新酷睿i7-975所保持的性能纪录的同时,我们并没有看到酷睿i7-980X的电力消耗有明显增长。
Intel中国越来越重视高端用户与市场,未来也将会投入更多时间开发高端市场
最后我们想说的是,此番Intel发布酷睿i7-980X至尊版处理器绝非纸面上的,它会在本月中旬Intel设在全国各地的至尊地带旗舰店内同步首发。Intel中国越来越重视高端用户与市场,未来也将会投入更多时间开发高端市场,致力于帮助渠道健康发展和助力合作伙伴成长。例如培养渠道合作伙伴高端运营,帮助渠道营建创新模式,促进基于体验的个性化销售服务,开拓网络销售通道等等,而Intel中国新DIY时代高峰会议也将会继续办下去。