Sandybridge-E核心架构
前面讲了SandyBridge-E依然是SandyBridge家族的产品,因此架构上的改革更多的还是在于核心模块的调整上。自从Nehalem架构之后,Intel将每个处理器单元均采用了Building Block模组化设计,因此组合起来更加的方便。下面是i7 2600K与本次的SandyBridge-E 3960X的CPU结构图。SandyBridge-E基本上可以看作是砍掉核芯显卡并且扩展了IMC、Core和Cache的强力版本。
▲模块调整
上一代至尊i7 990X采用的是Nehalem架构,现在下面我们来回顾一下SandyBridge架构相对于Nehalem的改进。
▲分支预测单元
新的分支预测单元分离自取址单元,分支预测单元提高了CPU内部对嵌套语句预测的正确率和速度。分支预测的准确率决定了指令执行的效率,对于CPU的效能提升有着至关重要的作用,尤其是现在处理器大多使用超标量流水线,乱序指令执行,如果某一条分支预测错误都会导致整个过程推到重来,白白浪费运算资源。
前端uop cache(微指令缓存),uop cache 可以保存已经解码的微指令,因此也可以被称为L0 ICache,容量为1.5K uops,根据英特尔的说法,通常的应用当中其命中率可以达到80%,在命中这个缓存之后,可以极大的释放前段解码单元的工作量。
▲物理寄存器架构
PRF(Physical Register File,物理寄存器文件)和RRF(Retired Register File,回退寄存器文件)之间的差别。SNB核心的处理器能够在其寄存器文件中存贮uop微操作数,而乱序执行引擎中仅携带指向操作数的指针,这样就大大减小了数据移动所需要的电能,最终使得数据流窗口扩大了1/3,且提高了性能。通过这一改进,使得ROB(ReOrder Buffer,新排序缓存)的容量也提高到了168项,统一调度的容量也升至54个条目。
另外SandyBridge-E也支持AVX和AES指令集,这些指令集在复杂媒体运算和加密解密等数据密集型的运算时也发挥了巨大的作用。因此从理论上看Nehalem的i7 990X已经成为过去了。