CPU 频道

步入康庄大道 酷睿微架构解析

    当Intel在Pentium产品线中增加128位矢量处理,也就是著名的SSE指令集(扩展的SIMD指令集),但是在P6微架构及其后的Banias中矢量处理实现有两个不利的地方:在ISA方面,SSE主要的缺陷是只能支持三个操作的指令,而在硬件方面,它又局限在P6核心的64位内部数据宽度上,128位的操作会被分成两个64位执行,结果就是128位的矢量操作在P6核心上执行至少需要两个时钟周期。

    Core架构最终实现了单时钟周期的128位矢量操作,Intel将浮点与矢量的内部数据带宽增加到128位,这意味着仅仅一个微操作需要被生成,分派,调度,大幅提升了性能。而且它提升了解码、分配和调度的带宽。

    新的酷睿架构能够在单周期内以128位执行全部的SSE指令,而之前的微架构每个时钟周期只能执行一个64位SSE指令,128位的SSE指令要分成两个64位执行。酷睿可以在一个时钟周期内完成128位SSE指令执行,这是相当大的改进,SSE的延迟从3个时钟周期降到1个时钟周期。

0
相关文章