Intel让Core架构核心每个时钟周期执行更多的指令,以缩短执行时间并改进效率。在Core架构中每个执行内核将变得更加宽阔,这样它们就可以同时获取、分配、执行和返回达4条完整的指令。(而之前的移动以及NetBurst架构每次只可处理3条指令)。4条是指转换后的微指令,每条x86指令大约是一条微指令。进一步提高效率的特性包括进一步提高执行灵活性的更精确的分支预测、更深的指令缓冲区,以及可以缩短执行时间的其它特性。Core拥有四个寄存器重命名单元和四个微指令分配单元。在指令译成微代码之前都是顺序执行的,指令的流程是FIFO,也就是先入先出。而到了微代码的分配与执行单元,则进行乱序分配与执行。
新的Core 2 Duo处理器的内存管线包含2MB或4MB缓存,它的调用与存储流水线同样是乱序执行,能够重新排序内存命令来提升性能。
宏融合可以缩短执行时间,Intel新的Macro-fusion技术能够结合共用的X86指令对到一个单独的微指令中,能够在一个ALU中以单时钟周期完成。在前几代处理器中,每条进入的指令均会被单独地解码和执行。宏融合可以在解码期间将常用的指令对(如条件分支后的比较)融合为单个内部指令(微操作)。这样2条程序指令就可以作为1个微操作执行,以减少处理器必须执行的整体工作量。这增加了给定时间内可以运行的全部指令数量,或者减少了运行一定指令数量的时间。通过在更短的时间内完成更多的任务,宏融合提高了整体性能和能效。
宏融合,Core新架构的前端硬件可以将x86指令在预解码单元合并,发送它们经过一个解码单元并翻译成一个微操作。这个特征被称为宏融合。它对某些指令很有用,特别是比较和测试指令能够与分支指令进行宏融合,Core四个解码单元中任一个都能在一个时钟周期内生成一个宏融合微指令。
Core的执行单元
Core拥有三个64位的整数执行单元,每个执行单元能进行单周期64位标量整数操作,并且有一个64位复杂整数单元(CIU),它同P6核心的CIU完成的工作相同,两个简单整数单元(SIUs)进行基本的操作,象是加,一个SIU同分支执行单元(BEU)共享指令端口2。SIU能够同BEU进行宏融合指令。Core能够在一个时钟周期内进行三个整数操作。
Core拥有两个浮点执行单元,能够进行标量与矢量浮点数学运算,在发布端口1的执行单元可以进行浮点加与其它简单的操作,它使用的数学格式如下:
- 标量:单精度(32位),双精度(64位)
- 矢量:四倍单精度,2倍双精度
在端口2上的浮点执行单元可以进行标量与矢量的浮点乘法和除法。