Real World Tech討論區最近有一個討論串,主題是x86 CPU「實際的指令throughput和latency」,而充滿秘密的Prescott 64 bits執行效能又變成了北港香爐,連Linus Torvalds本人都「共襄盛舉」。參考文件如下:
Instruction latencies and throughput for AMD and Intel x86 processors
不過,姑且不論Prescott的ALU設計是否「真的有效」,這篇文件倒是提醒了很多人(包括我自己)一件事情:對於x86這種register-memory架構指令集來說,immediate addressing所牽扯到的指令decode動作、L1 cache的寬度以及ALU本身的設計,對效能都有舉足輕重的影響。
最後,真的沒想到Pentium 4的cmov,latency已經長到這副德行,還不如乖乖的用一般的branch算了。guarded execution和predication的存在,是否與SMT的概念背道而馳,也是值得關注的技術焦點。
沒有留言:
張貼留言