目前確定Tejas和Prescott的相異點如下:
TDP 150W-166W
最高時脈4.6GHz-5GHz
Trace cache從12k uOp(128kB SRAM)→16k uOp(?)
L1 D-cache從16kB→24kB
L2 cache從1MB→2MB
加入TNI(SSSE3,Intel Compiler中的QxT項目)
這比較讓人吐血:decoder加倍
但這樣還是不能解釋如此巨大的理由,因為Prescott 2M也只有135mm^2,1MB L2僅多出23mm^2,那剩下的78mm^2跑到哪裡去了?
早上和鬍子大叔在MSN上討論了一下,因就他所知,Tejas「似乎」管線結構有重大變化,所以可能性如下:
一、Tejas核心支援四條SMT,或著導入SpMT。
二、增加執行單元和physical register數,導致uOp加長。
三、看在decoder加倍的份上,我強烈懷疑Tejas的trace cache每條cache line是4 uOp,每cycle可issue一條(Prescott是6 uOp per cache line,兩cycle一條)。
四、最後,Trace cache的SRAM容量激增到200kB,甚至更多。
話說回來,都tape out了才取消,Intel的動作也未免太慢了。可惜弄不到Tejas的樣品來玩玩...不過就算弄到跑起來了,我也不能講啊,ㄎㄎ。
但這樣還是不能解釋如此巨大的理由,因為Prescott 2M也只有135mm^2,1MB L2僅多出23mm^2,那剩下的78mm^2跑到哪裡去了?
早上和鬍子大叔在MSN上討論了一下,因就他所知,Tejas「似乎」管線結構有重大變化,所以可能性如下:
一、Tejas核心支援四條SMT,或著導入SpMT。
二、增加執行單元和physical register數,導致uOp加長。
三、看在decoder加倍的份上,我強烈懷疑Tejas的trace cache每條cache line是4 uOp,每cycle可issue一條(Prescott是6 uOp per cache line,兩cycle一條)。
四、最後,Trace cache的SRAM容量激增到200kB,甚至更多。
話說回來,都tape out了才取消,Intel的動作也未免太慢了。可惜弄不到Tejas的樣品來玩玩...不過就算弄到跑起來了,我也不能講啊,ㄎㄎ。
3 則留言:
有看到在Oregon的Jones Farm
有展示這個CPU
掛在牆上亂孤單的 呵呵
PCDVD某神人手中有Tejas 但不知他丟掉沒
如果有機會,我是真的很想測測Tejas,起碼可以計算出指令throughput/latency和cache hierarchy等,或多或少猜出整體架構的全貌。
張貼留言