星期三, 1月 30, 2008

基本上,AMD Barcelona的問題,並不是「效能」(中)

從K10 "Barcelona"的Opteron和Phenom發表至今,除了有認真做伺服器測試的AnandTech,只要是DIY導向的雜誌與網站,大概都沒留給AMD幾句好話,蓄意嘲弄興災樂禍棒打落水狗者比比皆是。

Barcelona難道就只是一團糟?當然不是,在伺服器端的表現還是很不錯的,只要記憶體頻寬壓力越大、多執行緒平行化程度越高,AMD K10的優勢就越明顯。

我知道會有人拿電腦王一月號的內容來反駁我,不好意思,那些測試都是本人「指導」的,到現在,我在公司的辦公桌上都隨時有一套雙Barcelona系統在跑。我只能說,AMD K10的實力被封印了,這不單純是L3 Cache TLB bug的問題。

一言以蔽之,AMD這次最吃虧之處,莫過於他們弄出一個應用範圍太窄,而且需廠商大興土木最佳化BIOS和主機板的產品。光是一個memory要不要gauged、Node Interleave要不要Auto、PowerNow!要不要啟動,和ACPI SRAT能否發揮作用,對效率就有舉足輕重的影響,區區一個Stream記憶體頻寬測試都可以差個30%。結果AMD也沒告訴大家,要怎麼做才能tune出最好的效能。

以前AMD K8雖然也是伺服器導向,起碼還可兼顧一般桌上型的需求,K10就真的走火入魔了。

「火燒Barcelona」也暴露出AMD在製造cache的能力遠不及Intel的宿疾,這不完全是容量密度和製程的問題,關鍵在於兼顧低延遲、高容量與多核心共享,背後的branch prediction與TLB lookup更是重要。Intel在Itanium累積的豐富經驗,終於在Merom/Penryn/Nehalem世代開花結果。這是那票整天高喊「x86萬萬歲、IA-64去死」笨蛋們的小腦袋瓜絕對想不到的。

說到AMD應該放棄既有的L3 cache,仿照Intel Yonah、Merom、Penryn和Nehalem的shared L2,根據過去的經驗,一定也會有以個人電腦端benchmark看天下、腦子裡完全沒有server sense的呆瓜,堅信Intel的快取階層一定比AMD好。很不幸的,Intel的Dunnington和Beckton(Nehalem-EX)馬上就賞這些人狠狠的一巴掌,如果他們知道cache coherence和MP scalability是什麼東西的話。別指望了。

但AMD K10的cache latency實在令人失望,幾乎到了讓人絕望的程度,512kB L2來個15 cycle也就算了(拜託,等同Penryn的6MB shared L2,給Intel做大概5 cycle都不到吧),區區2MB L3給我45 cycle是想怎樣?都是我預期的兩倍以上。容量小,延遲又長,一般個人端應用程式表現當然不好了(伺服器端反而沒那麼明顯)。更讓我百思不解的是,exclusive cache還有意義嗎?完全看不出來。我甚至嚴重懷疑電腦王的Xen Server測試,快取才是AMD全軍覆沒的罪魁禍首,難道Xen Hypervisor強行啟動有bug的Nested Paging導致大量page fault?只好等待B3 Stepping才能求證了。

AMD精心打造的DPPM更帶來BIOS和主機板空前的災難,我想等Barcelona的對應產品成熟時,Intel Nehalem也差不多該問世了。確定延期到明年第一季的Shanghai,在加大到6MB的L3 cache,和第二季L2加倍至1MB的Montreal之外,更該好好的改善cache的效率,否則AMD一點勝算都沒有。

聽說native octalcore的AMD K11 "Bulldozer"將延續類似K10的512kB L2 per core和8MB shared L3,AMD究竟會不會導入SMT來hide cache latency呢?頗值得期待。

無論如何,瑕不掩瑜,Barcelona都是了不起的技術成就,AMD做了太多Intel和IBM都不敢做的事情。但在這之前,AMD還是得先證明Barcelona的價值,而不是放任白痴媒體和無知鄉民把投資兩年的心血結晶講的比垃圾還不如。

7 則留言:

斜陽照 提到...

我把你的絕望放在這裡
http://d.veryxd.net/deptexts/show/2267

匿名 提到...

我是不懂如何測試啦,不過這位 Neal Nelson 的 AMD vs. Intel 測試結果請看看對不對...

http://www.worlds-fastest.com/wf8000.html

sutl 提到...

如果需要廠商最佳化BIOS與主機板,那AMD就應該出個示範用的公版才對啊!

匿名 提到...

http://forum.gamer.com.tw/C.php?bsn=60030&snA=106952&locked=F&page=1&gothis=637081#637081

巴哈姆特的某偉大鄉民?
MeridiaN
(珀爾塞福涅)
常常以(滯)程來褒I扁A...

匿名 提到...

HighK/Matel gate 並不算是改變 CMOS 的結構,只是改變所用的材料而已,電晶體結構的改變是在初代電晶體到半導體製程這個階段,之後都只是改變所用的材料跟製程,如果說有什麼結構改變的情況發生,應該又是一個諾貝爾獎了

HighK/Matel gate 的確是個突破,但並沒有那麼偉大就是

匿名 提到...

呼應樓上的,確實「HighK/Matel gate 並不算是改變 CMOS 的結構,只是改變所用的材料而已」,有篇文章可以加減參考:http://tech.digitimes.com.tw/ShowNews.aspx?zCatId=416&zNotesDocId=0000077676_B8H62P7E886ARBS7CFZ5M

匿名 提到...

請問關於這篇"基本上,AMD Barcelona的問題,並不是「效能」(下)"什麼時候會看到,很期待。