"It's not about perfect. It's about effort. And when you implement that effort into your life… every single day, that's where transformation happens. That's how change occurs. Keep going, remember why you started."
星期三, 1月 30, 2008
基本上,AMD Barcelona的問題,並不是「效能」(中)
Barcelona難道就只是一團糟?當然不是,在伺服器端的表現還是很不錯的,只要記憶體頻寬壓力越大、多執行緒平行化程度越高,AMD K10的優勢就越明顯。
我知道會有人拿電腦王一月號的內容來反駁我,不好意思,那些測試都是本人「指導」的,到現在,我在公司的辦公桌上都隨時有一套雙Barcelona系統在跑。我只能說,AMD K10的實力被封印了,這不單純是L3 Cache TLB bug的問題。
一言以蔽之,AMD這次最吃虧之處,莫過於他們弄出一個應用範圍太窄,而且需廠商大興土木最佳化BIOS和主機板的產品。光是一個memory要不要gauged、Node Interleave要不要Auto、PowerNow!要不要啟動,和ACPI SRAT能否發揮作用,對效率就有舉足輕重的影響,區區一個Stream記憶體頻寬測試都可以差個30%。結果AMD也沒告訴大家,要怎麼做才能tune出最好的效能。
以前AMD K8雖然也是伺服器導向,起碼還可兼顧一般桌上型的需求,K10就真的走火入魔了。
「火燒Barcelona」也暴露出AMD在製造cache的能力遠不及Intel的宿疾,這不完全是容量密度和製程的問題,關鍵在於兼顧低延遲、高容量與多核心共享,背後的branch prediction與TLB lookup更是重要。Intel在Itanium累積的豐富經驗,終於在Merom/Penryn/Nehalem世代開花結果。這是那票整天高喊「x86萬萬歲、IA-64去死」笨蛋們的小腦袋瓜絕對想不到的。
說到AMD應該放棄既有的L3 cache,仿照Intel Yonah、Merom、Penryn和Nehalem的shared L2,根據過去的經驗,一定也會有以個人電腦端benchmark看天下、腦子裡完全沒有server sense的呆瓜,堅信Intel的快取階層一定比AMD好。很不幸的,Intel的Dunnington和Beckton(Nehalem-EX)馬上就賞這些人狠狠的一巴掌,如果他們知道cache coherence和MP scalability是什麼東西的話。別指望了。
但AMD K10的cache latency實在令人失望,幾乎到了讓人絕望的程度,512kB L2來個15 cycle也就算了(拜託,等同Penryn的6MB shared L2,給Intel做大概5 cycle都不到吧),區區2MB L3給我45 cycle是想怎樣?都是我預期的兩倍以上。容量小,延遲又長,一般個人端應用程式表現當然不好了(伺服器端反而沒那麼明顯)。更讓我百思不解的是,exclusive cache還有意義嗎?完全看不出來。我甚至嚴重懷疑電腦王的Xen Server測試,快取才是AMD全軍覆沒的罪魁禍首,難道Xen Hypervisor強行啟動有bug的Nested Paging導致大量page fault?只好等待B3 Stepping才能求證了。
AMD精心打造的DPPM更帶來BIOS和主機板空前的災難,我想等Barcelona的對應產品成熟時,Intel Nehalem也差不多該問世了。確定延期到明年第一季的Shanghai,在加大到6MB的L3 cache,和第二季L2加倍至1MB的Montreal之外,更該好好的改善cache的效率,否則AMD一點勝算都沒有。
聽說native octalcore的AMD K11 "Bulldozer"將延續類似K10的512kB L2 per core和8MB shared L3,AMD究竟會不會導入SMT來hide cache latency呢?頗值得期待。
無論如何,瑕不掩瑜,Barcelona都是了不起的技術成就,AMD做了太多Intel和IBM都不敢做的事情。但在這之前,AMD還是得先證明Barcelona的價值,而不是放任白痴媒體和無知鄉民把投資兩年的心血結晶講的比垃圾還不如。
星期二, 1月 29, 2008
過年日本行終於敲定了
「台灣真是民不聊生 所以大家都出國過年 家裡繳不出水電費 所以到溫泉民宿過年 房屋繳不起貸款被查封了 所以到飯店過年 -- 機位/民宿/飯店全部客滿..amen」上週的MSN對話:
某人:是藍軍大勝要去日本宣揚國威嗎?言歸正傳,本次四人行:本痴漢、春日、Toki和Sheep,六天五夜(原本還規劃十天九夜的,越想越火)。
水球:搞不好一堆整天抱怨經濟不好民不聊生的人就跑去擠爆東京了...
2/3:日亞航EG200,早上10:00起飛,日本時間13:55降落,Tokyo Dome Hotel,晚上則是第N屆水球東京河豚大食團(with後藤弘茂and笠原一輝,希望AirL也有空)。
2/4:前進鬼怒川!下午閒晃鬼怒川,晚上住在鬼怒川觀光Hotel別館,泡溫泉泡到全身軟掉。
2/5:懷念的日光一日行,傍晚回東京,進駐New Otani Hotel。晚上計畫未定。
2/6:某人專車接送一日行(橫濱/神奈川一帶,未定),晚上年夜飯。
2/7:未定(輕井澤?)。
2/8:未定,晚上搭日亞航EG209回台。
唯一確定的是:這次絕不踏入秋葉原半步!
星期日, 1月 27, 2008
星期四, 1月 24, 2008
星期一, 1月 21, 2008
基本上,AMD Barcelona的問題,並不是「效能」(上)
主要是看到Mobile01這篇豪(洨)文和下面一串不知所云的回應,有感而發,要不是這周有點忙(太多拖延的工作堆積如山),大概會寫個數千字吧。
這裡先不提結論,先看看AnandTech的數據,特別是注意memory bandwidth & cache hierarchy和multi-core/multi-processor scalability之間的相互關係。
其實該講的,我過去都在無數文章都講的差不多了。
[週一中午前的豪洨對話]這一切都是民進黨害的
因為雪山隧道又被一堆該死的台北俗人塞住了 所以在礁溪泡溫泉喝酒搞到十二點才出發回台北....
waterball@Gigabyte NCBU:女子 火頁 口牙! 說:
=_=
還好沒跟你一起去花蓮
要不然我今天大概就會在辦公室陣亡了
御宅族美食達人 說:
不會啊...今天一早又精神飽滿一柱擎天了...哈哈哈
waterball@Gigabyte NCBU:女子 火頁 口牙! 說:
昨日經典場景:
「別吵!男主角已經把女主角脫光了!」這是昨天下午和某個看小說的人在天母某家店豪洨時,突然爆出的一句話。
御宅族美食達人 說 (上午 11:47):
神經病....
叫他多喝二杯吧..
waterball@Gigabyte NCBU:女子 火頁 口牙! 說 (上午 11:47):
台灣真的很民不聊生
窮苦到台灣人都過年沒錢留在台灣,只能去東京晃
waterball@Gigabyte NCBU:女子 火頁 口牙! 說 (上午 11:48):
到現在我回程機票都還沒搞定
御宅族美食達人 說 (上午 11:48):
窮苦到假日就開車到處糟蹋風景名勝
waterball@Gigabyte NCBU:女子 火頁 口牙! 說 (上午 11:49):
對呀
台灣果然物價太高了
waterball@Gigabyte NCBU:女子 火頁 口牙! 說 (上午 11:51):
我們只能去東京消費
御宅族美食達人 說 (上午 11:51):
雪山隧道昨天塞到十一點多....可見大家太窮苦了坐不起火車...只能買汽車來坐
waterball@Gigabyte NCBU:女子 火頁 口牙! 說 (上午 11:51):
這段對話真該貼上我的 blogf
blog
御宅族美食達人 說 (上午 11:51):
因為太窮苦了所以沒錢繳瓦斯費只好去洗溫泉
御宅族美食達人 說 (上午 11:52):
貼啊..又不收你錢
御宅族美食達人 說 (上午 11:53):
還有很多人 為了節省電費和水費開銷 只好一到假日就開車到鄉下去住民宿...都是該死的民進黨害的...
御宅族美食達人 說 (上午 11:55):
最近常看到礁溪的馬路一到假日就塞到不能動....幾千台車在那裡停著....這就是雪山隧道給礁溪的"發展"
waterball@Gigabyte NCBU:女子 火頁 口牙! 說 (上午 11:56):
蘇花高一起來
花蓮人就知道會怎麼災系了
星期六, 1月 19, 2008
[轉錄]洨言洨語:如何解釋近代戰爭的勝負
一句話:領導人的頭髮數量
希特勒雖然頭髮不少,但是史達林的頭髮更厚
所以德國輸給蘇聯羅斯福和邱吉爾的頭髮都很薄,但是加起來就贏希特勒了
所以西線英美聯軍會打敗德軍在諾曼地登陸中,隆美爾和艾森豪都是光頭
不過艾森豪加上有頭髮的蒙哥馬利就贏了至於墨索里尼是個光頭,所以打得比德國更土
在太平洋戰場,光頭的東條英機自然會輸給有頭髮的羅斯福
可是在中國戰場,東條和老蔣都是光頭,所以兩方會在中國陷入互角態勢戰後的國共內戰也一樣,地中海的毛澤東當然可以打贏寸草不生的蔣光頭
韓戰時因為李承晚和金日成都有頭髮
所以打了半天還是打回38度線,因為兩個都沒有一個特別會掉頭髮在古巴飛彈危機時,還好甘迺迪的頭髮超厚
壓過卡斯楚和赫魯雪夫(光頭)才讓美國佔了上風在1991年,因為老布希的頭髮比戈巴契夫多很多,所以蘇聯解體了
[胡言亂語]閒聊又被冷飯熱炒的虛擬化
Will Hyper-V Make VMware This Decade's Netscape?
嗯,ServerWatch還真是努力的炒作虛擬化議題呀!不過我自己好像沒什麼資格講這句話,看過一月號電腦王的鄉民,大概都猜出我協助他們幹出什麼好事了。幹,好累啊!
最近大概因為Windows Server 2008的Hyper-V "Viridian",類似「VMware是否將變成另一個Netscape,被微軟作業系統內建的免費(雖然Hyper-V目前還不是免錢的...)功能打垮」的論調,並不讓人意外的,成為眾人想當然爾的聯想方向。
基本上,目前這票以x86為主的虛擬化解決方案,有兩個值得觀察的面向,一個是Hypervisor的相容性與效率,另一個則是管理機制。
和某些人提倡的「虛擬化可降低對紛亂硬體規格的相依性,提高作業系統的可靠性」相反,天底下沒有白吃的午餐,當簡化VMM的複雜度時,其實更貼近底層硬體的Hypervisor,反而更加要求更嚴謹的硬體相容性,特別是VT-x/AMD-V所支援的相關管理指令和輔助硬體功能。
我知道一定有搞不清楚狀況、對「虛擬化」和「Hypervisor」的認知只限於這兩個名詞的人,看到這段會嗤之以鼻。那怪了,請問一下,既然Hypervisor虛擬化是這麼簡單的東西,可以把任何硬體issue丟到一旁,Intel和AMD幹嘛為了動態移轉去自找麻煩制定FlexMigration與Extended Migration?我也非常好奇,等Intel Nehalem出現後,那票虛擬軟體廠商會怎麼同時支援Intel的EPT和AMD的NPT,又將怎麼處理Intel VPID與AMD Tagged TLB這兩種對共用TLB截然不同的處理方式,Intel的VT-d和AMD未來RD890晶片組的IOMMU更是值得一看的好戲。
這是我和那堆VMM奮戰兩個多月的唯一感想,硬體規格混亂的x86世界難以導入IBM S/360三十多年前就具備的能力,並不是沒有理由的。不信?自己去玩一下Hyper-V和Xen,看看有哪些OS是根本打死就ACPI發春不給你裝上去的?
看在一狗票即將登場I/O及memory虛擬化技術的份上,效率倒不見得是值得擔心的問題,反倒是CPU廠商如何加快管理指令的執行效能,提高VM context switch的速度,才是最重要的課題。Intel的Penryn family之所以能規格處於劣勢的Xen Server虛擬化多VM I/O測試暫時擊垮AMD的BagalonaBarcelona,原因不外乎多重VM切換的表現。當然,虛擬軟體廠商對Intel VT-x/AMD-V態度有別的最佳化程度,也是另一個關鍵。
凌駕在眾多技術名詞之上的,就是對企業產生真正value的「管理」,例如有效建立server farm/pool和動態移轉/熱備援等,但這並不代表把管理介面做的很華麗很容易上手,就可把技術因素統統束之高閣,目前最大的瓶頸,在於後端儲存系統的壓力。
請回憶一下,VMware的VMtion要求SAN storage,而系出同源Xen Server的Xen Motion Live Migration與VirtualIron的LiveMigrate指明要iSCSI storage,原因何在?VM的執行狀態太肥了。事實上,精簡並切割VM的狀態資訊,擺脫對高效能儲存後端及高速網路的倚賴,已是所有軟硬體廠商鴨子滑水的努力目標,甚至日後的OS都得一起「VM-aware」,Windows 7披露的未來方向,早就透露出不少端倪。
最後,大家就等著看,美國時間2月27號,與台灣四月底的Windows Server 2008發表會,眾多媒體和分析師三太子上身的精彩表演吧。
星期四, 1月 17, 2008
星期六, 1月 12, 2008
既然嫌微軟貴,那為何乾脆不用?
感想:你們這些人就是心甘情願的被微軟綁死,讓他們坐大躺著賺,才在一邊哭窮一邊鬼扯「這是必需品」再靠盃靠木啥洨「微軟應該降價」。一句話,這種行為叫做「犯賤」。
一堆國家都在推動自由軟體的普及化,難道你們眼中都看不到?我到現在還是無法理解幹嘛連一個簡單的文件都要用MS Office?在iThome當了三年半的技術編輯,99%的工作都是靠Open Office完成的,也沒感覺到有什麼地方不好用,而且速度又快,更沒有Office 2003那一堆老是修不好的小bug。
要逼迫微軟降價?很簡單,開始導入自由軟體,在校園種下讓微軟不再壟斷的種子,自然就會讓步了。
不過看來這票人還是會繼續犯賤下去,唉。
星期四, 1月 10, 2008
星期三, 1月 09, 2008
四字熟語メーカー
那...我的四字熟語有哪些?
痴漢水球を表す四字熟語
水球を表す四字熟語
土匪水球を表す四字熟語
白爛水球を表す四字熟語
Waterballを表す四字熟語
waterballを表す四字熟語
Waterball.liuを表す四字熟語
waterball.liuを表す四字熟語
劉人豪を表す四字熟語
嗯,還是專心上班好了...orz
星期一, 1月 07, 2008
[洨話連篇]讀者投書,據作者說這篇只花不到45秒寫出來的
大概昨天晚上趕報告, 管壓太大所以有不正常想法...某人真的是太
我跟你到一間酒店, 但從沒有印像是那間 (都不是我有去過的),
原本一直喝酒聊天聊的很娛快, 直到聊到偽蛇第四個小孩子...
就忽然開始發起酒瘋, 衝到櫃臺裡面去把女店員裙子脫下來就上了..
然後好像什麼事都沒發生一樣的走回來說 "沒事 大家繼續"..
然後警察來了, 夢就醒了 XD
警察來了店裡後把我跟水球都帶走了, 以下是水球在警局的筆錄:
你們在酒店喝了什麼?
"青海的草原"
有什麼感覺?
"一眼看不完"
你知道你強姦了誰??
"喜瑪喇雅山"
形容一下那個人
"峰峰相連到天邊"
你知道那人什麼背景嗎?
"古聖和先閒"
你知道他們做了什麼?
"在這裡建家園"
你是在什麼情況下犯案的?
"風吹雨打中"
犯完案後的感覺?
"聳立五千年"
你家住那?
"中華民國~ 中華民國~ "
你知道你會被關嗎?
"經的起考驗"
你知道你會被關多久?
"只要黃河的水不斷"
我要你父母或你親友的住址電話
"中華民國~ 中華民國~ "
你還有打算強姦別的小姐?
"千秋萬世 直到永遠"
星期四, 1月 03, 2008
兩篇「看起來很重要」的patent
Register renaming for dynamic multi-threading (Intel)
A register renaming technique for dynamic multithreading. One disclosed embodiment includes a register map to store up to M.times.N values to map M registers for N threads. A set of N values, one per thread, and a set of state bits is associated with each of the M registers. Each set of state bits indicates which of the N values per register are valid and whether ones of the N sets of values have been written by a dynamic execution thread. In response to termination of a dynamic execution thread, recovery logic may update state bits associated with ones of the M registers that were written to during dynamic execution.
Across-thread out of order instruction dispatch in a multithreaded graphics processor (NVIDIA)
Instruction dispatch in a multithreaded microprocessor such as a graphics processor is not constrained by an order among the threads. Instructions are fetched into an instruction buffer that is configured to store an instruction from each of the threads. A dispatch circuit determines which instructions in the buffer are ready to execute and may issue any ready instruction for execution. An instruction from one thread may be issued prior to an instruction from another thread regardless of which instruction was fetched into the buffer first. Once an instruction from a particular thread has issued, the fetch circuit fills the available buffer location with the following instruction from that thread.
星期二, 1月 01, 2008
友人遺失相機,請眾人協尋
遺失物:
機器: 400D 日本版( Canon EOS kiss digital X) 含垂直手把
機器序號: 1310812474
包包:Lowepro Orion Trekker II 黑色
含有sigma 18-50/f.28, Tamron A09 (28-75/f2.8)兩個鏡頭(品相都不是很好)
sandisk exterm III 8GB CF卡
12個sanyo 低自放電池
遺失區域:
從小巨蛋附近的敦化國小出發,長安東西路到承德路這一段。
如果上二手網站看到以下情況請注意:
一、有人賣手把只有AA電池模組沒有Li電池模組。
二、有人賣相機卻沒法附上保證書有序號的日本保證書、說明書、光碟。
三、品相非常不好的那兩個鏡頭。
請各位網友協尋。沒想到2008第一篇竟然是這種事情...Q_Q