星期四, 12月 29, 2005

日本冬季戰役之第二日:Comiket 69第一天




對我而言,Comiket的開場,永遠都是車站懸吊的大型掛報。




如果人不多,就不叫做Comiket了。





拍攝這張照片時,已經接近下午4:50分,距離Comiket商業區結束僅不到十分鐘了。但是,其他的「最後尾」都一個一個陸續消失,只剩下一群熱愛なのは的人們,死守到最後一刻。



曲終人散,Comiket結束時的Big Sight,以及臨海線國際展示展車站。






最後,這是今天在なのはA's Project企業攤排隊五小時又十分鐘的最後戰果,四本設定集和三位魔法少女的馬克杯,我應該會拿一些出來當作送人的謝禮吧。

下面是我寫在巴哈的文章,不要懷疑,這一切都是真的。
姑且不講那麼多啦....

今天 Comiket 69,各位知道なのはA's Project 企業攤,本痴漢花了多少時間去排隊嗎?

五小時又 10 分鐘,從上午 11:44 到下午 16:54,當整個西地區四階的外場幾乎空無一人時,只剩下なのはA's的排隊人潮而已。

然後排隊的人幾乎沒有減少,前後左右都在熱烈討論這部作品的內容,甚至 Comiket 的場內人員都跑來關切。我不清楚為何整個排隊人潮一直停滯不前,但是我所看到的排隊者,甚少有放棄者。本痴漢也是又冷又餓又鱉尿幾小時,給他硬撐下去。換句話說,第一天就整個獻給這幾個小女生了。

我只能說,這部作品受歡迎的程度,真的遠超過我自己的想像。

棍!羅莉控真多!
這是我第四次Comiket,也是第一次參加冬季Comiket,沒想到熱血的程度,較夏季有過之而無不及。真不愧是日本人。

日本冬季戰役之第一日



在新宿一下月台,馬上就看到這張海報,對我等族類真是當頭棒喝。

當然,到了日本,河豚一定是免不了的,雖然12/30已經預定水球東京大食團,但是飢渴難耐的我,硬是拖著隨行的春日一起去Torafugu新宿本店大吃一頓,吃到將近十二點才離開。

日幣12250就這樣飛了。
















最後,明天Comiket 69終於有機會使用七大武器之首-折凳。千萬不要小看這張折凳,這是我去年Comiket 66第一天晚上在秋葉原買的,本來打算當作後面兩天早上排隊之用,結果我竟然後面兩天都睡過頭了!折凳無用武之地。所以,我就下定決心,一定要在Comiket的入場排隊中使用這張折凳!請各位痴漢祝福我吧!

不過,我為何要替某個艦長控去Comiket搜括泰莎同人本啊....

星期三, 12月 21, 2005

日本行程敲定!


時間:12/28-1/5

12/28出發,國泰航空,中午12:45起飛,日本時間16:45降落
12/29冬コミ
12/30冬コミ,晚上舉辦水球東京大食團,與日本同行餐敘
12/31到處晃,迎接跨年
1/1到處晃
1/2殺去日光進行雪地溫泉之旅
1/3回東京,到處晃
1/4到處晃
1/5回台灣,國泰航空,下午15:40起飛,台灣時間18:35降落

旅館:

12/28-1/1新宿華盛頓本館
1/2日光美川民宿
1/3-1/4新宿京王廣場

預算總額:扣掉日光那晚(約日幣一萬六),一個人28885元。

[網友投稿]OOO & SMT

這是某位大濕級人物的投稿,可以參考一下。
「這可以當作論文題目了,當然最好是可以寫個模擬器(這樣一來並不適合專欄)。不過要是我的話,我會把重點放在增加thread個數,減少thread的平均latency,而不是像Intel一樣一直增加OOO on the fly的instruction entry。

原因喔...既然沒辦法完全解決RAW的問題,而指令latency又一直拉長,在本來就要排隊的情況下,幹嘛又額外浪費一堆電路空間專門做插隊的行為...

而PPC指令的latency範圍本來就不會像x86這麼廣,也沒必要做得像。x86這麼複雜(禍首是x87啦...),做到可以cover某個指令最長的latency即可(cache/memory access latency是另外一個問題)。另一個潛在的論文題目則是「SMT下的cache overhead optimization with OS support」。

至於Altivec 256bit版本,這是很重要的東西,絕對要做啊。XD」
以上言論不代表本痴漢立場。XD

星期二, 12月 20, 2005

IBM Power6的全貌

Real World Tech的David Kanter發表了一篇介紹IBM Power6處理器的文章「An eCLipz Looms on the Horizon」,簡而言之,Power6的規格有幾個重點:

.65nm製程,原先預定2006年推出,近期時程表延期至2007年。
.超高時脈架構(Ultra High Frequency),2006年第三季到達4.8GHz,簡化過的P6L(Power6 Light,可能是單核心版本)在2006年第二季可達到5.5GHz,在2007年第三季,mainframe及高階伺服器版本Z6/eCLipz時脈介於4GHz至4.4GHz。不過根據新版時程表,在2007年的最高時脈也僅有4GHz至4.5GHz。
.對應「eCLipz」計畫,透過binary translation以及部份的硬體支援,將長期使用S/360指令集的zSeries轉移至Power處理器。
.電晶體數目約為750M。
.可能和Power4/5一樣是雙核心的晶片,也有可能是四核心。
.每個核心的L1 D-cache為64kB,8 way set associative。
.每個核心各自擁有獨立的L2 cache,總容量介於6MB至12MB。
.所有核心共用外部的L3/L4 cache。
.Power6核心採用4 issue的超深管線設計,具備OOOE能力,但規模僅有PowerPC 604e的等級。
.採用SMT架構,每個核心支援2條同步多執行緒。
.記憶體頻寬是Power5的兩倍,約為32GB/s。
.為了支援mainframe,提供10進位整數格式。
.支援VMX、虛擬機器架構指令,以及ViVA-2向量指令集延伸規格。
.根據作者的推測,Power6的SPEC CPU 2000效能表現可以達到現有Power5+的兩倍水準。

這樣子,IBM採用Ultra High Frequency的目的就很明顯了:透過高時脈去改善執行mainframe軟體的效能。不過,IBM mainframe的效能優勢並非CPU,而是強大的I/O系統和虛擬化能力。IBM是否可以順利的將mainframe轉移到Power上,而且說服客戶更換系統,並不是簡單的工作。

星期四, 12月 15, 2005

ACK-230入手



桌面空間是省了不少,不過用慣了UltraNav,使用這種「傳統」的鍵盤,真的感覺很吃力。

星期日, 12月 11, 2005

"Is Out-Of-Order Out-Of-Date?"

這篇文章我原本發表在部落格分部,不過因為那套pLog系統實在是太爛了,讓我整篇文章費了九牛二虎之力、甚至還被迫用Google Desktop把暫存檔挖出來,才順利張貼成功,弄得一卵葩火,所以乾脆也貼到這裡。如果再沒改善,我會認真評估撤掉第二個blog的可能性。

昨天hotball兄的文章,讓我回想起五年前的往事。

這標題,原本是在2000年In-Stat/MDR的Microprocessor Forum中,HP的William Worley與Jerry Huck所共同發表的文章。他們認為,現有處理器的OOO(Out-Of-Order)機制與RISC指令集皆早已不合時宜,指令集應該提供 compiler發掘更高parallelism的空間,當然毫無意外的,這個指令集就是IA-64。後來IBM的Martin Hopkins同時發表"A Critical Look on IA-64",從code density的角度強烈批判IA-64的必要性,其中某段話還被P&H第三版收錄為第四章的引言。他講了什麼,應該不需要我提醒了。

不過,姑且不論IA-64到底好不好、有沒有必要投入如此之高的resource去追求ILP(雖然有人認為IA-64的精神,是為了追求「thread內部的parallelism」)、現有的RISC是否真的落伍,現在看來,OOO似乎真的已經出現"Out-Of-Date"的跡象。

Google的Luiz André Barroso發表了一篇名為"An Economic Case for Chip Multiprocessing"的文章。簡而言之,他認為未來的資料中心不需要OOO,而應採用大量簡單的In-Order CPU。這篇文章的重點大致如下:

.耗電量已經成為伺服器重要的成本因素,但近年來處理器廠商(包含Intel、AMD和IBM)所努力宣揚的Performance/Watt,卻一直停滯不前。以低階x86伺服器來說,只要使用四年,電費成本就高達硬體採購成本的40%。

.為了攤平硬體研發成本,往往個人電腦所使用的桌上型處理器和伺服器處理器採用相同的核心,例如AMD Opteron和Athlon 64都是K8微架構、Intel Xeon與Pentium 4皆為NetBurst、IBM PowerPC 970沿用Power4等等。但事實上,兩者的應用環境有很大的差異,伺服器環境不但需要較高的TLP(Thread Level Parallelism),而且也早已具備大量高度平行化的應用程式,個人市場則反。換言之,目前這些伺服器處理器,並不見得適合「實際上的應用」。

其實Luiz André Barroso本人在DEC/Compaq時,就是負責Piranha計畫,採用8個簡單的in-order/single issue的Alpha處理器,整合理論頻寬12.8GB/s的Direct Rambus記憶體控制器與Protocol Engine,以追求TLP的效能與最高的Performance/Watt。

後來正如大家所知道的,Alpha死掉了,Piranha計畫無疾而終,但現在很多人應該也注意到了,Sun的Niagara與RMI的XLR就是這種觀念下的產物。近期盛傳Sun正與Google洽談Niagara系統的生意,看來並不是空穴來風。

現在不少人就在猜測,一直堅稱OOO結合SMT仍具備高度效益的IBM,會不會真的把超高時脈的Power6作成in-order。如果沒有意外,明年二月的ISSCC 2006就可以看到答案了。

同樣的一個標題,相隔五年,意義竟然是如此的大不同。

星期二, 12月 06, 2005

冬季日本行程正式拍板定案

時間:12/28-1/5

12/28出發
12/29冬コミ
12/30冬コミ,晚上舉辦水球東京大食團
12/31可能去崎玉縣探望某位爆肝破病的日本鬍子大叔,晚上迎接跨年
1/1到處晃
1/2殺去日光進行雪地溫泉之旅
1/3回東京
1/4到處晃
1/5回台灣

奧日光湯之湖,我又來了!