星期六, 8月 22, 2009

「終於」有人注意到GPU是否應該支援ECC的問題了...

The Case for ECC Memory in Nvidia’s Next GPU

想當年Virginia Tech那台用1100台PowerMac G5組成的Terascale Supercluster,就因為沒有memory ECC引起軒然大波,後來就乖乖換成Xserve了。

不過倒不只以今日觀點來看已略嫌不足的memory ECC,這些GPU的所有內部記憶體(總覺得中國對記憶體的翻譯「內存」在這邊很適用),包含register file和on-chip cache的可靠性,統統都會被打上一個大問號。因為從最初的產品設計需求、設計工具,一路到後端的製程與驗證,這些考量,GPU一應俱缺。

人家IBM POWER/Z series、Intel Itanium、Fujitsu SPARC64,就是貴在這裡。要做出高可靠度的GPU,我還覺得AMD比較有機會,畢竟這部份他們已經很有經驗了,只是看市場何時可以普遍接受用GPU疊出來的大型超級電腦。更何況,AMD其實也沒必要這麼急,讓NVIDIA來當開路先瘋就好了,還是快點生出Fusion比較實際。

BTW,幾年前曾在舊金山和David Kanter喝酒聊天過,不知道他本人近況如何...我好久沒去米國IDF了啊啊啊啊啊~
張貼留言