星期三, 7月 09, 2008

Larrabee、1T Flops Cell、Fusion、GPGPU和OpenCL

嗯,最近因為Intel要在Siggraph 2008正式發表Larrabee,越來越多相關討論出現在網路上,又剛好夢遺工廠...呃,夢工廠傳出全面捨棄AMD轉向Intel的新聞,讓我想起去年七月幫已消失的PC Shopper亂寫的東西和開了四年卻一同殉情的專欄

先不管Intel三太子上身的瘋狂構想能否威脅既有的顯示卡市場(短時間內絕對不會),Larrabee對正急著在教育界推廣CUDA/Tesla的nVidia,恐怕是極為沈重的一擊,即使Larrabee是明年才會問世的產品。另外可以確定的是,Intel未來勢必會將肥大汎用核心和類似Larrabee龐大的迷你核心合而為一,Sandy Bridge會把重心放在內部的ring bus上,大概就是為了這需求吧。

我會很期待在2010年,Intel以Sandy Bridge/Larrabee為基礎的Heterogenerous many-core,對決IBM那擁有兩個新型PPE和32組SPE的Cell。接著,就等著看AMD/ATI打算怎麼跟進了,現在完全看不出來他們的真正的Fusion到底會長成什麼樣子。

至於我對一票人一頭熱的GPGPU,只有一個看法:今天顯示晶片就是因為沒有「汎用化」的包袱,才有如此簡單的控制單元結構和巨大的理論浮點效能,但現在反過來看到漂亮的規格數據,就反過來想讓它汎用化,在上面疊床架屋,去作CPU的事情,難道都沒人覺得這背後的邏輯實在很奇怪嗎?反正看看Apple提議的OpenCL能搞出什麼名堂,搞不好真有人堅持GPGPU才是人類未來運算需求的王道我是跟不上時代演進的豬頭也說不定。

Update: (2008/7/10 10:30)

錯誤 1: Sandy Bridge會把重心放在內部的ring bus上,大概就是為了這需求吧。

更正: 那不叫作 ring bus, 那只叫作 ring 或 ring architecture, 同時, 我可以很肯定的告訴你重心擺在這裡不是為了 Larabee

錯誤 2: 我會很期待在2010年,Intel以Sandy Bridge/Larrabee為基礎的Heterogenerous many-core

更正: 我只能告訴你這不對, 但是我不能透露其它資訊

Intel U.S. 某部門苦工

5 則留言:

匿名 提到...

GPGPU...

molesterwaterball 提到...

感謝,已修正。真的是腦殘了。

<(_ _)>

匿名 提到...

水球,
You know me and I know you although I don't tell you who I am.

錯誤 1: Sandy Bridge會把重心放在內部的ring bus上,大概就是為了這需求吧。

更正: 那不叫作 ring bus, 那只叫作 ring 或 ring architecture, 同時, 我可以很肯定的告訴你重心擺在這裡不是為了 Larabee

錯誤 2: 我會很期待在2010年,Intel以Sandy Bridge/Larrabee為基礎的Heterogenerous many-core

更正: 我只能告訴你這不對, 但是我不能透露其它資訊

Intel U.S. 某部門苦工

Hotball 提到...

其實 GPGPU 應該怎麼說…我想沒有人會想要用 GPGPU 去跑個 OS,或是其它根本不適合平行化的工作。

我認為 GPGPU 其實是一個幫異質性計算架構找進入點的方式。一般人根本不可能會想要花錢去買什麼 DSP 卡或 CELL 卡,所以變成傳統雞生蛋的問題。可是很多人都有買 GPU。如果 GPU 可以成為一個異質性架構的平台,那就有切入點了。軟體可以開始支援異質性架構的計算,然後特別設計的異質性架構晶片才有機會切入。

Eji的碎碎念 提到...

> 今天顯示晶片就是因為沒有「汎用化」的包袱,才有如此簡單的控制單元結構和巨大的理論浮點效能,但現在反過來看到漂亮的規格數據,就反過來想讓它汎用化,在上面疊床架屋,去作CPU的事情....

設法讓GPU多一些泛用化的功能,和「疊床架屋作CPU的事情」真的是兩回事。

GPU之所以還沒有被CPU吸收,是因為繪圖的需求還在成長,音效卡會被吸收是因為需求停頓了,所以自然被巨輪壓過。

所以GPU如果還在成長,那麼在少數overhead交換下,可以做一些額外的事情,自然user會很歡迎,因為user已經幾乎是"必定購買"性能或高或低的GPU了,GPU到目前為止是少數可以認定為"商業上成功"的co-processor,因為繪圖的需求目前還沒有看到停頓,等哪天停頓了,也不知道是多久以後的事情了。

shader透過增加thread、提高某些控制複雜度來強化延遲掩蔽能力都還是"順便"的,真的塞上x86 ISA才叫做疊床架屋。