這裡先不提粗質多執行緒和細質多執行緒。
SMT的先驅:DEC Alpha 21464。
特色:加倍執行單元數,跑4 Thread,如果程式平行化程度夠高,單一thread可以享受到超過一顆CPU的資源。用來提高既有CPU執行單元利用效率的窮人SMT:Intel NetBurst的HyperThreading,(雖然Intel Itanium從Montecito也沿用這個名詞,但那是coarse-grained MT,不是SMT)Fujitsu SPARC64 VII也導入這種SMT。
特色:沒有特色,就這樣了。這應該不需要解釋了,IBM POWER5是最具代表性的象徵。為了追求最高的電晶體及功耗利用效率,從1999年一月的某份專利開始,AMD拖了超過十年,終於公佈「K7正統後繼者」的真正模樣,被弱化的FPU由GPU補足,但和標準雙核心相比,縮減60%的ALU執行單元寬度該如何彌補呢?這就讓人不得不好奇Bulldozer的時脈了。
2 則留言:
21464根本沒有出來嘛,相同概念的東西做出來的也就是Power7了,4 Thread與翻倍的FPU。
然后Cluster MT的概念,Rock也是吧,而且更復雜,4 Core共享2 FPU,每個Core 2 Thread。至于結果,似乎是21464的命運再現。
而Bulldozer弱化FPU靠GPU的說法,我不贊同,畢竟Bulldozer的FPU是翻倍的,單一Thread可以享受到超過單CPU的FPU資源。相比縮水的ALU部分,FPU部分的設計才是水球兄所認同的SMT吧。丿
我覺得喔 bulldozer的設計思想應該偏向于SpMT 所以ALU數量并不是重點
張貼留言