前言:Intel的新一代桌機CPU "Nova Lake" 總算終結了歹戲拖棚多年的「大小核之亂」,讓Intel的CPU終於再度成為筆者下一台桌機的選項 (雖然筆者從不覺得桌機需要大小核這種邪門歪道),不過看在現在記憶體和SSD價格因為缺貨亂漲的份上,現在這台只能跑Windows 10的老機器,大概起碼等撐到2026年10月14日延伸性安全更新 (ESU) 結束之後了。
順便一題,這篇文章是使用Google Gemini產出初稿,並且有高達80%的可用內容,我只能說,搞不好OpenAI真的會步上Netscape的後塵。
淺談Intel的Nova Lake:APX與AVX10.2,與遺珠之憾x86-S
指令集架構 (ISA, Instruction Set Architecture) 作為電腦的基本「語言」,軟體與硬體之間的界面 (Interface)。Intel新一代桌面CPU Core Ultra 400系列 "Nova Lake" (與新一代伺服器的Xeon 7 "Diamond Rapids") 將是x86指令集架構發展史上的重要里程碑,其亮點在於支援AVX10.2指令集與APX (Advanced Performance Extensions),不僅提升性能,更是Intel為了現代化x86架構、解決混核架構的指令集碎片化問題,以及對抗ARM架構高能效與快速產品研發的雙重優勢,所做出的「關鍵戰略調整」,或著說「補破網」也並不為過。
這兩項技術的意義,可以從以下三個層面解讀。
AVX10.2:結束大小核的「指令集分裂」
自第12代Core "Alder Lake" 引入混核 (Hybrid Architecture) 以來 (講的更嚴格一點,更早是2020年的實驗性產物 "Lakefield"),由於小核E-Core不支援AVX-512,導致Intel被迫在消費級產品中屏蔽該功能,造成了指令集的碎片化,也激起開發者的不滿,如知名的Linux之父Linus Torvalds。
統一向量指令集:繼大核限定的AVX10.1 (起自於Xeon 6 "Granite Rapids" 家族),AVX10.2允許大核P-Core和小核E-Core支援相同的512 bit SIMD指令集。雖然小核E-Core的內部運算單元可能被限制在256 bit寬度,而P-Core可馬力全開跑512 bit,但軟體開發者只需編寫一次代碼,即可在兩種核心上運行。至於為何Intel過去不乾脆師法AMD,透過「偷吃步 (資料路徑砍半)」的方式去在E-Core實做AVX-512,繞了AVX10這個遠路,其背後原因就不得而知了。
強化AI與浮點運算:這讓Nova Lake的所有核心都能參與高強度的AI推論與科學運算,釋放了混合架構的完整潛力,最起碼,不會像過去那樣活活搞死自己。
APX:x86指令集架構的「現代化」與能效革命
APX的引入被視為x86指令集架構數十年來最大的變革之一,將通用暫存器 (GPRs) 的數量從x64的16個增加到32個,並擴增第三個運算元 (a = a + b變成a = b + c) 以提高暫存器使用效率,使CISC的x86更接近RISC的樣貌。
減少記憶體存取: 長期以來,x86因通用暫存器數量少於ARM等RISC架構,導致CPU必須頻繁地將資料在暫存器與快取/記憶體之間搬運 (Memory-Intensive),或著需要更複雜的非循序指令執行 (OOOE) 核心。APX解決了這個痛點,大幅減少了對記憶體的存取次數,並更便於設計更高執行效率的核心微架構。
提升能效比:減少資料搬運意味著更低的功耗和更高的執行效率。據Intel的說法,這能提升約10%的整數運算性能,且無需額外的晶片面積或功耗,這對於提升筆電續航力和伺服器密度至關重要,更有助於打造出更貼近ARM架構的低功耗產品。
因為Intel已經與AMD攜手合作統一x86指令集架構與生態系統,如果沒有意外的話,AMD後續應該會在2027年的Zen 7世代對應AVX10與APX,其「New Matrix Engine」也應該是相容Intel的AMX。但在這之前,軟體廠商「有效利用」新增通用暫存器和第三個運算元的時程,才是決定使用者何時能享受到其好處的關鍵。
戰略意義:延續x86指令集架構的壽命
Nova Lake支援AVX10.2與APX這兩項技術在於證明x86架構仍具有強大的生命力與演進空間。Intel透過APX彌補了暫存器不足的短板,並透過AVX10.2整理了混亂的指令集生態。這標誌著 Intel正試圖擺脫舊時代包袱,打造一個更精簡、高效且「對開發者 (包含CPU研發人員) 友善」的x86生態系。
比AVX10和APX更早一年被提出的「純64位元」x86-S (x86 Simplification) 是Intel對於x86架構現代化願景的最後一塊拼圖,雖然它的關注度不如AVX10或APX高,但對於精簡架構具有重大意義。如果說APX是為了「增肌」(增加暫存器提升效能),AVX10是為了「整骨」(統一指令集),那麼x86-S就是為了「排毒」—徹底移除x86架構累積了40多年的歷史包袱,簡化晶片設計,並且減少驗證的複雜度,讓x86處理器更能快速的 "Time To Market"。
x86-S的主要特性如下。
移除16 bit與32 bit的開機模式:處理器通電後直接進入64 bit模式,省去了模式切換的握手過程,理論上能縮短系統啟動時間。目前的x86處理器在開機時,仍然會像1978年的Intel 8086處理器一樣,先進入16 bit的「真實模式 (Real Mode)」,然後切換到32 bit的「保護模式」,最後才進入64 bit的「長模式」,這個過程繁瑣且過時。
刪除過時包袱:取消節區 (Segmentation) 記憶體定址,連帶移除了如Ring 1/Ring 2這種現代OS根本不用的權限層級,以及老舊的I/O指令。
依然可以運行32 bit Ring 3應用程式:現代64 bit作業系統 (如 Windows 11) 透過相容層來執行 32 bit軟體,x86-S保留了這種能力。在x86-S架構下如何處理舊軟體相容性的問題,核心觀念可以總結為一句話:「應用程式 (Ring 3) 幾乎不受影響,但驅動程式與舊系統 (Ring 0) 必須依賴虛擬化」。
考量到工業電腦產業與嵌入式應用的相關領域,依然存在大量老舊軟硬體,以及貿然全面導入x86-S可能又會再次上演親手奉送客戶給AMD的風險,短期內應該看不到其成為現實,或許這還需要Intel與AMD先有共識,再跟微軟和Canonical等軟體公司私下講好吧。
到頭來,我還是寫了遠遠超過五百字....
下週來談談Intel取消8通道記憶體版本的Diamond Rapids-SP,以及Intel要在下一代Xeon "Coral Rapids"「恢復SMT (HyperThreading)」這件蠢到實在不知道該怎麼形容的蠢事。
延伸閱讀 (主要是筆者在科技新報的著作):
沒有留言:
張貼留言