
AMD 新一代 Radeon 9000 系列繪圖卡以及負責介紹的 AMD 產品管理主任 Scott Olschewsky。
在看完了新一代的 Ryzen Threadripper 9000 系列處理器的介紹後,接著來看這次 AMD 在工作站產品的另外一系列新品:Radeon 9000 系列繪圖卡,在 AMD 的 AI 加速運算規劃中,這次推出的 Radeon 9000 系列繪圖卡主要是介於 AMD Instinct MI 系列加速器以及 Ryzen AI Max 系列處理器間,針對多 GPU 設置的 AI 推論以及中小型的 LLM 模型所設計。

AMD 目前在 AI 加速運算架構部分的布局。

接著來看這次 AMD 在 Radeon 9000 繪圖卡的架構部分。

跟消費等級的 Radeon RX 9000 系列顯示卡相同,採用 RDNA 4 顯示架構、台積電 4 奈米製程以及 PCIe Gen 5 介面,另外在命令處理器、記憶體配置、快取系統部分都有更新,AI 加速器則是升級到第二代,增加了 8 Bit 的浮點資料格式支援。

另外在 RDNA 4 的架構部分,則是在運算單元(CU)部分提供了增強的矩陣運算、純量單元、排序器升級,另外在光線追蹤器部分也跟 RX 顯示卡一樣做了改進。

而在實際產品部分,AMD 則是推出了 Radeon AI Pro 9700 繪圖卡,具備 128 個 AI 加速器,32GB GDDR6 記憶體、300W TBP 功耗配置。而在算力部分則是提供了最高 191 TFLOPS FP16 Dense 以及 1531 TFLOPS INT4 Sparse 的效能表現。至於在實際產品的發行廠商部分,包括華擎、華碩、技嘉、撼訊、藍寶石、XFX 以及盈通等廠商都會推出產品。

跟上一代的 Radeon Pro W7800 相比,Radeon AI Pro 9700 繪圖卡主要在越來越普及的 FP16/BF16/INT8/INT4 經度部分具備更好的效能表現,並且也新增了對 FP8 資料格式的支援。

另外也透過較大的 32GB 記憶體配置,來應對越來越大的 AI 模型參數量配置。

透過較大的參數模型支援,在進行 AI 推論時會得出更理想的結果。

在單一 GPU 的配置下,Radeon AI Pro 9700 繪圖卡比起上一代的 Radeon Pro W7800 再生成 Token 的速度也都有很明顯的增加。

另外在多 GPU 的 支援部分,以四張 Radeon AI Pro 9700 繪圖卡的系統為例,最高可支援 180 個 Instance 進行平行運算。

而除了 Ryzen Threadripper 9000 系列處理器以及 Radeon AI Pro 9700 繪圖卡外,這次 AMD 也在工作坊中介紹了更新的 ROCm 軟體架構,達成 CPU+ GPU+ 軟體架構完整的生態系,所以接下來也來看看這部分。

目前 ROCm 架構的目標還是提供開發者一個良好體驗的開發環境,包括方便使用、規律更新以及超乎標準的使用體驗等等。

而目前 AMD 在工作站這個等級提供的 ROCm 為 6.41 版本,支援了大多數的模型、框架以及目前最多人使用的推論伺服器以及多 GPU 支援等等。

而在對於開發環境的支援部分,也支援了從雲端到地端、Liunx、Windows 作業系統等開發環境。

AMD 也推出了名為『The Rock』的佈署系統,支援 Linux/Windows 作業系統,使用者可到 Github 上下載即可安裝。(簡報裡還貼心地附上了連結 QR Code,歡迎大家去用啊)。

在簡報的最後 AMD 再度強調了 Ryzen Threadripper 90000 系列處理器、Radeon AI Pro 9700 繪圖卡與 ROCm 軟體架構能提供開發者更多不同的開發平台選擇。