位於芬蘭的 LUMI(Large Unified Modern Infrastructure)超級計算機目前仍在組裝過程中。按照原計劃,這臺擁有 375+ PFLOPs 算力的超算應該在 2021 年底前上線。但受到供應鏈危機的影響,其當下的目標是在 2022 年年中實現普遍供應。
LUMI 基於 AMD EPYC 處理器和 Instinct 計算卡打造,一旦投入執行,其預計將超越目前最快的日本 Fugaku 超算系統。LUMI 共有 2560 個計算節點,每個節點由一枚 64 核 AMD Trento CPU 和 4 路 AMD Instinct MI250X GPU 加速卡組成。
科技網站 ,雖然硬體在不斷完善,但 LUMI 團隊的 HPC 工程師仍一直在努力優化開源的 Linux 軟體棧。LUMI 超級計算機的工程師、CSC 首席 HPC 科學家 Georgios Markomanolis 曾在去年 2 月釋出過一個演講,提到了彼時 Radeon Open eCosystem 的情況,以及他們為使傳統上以 NVIDIA 為中心的 HPC 工作負載在當時的 AMD 測試硬體中執行而進行的所有移植工作 —— 其最初規劃使用的是 MI100,但 LUMI 同時也在等待 MI250X 的成熟落地。
日前舉行的 FOSDEM 2022 上,Georgios Markomanolis 分享了該團隊在過去一年中所進行的相關開源工作的一些資訊。現如今,HPC 工程師在對 AMD 用於 GPU 計算的 ROCm 開源軟體棧方面已經積累了更多的經驗;同時繼續在 HIP 上將更多的 CUDA 程式碼庫移植到 AMD GPU 支援的軟體中,並努力微調程式碼,以便在 AMD 硬體上執行時獲得最大效能。
此外,在過去的一年裡,工具包中還新增了一個值得一提的軟體元件:AMD 開源的 GPUFort,用於幫助將 OpenACC 和 CUDA Fortran 程式碼遷移到 AMD 的架構中。
儘管相關工作依然很複雜,但通過將複雜的程式碼庫轉移到 AMD ROCm 空間,可以獲得最佳的 GPU 效能。
更多有關 CSC 為準備 LUMI 上線而進行的開源移植和調優工作詳情可在 上檢視,其中包含有 Georgios Markomanolis 的演講 PPT 和視訊記錄。想了解更多關於 LUMI 的資訊可以檢視 。