【消費電子實驗室-2023/6/25】當地時間6月22日,英特爾(Intel)官方宣布,美國能源部阿拉貢國家實驗室已經完成基于英特爾CPU及GPU的新一代超算“Aurora”的安裝工作,今年晚些時候上線后將提供超過2 exaflops(2百億億次計算每秒)的FP64浮點性能,將超越隸屬于美國能源部橡樹嶺國家實驗室的“Frontier”,有望成為全球第一臺理論峰值性能超過2 exaflops的超級計算機。 據介紹,Aurora 超級計算機由英特爾、惠普企業 (HPE) 和美國能源部 (DOE) 合作,旨在大規模釋放高性能計算 (HPC) 三大支柱的潛力:模擬、數據分析和人工智能 (AI)。該系統配備了所有 10624 個刀片服務器,每個刀片由兩個英特爾Xeon Max 系列 CPU(至強Max 9480) 和六個英特爾 Max 系列 GPU 組成,使得Aurora 超級計算機總共擁有 63744 個英特爾數據中心 Max 系列 GPU 和21248 個英特爾Xeon Max 系列CPU。 在性能方面,英特爾稱,Xeon Max配備的高帶寬內存足以滿足最常見的HPC工作負載,與舊的英特爾至強 8380 系列處理器或 AMD EPYC 7773X 相比,可在某些工作負載中提供接近 5 倍的性能。 英特爾Xeon Max CPU中還包含 20 個加速引擎,主要是用于 AVX-512、AMX、DSA 和英特爾 DL Boost 工作負載。據稱,英特爾在 MLPerf DeepCAM 訓練中的性能比 AMD 7763 提升了 3.6 倍,比 NVIDIA 的 A100 提升了 1.2 倍。 至于英特爾MAX GPU實際上就是之前的Ponte Vecchio芯片,使用了英特爾有史以來最先進的封裝技術,擁有超過1000億個晶體管。其總共有63個模塊,包括了16個Xe-HPG架構的計算芯片、8個Rambo cache芯片、2個Xe基礎芯片、11個EMIB連接芯片、2個Xe Link I/O芯片和8個HBM芯片、以及16個負責TDP輸出的模塊,通過EMIB與Foveros 3D封裝中整合在一起。其中最強的MAX 1550配備了英特爾性能最高的OAM模塊,擁有128個Xe核心和128GB的HBM2e內存,TDP為600W。 此外,Aurora 系統還配備了10.9PB的傲騰持久內存。同時正如前面所介紹的,每個Xeon Max CPU內還封裝了64 GB 的 HBM2e 內存,這也意味著21248 個英特爾Xeon Max 系列CPU內的 HBM2e高帶寬內存容量達到了1.36PB;每個 Max GPU內最高還封裝了128 GB 的 HBM2e 內存, 63744個Max GPU內的HBM2e內存容量達到了8.16PB。三者合計達20.42PB內存。存儲方面,Aurora 集成了超過 1024 個存儲節點(使用 DAOS,英特爾的分布式異步對象存儲技術),并利用HPE Slingshot高性能結構,以每秒31TB的總帶寬提供220PB的總的存儲容量。 以上所有的CPU、GPU、內存及存儲等組件都將通過英特爾的oneAPI軟件互相鏈接。借助 oneAPI,開發者對整個系統中的節點進行編程,無需更改代碼,應用程序可以有效在 CPU 和 GPU 上運行,為開發人員提供無縫系統集成。 英特爾表示,Aurora將充分利用英特爾Max系列GPU和CPU產品系列的強大功能。Max系列GPU的早期結果旨在滿足動態和新興HPC和AI工作負載的需求,在現實世界的科學和工程工作負載上顯示出領先的性能,在OpenMC上顯示出高達AMD MI250X GPU性能的2倍,以及接近線性擴展到數百個節點。在許多現實世界的HPC工作負載(如地球系統建模、能源和制造)中,Intel Xeon Max系列CPU比競爭對手具有40%的性能優勢。 目前世界第一的超級計算機是隸屬于美國能源部橡樹嶺國家實驗室的“Frontier”,最大性能每秒1.19百億億次浮點計算,峰值性能可達1.68百億億次,其采用的是正是AMD EPYC 7A53 64核心處理器,以及Instinct MI250X GPU加速器。隨著“Aurora”的安裝工作完成,今年晚些時候上線后將可提供超過2 exaflops的性能,成為全球最強的超級計算機。 為了更好的發揮Aurora的性能,近期,英特爾還公布了一個主要面向于科學領域的生成式 AI 模型——Aurora genAI。 據介紹,Aurora genAI 模型以 Megatron 和 DeepSpeed 為基礎,其規模達到了 1 萬億個參數,相比之下基于GPT-3的ChatGPT 的規模僅為 1750 億參數,Aurora genAI 在參數規模上提升到了5.7倍。該模型將在通用文本、科學文本、科學數據和與該領域相關的代碼上進行訓練。可以推動清潔能源聚變、催化劑、癌癥、航空航天、神經科學研究、宇宙學等方面的研究。 英特爾公司副總裁兼超級計算集團總經理Jeff McVeigh表示:“Aurora是英特爾Max系列GPU的首次部署,這是世界上最大的基于Xeon Max CPU的系統,也是世界上最大的GPU集群。我們很自豪能成為這個系統的一部分,并為Aurora將實現的突破性AI,科學和工程感到興奮。” 阿貢國家實驗室副實驗室主任Rick Stevens表示:“在我們努力進行驗收測試的同時,我們將使用Aurora來訓練一些大規模的開源生成AI模型,Aurora 擁有超過 60000 個 Intel Max GPU、非常快速的 I/O 系統和全固態大容量存儲系統,是訓練這些模型的完美環境。” |
網站介紹 廣告業務 歡迎投稿 招聘信息 聯系我們 友情鏈接 法律顧問 網站地圖
CopyRight 2012消費電子實驗室 版權所有 京ICP備12048044號-4號
電話:13701384402 郵編:100040 郵箱:BICQ6688@QQ.COM