産(chǎn)品推薦(Intel®):Sapphire Rapids
當前位置:首頁(yè) > 技(jì )術熱點 >
産(chǎn)品推薦(Intel®):Sapphire Rapids


英特爾于ISC 2021中(zhōng)介紹了Ice Lake的下一代至強可(kě)擴展處理(lǐ)器 -- Sapphire Rapids。Sapphire Rapids将采用(yòng) 10nm Enhanced SuperFin制程工(gōng)藝,微架構升級為(wèi)全新(xīn)的 GoldenCove并集成更多(duō)的核心,還通過英特爾高級矩陣擴展(AMX)指令集來進一步強化AI性能(néng)。SapphireRapids隸屬于屬于EagleStream平台(未來還将有(yǒu)EmeraldRapids),加入了8通道DDR5内存、PCIe5.0協議以及CXL1.1标準。SapphireRapids各型号産(chǎn)品于2023年第一季度陸續投入生産(chǎn),代号藍寶石急流(Sapphire Rapids),開始了急流(Rapids) 系列,而不再稱作(zuò)某湖(hú)(Lake),暗示了它和消費品CPU設計上從此分(fēn)野。的确,作(zuò)為(wèi)開拓者的第四代至強可(kě)擴展處理(lǐ)器,在它面向的數據中(zhōng)心市場的各個性能(néng)和功能(néng)維度上,進行全面提高和改善。除此之外,SapphireRapids還将具(jù)有(yǒu)集成HBM高帶寬内存的型号。

在物(wù)理(lǐ)層面,Sapphire Rapids最多(duō)可(kě)以擁有(yǒu)60個核心,LGA4677封裝(zhuāng)接口,LGA4677封裝(zhuāng)接口,八通道DDR5-4800,擴展連接提供80條PCIe 5.0/4.0通道,最多(duō)可(kě)以集成64GB HBM2e内存。

Intel Eagle Stream平台與Sapphire Rapids的到來,終于能(néng)夠幫助英特爾在服務(wù)器市場競争中(zhōng)解決核心數量不足的難題,并尋找商(shāng)用(yòng)解決方案新(xīn)方向,引入x86高級矩陣擴展(AMX),CXL 1.1,DDR5,PCIe 5.0等新(xīn)技(jì )術。


image.png


image.png

消費級處理(lǐ)器不同的是,Sapphire Rapids隻有(yǒu)P-Core,即全員Golden Cove,并首次使用(yòng)芯粒(或者稱為(wèi)小(xiǎo)芯片)封裝(zhuāng),利用(yòng)嵌入式多(duō)芯互連橋技(jì )術(Embedded Multi-die Interconnect Bridge,EMIB)最大限度的減少延遲和拓寬帶寬,核心數量也進一步提升,因此被英特爾稱為(wèi)十年來數據中(zhōng)心級處理(lǐ)器最大的提升。

源自于Alder Lake的Golden Cove與Ice Lake 的Cypress Cove相比,單線(xiàn)程IPC性能(néng)提升19%,主要得益于架構發生較大變化,包括:

  • 16B → 32B 長(cháng)度解碼

  • 4-wide → 6-wide 解碼

  • 5K → 12K 分(fēn)支目标

  • 2.25K → 4K μop 緩存

  • 5 → 6 寬分(fēn)配

  • 10 → 12 個執行端口

  • 352 → 512 條目重排序緩沖區(qū)

image.png


除了這些關鍵指标之外,為(wèi)了數據與算力這兩大熱門方向,第四代至強可(kě)擴展處理(lǐ)器在CPU和南橋中(zhōng)自帶七大算力神器。

全面對數據處理(lǐ)和人工(gōng)智能(néng)算力進行加速,讓加速無所不在:

英特爾@ 高級矩陣擴展(英特爾@ AMX) : 可(kě)加深度學(xué)習(DL) 推理(lǐ)和訓練工(gōng)作(zuò)負載,例如自然語言處理(lǐ)(NLP)、推薦系統“和圖像識别:

英特爾@ 教據流加速器(英特爾@ DSA): 可(kě)通過改善流式數據移動和轉換提作(zuò),為(wèi)存情、網絡和教據密集型工(gōng)作(zuò)負載提供高性能(néng):

英特爾@ 存内分(fēn)析加速器(英特爾 IAA):可(kě)提高分(fēn)析性能(néng),同時從CPU核心卸載任務(wù)以加速教據庫查詢香葉量和其他(tā)工(gōng)作(zuò)負載;

英特爾@ 動态負載均衡器(英特爾@ DLB) :可(kě)以随系統負的變化動态地将網絡教據分(fēn)發到多(duō)個CPU 核心,從而提供高效的硬件級負載平衡:

英特爾@ 高級矢量擴展 512 (英特爾 AVX-512) : 支持多(duō)達兩個融合乘加(FMA) 單元,并包含多(duō)項優化來提高要求嚴苛的計算任務(wù)的性能(néng);

英特爾@ 教據保護與壓縮加速技(jì )術(英特爾@ QAT): 可(kě)加加密、解密和數據壓縮,從處理(lǐ)器核心卸載這些任務(wù)以幫助減少系統資源消耗:

英特爾@ 密碼提作(zuò)硬件加速 (Intel@ Crypto Acceleration) : 可(kě)減少實施普數據加密的代價,并提高加密敏感型工(gōng)作(zuò)負載的性能(néng),如安(ān)全套接層(SSL) Web 服務(wù)器、5G 基礎設施和VPN/防火牆

服務(wù)器上的Golden Cove将圍繞多(duō)線(xiàn)程表現性進行,不僅啓用(yòng)AVX-512,并且每個内核配備2MB二級緩存,與最新(xīn)的13代酷睿中(zhōng)的Raptor Cove相當,支持x86高級矩陣擴展(AMX)和加速器接口架構指令集(AIA),以支持對加速器和設備的有(yǒu)效調度、同步。


image.png


AMX指令用(yòng)于加速機器學(xué)習速度,屬于DL Boost系列的AVX512_VNNI、AVX512_BF16之後的第三項指令,與前兩者均建立在AVX512之上不同,AMX自帶存儲和操作(zuò)的獨立擴展,它引入了一套新(xīn)的矩陣寄存器堆,包括8個1024-bit寄存器,調用(yòng)方式則與AVX512相似,因此在整體(tǐ)結構上不需要做出修改,能(néng)夠與其他(tā)x86交錯使用(yòng)。同時在調用(yòng)矢量和矩陣指令時,每個内核都會有(yǒu)獨立的細粒度電(diàn)源控制器,以避免消費級CPU在運行AVX時候遇到頻率下降的情況。

按照最初設計預想,英特爾Sapphire Rapids推出應該需要與AMD Milan或者Milan的3D V-Cache緩存堆疊版本展開競争。但實際上Sapphire Rapids推出的節骨眼不得不面臨AMD Zen 4的次時代挑戰。但英特爾服務(wù)器級處理(lǐ)器的優勢永遠(yuǎn)不是核心數量那麽簡單,通過特定的加速器優勢,Sapphire Rapids仍然會成為(wèi)未來一段時間服務(wù)器市場換新(xīn)的主要考量。

從PCIe 5.0、DDR 5到内核的升級,也将帶動服務(wù)端新(xīn)一輪産(chǎn)業升級,再加上轉向芯粒方式提升量産(chǎn)成功率,Sapphire Rapids後續表現依然讓人期待。

深圳市科(kē)通技(jì )術股份有(yǒu)限公(gōng)司    客服電(diàn)話:(+86)755-26018083    郵箱:cs@comtech.cn

© Copyright 2018 www.comtech.cn | 京ICP證000000号 | 粵公(gōng)網安(ān)備 44030502003347号