Intel prezentuje procesory Xeon MAX Sapphire Rapids i Xeon GPU MAX Ponte Vecchio wyposażone w pamięci HBM i przeznaczone dla centrów danych
Intel wprowadza na rynek zupełnie nowe układy Xeon MAX Sapphire Rapids HBM i Xeon GPU MAX wcześniej znane pod nazwą Ponte Vecchio przeznaczone dla centrów danych i segmentów korporacyjnych.
Dziś Intel wreszcie wchodzi do segmentu centrów danych i przedsiębiorstw ze swoimi własnymi składającymi się z wielu bloków rdzeni „chipletowymi” produktami o nazwie kodowej Xeon MAX. Pierwsze dwa produkty z tej zupełnie nowej rodziny to seria Xeon CPU MAX, które są procesorami Sapphire Rapids z technologią HBM, natomiast drugi produkt to seria Xeon GPU MAX oparta na konstrukcji Ponte Vecchio, która mierzy się z architekturą chipletów.
Seria Xeon CPU Max to pierwszy i jedyny procesor oparty na architekturze x86 z pamięcią o wysokiej przepustowości, przyspieszający wiele obciążeń HPC bez konieczności zmiany kodu. Intel Data Center GPU Max Series to procesor firmy Intel o najwyższej gęstości pamięci i będzie dostępny w kilku obudowach, które zaspokoją różne potrzeby klientów.
Seria Xeon CPU Max oferuje 64 gigabajty pamięci o wysokiej przepustowości (HBM2e) na opakowaniu, znacznie zwiększając przepustowość danych dla obciążeń HPC i AI. W porównaniu z najwyższej klasy procesorami Intel Xeon Scalable 3. generacji, seria Xeon CPU Max zapewnia nawet 3,7 razy10 większą wydajność w szeregu rzeczywistych aplikacji, takich jak modelowanie energii i systemów ziemskich.
Ponadto, seria Data Center GPU Max mieści ponad 100 miliardów tranzystorów w 47-kafelkowej (blokowej) obudowie, zapewniając nowy poziom przepustowości w tak wymagających zadaniach jak fizyka, usługi finansowe i nauki przyrodnicze. W połączeniu z procesorami Xeon serii Max, połączona platforma osiąga do 12,8 razy większą wydajność niż poprzednia generacja podczas pracy z symulatorem dynamiki molekularnej LAMMPS.
Procesory Intel Xeon MAX „Sapphire Rapids z HBM”
Intel Xeon CPU MAX będzie zawierał do czterech stosów HBM, wszystkie oferujące znacznie większą przepustowość DRAM w stosunku do bazowego procesora Sapphire Rapids-SP Xeon z 8-kanałową pamięcią DDR5. Dzięki temu Intel będzie mógł zaoferować układy o zwiększonej pojemności i przepustowości dla klientów, którzy tego wymagają. Układy HBM mogą być używane w dwóch trybach, HBM Flat i HBM caching.
Standardowy układ Sapphire Rapids-SP Xeon będzie posiadał 10 interkonektów EMIB, a cały pakiet będzie mierzył imponujące 4446mm2. Przechodząc do wariantu HBM, otrzymujemy zwiększoną liczbę interkonektów, których jest 14 i są potrzebne do połączenia pamięci HBM2E z rdzeniami.
Cztery pakiety pamięci HBM2E będą posiadały stosy 8-Hi, więc Intel zamierza zastosować co najmniej 16 GB pamięci HBM2E na każdy stos, co daje łącznie 64 GB w pakiecie Sapphire Rapids-SP. Mówiąc o pakiecie, wariant HBM będzie mierzył aż 5700 mm2 lub 28% więcej niż standardowy wariant. W porównaniu do niedawno wyciekłych danych procesorów AMD EPYC Genoa, pakiet HBM2E dla Sapphire Rapids-SP będzie o 5% większy, podczas gdy standardowy wariant będzie o 22% mniejszy.
- Intel Sapphire Rapids-SP Xeon (pakiet standardowy) – 4446mm2
- Intel Sapphire Rapids-SP Xeon (pakiet HBM2E) – 5700mm2
- AMD EPYC Genoa (12 CCD Package) – 5428mm2
Wspomina się również, że procesory Intel Sapphire Rapids Xeon Max będą posiadały do 80 linii PCIe Gen 5.0 / 4.0, wsparcie dla 8-kanałowej pamięci DDR5-4800, do 4 linii UPI & 16 GTs oraz interfejs x8 DMI PCIe 3.0. Na rynku zadebiutuje dziś co najmniej pięć różnych wersji tych procesorów, do których należą:
- Xeon Platinum 9480 – 56 rdzeni (1,9 / 2,6 GHz) – 12980 USD
- Xeon Platinum 9470 – 52 Core (2.0 / 2.7 GHz) – 11590 USD
- Xeon Platinum 9468 – 48 rdzeni (2,1 / 2,6 GHz) – 9900 USD
- Xeon Platinum 9460 – 40 rdzeni (2,2 / 2,7 GHz) – 8750 USD
- Xeon Platinum 9462 – 32-rdzeniowy (2,7 / 3,1 GHz) – 7995 USD
Układy graficzne Intel Xeon MAX „Ponte Vecchio” w różnych konfiguracjach
GPU Intel „Ponte Vecchio” lub „Intel Data Center GPU Max Series”, jak chce je teraz nazywać firma, to główny produkt, który posiada 128 rdzeni Xe, 128 rdzeni RT (co czyni go jedynym GPU HPC / AI, który posiada natywny rdzeń raytracingowy), do 64 MB pamięci podręcznej L1 i do 408 MB pamięci podręcznej L2. Zastosowano także 128 GB HBM2e, a IO połączy do 8 kafelków z rdzeniami (chipletów).
Do komunikacji wykorzystywana jest magistrala PCIe 5.0 wraz z wykorzystaniem Xe Link, by zapewnić jak największą przepustowość.
Układy te produkowane są z wykorzystaniem procesów technologicznych TSMC N5 oraz N7 i Intel 7, poszczególne składowe układu graficznego (rdzenie obliczeniowe, moduły pamięci itp.) składane są w kompletną całość z wykorzystaniem najbardziej zaawansowanych technik łączenia ze sobą poszczególnych elementów przy użyciu metod pakowania EMIB i Foveros.
Układy graficzne z serii Max będą dostępne w kilku wariantach, aby zaspokoić różne potrzeby klientów:
- Max Series 1100 GPU: 300-watowa, dwuslotowa karta PCIe z 56 rdzeniami Xe i 48 GB pamięci HBM2e. Istnieje możliwość połączenia wielu kart poprzez mostki Intel Xe Link.
- Max Series 1350 GPU: 450-watowy moduł OAM ze 112 rdzeniami Xe i 96 GB pamięci HBM.
- Max Series 1550 GPU: 600-watowy moduł OAM o pełnej wydajności, wyposażony w 128 rdzeni Xe i 128 GB pamięci HBM.
Intel twierdzi, że możliwe jest połączenie maksymalnie osiem modułów OAM, na jednej karcie do uzyskania topowej wydajności. Intel podał wydajność dla karty z maksymalnie zainstalowanymi czterema modułami OAM, więc i my tylko takie informacje zamieścimy:
- 1 OAM: 128GB HBM2e, 128 rdzeni Xe, 600W TDP, 52TFLOPs, 3,2 TB/s przepustowości pamięci
- 2 OAM: 256 GB HBM2e, 256 rdzeni Xe, TDP 1200 W, 104 TFLOPS, przepustowość pamięci 6,4 TB/s
- 4 OAM: 512 GB HBM2e, 512 rdzeni Xe, TDP 2400 W, 208 TFLOPS, przepustowość pamięci 12,8 TB/s
Przejdźmy teraz do kwestii wydajności. Procesory graficzne Intel z serii Max zapewniają do 128 rdzeni Xe-HPC, czyli nowej architektury obliczeniowej przeznaczonej dla najbardziej wymagających obciążeń obliczeniowych.
Intel twierdzi, że każdy z OAM jest 2x szybszy od NVIDIA 100 w OpenMC i miniBUDE. Ponadto Intel twierdzi, że procesory graficzne Intel Data Center z serii Max mają 1,5-krotną przewagę wydajnościową w symulacjach wirtualnego reaktora jądrowego ExaSMR – NekRS, takich jak AdvSub, FDM (FP32), AxHelm (FP32) i AxHelm (FP64). Wreszcie, twierdzą oni również, że wydajność jest największa (w porównaniu do NVIDIA A100) w przypadku obciążeń finansowych, takich jak Riskfuel, które są wykorzystywane do szkolenia modeli opcji kredytowych i wyceny.