GTC 2025: NVIDIA prezentuje nowe procesory graficzne – Rubin oraz Blackwell Ultra

19 March 2025

Podczas konferencji GTC 2025 NVIDIA oficjalnie ogłosiła plany dotyczące nowych procesorów graficznych dla centrów danych. W 2026 roku na rynek trafi Rubin, a rok później jego ulepszona wersja Rubin Ultra. Firma zaprezentowała także model Blackwell Ultra B300, który już w tym roku zaoferuje znaczący wzrost wydajności obliczeniowej w porównaniu do poprzednika, jakim jest Blackwell B200.

Układ Rubin NVL144 będzie kompatybilny z dotychczasową infrastrukturą Blackwell NVL72, ale zaoferuje aż 3,3-krotny wzrost mocy obliczeniowej w porównaniu do Blackwell B300 NVL72. Rubin zapewni ponadto 3,6 petaflopsów przetwarzania FP4 i 1,2 eksaflopsów w treningu FP8. Kluczową zmianą będzie także przejście z pamięci HBM3/HBM3e na HBM4, a w przypadku Rubina Ultra – na HBM4e. Przepustowość pamięci wzrośnie z 8 TB/s do 13 TB/s, a NVLink podwoi szybkość do 260 TB/s. Nowością będzie również CX9, łącze między szafami serwerowymi o przepustowości 28,8 TB/s. Uzupełnieniem rodziny Rubin będzie procesor Vera, zastępujący obecne jednostki Grace. Vera zaoferuje 88 rdzeni ARM oraz 176 wątków, a jego interfejs NVLink będzie umożliwiać przesył danych z prędkością 1,8 TB/s.

Największym przełomem ma być jednak układ Rubin Ultra, planowany na drugą połowę 2027 roku. W jego przypadku liczba jednostek GPU w jednej szafie wzrośnie do 576, co przełoży się na 15 eksaflopsów mocy obliczeniowej FP4 i 5 eksaflopsów w treningu FP8. W celu zwiększenia gęstości obliczeń, układy GPU będą składać się z czterech rdzeni. Rubin Ultra będzie mieć łącznie 365 TB szybkiej pamięci i NVLink7 o 6-krotnie większej przepustowości w porównaniu do standardowego Rubina, osiągając wartość 1,5 PB/s.

Obok rodziny Rubin, NVIDIA zaprezentowała także Blackwell Ultra B300 – najnowszy procesor graficzny dla centrów danych. W porównaniu do B200 zaoferuje on 50% więcej pamięci oraz format FP4, co przełoży się na istotne przyspieszenie obliczeń AI. W nowym ekosystemie znajdziemy serwery B300 NVL16, GB300 DGX Station oraz GB300 NV72L, które w konfiguracji SuperPOD zapewnią 11,5 eksaflopsów FP4. NVIDIA podkreśla, że nowe układy Blackwell Ultra są zoptymalizowane pod kątem zaawansowanych modeli AI, takich jak DeepSeek R1.

B300 ma ponadto dostarczać 30-krotnie większą wydajność inferencji w porównaniu do poprzedniej generacji Hopper. Przykładem jest przyspieszona obsługa modelu DeepSeek R1-671B, gdzie B300 jest w stanie generować już do 1000 tokenów na sekundę, podczas gdy Hopper osiąga jedynie 100 tokenów na sekundę.