Chipy NVIDIA Blackwell przegrzewają się, więc giganci redukują zamówienia na szafy GB200

Kluczowi dostawcy usług chmurowych – Microsoft, Amazon, Google (Alphabet) i Meta – zdecydowali się na ograniczenie zakupów najnowszych rozwiązań serwerowych „Blackwell” od NVIDII z powodu kłopotów z przegrzewaniem.

Według agencji Reuters powołującej się na The Information, „najwięksi klienci firmy NVIDIA, tacy jak dostawcy usług chmurowych (CSP) Microsoft, Amazon, Alphabet’s Google oraz Meta Platforms, redukują zamówienia na najnowsze szafy serwerowe z układami ‘Blackwell’ ze względu na problemy z przegrzewaniem”. Informacje te wskazują, że pierwsze partie urządzeń wyposażonych w układy Blackwell cierpią też z powodu zakłóceń komunikacji między chipami.

Klienci, którzy zamierzali zainwestować nawet do 10 miliardów dolarów w nowe serwery, wstrzymują się teraz z decyzją o zakupie do czasu pojawienia się ulepszonej wersji sprzętu. Alternatywą ma być wybór starszej generacji układów NVIDII, co stanowi bezpieczniejsze, choć oczywiście mniej wydajne rozwiązanie.

 

Przykładem jest Microsoft, który – według The Information – planował zainstalować w jednej ze swoich serwerowni w Phoenix ponad 50 tysięcy chipów Blackwell umieszczonych w szafach GB200. Jednak ze względu na opóźnienia i komplikacje techniczne OpenAI poprosiło MS o dostarczenie poprzedniej generacji układów NVIDII „Hopper”. Ma to pozwolić na uniknięcie przestojów i zapewnić ciągłość projektów związanych ze sztuczną inteligencją.

Warto zauważyć, że nie po raz pierwszy układy Blackwell borykają się z takimi kłopotami. Jak przypomina Reuters, już w listopadzie 2024 roku pojawiały się sygnały o przegrzewaniu w serwerach z 72 procesorami Blackwell, co skłoniło NVIDIĘ do wprowadzenia poprawek w projektach szaf serwerowych.

Nad producentem wisi także widmo nowych regulacji rządu Stanów Zjednoczonych. Władze USA rozważają kolejne restrykcje dotyczące eksportu chipów dla AI, co w przyszłości może znacząco wpłynąć na wielkość sprzedaży NVIDII.