Chińskie GPU deklasują Nvidię w symulacjach superkomputerowych

Chińscy naukowcy opracowali technologię, która pozwala im osiągnąć niemal dziesięciokrotny wzrost wydajności w symulacjach superkomputerowych w porównaniu do systemów opartych na najnowocześniejszych procesorach graficznych Nvidii – wynika z recenzowanego badania. Odkrycie to nie tylko podważa dominację amerykańskich układów scalonych, ale również pokazuje, że chińska strategia uniezależniania się od zagranicznych technologii zaczyna przynosić wymierne efekty.

Oprogramowanie zamiast sprzętu – chińska recepta na przełom
Zespół badaczy pod kierownictwem prof. Nan Tongchao ze State Key Laboratory of Hydrology-Water Resources and Hydraulic Engineering na Uniwersytecie Hohai w Nankinie wykorzystał innowacyjne metody optymalizacji oprogramowania, aby znacząco zwiększyć wydajność obliczeniową chińskich GPU. Pomimo ograniczeń sprzętowych, udało im się pokonać superkomputery oparte na amerykańskich układach.

Osiągnięcie to jest szczególnie istotne w kontekście narastających amerykańskich sankcji technologicznych, które miały utrudnić Chinom dostęp do najnowszych technologii obliczeniowych. Zamiast jednak polegać na importowanych chipach, chińscy naukowcy skoncentrowali się na optymalizacji oprogramowania i architekturze „multi-node, multi-GPU”, co pozwoliło na radykalne zwiększenie efektywności obliczeń.

Summit superkomputer

 

Chińska odpowiedź na amerykańskiego TRITONa
W 2021 roku zespół Mario Moralesa-Hernandeza z Oak Ridge National Laboratory w USA opracował nowy model przewidywania powodzi TRITON, działający na superkomputerze Summit. Mimo użycia 64 węzłów obliczeniowych uzyskano jedynie sześciokrotne przyspieszenie przetwarzania danych.

Prof. Nan zastosował inne podejście – zamiast zwiększać liczbę węzłów, połączył wiele procesorów graficznych w jeden węzeł, optymalizując jednocześnie komunikację między nimi. Dzięki temu jego model osiągnął sześciokrotne przyspieszenie już przy użyciu zaledwie siedmiu węzłów, co oznacza redukcję zasobów obliczeniowych o 89% w porównaniu do amerykańskiego TRITON-a.

Badania przeprowadzono na chińskiej platformie obliczeniowej opartej na procesorach Hygon 7185 (32 rdzenie, 64 wątki, 2,5 GHz) i rodzimych GPU wyposażonych w 128 GB pamięci oraz sieć o przepustowości 200 Gb/s.

Rekordowe wyniki i realne zastosowania
Nowy model został przetestowany na przykładzie Zhuangli Reservoir w prowincji Shandong, gdzie przy użyciu 200 węzłów obliczeniowych i 800 procesorów graficznych udało się zasymulować proces powodziowy w zaledwie trzy minuty – osiągając ponad 160-krotne przyspieszenie względem modelu TRITON.

„Możliwość przeprowadzania symulacji powodzi w skali dorzecza w ciągu kilku minut oznacza rewolucję w systemach zarządzania kryzysowego. Pozwala to na niemal natychmiastowe przewidywanie scenariuszy opadów i przepływów, co przekłada się na skuteczniejsze zarządzanie zasobami wodnymi oraz ograniczenie strat ludzkich i materialnych” – podkreślił Nan w swojej publikacji.