Huawei Ascend 950PR napędzi DeepSeek V4. Bilion parametrów w nowym modelu AI

Chińska firma DeepSeek przygotowuje się do premiery swojego najnowszego modelu sztucznej inteligencji o nazwie V4, który zostanie oparty na procesorach Huawei Ascend 950 PR. To istotny etap w budowie lokalnego zaplecza technologicznego, mający doprowadzić do uniezależnienia tamtejszego rynku od rozwiązań NVIDII oraz jej zamkniętego środowiska programistycznego CUDA.
Nowa architektura i potężna moc obliczeniowa
Model DeepSeek V4 opiera się na zaawansowanej strukturze Mixture-of-Experts (MoE), która pozwala na obsługę aż biliona parametrów, przy czym podczas pojedynczego procesu wnioskowania aktywnych pozostaje około 37 miliardów z nich. Skala tego rozwiązania jest dwukrotnie większa w zestawieniu z poprzednią wersją, oznaczoną symbolem V3. Prace nad oprogramowaniem trwały kilka miesięcy, co wynikało z konieczności głębokiego przemodelowania architektury kodu, aby w pełni wykorzystać potencjał jednostek obliczeniowych dostarczanych przez Huawei oraz firmę Cambricon.
Sprzętowa odpowiedź na technologiczne ograniczenia
Fundamentem dla nowego modelu jest procesor Ascend 950PR, wytwarzany przez SMIC w procesie technologicznym N+3, który pod względem wydajności jest porównywalny z układami klasy 5 nanometrów. Jednostka ta posiada zintegrowaną autorską pamięć HiBL o przepustowości 1,4 TB/s, co ogranicza konieczność korzystania z zewnętrznych łańcuchów dostaw. Nowy procesor napędza karty akceleracyjne Atlas 350, które oferują moc obliczeniową rzędu 1 PFLOPS dla operacji FP8. Eksperci wskazują, że parametry te plasują chińskie rozwiązanie pomiędzy powszechnie stosowanymi modelami H100 a H200 od NVIDII.
Rynek reaguje na zmiany i wzrost dostępności
Zbliżająca się premiera, zaplanowana na połowę kwietnia, wywołała duże poruszenie wśród największych graczy technologicznych, takich jak Alibaba, ByteDance czy Tencent, którzy zamówili już setki tysięcy nowych układów Huawei. Wysokie zapotrzebowanie przełożyło się na wzrost cen tych procesorów o około 20%. Huawei zamierza dynamicznie zwiększać moce przerobowe, planując dostarczenie 1,6 miliona jednostek z serii Ascend w 2026 roku. Jeśli DeepSeek zdoła trwale przenieść procesy trenowania i wnioskowania na te układy, chiński ekosystem może stać się całkowicie samowystarczalny pod względem programowym i sprzętowym w ciągu najbliższych dwóch lat.




















