DeepSeek szkolił swój nowy model AI na chipach Nvidia Blackwell mimo amerykańskich sankcji

Reuters donosi, że Chiński startup DeepSeek miał trenować swój najnowszy model sztucznej inteligencji na najbardziej zaawansowanych układach Nvidii, mimo obowiązujących restrykcji eksportowych USA. Informację tę potwierdził wysoki rangą przedstawiciel administracji w Waszyngtonie.
Według źródeł rządowych model, który ma zostać zaprezentowany w najbliższych dniach, był trenowany na chipach Blackwell, obecnie najbardziej zaawansowanej architekturze AI firmy Nvidia. Zgodnie z obowiązującymi regulacjami Departamentu Handlu USA eksport tych układów do Chin jest zakazany.
Blackwell w Mongolii Wewnętrznej
Amerykańscy urzędnicy twierdzą, że układy Blackwell miały trafić do centrum danych DeepSeek w Mongolii Wewnętrznej. Jednocześnie pojawiły się obawy, że firma może próbować usunąć techniczne wskaźniki pozwalające wykryć wykorzystanie amerykańskich chipów w procesie trenowania modelu.
Administracja podkreśla, że polityka USA jest jednoznaczna i zakłada brak dostaw Blackwell do Chin. Ani Nvidia, ani DeepSeek nie skomentowały sprawy. Ambasada Chin w Waszyngtonie oświadczyła natomiast, że Pekin sprzeciwia się rozszerzaniu pojęcia bezpieczeństwa narodowego i upolitycznianiu kwestii technologicznych.
Sprawa może zaostrzyć spór w Waszyngtonie dotyczący zakresu ograniczeń wobec Chin. Część decydentów, w tym doradcy związani z sektorem technologicznym, argumentuje, że całkowite odcięcie Chin od amerykańskich półprzewodników przyspieszy rozwój lokalnych konkurentów, takich jak Huawei. Inni ostrzegają, że nawet komercyjne zastosowanie zaawansowanych akceleratorów AI może pośrednio wspierać rozwój chińskich zdolności wojskowych.
OpenAI oskarża DeepSeek o destylowanie modeli AI, sprawa trafiła do Kongresu USA
Geopolityka i destylacja modeli
W grudniu administracja Donalda Trumpa dopuściła sprzedaż do Chin układów H200, drugich pod względem wydajności po Blackwell, jednak ich wysyłka została wstrzymana z powodu chińskich zakazów.
Według amerykańskich źródeł model DeepSeek mógł być też trenowany z wykorzystaniem techniki destylacji, czyli procesu, w którym nowy model uczy się na podstawie odpowiedzi generowanych przez bardziej zaawansowane systemy. Wskazano przy tym na rozwiązania firm takich jak OpenAI, Anthropic czy Google.
To kolejny sygnał, że mimo restrykcji Chiny wciąż znajdują sposoby na dostęp do najnowszej infrastruktury AI. Dla rynku oznacza to rosnącą niepewność regulacyjną i potencjalne dalsze zaostrzenie kontroli eksportowych. Dla globalnego wyścigu AI to dowód, że bariery administracyjne nie zawsze nadążają za dynamiką technologii i interesami strategicznymi państw.





















