DeepSeek – AI, która wstrząsnęła światowymi rynkami technologii

DeepSeek, chiński gracz specjalizujący się w generatywnej sztucznej inteligencji, zdołał w krótkim czasie wprowadzić rozwiązania, które sprawiły, że branża zaczęła zadawać fundamentalne pytania o przyszłość mocy obliczeniowych i kosztów AI. Dzięki architekturze opartej na koncepcji Mixture of Experts, innowacyjnym mechanizmom FP8 Training i konsekwentnemu stawianiu na efektywność energetyczną firma zagroziła nie tylko pozycji amerykańskich gigantów, lecz także wywołała trzęsienie ziemi na giełdzie i sprowokowała zdecydowane reakcje rządów w różnych częściach świata.
Pierwsze sygnały nadchodzącej rewolucji pojawiły się, gdy DeepSeek zaprezentował model R1. Informacja, że koszt jego treningu wyniósł zaledwie kilka milionów dolarów, zaskoczyła społeczność skupioną wokół zaawansowanych modeli językowych. Dla porównania, podobnej klasy projekty prowadzone na Zachodzie potrzebowały wcześniej środków przekraczających sto milionów dolarów. Różnica była tak uderzająca, że w krótkim czasie na rynku pojawiły się liczne analizy próbujące wyjaśnić sekret sukcesu Chińczyków. O ile część specjalistów wskazywała, że firma mogła korzystać z ukrytych subsydiów i korzystniejszych cen energii, o tyle wielu obserwatorów zaczęło doceniać również oryginalną architekturę DeepSeek, która umożliwia pracę modelu przy znacznie mniejszym wykorzystaniu zasobów.
Mixture of Experts jako główna przewaga DeepSeek
W centrum tej architektury stoi Mixture of Experts, podejście pozwalające dynamicznie aktywować tylko wybrane moduły w strukturze sieci neuronowej. Zamiast wykorzystywać wszystkie warstwy w każdej operacji, model R1 decyduje się włączać wyłącznie te bloki, które najbardziej odpowiadają aktualnemu typowi zadania. DeepSeek uznaje tę metodę za klucz do ograniczenia zużycia energii i skrócenia czasu treningu. Ważnym uzupełnieniem jest strategia FP8 Training, czyli trenowanie modeli w formacie 8-bitowym. Choć takie skracanie bywa ryzykowne, bo często zwiększa niestabilność procesu uczenia, firma opracowała mechanizmy stabilizujące, co pozwoliło jej na niezwykle długie, nieprzerwane sesje treningowe, bez drastycznych wahań.
Tak duży nacisk na efektywność przełożył się na obniżenie opłat za korzystanie z API. Oferta DeepSeek, sięgająca około dziesięciu centów za milion tokenów, to ułamek stawek ustalanych przez zachodnie odpowiedniki. Organizacje działające w obszarach wymagających przetwarzania ogromnych wolumenów danych – jak medycyna, edukacja czy branża fintech – szybko dostrzegły, że mogą zaoszczędzić znaczną część budżetu, przechodząc na tańsze rozwiązania Chińczyków. Ten bodziec finansowy zadziałał jak zapłon dla kolejnych podmiotów, które do niedawna nawet nie rozważały współpracy z DeepSeek, a dziś coraz chętniej wdrażają jego modele.

Chiński startup przewraca stolik
Zainteresowanie korzystaniem z usług chińskiej firmy wzrosło tak bardzo, że kilka amerykańskich i europejskich przedsiębiorstw zaczęło dość otwarcie rozważać integrację R1 lub jego następców z własnymi systemami chmurowymi. Według nieoficjalnych doniesień Microsoft rozpatruje możliwość włączenia DeepSeek do katalogu usług dostępnych w ramach Azure, zwłaszcza dla klientów operujących na rynkach azjatyckich, ale także dla mniejszych start-upów na całym świecie. Jest to o tyle ciekawe, że dotąd Microsoft stawiał głównie na partnerstwo z OpenAI. Jeśli jednak wprowadzenie rozwiązań od DeepSeek rzeczywiście obniżyłoby koszty dużych wdrożeń nawet o kilkadziesiąt procent, to ten ruch mógłby się stać realną alternatywą lub przynajmniej solidnym uzupełnieniem portfolio.
Z kolei Google, czując na plecach oddech nowego gracza, zdecydowało się udostępnić część swoich modeli w otwartym API, rezygnując z części opłat licencyjnych. Meta postanowiła zakupić niemiecki start-up zajmujący się kompresją modeli, co odczytano jako próbę skopiowania recepty DeepSeek na ograniczanie rozmiarów sieci przy jednoczesnym zachowaniu wysokiej jakości wyników. Jakby tego było mało, OpenAI i Anthropic ogłosiły przyspieszenie prac nad własnymi wdrożeniami architektury Mixture of Experts, chcąc w ten sposób ograniczyć zapotrzebowanie na moc obliczeniową i energię. Choć szczegółowe terminy wprowadzenia takich rozwiązań nie są jeszcze znane, sama deklaracja świadczy o tym, że DeepSeek zmusił zachodnich gigantów do zmiany strategicznych priorytetów.
Najbardziej spektakularnym efektem działalności chińskiego gracza były jednak wydarzenia na giełdzie. Kiedy do opinii publicznej dotarły informacje o sukcesach R1 i niezwykle niskim koszcie treningu, inwestorzy zaczęli szybko reagować na perspektywę spadku popytu na tradycyjne, potężne GPU. Szczególnie mocno ucierpiała Nvidia, której kurs w ciągu jednego dnia spadł o kilkanaście procent, co przyniosło gigantyczny ubytek wartości rynkowej. Był to jeden z największych jednodniowych spadków w dziejach tej spółki. Równie dotkliwe okazały się konsekwencje dla producentów zaawansowanych układów i firm energetycznych; perspektywa, że większa efektywność modeli AI doprowadzi do zmniejszenia zapotrzebowania na prąd w centrach danych, wywołała lawinową wyprzedaż akcji. Czarny scenariusz zakłada, że redukcja zamówień na nowe serwerownie to tylko kwestia czasu, zwłaszcza jeśli DeepSeek i konkurenci pójdą dalej w stronę architektur wymagających coraz mniejszej liczby aktywnych parametrów.

Napływające dane wskazują też na roszady w portfelach inwestycyjnych. Fundusze venture capital zaczęły wstrzymywać finansowanie start-upów bazujących na drogich, zachodnich modelach wymagających kolosalnych inwestycji w GPU, a coraz chętniej wspierają projekty związane z wydajnymi architekturami typu Mixture of Experts. To z kolei sprzyja rosnącej popularności układów FPGA – uznawanych za bardziej elastyczne i wystarczająco mocne do wytrenowania oraz utrzymywania modeli na średnim poziomie złożoności. Zmiana ta, choć zaskakująca dla wielu obserwatorów, świetnie wpisuje się w trend racjonalizacji kosztów.
Koszty są ważne
Zdaniem niektórych ekspertów do najbardziej istotnych skutków wejścia DeepSeek na arenę należy obalenie dotychczasowego przekonania, że tworzenie ogromnych modeli językowych wymaga nakładów liczonych w miliardach dolarów. Chińska firma, korzystając zarówno z przemyślanych algorytmów, jak i relatywnie tanich zasobów energetycznych, udowodniła, że równie ważna jak rozmiar modelu jest jego architektura. To sygnał dla mniejszych podmiotów, iż nie potrzebują ogromnych funduszy, aby zaproponować konkurencyjne rozwiązania – wystarczy sprytne podejście do optymalizacji i wybór efektywnego formatu treningu.
Tak błyskawiczny sukces nie obył się jednak bez znaków zapytania. Pojawiły się głosy, że DeepSeek zaniża deklarowane koszty, pomijając wydatki na infrastrukturę poniesione przed 2024 rokiem lub korzystając z rozbudowanej sieci niejawnego wsparcia, takiego jak dostęp do prądu subsydiowanego przez chiński rząd. Z raportów analitycznych wynika też, że firma mogła wydać na sprzęt setki milionów dolarów, a nie zaledwie kilka. Oficjalnie jednak DeepSeek utrzymuje, że jego imponujące wyniki finansowe to efekt inteligentnego zarządzania projektami R&D, a wszystkie oskarżenia o zatajanie kosztów są jedynie próbą dyskredytacji firmy w oczach inwestorów. Do kontrowersji dochodzą także oskarżenia o omijanie restrykcji eksportowych, które blokują sprzedaż najnowszych układów GPU do Chin. Krytycy twierdzą, że znaczna część zasobów mogła trafić do DeepSeek z pominięciem oficjalnych kanałów handlowych, co firma konsekwentnie dementuje.

Bezpieczeństwo danych nie jest mocną stroną DeepSeek
Niezależnie od tego, ile prawdy jest w doniesieniach o niejawnych transferach technologii i subsydiach, główny rynek zareagował bardzo nerwowo. Pod presją opinii publicznej i obaw o bezpieczeństwo danych kolejne państwa zaczęły rozważać wprowadzenie obostrzeń lub całkowity zakaz stosowania rozwiązań DeepSeek w sektorze publicznym. Australia zrobiła to jako jedna z pierwszych, a wkrótce podobne kroki zapowiedziały Włochy i Francja. Oficjalne uzasadnienia wskazywały na ochronę prywatności i strach przed przekazywaniem wrażliwych danych do chińskich serwerowni.
Administracja w Stanach Zjednoczonych z kolei nie tylko przygląda się bliżej praktykom importowym firmy, ale też głośno rozważa nałożenie dodatkowych ceł na oprogramowanie AI pochodzące z Chin. Byłoby to uderzenie zarówno w DeepSeek, jak i w lokalne firmy, które zaczęły testować chińskie rozwiązania z czysto ekonomicznych pobudek. Pomysł spotkał się z ostrą krytyką ze strony Doliny Krzemowej, gdzie wielu przedsiębiorców obawia się nie tyle wypływu zysków za granicę, ile bardziej opóźnień w rozwoju rodzimych modeli, jeśli zabraknie zdrowej konkurencji.

Gdyby napięcia geopolityczne osiągnęły punkt wrzenia, skutki odczułby cały ekosystem AI. W takiej sytuacji stosowne mogłyby być analogie do „zimnej wojny” w dziedzinie technologii – z blokadami, sankcjami i próbami ograniczenia partnerstw badawczych po obu stronach. Tymczasem Chiny nie wydają się skłonne do wycofania się z rynku ani do ograniczenia eksportu swoich rozwiązań. Wręcz przeciwnie, analitycy twierdzą, że rząd w Pekinie może jeszcze aktywniej wspierać rozwój miejscowych championów AI, widząc w tym szansę na globalną dominację w przyszłości. Istnieje prognoza, według której chińskie modele mogą w kolejnych latach opanować do trzydziestu procent światowego rynku generatywnej sztucznej inteligencji, ze szczególnym uwzględnieniem sektora opieki zdrowotnej oraz edukacji.
Do całego zamieszania dołączyły też kwestie prawne. Pojawiły się pozwy zbiorowe przeciwko zachodnim firmom AI, zarzucające im zatajanie ryzyka konkurencji z Chin w trakcie przygotowań do debiutów giełdowych. Jeśli te procesy zakończą się niekorzystnymi wyrokami, branża technologiczna będzie musiała wykazać się większą przejrzystością w raportach i prospektach inwestycyjnych, szczególnie przy tak gwałtownie zmieniającej się sytuacji rynkowej. Niektórzy prawnicy widzą w tym również szansę na wprowadzenie klarownych regulacji, które określą zasady informowania o potencjalnym wpływie rewolucyjnych nowości technologicznych na wartość spółek.
Chińczycy nabrali rozpędu i nie zamierzają zwalniać
Tymczasem sam DeepSeek nie zamierza zwalniać tempa. Chińska firma zapowiedziała wprowadzenie kolejnej odsłony swojego modelu, tym razem zdolnego do przetwarzania nie tylko tekstu, lecz także obrazu i wideo. Już sam R1 bywa porównywany do GPT-4 pod względem zdolności do rozumowania matematycznego czy generowania kodu, choć w dużej mierze ustępuje mu w szybkości odpowiedzi. Jeśli jednak perspektywa silnej multimodalności dojdzie do skutku, przewaga kosztowa może okazać się jeszcze bardziej bolesna dla zachodnich spółek, zwłaszcza tych, które liczyły na zmonopolizowanie segmentu rozwiązań łączących kilka rodzajów danych. Na tym etapie nikt nie ma złudzeń, że DeepSeek ma zamiar aktywnie walczyć o klientów na całym świecie, co budzi jednocześnie fascynację i lęk wśród „większych” graczy.
Wpływ rewolucyjnych rozwiązań DeepSeek nie ogranicza się przy tym do firm stricte technologicznych. Sektory takie jak energetyka, marketing, medycyna czy finanse muszą szybko oszacować, jakie będą długofalowe konsekwencje mniejszego zapotrzebowania na energię i drastycznego spadku kosztów analizy danych. Przedsiębiorstwa, które zbudowały swój model biznesowy na drogich, zamkniętych API, mogą w krótkim czasie stracić część przewag konkurencyjnych. Z drugiej strony pojawiają się liczne głosy wskazujące, że niższe bariery wejścia pobudzą innowacyjność, bo mniejsze firmy i start-upy otrzymają narzędzia, które wcześniej były poza ich zasięgiem finansowym.

Niektóre korporacje, w tym Amazon, już sygnalizują, że będą dywersyfikować portfel zamówień na sprzęt, kupując więcej procesorów i chipów od kilku różnych dostawców. Dotyczy to nie tylko wielkich fabryk w Stanach Zjednoczonych, ale i nowych zakładów powstających w Europie, gdzie politycy również dostrzegają szansę na wsparcie lokalnych inicjatyw AI. W Unii Europejskiej pojawił się nawet specjalny fundusz, który ma wspomagać rozwój energooszczędnych modeli i tym samym konkurować z DeepSeek na polu efektywności. Krytycy unijnych planów obawiają się jednak, że na realne rezultaty trzeba będzie czekać wiele lat, podczas gdy chińska firma już dziś przejmuje kolejne obszary rynku.
Ostateczny obraz wyłania się taki, że DeepSeek w ciągu zaledwie kilku miesięcy przedefiniował reguły gry w sektorze AI. Zamiast bezustannego zwiększania liczby parametrów i stawiania kolejnych serwerowni, firma udowodniła, że nie mniej istotne jest opracowanie sprytnych algorytmów, które precyzyjnie dopasowują obliczenia do potrzeb użytkownika. Efekt nie tylko przyniósł znaczne oszczędności, ale też zainicjował falę zmian: firmy dokonują gwałtownych zwrotów w strategiach, giełda reaguje nerwowo, a rządy przygotowują się do możliwości powstania nowej „zimnej wojny” w świecie cyfrowym.

Na rywalizacji mogą skorzystać mniejsze firmy i użytkownicy
Czy DeepSeek utrzyma przewagę w perspektywie kilku lat, czy może zachodni gracze nadrobią braki, przyjmując podobne rozwiązania i zyskując dystans w obszarach, w których Chińczycy wciąż pozostają w tyle? Już teraz widać, że zbliża się okres zażartej rywalizacji o klientów, partnerów i zasoby. Jednocześnie można spodziewać się dalszego zaostrzania przepisów eksportowych, nakładania barier handlowych i sporów prawnych. Większości start-upów i mniejszych przedsiębiorstw pozostaje tylko obserwacja tego starcia gigantów i korzystanie z okazji, jakie niosą niższe koszty zaawansowanych modeli generatywnych.
Niewykluczone, że w ciągu najbliższych lat DeepSeek stanie się synonimem paradygmatu opartego na efektywności, a cały przemysł AI przejdzie do epoki, w której zamiast zwiększania mocy obliczeniowej liczą się sprytne architektury. Być może to dopiero początek wielkich przemian: kolejne wersje R1 i R2, łączące tekst, obraz oraz wideo, mogą stać się katalizatorem jeszcze głębszych przeobrażeń. Jedno jest pewne: rewolucja, którą wywołała chińska firma, nie tylko wstrząsnęła rynkami finansowymi, lecz także zmusiła liderów branży do przewartościowania priorytetów i pokazała, że w świecie sztucznej inteligencji zawsze może pojawić się ktoś, kto zburzy utarte schematy.