DeepSeek udowadnia, że w AI liczy się pomysł, a nie brutalna moc obliczeniowa

29 January 2025

Niespełna dwa miesiące, 2048 procesorów graficznych Nvidii i język programowania sprzed ery CUDA – chiński DeepSeek pobił rekord efektywności w szkoleniu sztucznej inteligencji. Ich model językowy (671 miliardów parametrów) powstał 10 razy szybciej niż konkurencyjne rozwiązania gigantów takich jak Meta. Sekret? Inżynierowie zamiast standardowych narzędzi Nvidii sięgnęli po zapomniany niemal “asembler GPU”.

W wyścigu o dominację w sztucznej inteligencji pojawił się nowy gracz. Chiński start-up DeepSeek, korzystając z klastra 2048 GPU Nvidia H800, wytrenował swój flagowy LLM w zaledwie 60 dni. Efektywność? Dziesięciokrotnie wyższa niż w przypadku Llama 3 – przy jednoczesnym zużyciu energii niższym o 90%.

Kluczem okazał się nietypowy pomysł: zamiast korzystać z popularnego frameworka CUDA, inżynierowie sięgnęli po PTX (Parallel Thread Execution) – niskopoziomowy język programowania, który Nvidia promowała… 15 lat temu.

„To jak porzucenie wygodnego autopilota w samolocie dla ręcznego sterowania śrubokrętem. Ale tylko tak można wycisnąć z GPU ostatnie pokłady mocy” – tłumaczy anonimowo jeden z ekspertów cytowany przez Wired.

PTX, nazywany “asemblerem dla kart graficznych”, pozwolił na mikroskopijne dostrojenie każdej operacji. Na przykład: 20 z 132 jednostek przetwarzających w każdym GPU przeznaczono wyłącznie na komunikację między serwerami, co przyspieszyło wymianę danych. Dodatkowo DeepSeek opracował autorski system DualPipe, nakładający fazy obliczeń i komunikacji – jak taśma w fabryce, która nigdy nie stoi.

Efekt? Koszt szkolenia modelu wyniósł jedyne 5,6 mln dolarów – Meta na podobne zadanie wydała ok. 500 mln.

Choć liczby robią wrażenie, część środowiska podchodzi do doniesień z rezerwą.

„PTX to piekło dla programistów. Każda zmiana w architekturze Nvidii może unieważnić te optymalizacje” – ostrzega na Twitterze @GPU_Guru.

Niepokój widać też na Wall Street. Inwestorzy obawiają się, że jeśli każdy zacznie tak majstrować przy GPU, sprzedaż najdroższych modeli spadnie. Paradoksalnie, entuzjazmu nie kryje… Pat Gelsinger, szef Intela.

„To dowód, że AI zmieści się nawet w taniej elektronice. Wyobrażacie sobie ChatGPT w pralce?” – żartuje w rozmowie z Tom’s Hardware.

Chińska firma nie zwalnia tempa. Model DeepSeek-V3 jest już dostępny open-source, a w planach jest stworzenie AI ogólnego przeznaczenia (AGI).

„Nasza filozofia? Mniej mocy, więcej sprytu” – mówi w wideowywiadzie CEO firmy, cytując starochińskie przysłowie o szczupaku, który płynął pod prąd.

Najnowszy numer

Więcej z danej firmy

Polecane artykuły

AI Poland – nowy głos polskiej sztucznej inteligencji w Europie...

18 June 2025

Samsung Memory Summit 2025: “Spotkaliśmy się już po raz czwarty...

18 June 2025

Samsung Memory Summit 2025: “Kto potrafi dostarczyć pamięci ogromnej pojemności...

18 June 2025

DeepSeek udowadnia, że w AI liczy się pomysł, a nie brutalna moc obliczeniowa

Najnowszy numer

Więcej z danej firmy

TSMC już za rok przejmie rekordowe trzy czwarte rynku produkcji...

Liderzy Google, Microsoftu i Cisco w Watykanie – AI pod...

OpenAI z kontraktem wartym 200 milionów dolarów od Pentagonu

AI Poland – nowy głos polskiej sztucznej inteligencji w Europie...

Meta kusiła pracowników OpenAI i Google DeepMind milionami dolarów. Dlaczego...

Fluentbe: Polskie AI w edukacji. Technologia wspiera, ale nie zastępuje...

AI zmienia zasady gry w reklamie

Nowy poziom interaktywności zabawek. Barbie z zaimplementowaną AI

NVIDIA wraz z Deutsche Telekom zbudują pierwszą w Europie gigafabrykę...

Rosnące koszty inferencji hamują adopcję AI w przedsiębiorstwach

Polecane artykuły

AI Poland – nowy głos polskiej sztucznej inteligencji w Europie...

Samsung Memory Summit 2025: “Spotkaliśmy się już po raz czwarty...

Samsung Memory Summit 2025: “Kto potrafi dostarczyć pamięci ogromnej pojemności...

IT Champions 2025: “Przesuwamy granice tego, co możliwe” – podkreślił...

IT Champions 2025: “Ta nagroda jest dla nas ogromną motywacją”...

IT Champions 2025: “Od 20 lat inwestujemy w kompetencje i...

Samsung Memory Summit 2025: “Takiej współpracy życzyłbym wszystkim partnerom biznesowym”...

Samsung Memory Summit 2025: “Dobry rok za nami. Dobry rok...

IT Champions 2025: “Dbamy o to, żeby biznesy były połączone...

Jabra otworzyła showroom w Warszawie i prezentuje system konferencyjny PanaCast...

Najnowszy numer