Na jakich chipach działa DeepSeek R1?

29 January 2025

DeepSeek R1, najnowszy model sztucznej inteligencji z Chin, przyciąga uwagę ze względu na niskie koszty użytkowania i wysoki poziom skuteczności. Jak się okazuje, może to odrobinę zaskakiwać.

Według wielu źródeł, model ten działa na chipie Huawei Ascend 910C, co czyni go ważnym elementem w trwającej wojnie technologicznej między USA a Chinami oraz ograniczeniach eksportowych. Układy Huawei Ascend 910C używane są do wnioskowania (inferencji). Chociaż model R1 został wytrenowany na układach NVIDIA H800, to jego codzienna praca opiera się na chipie zaprojektowanym przez Huawei. Proces inferencji polega na analizowaniu nowych danych przez wytrenowany model i podejmowaniu decyzji na podstawie wcześniejszych wzorców.

Ascend 910C to nowoczesny procesor AI od Huawei, który został zaprezentowany w ubiegłym roku jako konkurent dla H100 i B20. Jego stosunkowo niski koszt w porównaniu do procesorów Nvidia sprawia, że stanowi atrakcyjne rozwiązanie dla modeli AI, takich jak DeepSeek R1.

Huawei Ascend 910

DeepSeek to chiński startup AI, założony w 2023 roku i finansowany przez fundusz hedgingowy High-flyer. Firma koncentruje się na tworzeniu open source’owych dużych modeli językowych, a jej najnowszy produkt – DeepSeek R1 – to wszechstronny system AI dostępny za darmo i bez ograniczeń, w przeciwieństwie do konkurencyjnych rozwiązań, takich jak OpenAI czy Gemini. Od 10 stycznia aplikacja czatbota oparta na R1 stała się najczęściej pobieraną aplikacją w USA, wyprzedzając ChatGPT.

Główną przewagą DeepSeek R1 jest jego efektywność kosztowa. Podczas gdy OpenAI pobiera 15 dolarów za milion tokenów wejściowych, DeepSeek R1 kosztuje jedynie 0,55 dolara. To sprawia, że model jest dostępny dla szerokiego grona użytkowników i firm, które nie chcą ponosić wysokich kosztów korzystania z AI.