Dostosuj preferencje dotyczące zgody

Używamy plików cookie, aby pomóc użytkownikom w sprawnej nawigacji i wykonywaniu określonych funkcji. Szczegółowe informacje na temat wszystkich plików cookie odpowiadających poszczególnym kategoriom zgody znajdują się poniżej.

Pliki cookie sklasyfikowane jako „niezbędne” są przechowywane w przeglądarce użytkownika, ponieważ są niezbędne do włączenia podstawowych funkcji witryny.... 

Zawsze aktywne

Niezbędne pliki cookie mają kluczowe znaczenie dla podstawowych funkcji witryny i witryna nie będzie działać w zamierzony sposób bez nich.Te pliki cookie nie przechowują żadnych danych umożliwiających identyfikację osoby.

Brak plików cookie do wyświetlenia.

Funkcjonalne pliki cookie pomagają wykonywać pewne funkcje, takie jak udostępnianie zawartości witryny na platformach mediów społecznościowych, zbieranie informacji zwrotnych i inne funkcje stron trzecich.

Brak plików cookie do wyświetlenia.

Analityczne pliki cookie służą do zrozumienia, w jaki sposób użytkownicy wchodzą w interakcję z witryną. Te pliki cookie pomagają dostarczać informacje o metrykach liczby odwiedzających, współczynniku odrzuceń, źródle ruchu itp.

Brak plików cookie do wyświetlenia.

Wydajnościowe pliki cookie służą do zrozumienia i analizy kluczowych wskaźników wydajności witryny, co pomaga zapewnić lepsze wrażenia użytkownika dla odwiedzających.

Brak plików cookie do wyświetlenia.

Reklamowe pliki cookie służą do dostarczania użytkownikom spersonalizowanych reklam w oparciu o strony, które odwiedzili wcześniej, oraz do analizowania skuteczności kampanii reklamowej.

Brak plików cookie do wyświetlenia.

Lenovo ustanawia nowy rekord wydajności AI na pojedynczym serwerze

Lenovo

Lenovo ogłosiło przełomowy wynik wydajności swojego najnowszego serwera AI – ThinkSystem WA7785a G3. Urządzenie osiągnęło rekordowy wynik 6708 tokenów na sekundę przy implementacji pełnoskalowego modelu DeepSeek o rozmiarze 671 miliardów parametrów na pojedynczej maszynie. To znaczący krok naprzód w dziedzinie przetwarzania ultradużych modeli językowych na pojedynczym serwerze.

Lenovo przypisuje ten sukces zastosowaniu nowoczesnej platformy obliczeniowej Wanquan, która optymalizuje dostęp do pamięci oraz wykorzystuje architekturę PCIe 5.0. Dodatkowo firma zaimplementowała specjalnie dobrane operatory z frameworka SGLang, które usprawniły zarówno proces pre-treningu, jak i inferencji modelu. Dzięki tym rozwiązaniom ThinkSystem WA7785a G3 osiągnął rekordową wydajność przy jednoczesnym zachowaniu wysokiej efektywności energetycznej.

 

Wydajność w praktycznych scenariuszach użytkowania

Testy przeprowadzone przez Lenovo wykazały imponujące osiągi serwera w różnych zastosowaniach. W symulowanych zadaniach typu pytanie-odpowiedź (z długością kontekstu 128/1K) serwer obsługiwał jednocześnie do 158 użytkowników, przy czasie generacji pojedynczego tokena wynoszącym 93 ms i czasie do pierwszego tokena na poziomie 2,01 s. W scenariuszach generowania kodu (długość kontekstu 512/4K) obsługiwano 140 użytkowników równocześnie, a TPOT wynosił 100 ms, a TTFT 5,53 s.

Dla porównania wcześniejszy model – ThinkSystem WA7780 G3 – osiągnął 2500 tokenów/s, co oznacza, że nowa generacja serwerów niemal trzykrotnie zwiększyła wydajność. Lenovo podkreśla, że serwer WA7785a G3 może bez problemu obsłużyć potrzeby firmy liczącej 1500 pracowników, co czyni go idealnym rozwiązaniem dla przedsiębiorstw i instytucji wymagających dużych mocy obliczeniowych w zakresie AI.

 

AMD

 

Współpraca Lenovo i AMD w dążeniu do jeszcze lepszych wyników

Lenovo podkreśla, że osiągnięcie tego przełomu było możliwe dzięki ścisłej współpracy z AMD oraz zespołom badawczym Lenovo Research i ICI Lab. Inżynierowie obu firm wspólnie pracowali nad optymalizacją sprzętową i programową, co doprowadziło do rekordowego wyniku. Lenovo zapowiada, że to dopiero początek – dalsze badania nad optymalizacją systemu mają na celu jeszcze większe zwiększenie wydajności i efektywności działania modeli AI.