Fujitsu wykorzystuje superkomputer Fugaku do trenowania LLM

14 May 2024

Chociaż superkomputer Fugaku firmy Fujitsu nie jest już najszybszą maszyną na świecie z listy Top 500 superkomputerów, to nadal jest to bardzo wydajny system, a wszechstronność procesora A64FX pozwala na wykorzystanie go do różnych obciążeń, takich jak sztuczna inteligencja.

W tym tygodniu Fujitsu wydało Fugaku-LLM, duży model językowy z zaawansowanymi możliwościami przetwarzania języka japońskiego, który jest przeznaczony zarówno do badań, jak i zastosowań komercyjnych.

Fugaku-LLM firmy Fujitsu został przeszkolony przy użyciu 380 miliardów tokenów w 13 824 węzłach superkomputera Fugaku opartego na procesorze A64FX, który obsługuje tryby FP64, FP32, FP16 i INT8 dla różnych zastosowań sztucznej inteligencji i konwencjonalnych superkomputerów. Szkolenie Fugaku-LLM naturalnie wykorzystało techniki rozproszonego uczenia równoległego zoptymalizowane pod kątem architektury superkomputera i połączenia Tofu D.

To obszerne szkolenie skoncentrowane na języku japońskim odróżnia go od innych japońskich modeli, które były szkolone głównie na angielskich zbiorach danych. W rezultacie Fugaku-LLM może pochwalić się doskonałą biegłością w języku japońskim, osiągając średni wynik 5,5 w japońskim MT-Bench. To najwyższy wynik wśród ogólnodostępnych modeli wytrenowanych na oryginalnych danych z Japonii. Szczególnie wyróżnia się w naukach humanistycznych i społecznych, osiągając imponujący wynik 9,18, według Fujitsu.

Inicjatywa Fugaku-LLM była napędzana przez współpracę wiodących japońskich instytucji, w tym Tokyo Institute of Technology, Tohoku University, Fujitsu Limited, RIKEN, Nagoya University, CyberAgent i Kotoba Technologies. Jednym z powodów współpracy był niedobór procesorów graficznych zwykle wykorzystywanych do trenowania i wnioskowania modeli sztucznej inteligencji. Innym powodem było to, że model mógł być używany ze 150-rdzeniowym procesorem centrów danych Monaka nowej generacji firmy Fujitsu, zoptymalizowanym zarówno pod kątem obciążeń AI, jak i HPC.

Fugaku-LLM jest teraz dostępny zarówno do celów akademickich, jak i komercyjnych na określonych warunkach licencyjnych z GitHub i Hugging Face (choć Fujitsu nie podało żadnych linków). Ponadto od 10 maja 2024 r. będzie on również oferowany za pośrednictwem portalu badawczego Fujitsu.

Konsekwencje Krajowego Systemu Cyberbezpieczeństwa – Czy rzeczywiście najnowszy projekt KSC jest “strzelaniem z armaty do komara”?

Najnowszy numer

Więcej z danej firmy

CFO strategicznym partnerem biznesu – już 74% dyrektorów finansowych kształtuje...

5 December 2025

Cyberprzestępcy uruchamiają własne modele AI – “złośliwe LLM-y” naśladują legalne...

5 December 2025

Polecane artykuły

Premiera AI RADAR Trendbook – największa polskojęzyczna publikacja o trendach...

3 December 2025

Ingram Micro VC Days 2025: Za kulisami technologii

2 December 2025

PFR otwiera Centrum Kompetencji AI, które ma przyspieszyć cyfrową transformację...

2 December 2025

IFS Industrial X Unleashed w Nowym Jorku – AI wychodzi...

28 November 2025

Polsko-niemieckie konsultacje cyfrowe – suwerenność technologiczna i AI na pierwszym...

28 November 2025

ACTION S.A. z dwucyfrowym wzrostem przychodów w kanale B2B i...

28 November 2025

Samsung Display Awards 2025 – wieczór partnerów, technologii i spokojnej...

27 November 2025

Lenovo stworzyło nowy superkomputer dla Merck KGaA

26 November 2025

HP Inc podało wyniki kwartalne

26 November 2025

Dell Technologies podsumowało trzeci kwartał

26 November 2025

Fujitsu wykorzystuje superkomputer Fugaku do trenowania LLM

Najnowszy numer

Więcej z danej firmy

CFO strategicznym partnerem biznesu – już 74% dyrektorów finansowych kształtuje...

Cyberprzestępcy uruchamiają własne modele AI – “złośliwe LLM-y” naśladują legalne...

Arkadiusz Długozima pokieruje segmentem Copilot PC w TD SYNNEX Polska...

Suwerenność danych w rękach Europy – japońskie procesory Fujitsu zasilą...

GAIN AI Act odłożony na półkę – Nvidia przekonała Biały...

Replit rozszerza wykorzystanie Google Cloud – nowy sojusz w wyścigu...

Microsoft inwestuje w przywództwo, Cichocka i Albin w nowych funkcjach...

Amazon Nova Forge pozwoli firmom trenować modele AI od wczesnych...

Alibaba uruchamia AI Mode – koniec ręcznego wyszukiwania dostawców dla...

Google 2025 Year in Search: hasło „Gemini” rośnie najszybciej –...

Polecane artykuły

Premiera AI RADAR Trendbook – największa polskojęzyczna publikacja o trendach...

Ingram Micro VC Days 2025: Za kulisami technologii

PFR otwiera Centrum Kompetencji AI, które ma przyspieszyć cyfrową transformację...

IFS Industrial X Unleashed w Nowym Jorku – AI wychodzi...

Polsko-niemieckie konsultacje cyfrowe – suwerenność technologiczna i AI na pierwszym...

ACTION S.A. z dwucyfrowym wzrostem przychodów w kanale B2B i...

Samsung Display Awards 2025 – wieczór partnerów, technologii i spokojnej...

Lenovo stworzyło nowy superkomputer dla Merck KGaA

HP Inc podało wyniki kwartalne

Dell Technologies podsumowało trzeci kwartał

Najnowszy numer