Foxconn uruchamia swój pierwszy model języka LLM „FoxBrain”

Tajwański gigant produkcyjny wchodzi na rynek sztucznej inteligencji z modelem optymalizowanym pod chiński oraz tajwański styl językowy.
Tajwański Foxconn poinformował o uruchomieniu swojego pierwszego dużego modelu językowego (LLM), który zostanie wykorzystany do usprawnienia procesów produkcyjnych i zarządzania łańcuchem dostaw. Model nazwany jako „FoxBrain” został wytrenowany przy użyciu 120 procesorów GPU NVIDIA H100, a proces ten zajął około czterech tygodni – przekazał w oświadczeniu największy na świecie producent elektroniki kontraktowej.
Firma, która montuje iPhone’y dla Apple’a, a także produkuje serwery AI dla NVIDII, poinformowała, że model bazuje na architekturze Llama 3.1 stworzonej przez Metę. Jest to pierwszy tajwański model językowy z możliwościami rozumowania, zoptymalizowany dla tradycyjnego chińskiego oraz tajwańskiego stylu językowego. Foxconn przyznał, że istnieje niewielka luka wydajnościowa w porównaniu z modelem chińskiego DeepSeek, jednak ogólna wydajność jest bardzo zbliżona do światowych standardów.
Model, początkowo zaprojektowany do zastosowań wewnętrznych, obejmuje analizę danych, wsparcie decyzyjne, współpracę nad dokumentami, matematykę, rozumowanie, rozwiązywanie problemów oraz generowanie kodu. Foxconn planuje współpracę z partnerami technologicznymi w celu rozszerzenia zastosowań modelu, udostępnienia informacji open-source oraz promocji AI w produkcji, zarządzaniu łańcuchem dostaw i inteligentnym podejmowaniu decyzji.

NVIDIA już zapewniła swoje wsparcie poprzez swój tajwański superkomputer „Taipei-1” oraz doradztwo techniczne podczas treningu tytułowego modelu. Foxconn zapowiedział, że więcej szczegółów na temat modelu zostanie ogłoszonych podczas konferencji developerskiej NVIDIA GTC, która odbędzie się już w połowie marca. Podczas eventu poruszone zostaną dodatkowo takie tematy jak postępy w dziedzinie obliczeń kwantowych, technologie dla superkomputerów, rozwiązania dla autonomicznych pojazdów, osiągnięcia w obszarze metaverse i rozszerzonej rzeczywistości czy zastosowania AI w medycynie i nauce.