Nowy model AI od ByteDance bije rekordy w testach ogólnej sztucznej inteligencji

Właściciel TikToka włączył się do wyścigu o najinteligentniejsze AI na rynku. Ich nowy model Seed-Thinking-v1.5 podobno radzi sobie lepiej niż rozwiązania gigantów takich jak Google czy OpenAI, zwłaszcza w testach matematycznych i logicznych.
Co sprawia, że ten model jest wyjątkowy? ByteDance zastosował architekturę Mixture-of-Experts, dzięki której AI może korzystać z ogromnej puli 200 miliardów parametrów, choć przy pojedynczym zadaniu aktywuje tylko 20 miliardów. To trochę tak, jak mieć do dyspozycji cały sztab ekspertów, ale angażować tylko tych, którzy są potrzebni do konkretnego problemu.
Wyniki robią wrażenie – 86,7% dokładności w matematycznych testach AIME 2024, 55% w trudnych zadaniach programistycznych Codeforces i 77,3% w quizie naukowym GPQA. Co jednak najważniejsze – model od ByteDance przebija Google Gemini 2.5 Pro i OpenAI o3-mini-high w benchmarku ARC-AGI, który sprawdza, jak blisko jesteśmy do stworzenia tzw. ogólnej sztucznej inteligencji.

Proces uczenia opierał się na wyselekcjonowanej bazie 400 tysięcy przykładów, z których 75% stanowiły zadania z jednoznacznymi rozwiązaniami, a pozostałe 25% to pytania otwarte bez sprecyzowanych odpowiedzi. Kluczowym elementem było wdrożenie zaawansowanego systemu uczenia ze wzmocnieniem, wykorzystującego dwa odrębne mechanizmy weryfikacji: jeden oceniający poprawność końcowego wyniku, drugi analizujący jakość procesu rozumowania prowadzącego do rozwiązania.
Za projektem stoi zespół ByteDance Seed LLM, kierowany przez Yong Hui Wu, z Haibin Lin w roli publicznego przedstawiciela. Model nie jest jeszcze dostępny dla zwykłych użytkowników, ale jego pojawienie się z pewnością podgrzewa atmosferę w świecie sztucznej inteligencji.