Elon Musk jest zdania, że zasoby danych do szkolenia AI zostały wyczerpane
Elon Musk, kontrowersyjny biznesman-polityk, m.in. właściciel firmy xAI, wyraził swoje zdanie na temat przyszłości sztucznej inteligencji.
Doradca nowego prezydenta USA stwierdził, że branża osiągnęła moment, w którym dostępne dane rzeczywiste zostały niemal całkowicie wykorzystane. W rozmowie na platformie X (dawniej Twitter) Musk powiedział: „Praktycznie wyczerpaliśmy kumulatywną sumę ludzkiej wiedzy… w trenowaniu AI. To wydarzyło się w zasadzie w zeszłym roku.” Musk podkreślił, że przyszłość sztucznej inteligencji będzie opierać się na danych syntetycznych, generowanych przez same modele AI.
ELON: THE CUMULATIVE SUM OF HUMAN KNOWLEDGE HAS BEEN EXHAUSTED IN AI
’We’ve now exhausted basically the cumulative sum of human knowledge has been exhausted in AI training.
That happened, basically, last year.”
Source: @elonmusk @Mark_Penn @ces https://t.co/FmU8m1PbJd pic.twitter.com/ytskiVKJsL
— Mario Nawfal (@MarioNawfal) January 9, 2025
Podobne poglądy wyraził wcześniej Ilya Sutskever, współzałożyciel OpenAI, na konferencji NeurIPS w grudniu, nazywając obecny moment w branży AI „szczytem danych”. Wskazał on, że brak nowych danych rzeczywistych wymusi zmianę metod trenowania modeli AI. Korzystanie z danych syntetycznych staje się standardem wśród największych graczy technologicznych. Firmy takie jak Microsoft, Google, Meta, OpenAI czy Anthropic już wykorzystują tę technologię do rozwijania swoich flagowych modeli.
Poza umożliwieniem dalszego rozwoju AI, dane syntetyczne przynoszą również oszczędności. Przykładowo, startup AI Writer stworzył model Palmyra X 004 niemal wyłącznie na bazie danych syntetycznych za kwotę 700 tysięcy dolarów. Dla porównania, opracowanie modelu o podobnej wielkości przez OpenAI kosztowało około 4,6 miliona dolarów. Ograniczenia związane z danymi rzeczywistymi oznaczają, że branża AI wchodzi w nową erę, gdzie dane syntetyczne odegrają kluczową rolę. Wprowadzenie tych technologii nie tylko przyspiesza rozwój modeli, ale także otwiera nowe możliwości eksplorowania samouczenia się i optymalizacji kosztów. Jak pokazują działania gigantów technologicznych, syntetyczne dane staną się podstawą przyszłych innowacji w dziedzinie sztucznej inteligencji.