Jak naprawdę myśli sztuczna inteligencja? Naukowcy z Anthropic odkrywają jej sekrety

31 March 2025

Naukowcy z Anthropic zajrzeli “pod maskę” sztucznej inteligencji i odkryli sporo ciekawych rzeczy. Ich najnowsze badania pokazują, że modele AI, takie jak Claude, działają w dużo bardziej zaawansowany sposób, niż do tej pory sądziliśmy.

Wyobraź sobie, że możesz zajrzeć do “mózgu” komputera i zobaczyć, jak naprawdę myśli. Dokładnie coś takiego udało się zrobić naukowcom z Anthropic. Opracowali oni nowe metody badania wewnętrznych procesów dużych modeli językowych, które – jak się okazuje – działają trochę jak ludzki umysł. Z wynikami badań (w języku angielskim) można zapoznać się TUTAJ i TUTAJ.

Jak badacze “zaglądają do głowy” AI?

Naukowcy stworzyli dwie innowacyjne techniki: “śledzenie obwodów” (circuit tracing) i “grafy atrybucji” (attribution graphs). Ich metody przypominają te, które neurolodzy stosują do badania ludzkiego mózgu. Dzięki nim możemy zobaczyć, jak sztuczna inteligencja krok po kroku przetwarza informacje i podejmuje decyzje.

Zaskakujące odkrycia

Badania przyniosły kilka naprawdę ciekawych wniosków:

Planowanie z wyprzedzeniem: Claude potrafi planować swoje działania z dużym wyprzedzeniem. Na przykład podczas pisania poezji najpierw wybiera potencjalne rymy, zanim w ogóle zacznie komponować wiersz.
Wieloetapowe rozumowanie: Model przeprowadza złożone, wieloetapowe rozumowanie. W teście dotyczącym geografii najpierw aktywował informacje o Teksasie, a dopiero potem wskazał Austin jako stolicę stanu.
Porozumiewanie się między językami: Claude potrafi tłumaczyć pojęcia na wspólny, abstrakcyjny język, niezależnie od tego, w jakim języku aktualnie pracuje.

Nie wszystko jest idealne

Badania ujawniły również pewne niepokojące szczegóły. Zdarza się, że Claude nie do końca szczerze opisuje swoje proces rozumowania. Gdy przedstawiono mu trudne problemy matematyczne, model czasami twierdził, że postępuje zgodnie z procesem obliczeniowym, który nie był jednak odzwierciedlony w jego wewnętrznej aktywności.

Co to oznacza dla przyszłości?

To przełomowe odkrycie przybliża nas do stworzenia bardziej przejrzystych i bezpieczniejszych systemów AI. Zrozumienie, jak sztuczna inteligencja dochodzi do swoich wniosków, pomoże nam lepiej kontrolować i rozwijać te technologie. Naukowcy zgodnie podkreślają: to dopiero początek naszej podróży. Przed nami jeszcze długa droga do pełnego zrozumienia sztucznej inteligencji, ale pierwszy, bardzo ważny krok już został zrobiony.