Najnowszy duży model językowy Meta (LLaMa), wyciekł do sieci i jest dostępny do pobrania

Właściciel Facebooka ogłosił w lutym, że udostępnia model w ograniczonym zakresie wybranym naukowcom, przedstawicielom rządu i firmom do wykorzystania w obawie, że LLaMA może zostać niewłaściwie wykorzystana. Jednakże, pomimo zastosowania tych środków zapobiegawczych, model wyciekł do sieci za sprawą sieci torrent.

Duże generatywne modele językowe tworzą fragmenty tekstu na podstawie podpowiedzi, aktualnie są zdolne do automatycznego uzupełniania tekstu po chatboty zdolne do wykonywania zadań, gdy je o to poprosimy.

Eksperci ostrzegają, że ta technologia może zostać wykorzystana do zautomatyzowania produkcji dużych ilości fałszywych wiadomości, spamu, e-maili phishingowych, dezinformacji, podburzania. Organizacje budujące te modele często trzymają oprogramowanie pod osłoną, za API, lub wypuszczają ograniczone wersje lub dema.

„Jest jeszcze więcej badań, które należy przeprowadzić, aby zająć się ryzykiem stronniczości, toksycznych komentarzy i halucynacji w dużych modelach językowych”, powiedziała Meta w zeszłym tygodniu.

„Podobnie jak inne modele, LLaMA dzieli te wyzwania. Jako model fundamentowy, LLaMA jest zaprojektowana tak, aby była uniwersalna i mogła być stosowana do wielu różnych przypadków użycia, w przeciwieństwie do precyzyjnie dostrajanych modeli, które są przeznaczone do wykonywania konkretnego zadania.

„Aby zachować integralność i zapobiec niewłaściwemu użyciu, wypuszczamy nasz model na niekomercyjnej licencji skupionej na przypadkach użycia w badaniach naukowych. Dostęp do modelu będzie przyznawany na zasadzie indywidualnych przypadków badaczom akademickim; osobom związanym z organizacjami rządowymi, środowiskiem akademickim; oraz laboratoriom badawczym przemysłu na całym świecie.”

Jednak wysiłki Mety mające na celu kontrolę dostępu do LLaMA okazały się daremne, a przynajmniej tak się wydaje. Wkrótce po podzieleniu się modelem z wybranymi specjalistami oraz osobami z branży, ktoś na 4Chan zamieścił szczegóły dotyczące tego, jak uzyskać cały model poprzez wymianę plików peer-to-peer, a ostatecznie instrukcje, jak go pobrać, zostały opublikowane na GitHubie. Jak zawsze należy zachować ostrożność przy pobieraniu takich rzeczy z torrentów, na wypadek gdyby ktoś ukrył tam coś podejrzanego. 65-miliardowy model zajmuje około 220 GB miejsca na dysku.

Kopie LLaMA dostępne poprzez GitHub wydają się być legalne, zauważamy. Shawn Presser, inżynier sztucznej inteligencji, który napisał instrukcję pobierania na stronie Microsoftu, zaprezentował zrzuty ekranu, na których z powodzeniem generuje tekst z modelu. Uważa on, że badacz, który otrzymał dostęp do modelu od Mety, wyciekł go, co doprowadziło do jego być może szerszej niż oczekiwana dystrybucji.