Microsoft Memora: Nowy sposób na długotrwałą pamięć agentów AI

Zespół badawczy Microsoft Research opracował nową architekturę pamięci o nazwie Memora, która ma umożliwić agentom sztucznej inteligencji zapamiętywanie informacji w długich okresach czasu. Rozwiązanie to pozwala na drastyczne ograniczenie zużycia zasobów obliczeniowych, zachowując przy tym wysoką precyzję odzyskiwania danych z przeszłych rozmów.

 

Koniec z fragmentacją wiedzy w systemach autonomicznych

Obecne systemy sztucznej inteligencji często tracą wątek podczas długich interakcji lub wymagają ponownego przesyłania całej historii rozmowy, co generuje wysokie koszty operacyjne. Memora zmienia to podejście poprzez oddzielenie samej treści wspomnienia od sposobu, w jaki jest ono wyszukiwane przez algorytm. Zamiast indeksować surowy tekst, system tworzy tak zwane abstrakcje pierwotne, czyli krótkie podsumowania oddające istotę danej informacji. Dzięki takiemu rozwiązaniu nowe dane dotyczące tego samego zagadnienia są łączone w jeden spójny wpis, co zapobiega powstawaniu duplikatów i chaosu w bazie wiedzy agenta.

 

Wydajność potwierdzona w testach porównawczych

W testach przeprowadzonych na obszernych zbiorach danych, Memora wykazała się skutecznością na poziomie przekraczającym 86 procent, wygrywając z popularnymi obecnie rozwiązaniami typu RAG czy systemami grafowymi. Największą zaletą technologii wydaje się jednak oszczędność zasobów, gdyż Microsoft deklaruje, że ich rozwiązanie potrafi zredukować liczbę przesyłanych tokenów nawet o 98 procent w porównaniu do pełnego kontekstu rozmowy. Jak zauważa Sanchit Vir Gogia, główny analityk w Greyhound Research, kluczową różnicą jest fakt, że system traktuje odnajdywanie informacji jako proces nawigacji, a nie pojedynczą próbę trafienia w odpowiedni fragment tekstu.

 

Wyzwania wdrożeniowe i aspekty prawne

Mimo obiecujących wyników, implementacja nowej technologii w środowisku biznesowym wiąże się z konkretnymi wyzwaniami technicznymi. Najdokładniejszy tryb pracy systemu Memora jest wyraźnie wolniejszy od standardowych metod semantycznych, co może wydłużać czas oczekiwania na odpowiedź asystenta o kilka sekund. Eksperci zwracają również uwagę na konieczność dostosowania takich rozwiązań do wymogów prawnych, w tym europejskiego aktu o sztucznej inteligencji, który kładzie nacisk na przejrzystość procesów decyzyjnych algorytmów. Obecnie kod projektu został udostępniony w serwisie GitHub, co pozwala programistom na swobodne testowanie tej architektury w ich własnych aplikacjach.