Badanie Google DeepMind: Pojedynczy agent AI lepszy niż multi-agent w sekwencyjnych zadaniach

Badacze Google przetestowali 180 scenariuszy z modelami AI od Google, OpenAI i Anthropic, ustalając reguły wyboru między pojedynczym a wieloma agentami. Wyniki pokazują, że multi-agentowe systemy poprawiają wyniki tylko w zadaniach równoległych, np. analizie finansowej, ale obniżają skuteczność w sekwencyjnych procesach nawet o 70%. Odkrycia pomagają firmom unikać kosztownych błędów w automatyzacji procesów IT i biznesowych.​

Google opublikowało wyniki eksperymentów na benchmarkach obejmujących wyszukiwanie danych z witryn, planowanie w środowisku gry Minecraft, zadania biznesowe (e-maile, spotkania, zarządzanie projektami) oraz analizę finansową z raportów SEC. Ankieta McKinsey z listopada potwierdza problemy: tylko 2% firm w pełni wdrożyło agentów AI w IT, a większość eksperymentuje bez skalowania. Długie procesy z wieloma krokami zawodzą przez błędy kumulujące się na wczesnych etapach oraz wysokie koszty obliczeniowe przy planowaniu.​

W zadaniach sekwencyjnych (np. planowanie ruchów w wirtualnym świecie gry Minecraft) pojedynczy agent przewyższa konfiguracje z wieloma agentami, jeśli osiąga co najmniej 45% sukcesu – dodatkowe agenty pochłaniają budżet obliczeniowy i obniżają wyniki o 39-70%. W równoległych procesach, jak analiza finansowa (porównanie wyników z prognozami, cash flow dla M&A), centralny system z koordynatorem daje 80% lepszy rezultat niż solo, podczas gdy niezależne agenty – 57%. Badanie obala mit uniwersalnej wyższości wielu agentów, podkreślając zależność od typu zadania.​

Wyniki dają firmom konkretne wytyczne do projektowania procesów, redukując koszty i poprawiając ROI agentów AI w marketingu, HR czy IT. Wdrożenia na dużą skalę pozostają rzadkie z powodu złożoności i kosztów; badania Google wspierają decyzje o konfiguracjach, ale wyzwaniem jest wpływ na rynek pracy przy automatyzacji złożonych procesów biznesowych. Firmy jak np. Prosus potwierdziły korzyści wielu agentów w praktyce, lecz wyniki wskazują także na potrzebę selektywnego podejścia.​