Google DeepMind prezentuje nowe modele AI przeznaczone dla robotyki

Google DeepMind ogłosiło wprowadzenie dwóch nowych modeli sztucznej inteligencji: Gemini Robotics i Gemini Robotics-ER, które mają stanowić podstawę dla kolejnej generacji robotów. Modele te rozszerzają możliwości Gemini 2.0 o zdolność do wykonywania działań fizycznych i rozumienia przestrzennego, przybliżając wizję robotyki wielozadaniowej.
Gemini Robotics to zaawansowany model wizualno-językowo-akcyjny (VLA), który umożliwia robotom interpretowanie otoczenia i wykonywanie poleceń w sposób bardziej naturalny. Model Gemini Robotics-ER wzmacnia zdolności Gemini w zakresie rozumowania przestrzennego, pozwalając na precyzyjniejsze planowanie ruchów i interakcję z otoczeniem. Dzięki temu roboty mogą lepiej dostosowywać się do dynamicznych środowisk i wykonywać bardziej skomplikowane zadania.
Google DeepMind podkreśla, że kluczowymi cechami skutecznych modeli AI dla robotyki są uniwersalność, interaktywność i zręczność. Gemini Robotics został zaprojektowany z myślą o obsłudze różnorodnych obiektów i środowisk, a także reagowaniu na zmiany w otoczeniu. Może wykonywać złożone zadania, takie jak składanie origami czy pakowanie produktów, a jego możliwości demonstracyjne obejmują m.in. rozpoznawanie słów i wykonywanie poleceń, takich jak rzuty do kosza.

Przedstawiciele Google DeepMind podkreślają, że przyszłość robotyki wymaga rozwijania AI zdolnej do radzenia sobie z chaosem rzeczywistego świata. Współpraca z partnerami oraz stopniowe wprowadzanie zaawansowanych systemów ma na celu zbudowanie robotów, które w przyszłości będą mogły skutecznie wspierać ludzi w codziennych zadaniach.
Google od lat inwestuje w rozwój robotyki, choć historia tej działalności była burzliwa. Po zamknięciu działu Everyday Robots w 2023 roku firma zintegrowała część technologii z innymi projektami i teraz, pod szyldem generatywnej AI, wraca do tematu. Nowe modele są testowane we współpracy z firmami takimi jak Apptronik, Boston Dynamics czy Agile Robots.
Meet Gemini Robotics: our latest AI models designed for a new generation of helpful robots. 🤖
Based on Gemini 2.0, they bring capabilities such as better reasoning, interactivity, dexterity and generalization into the physical world. 🧵 https://t.co/EXRJrmxGxl pic.twitter.com/MeEkRLomXm
— Google DeepMind (@GoogleDeepMind) March 12, 2025