Technologia X-Mind od XPENG: Nowy rodzaj rozumowania dla autonomicznych aut

Chiński producent technologii XPENG zaprezentował architekturę X-Mind, pełniącą rolę przewidującego mózgu dla systemów autonomicznych. Rozwiązanie to pozwala pojazdom na symulowanie przyszłych scenariuszy drogowych przed podjęciem konkretnego manewru, co znacząco podnosi poziom bezpieczeństwa w trudnych warunkach komunikacyjnych.

 

Od reakcji do aktywnego rozumowania zdarzeń

Nowa koncepcja odchodzi od tradycyjnych systemów opartych na prostym schemacie postrzegania i natychmiastowego działania, które często ograniczają się do reagowania na bieżące klatki obrazu. X-Mind wprowadza mechanizm wizualnego łańcucha myśli (Visual Chain-of-Thought), dzięki któremu komputer pokładowy wykonuje wewnętrzną symulację czasoprzestrzenną przed wygenerowaniem akcji. Pozwala to samochodowi zachowywać się jak doświadczony kierowca, który przewiduje ewolucję ruchu drogowego i planuje trajektorię z uwzględnieniem potencjalnych zmian w otoczeniu. Xianming Liu, szef centrum inteligencji ogólnej w XPENG, zaznaczył podczas premiery, że proaktywne rozumowanie oraz kontrolowane generowanie obrazu to niezbędne fundamenty dla wdrożenia zaawansowanych modeli świata w transporcie.

 

 

Efektywność obliczeniowa i szkic poznawczy

Kluczowym elementem architektury jest moduł szkicu poznawczego (Thought Sketch), który przekłada skomplikowane dane wizualne na uproszczoną, lecz precyzyjną reprezentację. System ten wykorzystuje autoenkoder głębokiej kompresji do zamiany dwunastu przyszłych klatek obrazu na zaledwie 96 tokenów, co drastycznie zmniejsza zapotrzebowanie na moc obliczeniową pojazdu. Zamiast przetwarzać zbędne szczegóły tekstur, algorytm skupia się na istotnych elementach, takich jak topologia dróg, stan sygnalizacji świetlnej oraz intencje nawigacyjne. Dzięki zastosowaniu innowacyjnego mechanizmu Recurrent Block Diffusion (RBD), generowanie wysokiej jakości prognoz odbywa się w jednym przebiegu obliczeniowym, co pozwala uniknąć opóźnień typowych dla standardowych modeli dyfuzyjnych.

 

Bezpieczeństwo w skomplikowanych warunkach drogowych

Testy przeprowadzone na setkach milionów klatek danych z rzeczywistego ruchu potwierdziły wysoką skuteczność nowej technologii w najbardziej wymagających scenariuszach. X-Mind znacząco redukuje błędy przewidywania trasy, szczególnie w sytuacjach nagłego hamowania pojazdu poprzedzającego, włączania się do ruchu na autostradzie czy przejazdu przez złożone skrzyżowania. Co istotne, system wykazuje zdolność do przewidywania ruchu obiektów nawet wtedy, gdy nie są one bezpośrednio widoczne w danych treningowych. Rozwiązanie to stanowi dopełnienie linii badawczej XPENG w zakresie fizycznej sztucznej inteligencji, obejmującej wcześniej zaprezentowane moduły X-World i X-Foresight. W przyszłości opracowana technologia ma znaleźć zastosowanie nie tylko w motoryzacji, ale również w szerszym ekosystemie inteligentnych maszyn i robotyki.