Ewolucja w stronę autonomii: GPT-5.4 wprowadza natywne sterowanie systemami operacyjnymi

OpenAI wprowadziło na rynek model GPT-5.4, określany przez producenta jako najbardziej wydajny system dedykowany do złożonych zastosowań profesjonalnych. Nowa iteracja wprowadza natywną funkcję obsługi komputera oraz rekordowe okno kontekstowe o rozmiarze 1 miliona tokenów, co fundamentalnie zmienia sposób automatyzacji procesów w przedsiębiorstwach.

 

Model GPT-5.4, udostępniony 5 marca 2026 roku, reprezentuje nową generację systemów typu „frontier model”, które integrują zaawansowane wnioskowanie z bezpośrednim sterowaniem oprogramowaniem. Kluczowym wyróżnikiem wersji 5.4 jest funkcja „Computer Use”, pozwalająca sztucznej inteligencji na nawigowanie po pulpicie, klikanie elementów interfejsu i wprowadzanie danych w dowolnych aplikacjach biznesowych, od arkuszy kalkulacyjnych po systemy CRM. W testach OSWorld-Verified model uzyskał wynik 75%, co stawia go powyżej średniej sprawności ludzkiego użytkownika (72,4%) w nawigowaniu po interfejsach graficznych wyłącznie na podstawie zrzutów ekranu. OpenAI zunifikowało również możliwości modelu, łącząc silnik logiczny z zaawansowanymi funkcjami programistycznymi znanymi z wcześniejszego GPT-5.3-Codex, co pozwala na płynne przechodzenie od planowania zadań do ich technicznej realizacji.

 

Pod względem merytorycznym GPT-5.4 wykazuje znaczący postęp w rzetelności generowanych treści. Producent deklaruje, że model jest o 18% mniej podatny na błędy w porównaniu do wersji GPT-5.2, a liczba fałszywych twierdzeń w odpowiedziach (tzw. halucynacji) spadła o 33%. W nowym benchmarku GDPval, który ocenia zdolność AI do wykonywania zadań w 44 zawodach opartych na pracy z wiedzą, model osiągnął 83% skuteczności, wygrywając lub remisując z ludzkimi ekspertami. Wprowadzono również nową architekturę „Thinking”, która w wersji ChatGPT Plus i Pro pozwala użytkownikom na podgląd planu działania modelu przed wygenerowaniem ostatecznej odpowiedzi. Użytkownicy mogą teraz modyfikować instrukcje w trakcie „procesu myślowego” AI, co eliminuje konieczność wielokrotnego restartowania konwersacji przy skomplikowanych projektach.

 

Efektywność ekonomiczna GPT-5.4 została zoptymalizowana pod kątem API i dużych wdrożeń korporacyjnych. Choć cena za milion tokenów wejściowych wynosi 2,50 USD, model zużywa od 18% do 20% mniej tokenów do rozwiązania tych samych problemów technicznych co jego poprzednik, GPT-5.2. Przekłada się to na szybsze czasy odpowiedzi i niższy całkowity koszt posiadania (TCO) dla firm budujących własne systemy agentowe. Model obsługuje obecnie okno kontekstowe o wielkości 1 miliona tokenów, co pozwala na jednoczesną analizę tysięcy stron dokumentacji technicznej lub całych repozytoriów kodu. Nowa wersja „Pro” oferuje dodatkowo tryb „Extreme reasoning”, dedykowany do najtrudniejszych problemów matematycznych i architektonicznych, które wymagają wielogodzinnych procesów obliczeniowych.