ChatGPT zyska fizyczną formę. Ponad 200 ekspertów pracuje nad sprzętem od OpenAI

Twórca ChataGPT, firma OpenAI, intensyfikuje prace nad własną linią urządzeń konsumenckich, w tym inteligentnym głośnikiem wyposażonym w zaawansowaną kamerę. Projekt, nad którym czuwa zespół ponad 200 specjalistów, ma na celu stworzenie ekosystemu sprzętowego zdolnego konkurować z rozwiązaniami od Google, Amazonu czy Apple.
Według najnowszych doniesień, OpenAI przygotowuje się do debiutu na rynku elektroniki użytkowej z rodziną urządzeń napędzanych sztuczną inteligencją. Centralnym punktem nowej oferty ma być inteligentny głośnik, którego cena rynkowa ma oscylować w granicach 200–300 dolarów. Urządzenie to, w przeciwieństwie do tradycyjnych asystentów głosowych, zostanie wyposażone w kamerę umożliwiającą rozpoznawanie twarzy oraz identyfikację obiektów w otoczeniu użytkownika. Pozwoli to na realizację zakupów poprzez autoryzację biometryczną oraz proaktywne wsparcie w codziennych obowiązkach, takie jak analizowanie otoczenia w czasie rzeczywistym.
Prace nad warstwą sprzętową prowadzone są przez dynamicznie powiększający się zespół, w skład którego wchodzą byli inżynierowie Apple, a projekt ma wspierać legendarny projektant Jony Ive. Oprócz wspomnianego głośnika, OpenAI rozważa również wprowadzenie na rynek inteligentnych okularów oraz nowoczesnej lampy AI. Choć harmonogram prac nad okularami pozostaje niepewny ze względu na silną konkurencję ze strony Meta i Google, debiut pierwszego urządzenia – głośnika – spodziewany jest na przełomie 2026 i 2027 roku. Produkcja ma być realizowana we współpracy z koncernem Foxconn, co podkreśla skalę i powagę przedsięwzięcia.
Inicjatywa ta jest ściśle powiązana z szerszą strategią infrastrukturalną spółki, znaną pod kryptonimem „Stargate”. Ten wart setki miliardów dolarów projekt budowy potężnych centrów danych ma zapewnić moc obliczeniową niezbędną do płynnego działania nowej generacji „fizycznej” sztucznej inteligencji. OpenAI planuje, aby ich urządzenia nie były jedynie pasywnymi odbiornikami komend, lecz aktywnymi agentami, którzy dzięki multimodalności modelu GPT potrafią „widzieć” i rozumieć kontekst sytuacyjny użytkownika w jego domu lub biurze.





















