ChatGPT z natywnym generowaniem i edycją obrazów w GPT-4o

ChatGPT zyskuje zupełnie nowy wymiar możliwości – OpenAI ogłosiło wprowadzenie natywnej funkcji generowania i edytowania obrazów bezpośrednio w modelu GPT-4o. Nowość dostępna jest już dla użytkowników wersji Pro, a wkrótce trafi do szerszego grona.
We wtorek, podczas transmisji na żywo, dyrektor generalny OpenAI Sam Altman ogłosił największe od ponad roku rozszerzenie funkcji generatywnych ChatGPT. Od teraz użytkownicy mogą nie tylko prowadzić rozmowy i generować teksty, ale również tworzyć i modyfikować obrazy bezpośrednio w tym samym interfejsie. Za wszystkim stoi ulepszony model GPT-4o.
Dotychczas GPT-4o wspierał głównie przetwarzanie tekstu, jednak w nowej odsłonie model potrafi generować grafiki i zdjęcia oraz dokonywać ich edycji. Co istotne, funkcja dostępna jest już teraz dla subskrybentów planu Pro (200 dolarów miesięcznie) zarówno w ChatGPT, jak i w Sora – narzędziu OpenAI do generowania wideo. Firma zapowiada, że w najbliższym czasie funkcjonalność trafi również do użytkowników planu Plus, wersji darmowej oraz deweloperów korzystających z API.
GPT-4o kontra DALL-E 3
Nowa funkcja de facto zastępuje znany wcześniej model DALL-E 3, ale – jak zapewnia OpenAI – oferuje znacznie wyższą precyzję i jakość wizacji. GPT-4o analizuje dane „dłużej” niż poprzednik, co przekłada się na dokładniejsze odwzorowanie detali. W ramach edycji użytkownik może modyfikować istniejące obrazy, w tym także z udziałem osób – od zmiany tła po dodawanie lub usuwanie elementów pierwszego planu (tzw. inpainting).

Prawa autorskie a dane treningowe
W rozmowie z Wall Street Journal OpenAI ujawniło, że model GPT-4o trenowano na ogólnodostępnych danych oraz danych pochodzących z komercyjnych partnerstw, m.in. z Shutterstock. Praktyka ta budzi kontrowersje w branży, ponieważ dane treningowe to nie tylko przewaga konkurencyjna, ale też potencjalne źródło sporów prawnych dotyczących praw autorskich.
Aby przeciwdziałać zarzutom o naruszenia własności intelektualnej, firma wdrożyła kilka zabezpieczeń. Jak zapewnia Brad Lightcap, COO OpenAI, model nie generuje obrazów naśladujących styl żyjących artystów, a twórcy mogą złożyć wniosek o usunięcie ich dzieł z zestawów treningowych. Dodatkowo OpenAI szanuje żądania właścicieli stron internetowych dotyczące wykluczenia ich treści z procesu web scrapingu.