Sora – model od OpenAI, który ma zamieniać tekst na wideo

W czwartek firma poinformowała, że OpenAI wspierane przez Microsoft pracuje nad oprogramowaniem, które będzie w stanie generować minutowe filmy na podstawie komunikatów tekstowych. 

Oprogramowanie o nazwie Sora jest obecnie dostępne dla Red Teaming, co pomaga identyfikować wady systemu AI. Ma być też wykorzystywane przez artystów wizualnych, projektantów i filmowców w celu uzyskania opinii na temat modelu – podała firma w oświadczeniu.

Prace nad Sorą są w toku, a firma dodała, że model może mylić szczegóły przestrzenne podpowiedzi i mieć trudności z podążaniem za określoną trajektorią kamery.

Oprócz generowania filmów na podstawie podpowiedzi tekstowych Sora może animować nieruchomy obraz, jak podała firma w poście na blogu. Oprogramowanie do generowania wideo jest zgodne z chatbotem ChatGPT firmy OpenAI, który został wydany pod koniec 2022 r.

„Sora jest w stanie generować złożone sceny z wieloma postaciami, określonymi rodzajami ruchu oraz dokładnymi szczegółami obiektu i tła” – czytamy w oświadczeniu, w którym podano, że może tworzyć wiele ujęć w jednym filmie.

OpenAI twierdzi, że pracuje także nad narzędziami, które będą w stanie rozpoznać, czy wideo zostało wygenerowane przez Sorę.