OpenAI ujawnia narzędzie AI do budowania modeli 3D

22 December 2022

Laboratorium badań nad sztuczną inteligencją OpenAI ogłosiło szczegóły dotyczące swojej najnowszej technologii, która pozwoli na ogromne usprawnienie renderingu i tworzenia obiektów 3D.

OpenAI to firma stojąca za generatorem tekstu na obraz, DALL-E, która teraz zwróciła uwagę na tłumaczenie podpowiedzi tekstowych na chmury punktów 3D, które będzie nazywać POINT-E. Według dokumentu opublikowanego przez OpenAI, POINT-E “produkuje modele 3D w zaledwie 1-2 minuty na pojedynczym procesorze graficznym”, w porównaniu do innych obecnych rozwiązań, które mogą zająć godziny i wymagają wielu procesorów graficznych.

Fragment dokumentu szczegółowo opisuje obecne miejsce POINT-E w świecie tworzenia modeli 3D:

“Podczas gdy nasza metoda wciąż nie dorównuje najnowocześniejszym modelom pod względem jakości próbek, jest o jeden do dwóch rzędów wielkości szybsza w próbkowaniu, oferując praktyczny kompromis dla niektórych przypadków użycia”.

Działa poprzez wygenerowanie pojedynczego obrazu syntetycznego z modelem. Następnie generowana jest chmura punktów 3D, która jest łatwiejsza do zsyntetyzowania, stąd mniejsze obciążenie procesorów graficznych, choć nie wychwytuje mniejszych szczegółów, stąd kompromis wspomniany w dokumencie.

Wyszkolono dodatkową sztuczną inteligencję, aby złagodzić niektóre z tych problemów, ale w pracy wyjaśniono, że może ona “czasami przegapić cienkie/delikatne części obiektów”, takie jak łodygi roślin, dając złudzenie pływających kwiatów. OpenAI obiecuje, że wytrenował sztuczną inteligencję na kilku milionach modeli 3D i ich metadanych, choć jej przypadki użycia na razie pozostają dość ograniczone.

Jednym z takich przykładów jest renderowanie rzeczywistych obiektów na potrzeby druku 3D, choć wraz z rozwojem technologii i jej udoskonalaniem, prawdopodobnie zobaczymy ją w bardziej zaawansowanych przypadkach, takich jak gry, a nawet telewizja.