Technologia NVIDII tworzy wirtualne lokacje w oparciu o nagrania wideo
Branża stawia kolejny krok w stronę taniego i efektywnego projektowania wirtualnych światów. Za dokonaniem stoją programiści Nvidii zajmujący się sztuczną inteligencją.
Ich program tworzy na bazie filmów trójwymiarowe otoczenie, po którym następnie można przejechać się w prostej grze wyścigowej. Efekt jest zdumiewający, nawet jeśli powstałe w ten sposób kanciaste światy przypominają na razie ulepszone modele 3D z Google Maps.
Jak to właściwie działa? Jak wyjaśniają odpowiedzialni za projekt, wszystko opiera się na dwóch sieciach neuronowych. Najpierw główną AI trzeba wytrenować, podsuwając jej pod nos nagrania z rozmaitych miast. Mowa tu o setkach filmików zassanych z baz serwisów takich jak Cityscapes. Następnie na scenę wkracza drugi program, oparty na Unreal Enginie 4, który automatycznie sortuje i oznacza obiekty obecne na materiałach. Każdy samochód, latarnia, budynek otrzymuje swoją kategorię. Tak przygotowane pliki wracają do wytrenowanej AI, która zaczyna generować za ich pomocą otoczenie.
Wrażenie robią dwa fakty - po pierwsze, wspomniana sieć jest w stanie samodzielnie wypełniać luki za obiektami. Kojarzycie drzewa przyklejone do ziemi lub karykaturalne, zlane z ziemią mosty obecne w skanach trójwymiarowych map? Tutaj za wygenerowanym obiektem nie będzie żadnej dziury - za, dajmy na to, samochodem pojawi się samodzielnie stworzona przez program witryna sklepowa. Po drugie, świat oraz prosta gra przygotowana przez programistów renderują się w czasie rzeczywistym bez pomocy zewnętrznego silnika graficznego. Jakby tego było mało, wszystko da się bardzo łatwo modyfikować oraz eksportować do innego, stricte developerskiego środowiska.
Brzmi jak science fiction? Pamiętajmy, że podobnie szokowała swego czasu technika fotogrametrii, która obecnie znajduje się w powszechnym użyciu w rozmaitych studiach pragnących osiągnąć w swych grach fotorealizm. Podobnie sprawa wygląda z powoli wkradającym się do powszechnego użytku ray tracingiem. Absurdalnie niski koszt, możliwość tworzenia szkiców światów w mgnieniu oka oraz obiecywana przez firmę edytowalność i elastyczność efektów pracy sieci neuronowej mogą sprawić, że developerzy będą w stanie przygotowywać wielkie otwarte środowiska tak szybko, jak nigdy dotąd. Wspomniana technologia z pewnością zyska niebawem zdolność generowania wielu innych rodzajów otoczenia lub obiektów.
Jeśli chcecie dowiedzieć się więcej oraz obejrzeć pionierski render na własne oczy, Nvidia opublikowała na swoim kanale krótki film: