Świat filmu, jaki znamy. Strajk się skończył, ale hollywoodzkiego happy endu nie ma
A to chociażby z powodu takich doniesień jak to, które pojawiło się niemal dokładnie w tym samym czasie co informacje o porozumieniu w Hollywood, a które dotyczyło aktorki Scarlett Johansson podejmującej kroki prawne przeciwko twórcy aplikacji AI, oskarżanego przez gwiazdę o kradzież jej głosu i wizerunku na potrzeby reklamy internetowej.
Organizacja skupiająca amerykańskich scenarzystów i innego rodzaju twórców piszących, Writers Guild of America (WGA), zrozumiała dość szybko, jak wielkim zagrożeniem jest dla zrzeszonych w niej rozwój generatorów AI, od ChatGPT po kolejne coraz bardziej zaawansowane modele językowe. Doszły do tego zadawnione spory z firmami produkującymi filmy, płacowe, pracownicze i wiele innych. W pierwszej połowie 2023 ogłosiła strajk. Dołączyli do nich następnie aktorzy zrzeszeni w związku SAG-AFTRA.
Twórcy niepokoją się i buntują, bo stało się jasne, że narzędzia sztucznej inteligencji mogą zostać wykorzystane przez producentów, studia i inne podmioty oferujące treści filmowo-telewizyjne do całkowitego zastąpienia autorów (a na kolejnych etapach rozwoju technik wizualnych - także aktorów) ludzkich. W najlepszym przypadku piszący ludzie zostaliby zredukowani do roli korektorów i redaktorów ostatecznej wersji dzieła AI, poprawiających niedociągnięcia i błędy w skrypcie wygenerowanym przez model językowy.
Generowanie tekstów, czyli scenariuszy, scenopisów i innych pisanych form stanowiących podstawy i pomoc w produkcji filmu, to dopiero początek. Na rynku pojawiły się już zalążki rozwiązań pozwalających generować z promptów całe filmy. To na przykład prototypowy oparty na AI generator filmów, Make-A-Video firmy Meta. Wkrótce po jego pojawieniu się Google przedstawiło Imagen Video, system sztucznej inteligencji, który potrafi generować klipy wideo na podstawie podpowiedzi tekstowej. Generowane w tych wczesnych, prototypowych wersjach generatorów wideo AI wyniki są bardzo dalekie od ideału. Są króciutkie, jest w nich pełno zakłóceń, szumów i aberracji typowych dla kreacji tworzonych przez sztuczną inteligencję. Oba narzędzia trzeba traktować głównie jako zapowiedź przyszłości - rozwiązań pozwalających tworzyć za pomocą AI całe, najpierw krótkometrażowe, potem zapewne coraz dłuższe i doskonalsze, dzieła filmowe. Zresztą amerykańscy potentaci Big Tech nie są jedynymi, którzy nad tym pracują. Na początku 2022 r. grupa chińskich badaczy z Uniwersytetu Tsinghua zademonstrowała system CogVideo, który potrafi przetłumaczyć tekst na krótkie klipy o dość wysokiej jakości.
Wirtualne gwiazdy
AI to zagrożenie nowe, które ustawia się w szeregu wielu innych zjawisk, które od lat powinny niepokoić filmowców. Od lat, na przykład, w krajach rozwiniętych spada frekwencja widzów w kinach. W ubiegłej dekadzie w przemyśle filmowym widoczna była również ekspansja chińskich firm, agresywnie przejmujących udziały w filmowych przedsiębiorstwach w USA.
Jednak już od lat, według komentujących wszystkie te zjawiska ekspertów, to nie Chiny najbardziej zagrażały i zagrażają Hollywood, lecz Dolina Krzemowa i wywodzące się z niej takie firmy jak Netflix. Gdy ten rozpoczął tworzenie własnych treści w 2013 r., dla wielu był to szok. Przerażające dla kadry zarządzającej w branży rozrywkowej było nie tylko to, że Netflix kręcił i finansował projekty telewizyjne i filmowe, przez co granica między nimi zacierała się (wcześniej produkcja filmowa i telewizyjna to były odrębne światy). Bardziej groźne dla Hollywood było wywodzące się z kultury Doliny Krzemowej techniczne i precyzyjne podejście Netflixa. Firma, zanim jeszcze zaczęła jakiekolwiek prace nad serialem „House of Cards”, była całkowicie pewna sukcesu. Korzystała z zaawansowanej analityki opartej na big data i robiła to przed podjęciem jakichkolwiek nakładów na produkcję. Nie było tu ani centymetra miejsca na typową dla hollywoodzkich studiów niepewność.
Po latach również Netflix dostał zadyszki. Obecnie najbardziej agresywnym graczem streamingowym jest inna firma z Krzemowej Doliny - Amazon. Amazon, podobnie jak Netflix i Apple, zbudował swoje studio od podstaw, zaczynając ponad dekadę temu. Mają usługę streamingu wideo, Prime. Niedawno Amazon kupił MGM, zasłużone hollywoodzkie studio filmowe za około 8,5 miliarda dolarów.
Zapowiedzią zmian, które po latach wzbudziły fale strajków, była zauważalna od lat ekspansja technik generatywnych i wirtualnych w filmie. Zapowiedź tego świata, który w pewnym sensie „dekonstruuje” system hollywoodzkich gwiazd, stanowił film „Łotr 1” z serii „Gwiezdne Wojny”, w którym widzieliśmy nieżyjącego od 1994 Petera Cushinga i zmarłą tuż przed premierą Carrie Fisher w roli młodej Księżniczki Lei. Aktorzy od dłuższego czasu są za pan brat z technikami cyfrowej obróbki obrazu przy produkcjach, a z powodu stosowania motion capture noszą często skomplikowane stroje i maski. Wkrótce mogą zostać całkowicie zastąpieni przez cyfrowe awatary, czego trudno nie odbierać jako kolejnej oznaki zmierzchu starego systemu, w którym siła i popularność produkcji filmowej zależała właśnie od ludzi, artystów, sławnych aktorów.
Istnieją inne, jeszcze dalej idące teorie na temat przyszłości tego świata, które przewidują, że film i gry wideo połączą się w jedno, a widz stanie się bohaterem/aktorem w filmie, który dodatkowo będzie mógł personalizować pod kątem swojego gustu i potrzeb. Wyobraźmy sobie sytuację, że po powrocie z pracy do domu mówimy osobistemu asystentowi cyfrowemu, że „obejrzałbym…”, a może raczej „wziąłbym udział w przygodowym filmie akcji w stylu westernu jako partner Johna Wayne'a i z udziałem Marilyn Monroe, przy czym scenerią westernu niech będzie planeta Mars”. Asystent AI pyta, na którą ma być gotowa produkcja, a potem… bierze się do roboty, robiąc maszynowo to, czym od stu lat zajmuje się Hollywood.
Niemożliwe? Potężna sztuczna inteligencja nowej generacji już stała się narzędziem służącym do produkcji filmów. Już kilka lat temu jeden z filmów z serii „Avengers” - „Infinity War” wykorzystywał algorytmy AI do tak dokładnego odwzorowania twarzy aktora, że widać było każdą zmarszczkę na cyfrowej „twarzy” jednej z postaci, a konkretnie szwarccharakteru Thanosa. Dzięki sztucznej inteligencji i technologii motion capture to, co kiedyś zajmowało tygodnie prac w laboratorium, mogło być renderowane w czasie niemal rzeczywistym.
Najnowsze przykłady stawiające pod znakiem zapytania potrzebę istnienia żywych wykonawców widzimy chociażby w niedawnej produkcji teledysku do piosenki „Now and Then” w reżyserii Petera Jacksona, który pomógł w opracowaniu technologii AI, która wyizolowała głos Johna Lennona w nowym singlu. Oprogramowanie audio o nazwie Mal (machine audio learning) pozwoliło oddzielić wokal Lennona od wersji demo. Ścieżka została następnie przebudowana z dodatkiem nowo wyprodukowanych partii wokalnych McCartneya i Ringo Starra, wraz z fragmentami nagrań gitary George’a Harrisona (podobnie jak Lennon już nie żyje) z ich odłożonej na półkę sesji nagraniowej w latach 90.
Tom Graham, założyciel Metaphysic.ai, jest gorącym zwolennikiem poglądu, że generatywna sztuczna inteligencja wywróci do góry nogami przemysł filmowy i zmieni nasze rozumienie tego rodzaju twórczości filmowej. Metaphysic opracowała technologię sztucznej inteligencji do przechwytywania biometrycznego profilu dowolnego człowieka w celu podrabiania go w czasie rzeczywistym. Znane deepfakesy Toma Cruise’a na TikToku i Elvisa w znanym amerykańskim programie telewizyjnym to właśnie dzieła Metaphysic. W wykładzie na scenie TED Graham podaje przykład zatrudniania Toma Hanksa bez fizycznego angażowania Toma Hanksa. Tom Hanks nie musiałby pojawiać się na planie, aby faktycznie nagrywać.
Zamiast plenerów i scenografii - wirtualne studio
Nowe w świecie filmowym jest nie tylko AI. Francis Ford Coppola jesienią 2023 roku zakończył zdjęcia do swojego dzieła pt. „Megalopolis”, futurystycznego filmu fabularnego, który powstawał przez 20 lat. O tym filmie pisze się, że reżyser czekał tak długo, by gotowa na jego wizję była technika realizacji i produkcji. Na początku roku mówił w wywiadzie, że jego „Megalopolis” będzie pierwszym filmem fabularnym nakręconym na scenie LED w nowo otwartym Prysm Stages w Trilith Studios w Atlancie w stanie Georgia. To mający prawie 1700 m² powierzchni ekosystem wirtualny, naszpikowany najnowocześniejszymi systemami dźwiękowymi i wizualnymi. Modułowa scena Prysm jest zbudowana tak, aby pomieścić duże elementy scenografii, otoczone na 360 stopni panelami LED, w tym także sufitem z wyświetlaczy LED. Do wyświetlania wideo wykorzystana została technika wydajnych silników do gier. W obiekcie znajdzie się również scena procesowa zaprojektowana do zdjęć motoryzacyjnych.
Jak łatwo zauważyć, wykorzystanie wirtualnego studia to potencjalnie duże oszczędności na organizacji plenerów, na scenografii, rekwizytach, nawet na technikach animacji komputerowej, czyli rzecz dla szukających obniżenia kosztów producentów z Hollywood równie cenna, jak generatory AI.
Jest wielu takich, którzy uważają, że przyczyną upadku Hollywood i systemu wielkich wytwórni filmowych jest coś znacznie bardziej banalnego niż presja nowych technik i konkurencja spółek Big Tech. Chodzi raczej o to, że przemysł filmowy robi od dłuższego czasu po prostu słabe filmy. Oglądamy wciąż przeróbki i kontynuacje zgranych formatów czy, jak to się mówi w tej branży, „franczyz”, nieciekawe historie z namolnymi tezami, wtórność i brak pomysłów. Branża ta po prostu nie ma żadnych atutów, którymi mogłaby przyciągnąć widza, zwłaszcza tego młodego, do kina. Ten widz ma YouTube czy TikToka, gdzie we własnej ocenie znajduje równie dobre, a nawet z jego punktu widzenia bardziej atrakcyjne treści. I nie musi za to płacić.
Mirosław Usidus