Cześć, nazywam się Chuck Jackman. Zajmuję się systemem motion capture i animacjami używanymi w dialogach w Guild Wars 2 i z chęcią przedstawię wam jak sprawa wygląda. Czym dokładnie jest filmowa rozmowa (cinematic conversation)? Cieszę się, że pytacie. Jeśli mieliście okazję zagrać w demo GW2, mogliście zobaczyć krótkie cut-scenki, które odbywały się między NPCami i Waszą postacią. To właśnie filmowe rozmowy.
Do tej pory, widzieliście tylko prowizorkę naszych konwersacji. To dlatego, że tu, w ArenaNet mamy bardzo chętny zmian proces deweloperski, pozwalający nam ba zajmowanie się zawartością gry w różnym stopniu ukończenia. Dzięki temu widzimy wszystkie niedoróbki i natychmiast możemy je usunąć. Takie podejście pozwala naszym pisarzom ciągle czuć tempo opowieści, podczas gdy my zastanawialiśmy się jakie informacje przekazać wizualnie.
Kiedy zaczęliśmy produkcję Guild Wars 2, wiedzieliśmy, że chcemy pokazać więcej historii w cut-scenkach niż w pierwowzorze. Szybko zdecydowaliśmy, że będą trzy poziomy takich przerywników. Pierwszy to pełny film, pokazujący szybką akcję, niszczenie Ascalonu i smoczą rozwałkę. Tymi zajmujemy się naszym własnym urządzeniem, zwanym Cameo, opracowanym przez ten sam świetny zespół, który zajmuje się trailerami, które oglądacie. Takie przerywniki to małżeństwo dwu- i trójwymiarowej grafiki i animacji.
Następnie mamy drugi poziom, zajmujący się sednem sprawy, wszystkimi zwrotami akcji i przysłowiowym trzonem historii osobistej waszego bohatera. Nie są one pre-renderowane i dzieją się, gdy historia wymaga coś więcej niż daje nam zwykły gameplay. To właśnie filmowe rozmowy.
Sceny pojawiają się w grze jako tekst wypowiadany przez NPCów i przeważnie służą do przekazania wskazówek i informacji. Trzeci i ostatni poziom nazywamy „scenami”.
Wiedzieliśmy, że rozmowy filmowe w GW2 są zdecydowanie bardziej ożywione, w stosunku do Guild Wars, jednak zechcieliśmy wprowadzić więcej życia również w te tymczasowe wersje, które mieliśmy. Tymi tymczasowymi wersjami był dwie postacie stojące sobie i animowane w sposób minimalny i pozornie losowy. Zawierały między innymi bardzo podstawową synchronizację ust z wypowiadaną treścią, co jednak bardziej przypominało kacze dziób (
), niż ludzką twarz. Wszystko to dlatego, że te tymczasowe wersje składały się tylko ze zautomatyzowanych animacji twarzy i bardzo ograniczonej puli animacji mówienia i bezczynności. To oczywiście nie pozwalało postaciom na przekazanie emocji w realistyczny, wiarygodny sposób. Było również niemożliwym zsynchronizować gesty postaci z tym, co mówią.
Potrzebowaliśmy uniwersalnego rozwiązania, które pozwoliłoby nam użyć ponownie i przerobić animacje z naszej puli tak, by nie były zbyt monotonne. Zatem skontaktowaliśmy się z kilkoma artystami, programistami, designerami, pisarzami i ustaliliśmy co chcemy osiągnąć i jak chcemy to zrobić. Po pewnej dawce eksperymentów uznaliśmy, że podejście wielowarstwowe, z użyciem morion capture, dodatkowych animacji i zaawansowanego oprogramowania do synchronizacji ust.
Po zatwierdzeniu planu odprawiliśmy rytuały i złożyliśmy ofiarę zespołowi programistów. Oni, w zamian, wezwali swą najczarniejszą magię i wyrwali potrzebny kod z umysłów starożytnych bogów, by przemienić go na niesamowity zestaw narzędzi pozwalający nam dokończyć nasz złowieszczy… eee… plan.
Ten nowy zestaw narzędzi pozwolił nam na stworzenie stałych, opartych na emocjach postaci animacji bezczynności (idle), wciąż pozwalając nam na zajęcie się gestami i wyrazem twarzy. Ta elastyczność dzięki dodatkowym animacjom otwiera nam drogę to stworzenia małych i szybkich animacji gestów, które można dodać do każdej innej animacji. Na przykład, możemy animować wzruszenie ramion, i użyć go na postaci pewnej siebie, ale także na osobie rozzłoszczonej, a i tak w obu przypadkach będzie to wyglądało prawidłowo.
Używamy również warstw i podejścia „dodawania” na twarzach. Możemy animować oparte na samopoczuciu emocje oraz synchronizować ruch ust. Potem możemy dodać pewne gesty w odpowiednim miejscu dialogu. Na przykład możemy sprawić, by postać wyglądała na nieśmiałą lub przestraszoną, gdy mówi. Potem coś może się stać i ją przestraszyć, a na postać ta wzdrygnie się. Dzięki temu reagują one na to, co dzieje się wokół nich.
A to krótkie przedstawienie sposobu, w jaki składamy nasze scenki w całość:
Po ostatecznym ugłosowieniu, odgrywam dany fragment kilkukrotnie, aby określić stan emocjonalny bohaterów i znaleźć miejsca, gdzie możemy wstawić odpowiednie gesty by zaakcentować wypowiedź. Robię notatki, które przekazuję do pokoju gdzie rezyduje odpowiedzialny za animacje Heron Prior i drugi facet, Igor… eee, znaczy Andrew. Naszą wybraną ofiarę pakujemy w sprzęt motion capture i zmuszamy ich do spełnienia naszych życzeń do momentu, gdy wiemy już, że to jest to.
Nasz system motion capture troszkę różni się od tego, co mogliście widzieć. Używamy Xsens MVN, systemu „bezkamerowego”, który jest strojem z garścią sensorów, które śledzą ruch osobnika w kombinezonie i przekazują go komputerowi. Daje nam to sporą elastyczność, ponieważ nie musimy wszystkiego odgrywać w jednym pokoju.
Gdy to już jest zrobione, ja, albo inny animator przekazuje otrzymane dane do Motion Builder’a. Potem prowadzimy szeroko zakrojone przymiarki, wprowadzamy zmiany i oddajemy do ostatecznego doszlifowania. To staje się fundamentem naszych animacji. Myślcie o tym, jako ogólnej pozie i ruchu ciała.
Zerknijmy na ten przykład rozmowy z Guild Wars 2:
Jeśli obejrzeliście filmik powyżej, przedstawiający rozmowę między kapłanką Dwayny i graczem, możecie zobaczyć tego przykład.
Podczas gdy animatorzy pracują nad wyrazem twarzy i gestami, synchronizacja ust jest sporządzana za pomocą programu FaceFX, któremu podaje się tekst wypowiadany przez postaci. To przekształca dźwięki fonetyczne na kształty wcześniej przygotowane przez nasz zespół. Potem składamy to, zmieniamy i dopracowujemy.
Synchronizacja ust nie jest jednak jedyną rzeczą, jaką się zajmujemy. Tworzymy także pętle I gesty. Są one podobne do gestów I ruchów wykonywanych przez “bezczynne” ciało, jednak główną różnicą polega na tym, że są bardziej subtelne, lub przeciwnie – ekstremalne.
Zobaczmy jak wygląda konwersacja, po “liftingu”:
To by było wszystko. Jak się okazało moja krótka notka nie jest taka krótka, lecz mam nadzieję, że przyjemnie się wam to czytało. Trzymajcie się I do zobaczenia w grze!
Źródło: http://www.arena.net/blog/chuck-jackman-on-updated-cinematic-conversations#more-6812









