Animaationäytelmien luominen tekoälyn tekstipohjaisesta tarinankerronnasta
Suuria kielimalleja voidaan hyödyntää laajasti erilaisissa generatiivisissa tehtävissä, joista yksi on kyky luoda tarinankerrontaa. Mallit voivat luoda uusia kertomuksia pohjautuen mihin tahansa aiheeseen, teemaan tai muihin kuvaileviin avainsanoihin. Mahdollisuudet ovat käytännössä loputtomat, mutta yksi keskeinen rajoite on olemassa – lopputulos on pelkkää tekstiä. Se ei sisällä visuaalisia elementtejä, ääniä tai mitään muutakaan.
Voisiko tekoälyn tekstipohjaisen tarinankerronnan muuntaa visuaaliseen muotoon automaattisesti?
Tämä on se kysymys, josta idea työhön lähti. On kuitenkin hyvä huomata että tekoälymallit ovat kehittyneet hyvin nopeasti, jonka myötä tämä tavoite ei ole enää niin kaukainen kuin vielä pari vuotta sitten. On olemassa jo malleja jotka pystyvät tuottamaan myös kuva-, video-, ja äänisisältöä.
Kyseiset ”multimodal”-mallit ovat tosin vielä melko keskeneräisiä ja niiden saatavuus on rajallista. Tuloksien laatu eroaa huomattavasti tekstipohjaisiin kielimalleihin verrattuna. Laatuero johtuu mm. siitä että tekstiä on paljon helpompi luoda sellaisella tasolla joka näyttää ihmisen silmään luontevalta kun taas esimerkiksi tekoälyn generoimista kuvista on helppo huomata epäkohtia. Tämä on kuitenkin vain nykytilanne, joka tulee todennäköisesti muuttumaan.
Tavoitteet
Opinnäytetyön tavoitteena oli tutkia menetelmiä, joilla tekstipohjainen tarinankerronta voitaisiin esittää visuaalisessa muodossa. Motiivina oli ensisijaisesti viihdearvo, mutta samankaltaista konseptia voitaisiin soveltaa myös muissa käyttötarkoituksissa.
Tavoite saavutettiin hyödyntämällä kehotesuunnittelua, jonka avulla tekoäly ohjataan muotoilemaan tarinankerronta mukautetussa formaatissa. Tämä formaatti, joka koostuu tarinan hahmojen teoista ja dialogista voidaan simuloida interaktiivisena 3D-animaationa Unity-pelimoottorilla luodussa virtuaaliympäristössä.
Tulokset
Opinnäytetyön tuloksena on toimiva prototyyppi, joka mahdollistaa uusien animaationäytelmien luomisen napin painalluksella. Lopputulokseen voidaan myös vaikuttaa ennalta määritettyjen avainsanojen ja muun tiedon avulla. Projektin nykyinen tila toimii hyvänä pohjana jatkokehitykselle ja sen toiminnallisuuksia voidaan hyödyntää myös muissa projekteissa.
Alla olevasta videosta voi katsoa esimerkin projektin toiminnasta:
Lähde
Seppälä, L. 2024. Generating animated shows from text-based AI storytelling – Theseus, Turun ammattikorkeakoulun opinnäytetyö.
Artikkelikuva: Leevi Seppälä