Tekoälypohjainen hahmonluonti viihde- ja hyötypeliteollisuudessa
Huomaatko eron toisen käyttäjän ja tekoälyn välillä? Toistaiseksi tekoälyn kopioimat ja generoimat julkaisut netissä herättävät käyttäjissä hilpeyttä ja oudoksi laaksoksi kutsuttua ilmiötä. Entä kun astumme videopelimaailmaan, missä ympäristö ja hahmot ovat tarkasti käsikirjoitettu seuraamaan ohjelmoituja kaavoja – huomaisitko eron tavallisen ei-pelattavan hahmon ja tekoälyn välillä?
Vuonna 2022 OpenAI:n julkaisema suuri tekoälykielimalli ChatGPT-3.5 sai käyttäjät kokemaan ainutlaatuisen tekoälypaniikin. Näytteitä aikaisemmista keskustelevista kielimalleista oli käyttäjien saatavilla jo eri valmistajilta ennen ChatGPT:n ilmaantumista. Samoin generatiivinen kuvia tuottava tekoäly oli tässä vaiheessa tehnyt itsensä tutuksi suurelle yleisölle. Generoivan tekoälyn tapaan, tätä kielimallia pystyi pyytämään kehotteiden avulla luomaan eri tekstilajeja tai keskustelemaan sen kanssa arkipäiväisesti. Kielimalleista ja tekoälystä pohdittiin yleisesti, oliko niitä suotavaa hyödyntää opiskelussa ja työelämässä vai voisiko uudesta teknologiasta olla haittaa kehitykselle.
Muiden luovien toimialojen tapaan myös peliala kiinnostui generatiivisen tekoälyn tuomista mahdollisuuksista. Suunnittelu ja kevyen koodin tuottaminen tuntuivat olevan tekoälykielimallien erikoisosaamista. Vaikka ChatGPT:n generoima tieto oli välillä paikoin epäluotettavaa, kykeni se käymään jouhevaa small talk -keskustelua käyttäjiensä kanssa. Tähän ominaisuuteen tarttuneena syntyi ideoita tekoälypohjaisista keskustelukumppaneista ja assistenteista videopeleissä sekä erilaisissa sovelluksissa.
Mitä jos pelien NPC-hahmojen takana olisi ihmismäisiä vastauksia lateleva tekoäly?
Opinnäytetyössä NPC-hahmojen kehitys OpenAI-teknologian käyttöönoton myötä käsitellään suuren kielimallin hyödyntämistä käyttäjän kanssa kommunikoimiseksi. Tutkimuksessa vertaillaan perinteisiä NPC-hahmototeutuksia opinnäytetyötä varten Unity-pelimoottorilla kehitettyyn virtuaalitodellisuusympäristöön, jossa käyttäjän on mahdollista olla vuorovaikutuksessa ChatGPT-pohjaisen hahmon kanssa.
Tutkimuskysymyksiin vastatessa pohditaan sitä, helpottaako OpenAI-teknologian omaksuminen hahmojen kehitysprosessia ja suunnittelua. Myös puheentunnistukseen (engl. speech-to-text, STT) ja äänisynteesiin (engl. text-to-speech, TTS) perehdytään miettimällä, tarjoavatko STT- ja TTS-teknologiat lähestyttävämmän tavan keskustella käyttäjän ja NPC-hahmon välillä.
Esittelyssä dynaamiset NPC-hahmot
Pelimaailmassa NPC-hahmojen vuorovaikutteisuus on pitkään ollut rajoitettua ennalta ohjelmoituihin vasteisiin. Tutkimuksessa huomataan, että tekoäly sallii laajemman, ellei jopa rajattoman, määrän erilaisia vastauksia käyttäjän syötteeseen, joka tässä tapauksessa saattaa olla tervehdys tai kysymys. NPC-hahmo reagoi syötteisiin puhesynteesin avulla ja siivittää vastaustaan käynnistämällä puheesta löytyvien sanojen perusteella sopivan animaation. Hahmo esimerkiksi nyökyttää ja pudistelee päätään tai esittää aidon hämmentynyttä, jos yhteys OpenAI-rajapintaan katkeaa.
Vähäiset käyttäjältä vaaditut toimenpiteet tukevat käyttäjäkokemuksen kannalta tärkeäksi koettua immersiota.
Käyttäjävuorovaikutusta nykyaikaistetaan projektissa mahdollistamalla puheentunnistus. Näppäimistöllä kirjoittamisen sijasta käyttäjä voi puhekäyttöliittymästä tallettaa niin kutsutun transkription ja lähettää sen OpenAI:n rajapintaan. Vastauksena saadaan generoitu teksti, joka kääntyy äänisynteesin avulla ymmärrettäväksi puheeksi. Vähäiset käyttäjältä vaaditut toimenpiteet lisäävät ympäristöön syventymistä ja luo keskustelusta luonnollisemman, eli toisin sanoen ne tukevat käyttäjäkokemuksen kannalta tärkeäksi koettua immersiota.
Kehitystyön kannalta tekoäly vähentää tarvetta perinteisille menetelmille käyttäjän ja NPC-hahmon dialogin aikaansaamiseksi. Esimerkiksi monimutkaisten dialogivaihtoehdoista koostuvien hakupuiden tai kommunikaatiosta vastaavien tila- ja siirtymäkaavioiden määrä on tässä projektitoteutuksessa pyöreä nolla. Kehitystyön joustavuus mahdollistaa dynaamisten hahmojen luomisen ilman merkittävää lisätyötä.
Paikoin ChatGPT-bottikin uupuu ja puhumalla toteutettu vuorovaikutus ontuu.
Paikoin ChatGPT-bottikin uupuu ja puhumalla toteutettu vuorovaikutus ontuu. Projektissa hyödynnetty Whisper-puheentunnistus on suurimman osan ajasta tarkka, mutta puhetavasta ja äänen voimakkuudesta riippuen osia puheesta voi jäädä tulkitsematta. Tutkimuksessa otetaan kantaa myös puhesynteesin laatuun, sillä heikko puhesynteesiääni voi rikkoa immersion tai jopa heikentää vuorovaikutuksen laatua.
Verkkoyhteydestä ja käytössä olevien virtuaalilasien resursseista riippuen yhteys rajapintaan saattaa kestää muutaman sekunnin, joka hidastaa vastauksen saamista. Odottelu voi tuntua käyttäjästä kiusalliselta ja hämmentää, kun ruutuun ilmestyy pyörivä latausympyrä. Tämä itsessään syö tunnetta reaaliaikaisesta ja sujuvasta keskustelusta.
Tulevaisuudessa tekoälyosaajia suositaan
Projektikehittämisessä kiinnitettiin huomiota ChatGPT:n skaalautuvuuteen. Tekoälykielimalli vähentää työvaiheita ja keventää projektin ohjelmointivyyhtiä. STT- ja TTS-teknologiat poistavat tarpeen tekstintuotosta, mutta vaativat perehtymään puheentunnistamiseen ja äänisynteesiin. Työkalut kuitenkin toimivan puhekäyttöliittymän valmistamiseen ovat helposti saavutettavissa. Maksuttomia avoimen lähdekoodin äänisyntetisaattoreita löytyy, mutta markkinoiden laadukkaimmat sovellukset ovat isojen teknologiajättien hallinnoimia.
Kevennetystä kehitysprosessista ja kelvollisesta lopputuotteesta syntyy ideoita ja kysymyksiä. Vastaavanlaista teknologiaa on todennäköistä nähdä tulevina vuosina viihde- ja hyötypeleissä, simulaatioissa sekä assistenttibotteina. On pääteltävissä, että perinteisiä menetelmiä suosivat kehitysprojektit vievät enemmän ajallisia ja taloudellisia resursseja. Toisaalta tekoäly mahdollistaa yksittäin ja pienissä ryhmissä toimivien julkaisijoiden räjähdysmäisen nousun teknologia-alalla. Pitkään polttanut kysymys tekoälystä työntekijän korvaajana voi konkretisoitua, jos tekoälyä ei opettele hyödyntämään osana omaa työskentelyään.
Lähde
Suomalainen, M. 2024. NPC-hahmojen kehitys OpenAI-teknologian käyttöönoton myötä – Theseus, Turun ammattikorkeakoulun opinnäytetyö.
Artikkelikuva: Milla Suomalainen