360-asteisia kuvia generatiivisella tekoälyllä

19.06.2024

Kuvien luonti tekoälyllä on edistynyt viime vuosien aikana nopeasti ja kehittäjät ovat saaneet uuden työkalun käyttöönsä. Opinnäytetyössä tutkittiin, voiko tätä teknologiaa hyödyntää 360-asteisten kuvien luontiin virtuaalitodellisuuden käyttöön. Teimme kuvia generatiivisella tekoälyllä, vertasimme niitä tarkoitukseen tehdyn kameran ottamiin kuviin, ja selvitimme, kuinka käyttökelpoisia tehdyt kuvat ovat.

Tekoälyllä voidaan luoda erittäin todennäköisiä kuvia ja tätä mahdollisuutta kokeiltiin opinnäytetyössä 360-asteisten panoraamakuvien luomiseen. Käytetty generatiivinen tekoäly oli Stable Diffusion webUI. Tämä tekoäly on ilmainen ’tekstistä kuvaksi’ tekevä tekoäly, joka tarvitsee malleja luodakseen kuvia.

Mallit ovat datasettejä, joihin on kerätty tietoja erilaisista kuvista ja joka kertoo, miten Stable Diffusionin pitäisi luoda kuvia. Tekoälylle annetaan kuvaus halutusta lopputuloksesta kahdessa muodossa, positiivisessa eli mitä halutaan kuvassa olevan ja negatiivinen, mitä ei haluta kuvassa olevan.

Tämän opinnäytetyön tavoitteena oli selvittää, kuinka hyvin tekoälyä voi käyttää virtuaalitodellisuuteen tarkoitettujen 360-asteisten kuvien luomiseen. Tämä tehtiin seuraavissa vaiheissa:

  • generatiivisen tekoälyn tausta tutkiminen
  • kuvien ottaminen kameralla
  • kuvien luominen tekoälyllä
  • kuvien vertaaminen.

Kuvien luominen ja ottaminen vertailua varten

Opinnäytetyössä luotiin kuvia käyttämällä Modelshoot-mallia Stable Diffusionissa. Modelshoot-malli ei ole alun perin 360-asteisia kuvia varten tehty, mutta se toimi erittäin hyvin tässä tapauksessa. Kyseinen malli on tehty alun perin tehty muotiestetiikkaan ja vaatteiden luomiseen koko- tai puolivartalokuvia varten.(Wavymulder, n.d.).

Modelshoot-malli oli yllättävän pätevä tekemään 360-asteisia kuvia opinnäytetyötä varten. Kuvat luotiin pääasiallisesti vain kertomalla tekoälylle, millaisia kuvia tarvitaan. Muutama kuva tehtiin siten, että tekoälylle syötettiin valmis 360-asteinen kuva ja kuvailtiin samaa kuvaa paremman tasoisen kuvan luomiseksi.

Vertailemista varten otettiin 360-asteisia kuvia ottavalla kameralla. Tähän käytettiin Insta360 Pro -kameraa. Tässä kamerassa on kuusi 200 asteen linssiä, joilla otetut kuvat sitten yhdistettiin yhdeksi 360-asteen kuvaksi kameran valmistajan omalla sovelluksella (Insta360 Pro, n.d.).

Kuvien vertaileminen ja arviointi

Valmiit kuvat laitettiin virtuaalitodellisuusympäristöön, jossa niitä katseltiin ja arvioitiin. Tässä arviointi- ja vertailuvaiheessa laitettiin virtuaalitodellisuuslasit päähän ja katseltiin ympärilleen. Tässä huomattiin, mitä ongelmia tekoälyllä oli kuvien luomisessa. Sille puut olivat erittäin hankalia, jos ne olivat lähellä keskipistettä. Puista tuli usein tuli epämuodostuneita. Tästä huolimatta muutamat vertailijoista kokivat seikkailun tunnetta osassa metsäympäristöistä.

Tekoäly osasi myös kehittää toimivia kuvia, jotka eivät näyttäneet täysin oudolta, tai ainakin, jos niitä ei katsonut kauaa ja ylenpalttisen tarkasti. Pieniä virheitä kuvilta löytyi, mutta niitä voi korjata lisäämällä kuvien luomisen jälkeen vielä niiden ehostamiseen tarkoitetun tekoälyprosessin.

Kuvien vertailemisen lopputulos

Lopputuloksena kuvat olivat mukavia katsella, vaikka ne olivat jonkun verran virheellisiä. Kuinka paljon nämä virheet vaikuttavat kuvan mukavuuteen on henkilökohtaista ja se voi vaihdella paljonkin.

Opinnäytetyön aikana tehdyn vertailun päätteeksi kameralla otetut kuvat saivat paremman arvosanan erikseen ja yhteensä verrattuna tekoälyllä tehtyihin kuviin. Lopputuloksena kuitenkin oli, että tekoälyllä voi luoda käytettäviä kuvia virtuaalitodellisuustarkoitukseen ja etenkin, jos lisää ehostusmenetelmiä vielä kuvien luonnin jälkeen.

Lähteet

Insta360 Pro. (n.d.). Retrieved from Insta360: https://www.insta360.com/product/insta360-pro/.

Wavymulder. (n.d.). modelshoot. Retrieved from Hugging Face: https://huggingface.co/wavymulder/modelshoot.

Niemi, O. 2024. Generative AI for enhanced 360 environments : can AI create better 360 environments? Master´s Thesis. Turku University of Applied Sciences.