Tehokkaampaa meriliikennettä: AIS-datan muuntaminen tietojoukoiksi

03.06.2024

Automaatio ja datan hyödyntäminen merenkulussa on jatkuvassa kehityksessä. Turun ammattikorkeakoulussa tehty opinnäytetyö pureutuu AIS-datan muuntamiseen tietojoukoiksi, mikä parantaa autonomisten laivojen kehittämistä ja meriliikenteen turvallisuutta.

Laivojen Automatic Identification System (AIS) tuottaa valtavan määrän tietoa, kuten aluksen sijainnin, nopeuden ja määränpään. Näiden tietojen tehokas hyödyntäminen on keskeistä merenkulun automaatiossa. Turun ammattikorkeakoulun Wireless Communications and Cybersecurity -tutkimusryhmässä tehdyn ARPA-projektin tietoalusta pyrkii parantamaan AIS-datan hyödyntämistä luomalla tietojoukkoja, joita voidaan käyttää tekoäly- ja koneoppimisprojekteissa.

AIS-datan muuntaminen tietojoukoiksi

AIS (Automatic Identification System) on laivojen automaattinen tunnistus- ja seurantajärjestelmä, joka parantaa meriliikenteen tehokkuutta ja turvallisuutta. AIS-dataa kerätään sensoreilla, jotka lähettävät tietoja laivojen ja seuranta-asemien välillä. Tämä data sisältää tärkeitä tietoja, kuten aluksen tunnistenumeron, sijainnin ja nopeuden. AIS-datan analysointi on keskeisessä asemassa nykyaikaisessa meriliikenteen tutkimuksessa, jossa hyödynnetään edistyneitä algoritmeja ja koneoppimismenetelmiä.

AIS-datan analysointi on keskeisessä asemassa nykyaikaisessa meriliikenteen tutkimuksessa, jossa hyödynnetään edistyneitä algoritmeja ja koneoppimismenetelmiä.

AIS-datan avulla voidaan seurata laivojen liikkeitä reaaliajassa, mikä mahdollistaa tehokkaamman reitinsuunnittelun ja liikenteen hallinnan. Tiedon parempi hyödyntäminen tukee myös turvallisuuden parantamista meriliikenteessä, sillä reaaliaikainen tieto auttaa ennakoimaan ja ehkäisemään mahdollisia vaaratilanteita. Tämä tekee AIS-datasta arvokkaan resurssin niin kaupallisille toimijoille kuin viranomaisillekin.

Tietoalustan teknologiat

AIS-datan käsittelyyn ja muuntamiseen tietojoukoiksi käytettiin useita teknologioita:

  • Apache Pulsar: Viestinvälitysalusta, joka mahdollistaa suurten datamäärien käsittelyn reaaliajassa. Se tukee skaalautuvuutta ja matalaa viivettä, mikä tekee siitä ihanteellisen alustan reaaliaikaiselle tiedonvälitykselle.
  • Ambry: LinkedInin kehittämä jaettu objektivarasto, joka tukee suurten datamäärien säilytystä. Ambry on optimoitu sekä pienille että suurille objekteille, mikä varmistaa datan saatavuuden ja skaalautuvuuden.
  • PostgreSQL: Avoimen lähdekoodin tietokantajärjestelmä, joka mahdollistaa monimutkaisten kyselyiden suorittamisen ja datan tehokkaan hallinnan. PostgreSQLjoustavuus ja laajat ominaisuudet tekevät siitä erinomaisen valinnan suurten datamäärien käsittelyyn.
  • Flask: Pythonilla kehitetty kevyt verkkosovelluskehys, joka mahdollistaa helpon ja nopean web-sovellusten kehittämisen. Flaskin yksinkertaisuus ja laajennettavuus tekevät siitä sopivan ratkaisun käyttöliittymien ja API-kutsujen toteuttamiseen.

Tietojoukkojen luontiprosessi

Tietojoukkojen luonti alkaa tarvittavien ohjelmistojen asennuksella ja testiblobien luomisella. PostgreSQL-taulut luodaan metatiedon tallentamista varten, ja datan suodattaminen ja noutaminen tapahtuu PostgreSQL-tietokannasta ja Ambry-varastosta. Lopuksi tietojoukot yhdistetään yhdeksi tiedostoksi, joka tallennetaan .tar-muodossa jatkokäyttöä varten.

Tämä prosessi mahdollistaa suurten datamäärien tehokkaan käsittelyn ja varmistaa, että tiedot ovat yhtenäisiä ja helposti saatavilla jatkokäsittelyä varten. AIS-datan muuttaminen tietojoukoiksi mahdollistaa tiedon tehokkaamman hyödyntämisen erityisesti tekoälyn ja koneoppimisen sovelluksissa, jotka vaativat suuria määriä laadukasta dataa.

Testauksen merkitys

Testaus on olennainen osa tietojoukkojen luomisprosessia. Testauksen avulla varmistetaan, että kaikki komponentit toimivat odotetusti ja että data tallentuu ja haetaan oikein. Testauksessa käytetään sekä viestinvälitys- että verkkosovelluskomponenttien tuottamia lokitietoja prosessin etenemisen seuraamiseksi ja mahdollisten ongelmien diagnosoimiseksi. Testausprosessissa varmistetaan myös, että tietojoukot sisältävät oikeat ja relevantit tiedot. Tämä saavutetaan tarkistamalla, että kaikki tiedot tallentuvat oikein tietokantaan ja että ne voidaan noutaa ja yhdistää odotetusti. Testauksen avulla voidaan havaita ja korjata mahdolliset virheet ennen kuin järjestelmä otetaan käyttöön tuotantoympäristössä.

Tulokset ja jatkokehitys

Opinnäytetyön tuloksena syntyi toimiva tietojoukkojen luontiominaisuus, joka parantaa AIS-datan hyödyntämistä ja tukee autonomisten järjestelmien kehittämistä. Tämän ominaisuuden avulla voidaan luoda datakokonaisuuksia, jotka soveltuvat erinomaisesti tekoälyn ja koneoppimisen tutkimuksiin ja sovelluksiin.

Tulevaisuudessa kehitystyötä jatketaan käyttöliittymän parantamisella, jotta tietojoukot voidaan esittää visuaalisesti käyttäjille. Tämä parantaa järjestelmän käytettävyyttä ja mahdollistaa datan tehokkaamman hyödyntämisen. Lisäksi tietoturvaan liittyvät seikat otetaan huomioon ennen kuin ominaisuus otetaan käyttöön tuotantojärjestelmässä, mikä varmistaa datan turvallisuuden ja luotettavuuden.

Lopuksi

Työn tulokset edistävät tietoalustan kykyä käsitellä ja analysoida AIS-dataa, mikä tukee autonomisten alusten kehitystä ja meriliikenteen turvallisuutta. Tämä työ auttaa tulevia tutkimusryhmän tekoäly- ja koneoppimisprojekteja, joissa meriautomaation kehittäminen on keskiössä.

AIS-datan tehokas hyödyntäminen on avainasemassa tulevaisuuden meriliikenteessä. Reaaliaikainen tieto alusten liikkeistä ja niiden analysointi mahdollistavat entistä turvallisemman, tehokkaamman ja ympäristöystävällisemmän merenkulun. Tekoälyn ja koneoppimisen avulla voidaan kehittää entistä älykkäämpiä ja itsenäisempiä järjestelmiä, jotka tekevät meriliikenteestä entistä sujuvampaa ja turvallisempaa.

Lähde

Oskar L. 2024. AIS-datan muuntaminen tietojoukoiksi tietoalustalla – Theseus, Turun ammattikorkeakoulun opinnäytetyö

Kuva: ChatGPT, OpenAI:n kehittämä tekoälymalli