Miksi robottikoira ei liiku paremmin – tässä syyt

Monilla uusilla palveluroboteilla on edelleen isoja vaikeuksia liikkua ihmisjoukon keskellä, arvioidaan torstaina 19.10 Joensuun yliopistolla tarkastettavassa väitöskirjatutkimuksessa, Robotti havainnoi kyllä ympäristöä kameralla ja muilla antureilla, mutta liikkuminen voi olla nykivää jatkuvina suunnanmuutoksineen ja pysähdyksineen.

Uudet palvelurobotit kykenevät liikkumaan monin eri tavoin, esimerkiksi pyörillä, mekaanisilla jaloilla tai erilaisine drone-ratkaisuina. Niillä on kuitenkin Joensuun yliopistolla ensi viikolla tarkastettavan MSc Chengmin Zhou väitöskirjan mukaan vaikeuksia liikkumisessa ihmisjoukon keskellä.

Liikkumisen ongelmana ei ole törmäily tai ympäröivän maailman havainnointi, vaan käytössä olevan datan tehokas ja älykäs hyödyntäminen. Nykyiset menetelmät vain vaativat liian paljon laskentaresursseja, eivätkä siten sovellu reaaliaikaiseen käyttöön, jossa päätöksiä pitäisi tehdä nopeasti.

Usean robotin yhteistestausta Shenzhenin yliopiston tiloissa. Kuva: Chengmin Zhoun.

Chengmin Zhou on tutkinut Joensuun yliopistolla vahvistusoppimisalgoritmien (reinforcement learning, RL) käyttöä palvelurobottien navigointiin. Väitöskirjan tulosten mukaan uudet tehokkaammat algoritmit ratkaisevat navigointitehtäviä useampien liikkuvien esteiden tapauksessa – siis esimerkiksi tilanteessa, jossa robotti etenee ihmisvilinässä ja sillä on rajallinen aika reagoida.

Parhaaksi ratkaisuksi osoittautui malliton RL-algoritmi, joka oppii omista kokemuksistaan ja riittävästi opittuaan kykenee selviytymään vaativissakin tilanteissa. Mallittomassa RL-algoritmissa on kuitenkin monia haasteita, kuten hidas oppimistehokkuus (konvergenssi).

Väitöskirjatyössä parannettiin oppimistehokkuutta kahdella eri tavalla. Käytön aikana kerättyä dataa hyödynnettiin robotin kouluttamisessa. Robotin käytön aikana saadaan uutta reaaliaikaista dataa, joka voidaan yhdistää aiempaan koulutusdataa ja täten tehostaa robotin koulutusta.

Siinä parannettiin myös havaintoympäristön tulkitsemista. Siinä robotin toimintaympäristöä ei pidä oppia liian tarkasti (ylioppiminen), vaan sitä on tulkittava niin, että ympäristöstä opitaan asioita, jotka hyödyntävät robotin toimintaa muissa samankaltaisissa, mutta ei identtisissä tilanteissa.

Tutkimustyön tuloksena on syntynyt jo kolme teknistä parannusta, rajoitetut (diskreetit) toimintaohjeet, reaalidata ja koulutusdatan yhdistäminen, sekä robotin ja muiden kohteiden välisten suhteellisten sijaintien käyttö robotin koulutuksessa. Kehitettyjä algoritmeja on testattu sekä tietokonesimulaatioilla, että laboratorioympäristössä Shenzhenin teknillisessä yliopistossa Kiinassa.

MSc Chengmin Zhoun tietojenkäsittelytieteen alaan kuuluva väitöskirja Deep reinforcement Learning for crowd-aware robotic navigation tarkastetaan Joensuussa torstaina 19.10.2023, Vastaväittäjänä toimii professori Juha Röning, Oulun yliopisto ja kustoksena professori Pasi Fränti, Itä-Suomen yliopisto. Tilaisuuden kieli on englanti.

Lisää: MSc Chengmin Zhoun väitöskirjatyö pdf-tiedostona (LINKKI) ja väitöstilaisuus 19.10.2023 klo 12-15 Joensuun Science Parkissa (LINKKI)

Aloituskuva: Robottikoira Joensuun yliopistolla. Kuva: Chengmin Zhoun/Joensuun yliopisto.