Tekoälyä jo valon nopeudella

Aalto-yliopiston johdossa on toteutettu ns. tensorilaskentaa valon nopeudella yhdellä laskentakierroksella. Tulos on tärkeä askel kohti tulevaisuuden tekoälylaitteistoa, joka perustuisi optiseen laskentaan perinteisen elektroniikan sijaan.

Tensorilaskentana tunnettu aritmetiikan ala toimii lähes kaikkien nykyaikaisten teknologioiden ja erityisesti tekoälyn selkärankana, mutta sen toiminnallisuus ulottuu kauas matematiikan lyhyen oppimäärän ulkopuolelle.

Ajattele vaikkapa mitä kaikkea tarvitaan Rubikin kuution pyörittämiseen, kiertämiseen ja uudelleenjärjestelyyn eri ulottuvuuksissa. Siinä missä ihmiset ja perinteiset tietokoneet suorittavat nämä operaatiot kohta kohdalta, valo voi tehdä ne kaikki kerralla.

Ja nykyisin kaikki tekoälyn toiminnallisuudet aina kuvantunnistuksesta kielen käsittelyyn perustuvat tensorilaskentoihin. Datan räjähdysmäinen kasvu on kuitenkin työntänyt grafiikkasuorittimien (GPU) kaltaiset perinteiset digitaaliset laskentajärjestelmät äärirajoilleen niin nopeuden, skaalautuvuuden kuin energiankulutuksenkin suhteen.

Aalto-yliopiston tutkijatohtori Yufeng Zhangin johtama kansainvälinen tutkijaryhmä on nyt tarttunut tähän ajankohtaiseen ongelmaan. Tutkijat onnistuivat löytämään uuden menetelmän, joka pystyy suorittamaan monimutkaisia tensorilaskentoja käyttämällä yhtä valon etenemissuuntaa. Tuloksena syntyi valon nopeudella saavutettu, kertaluontoinen tensorilaskenta.

”Menetelmämme suorittaa samankaltaisia laskentoja kuin nykyiset grafiikkasuorittimet, kuten konvoluutioita ja huomiokerroksia – mutta tekee sen valon nopeudella. Elektronisten piirien sijaan käytämme valon fysikaalisia ominaisuuksia useiden laskutoimitusten suorittamiseen samanaikaisesti”, Zhang kertoo.

Tämän saavuttamiseksi tutkijat ohjelmoivat digitaalista dataa valon värähdyslaajuuksiin ja -vaiheisiin, jolloin luvut muuttuivat optisen kentän fysikaalisiksi ominaisuuksiksi. Kun nämä valokentät vuorovaikuttavat ja yhdistyvät, ne toteuttavat luonnostaan matemaattisia operaatioita, kuten matriisi- ja tensorikertolaskuja, jotka taas muodostavat syväoppimisalgoritmien ytimen.

Käyttämällä lisäksi useita valon aallonpituuksia, tutkimusryhmä pystyi laajentamaan tätä lähestymistapaa käsittelemään vielä korkea-asteisempia tensorioperaatioita.

”Optinen laskentamenetelmämme yhdistää kaikki paketit ja laittaa ne samalla kerralla kaikkien eri koneiden läpi. Olemme luoneet ’optisia koukkuja’, jotka yhdistävät jokaisen sisääntulon oikeaan ulostuloon: tällöin kaikki paketit tarkastetaan ja lajitellaan välittömästi ja samanaikaisesti”, Zhang selittää.

Tehokkuuden lisäksi tämän menetelmän keskeinen etu on tutkijoiden mukaan sen yksinkertaisuus. Optiset toiminnot tapahtuvat passiivisesti valon edetessä, jolloin laskennan aikana ei ole tarvetta aktiiviselle ohjaukselle tai elektronisille kytkennöille.

Aalto-yliopiston fotoniikkaryhmän johtajan, professori Zhipei Sunin mukaan lähestymistapaa voidaan toteuttaa lähes millä tahansa optisella alustalla.

”Tulevaisuudessa integroimme tämän laskentakehyksen suoraan fotonisiin piireihin, jolloin valoon pohjaavat prosessorit voivat suorittaa monimutkaisia tekoälytehtäviä erittäin pienellä virrankulutuksella”, Sun sanoo.

Lisää:  Tutkimus on julkaistu Nature Photonics -julkaisussa 14.1.2025 (LINKKI).

Kuvituskuva: Tavoitteena on ottaa uusi menetelmä käyttöön jo olemassa olevilla laitteistoalustoilla. Tutkijoiden mukaan varovaisen arvion mukaan integraatio voisi tapahtua 3–5 vuoden sisällä. Kuva: Fotoniikan ryhmä / Aalto-yliopisto.