Suomalainen supertietokone jauhaa avointa kielimallia Eurooppaan

Turun yliopisto ja suomalaisen Silo AI:n tytäryhtiö SiloGen käynnistävät projektin, jossa kehitetään Lumi-supertietokoneen avulla luotettavia kielimalleja eurooppalaisille kielille. Tavoitteena on vahvistaa alan  osaamista sekä varmistaa eurooppalaisen näkökulmaa  kielimalleihin.

Turun yliopiston TurkuNLP-tutkimusryhmä ja tekoäly-yhtiö Silo AI:n kielimalleihin keskittyvä tytäryhtiö SiloGenin tavoitteena on tuottaa ratkaisu kaikille virallisilleeurooppalaisilla kielille. Lisäksi yhteistyönä kehitettävät perusmallit tulevat tarjoamaan yrityksille mahdollisuuden luoda ja kouluttaa erikoistuneita kielimalleja yritysten omiin tarpeisiin.

Tutkimuskonsortio käyttää apunaan Kajanissa sijaitsevaa Lumi-supertietokonetta. Ryhmä on  jo vuoden ajan rakentanut ensimmäisiä kielimalleja ja ehtinyt julkaisemaan FinGPT-nimeä kantavan suomenkielisen generatiivisen kielimallin.

Kehitetyn FinGPT- kielimallin pohjana on valikoituja aineistoja, jotka edustavat ryhmän mukaan luotettavasti ja tarkasti eurooppalaisia kieliä. Tutkimusryhmä hyödyntää apuna myös High Performance Language Technologies (HPLT) -konsortiohankkeessa viime vuosien aikana tuotettuja aineistoja. HPLT on monen yliopiston yhteinen EU-rahoitteinen konsortio.

TurkuNLP-tutkimusryhmä perustettiin Turun yliopistossa vuonna 2001. Ryhmä on erikoistunut jo yli 20-vuoden ajan luonnollisten kielten käsittelyn tutkimukseen ja digitaaliseen kielentutkimukseen keskittyen kehittämään koneoppivia sovelluksia tekstin automaattista analyysiä ja tuottamista varten.

Turku NLP on suomen johtava tutkimusryhmä suurissa generatiivisissa kielimalleissa ja mukana EU:n Horisontti Eurooppa -ohjelmaan kuuluvassa High Performance Language Technologies -projektissa, joka on parhaillaan luomassa seuraavan sukupolven eurooppalaisia kielimalleja Kajaanissa sijaitsevalla CSC;n Lumi-supertietokoneella.

Kuvituskuva: Lumi-supertietokone Kajaanissa, CSC – Tieteen tietotekniikan keskus Oy.