Koneen Säätiö myönsi apurahoja nykykielten laitoksen tutkijoille

Koneen Säätiön apurahojen saajat julkaistiin 8.12.2015. Seuraavissa rahoitusta saaneissa hankkeissa on mukana nykykielten laitoksen tutkijoita.

Suomalais-ugrilaiset kielet ja internet

FT Krister Lindén ja työryhmä, 79 120 € (jatkoapuraha)

Hankkeessa rakennetaan prototyyppi automaattisesta järjestelmästä, joka verkkoharavointia käyttäen kerää ja ylläpitää linkkisivustoa pienillä suomalais-ugrilaisilla kielillä toteutetuille sivustoille. Järjestelmän avulla luodaan löydettyjen sivustojen teksteistä lisäksi virke-, lause- ja sanakorpuksia näille kielille. Julkaistut korpukset tulevat toimimaan lähdeaineistona kielentutkijoille. Hankkeen osana tuotetaan kielentunnistin, jolla internetistä löydettyjen sivujen kieli pystytään tunnistamaan. Lisäksi työ dokumentoidaan tieteellisesti väitöskirjassa kielen automaattisesta tunnistamisesta. Osana tutkimustyötä tuotetaan rakennettavan järjestelmän avulla myös tilastotietoa pienten suomalais-ugrilaisten kielten levinneisyydestä internetissä. Hanke toteutetaan osana kansainvälistä CLARIN-yhteistyötä, jota suomessa edustaa FIN-CLARIN-konsortio.

Projektin aikana kehitetään maailman huippuluokkaa oleva tekstin kielentunnistin, joka kykenee tunnistamaan myös suurinta osaa suomalais-ugrilaisista kielistä. Hankkeen tuottama tilastotieto pienten suomalais-ugrilaisten kielten levinneisyydestä Venäjän alueen internetissä on erittäin ajankohtaista. Sieltä saatava tekstiaineisto on myös tärkeä saada talteen tulevaisuutta varten.

Kielen säätely yliopistomaailmassa – englannin käytön vaihtelevat normit

FT, dosentti Anna Solin ja työryhmä, 75 325 € (jatkoapuraha)

Hankkeessa tutkitaan kielen säätelyä yliopistomaailmassa erityisesti englannin kielen näkökulmasta. Kielen säätely ilmenee monissa eri muodossa: säätelyä on niin toisen puheen tai tekstin korjaaminen kuin kielenkäyttöoppaiden tai kielipoliittisten linjausten julkaiseminen. Hanke tutkii säätelyä erilaisten englannin käyttäjien ja englannin käytön normittajien näkökulmasta. Tutkittavana ovat muun muassa englanniksi kirjoittavat tutkijat ja tiedottajat sekä englanniksi luennoivat opettajat. Hankkeessa tarkastellaan myös yliopistohallinnon käytäntöjä, kuten yliopistojen virallisia kieliperiaatteita ja keskitettyjen kielipalvelujen toimintaa. Keskeisiä tutkimuskysymyksiä ovat, missä tilanteissa ja tekstilajeissa englannin käyttöä säädellään, ketkä toimivat kielellisinä auktoriteetteina ja millaisia näkemyksiä erilaiset akateemiset toimijat ilmaisevat englannin kielen roolista ja käytöstä.

Valtaosa yliopistojen kielipolitiikkaa koskevista tutkimuksista ja julkisesta keskustelusta liikkuu makrotasolla: puhutaan eri kielten asemasta korkeakouluissa, englannin ’imperialismista’, kielenkäytön rapistumisesta. Hankkeemme tavoitteena on tuoda esiin ruohonjuuritason toimijoiden ääni. Mitä ja miten geologi kirjoittaa englanniksi? Korjataanko nettisivujen kieliasu samoin kuin tutkimusartikkelin? Saako englanniksi luennoiva suomalainen kuulostaa suomalaiselta? Kuka tästä kaikesta päättää?

Kielensisäisen tekstityksen kehittäminen

Professori Mikko Kurimo ja työryhmä (HY:ltä mukana Prof. Liisa Tiittula ja tohtorikoulutettava, FM Minna Pöntys), 55 810 €

Automaattisen puheentunnistuksen avulla saavat kuulovammaiset, huonokuuloiset ja suomea opiskelevat puheen lähes viiveettä nähtäville tukemaan kuuntelua. Tässä hankkeessa on tarkoitus saattaa Suomessa automaattinen puheentunnistuksen tutkimuksen parissa tehtävä tutkimustyö hyödyttämään suurta joukkoa, lähes miljoonaa suomalaista, joille puhuttu kielenmuoto ei ole helposti saavutettavissa. Puheentunnistukseen perustuvaa tekstitystä kehitetään niin, että se on käytettävissä esimerkiksi luennoilla, television suorissa lähetyksissä ja teatterissa. Hankkeessa tutkitaan kielensisäisen tekstityksen saavutettavuutta ja automaattisen puheentunnistuksen menetelmiä, joilla olisi mahdollista tuottaa parempaa reaaliaikaista tekstitystä. Tekstityksen tutkimuksessa pääpaino on vastaanottajan näkökulmassa. Tutkimme sitä, millaista tekstin tulisi olla, jotta se on puheen seuraamisen kannalta ymmärrettävää ja riittävää.

Työ toteutetaan Aalto-yliopiston puheentunnistustutkijoiden ja Helsingin yliopiston tekstitystutkijoiden ja Humakin saavutettavuustutkijoiden monitieteisenä hankkeena. Hankkeessa kehitetään Aalto-yliopiston puheentunnistimesta automaattista ja puoliautomaattista tekstitystä tukevia tekstitystyökalun koeversioita, joiden avulla määritetään vastaanottajan kannalta oleelliset puheentunnistuksen kehitystarpeet. Hanke on kolmivuotinen ja siinä tuotetaan käyttäjiä varten vuosittain uudet parannetut koeversiot tekstitystyökalusta.

Puheentunnistuksen valtavirta tutkii vain väärintunnistettujen sanojen lukumäärän minimointia ja vain muutamaa valtakieltä. Kaikki sanat tai sanojen tunnistusvirheet kuitenkaan ole sisällön ymmärtämisen kannalta samanarvoisia. Tämä ristiriita korostuu erityisesti morfologisesti rikkaissa kielissä, joita ovat mm. suomalaisugrilaiset kielet. Tällöin automaattiseen puheentunnistukseen perustuva tekstitys vaatii valtavirrasta poikkeavien puheentunnistusmenetelmien kehittämistä.