Tiedote: Suomen kielen tulevaisuus ratkaistaan nyt

Kieliteknologia puhelin

Lähivuosina ratkaistaan, millä kielellä me ja lapsemme tulevaisuudessa käytämme älypuhelimia, internetiä ja tietotekniikan sovelluksia. Teknologia on asettanut suomen kielen pisteeseen, joka on verrattavissa kirjakielen syntyyn yli viisisataa vuotta sitten. Helsingin yliopiston nykykielten laitoksessa kehitetään kieliteknologiaa ja taistellaan liian tiukkoja tekijänoikeuksia vastaan.

Nopeasti kehittyvillä teknologisilla sovelluksilla on nyt yhtä suuri merkitys suomen kielelle kuin Agricolalla ja kirjapainotekniikalla aikanaan. Elinvoimainen suomen kieli tarvitsee suomenkielistä kieliteknologiaa. Suomen kaltaisen pienen kielen kohdalla markkinat ovat yrityksille usein liian pienet. Valtion tulisikin panostaa nykyistä aktiivisemmin kieliteknologian kehitykseen.

– Tarvitaan suuri määrä pääosin vapaasti saavutettavia erilaisia puhutun ja kirjoitetun kielen aineistoja, jotta kieli pysyy myös teknologian kehityksessä mukana. Näin ei valitettavasti ole, sanoo projektisuunnittelija Mietta Lennes Helsingin yliopiston nykykielten laitokselta.

Esimerkiksi luotettavaa automaattista puheentunnistusta, konekääntämistä ja digitaalisia sanakirjoja varten kieltä on mallinnettava perusteellisesti. Tämä onnistuu ainoastaan, kun asiantuntijoilla on käytössään riittävän suuri massa laadukkaita kieliaineistoja kuten erilaisia tekstejä, äänitteitä tai videokuvaa sisältäviä digitaalisia arkistoja. Pelkkien teknisten sovellusten kopiointi kielestä toiseen ei kieliteknologiassa ole mahdollista.

Suomen ankara tekijänoikeuslainsäädäntö sekä henkilösuojakysymykset estävät monesti kieliaineistojen jakamisen ja tehokkaan tutkimisen. Niin sanotun tutkimuspoikkeuksen puuttuminen lainsäädännöstä haittaa kielentutkimusta ja kieliteknologiaa hyödyntävien sovellusten kehittämistä. Esimerkiksi Hollannissa kaikki tekijänoikeuden alaiset kieliaineistot ovat tutkijoiden vapaassa käytössä.

Tutkimustyön tulokset ovat lupaavia. Helsingin yliopiston nykykielten laitoksessa toimii kaksi hanketta, FIN-CLARIN ja META-NORD, jotka yhdessä kartoittavat ja kehittävät kieliaineistoja ja kieliteknologisia työkaluja sekä etsivät käytäntöjä kielivarojen julkaisuun liittyviin oikeudellisiin kysymyksiin.

Hankkeiden tavoitteena on, että etenkin tutkijat saavat käyttöönsä sopivia kieliaineistoja ja voivat hyödyntää niitä riippumatta siitä, missä aineistot sijaitsevat.

Osaa FIN-CLARINin  ja META-NORDin kielivaroista voi käyttää myös täysin vapaasti. Keskeisimpiä vapaita aineistoja on puurakenteena kuvattu, kieliopillisesti jäsennetty tekstiaineisto, jota kutsutaan puupankiksi. Lisäksi FinnWordNet-sanapankissa valtava joukko sanoja on linkitetty verkostoksi merkitystensä mukaan ja yhdistetty vastaaviin englannin kielen sanoihin. FinnWordNet on tällä hetkellä maailman toiseksi suurin sanapankki.

Lisätietoja:

Mietta Lennes, projektisuunnittelija
puh. 050 318 2155
mietta.lennes@helsinki.fi

Ville Korhonen, tiedottaja
Nykykielten laitos
puh. 050 318 3956
ville.korhonen@helsinki.fi