Tiedote: Suomen kielen tulevaisuus ratkaistaan nyt

Kieliteknologia puhelin

Lähivuosina ratkaistaan, millä kielellä me ja lapsemme tulevaisuudessa käytämme älypuhelimia, internetiä ja tietotekniikan sovelluksia. Teknologia on asettanut suomen kielen pisteeseen, joka on verrattavissa kirjakielen syntyyn yli viisisataa vuotta sitten. Helsingin yliopiston nykykielten laitoksessa kehitetään kieliteknologiaa ja taistellaan liian tiukkoja tekijänoikeuksia vastaan.

Nopeasti kehittyvillä teknologisilla sovelluksilla on nyt yhtä suuri merkitys suomen kielelle kuin Agricolalla ja kirjapainotekniikalla aikanaan. Elinvoimainen suomen kieli tarvitsee suomenkielistä kieliteknologiaa. Suomen kaltaisen pienen kielen kohdalla markkinat ovat yrityksille usein liian pienet. Valtion tulisikin panostaa nykyistä aktiivisemmin kieliteknologian kehitykseen.

– Tarvitaan suuri määrä pääosin vapaasti saavutettavia erilaisia puhutun ja kirjoitetun kielen aineistoja, jotta kieli pysyy myös teknologian kehityksessä mukana. Näin ei valitettavasti ole, sanoo projektisuunnittelija Mietta Lennes Helsingin yliopiston nykykielten laitokselta.

Esimerkiksi luotettavaa automaattista puheentunnistusta, konekääntämistä ja digitaalisia sanakirjoja varten kieltä on mallinnettava perusteellisesti. Tämä onnistuu ainoastaan, kun asiantuntijoilla on käytössään riittävän suuri massa laadukkaita kieliaineistoja kuten erilaisia tekstejä, äänitteitä tai videokuvaa sisältäviä digitaalisia arkistoja. Pelkkien teknisten sovellusten kopiointi kielestä toiseen ei kieliteknologiassa ole mahdollista.

Suomen ankara tekijänoikeuslainsäädäntö sekä henkilösuojakysymykset estävät monesti kieliaineistojen jakamisen ja tehokkaan tutkimisen. Niin sanotun tutkimuspoikkeuksen puuttuminen lainsäädännöstä haittaa kielentutkimusta ja kieliteknologiaa hyödyntävien sovellusten kehittämistä. Esimerkiksi Hollannissa kaikki tekijänoikeuden alaiset kieliaineistot ovat tutkijoiden vapaassa käytössä.

Tutkimustyön tulokset ovat lupaavia. Helsingin yliopiston nykykielten laitoksessa toimii kaksi hanketta, FIN-CLARIN ja META-NORD, jotka yhdessä kartoittavat ja kehittävät kieliaineistoja ja kieliteknologisia työkaluja sekä etsivät käytäntöjä kielivarojen julkaisuun liittyviin oikeudellisiin kysymyksiin.

Hankkeiden tavoitteena on, että etenkin tutkijat saavat käyttöönsä sopivia kieliaineistoja ja voivat hyödyntää niitä riippumatta siitä, missä aineistot sijaitsevat.

Osaa FIN-CLARINin  ja META-NORDin kielivaroista voi käyttää myös täysin vapaasti. Keskeisimpiä vapaita aineistoja on puurakenteena kuvattu, kieliopillisesti jäsennetty tekstiaineisto, jota kutsutaan puupankiksi. Lisäksi FinnWordNet-sanapankissa valtava joukko sanoja on linkitetty verkostoksi merkitystensä mukaan ja yhdistetty vastaaviin englannin kielen sanoihin. FinnWordNet on tällä hetkellä maailman toiseksi suurin sanapankki.

Lisätietoja:

Mietta Lennes, projektisuunnittelija
puh. 050 318 2155
mietta.lennes@helsinki.fi

Ville Korhonen, tiedottaja
Nykykielten laitos
puh. 050 318 3956
ville.korhonen@helsinki.fi

Nykykielten laitos menestyi erinomaisesti tutkimuksen arvioinnissa

Metsätalon sisäänkäynti.  Kuva: Jenni EnqvistKansainvälinen tutkimuksen ja tohtorikoulutuksen arviointi Helsingin yliopistossa on valmistunut. Nykykielten laitoksen tutkijat olivat hyvin edustettuina useissa arvioinnissa menestyneissä ryhmissä. Nykykielten laitoksen johtajan Arto Mustajoen mukaan tämä vahvistaa aiempien kansainvälisten rankingien tulokset laitoksessa tehtävän tieteen korkeasta tasosta.

Kuuden vuoden välein toteutettava arviointi tehtiin nyt kolmatta kertaa. Vuonna 2010 aloitettu prosessi erosi aiemmista, sillä tutkijat muodostivat ryhmänsä arviointia varten itsenäisesti. Toinen kansainvälisestikin ainutlaatuisen prosessin uutuus oli se, että ryhmät saivat valita vapaasti viidestä kategoriasta sen, johon ne ilmoittautuivat arvioitaviksi.

Mustajoki pitää uutta arviointia monipuolisena ja raikkaana.

– Arvioinnilla on todennäköisesti myös palkinnon ulkopuolelle jääneille yhteisöille hyviä seurauksia, sillä prosessi on auttanut monia samoista kysymyksistä kiinnostuneita tutkijoita löytämään toisensa.

Arvioinnin toteutti viisi kansainvälistä asiantuntijapaneelia. Arviointia varten tutkijayhteisöt vastasivat arviointikysymyksiin. Sen lisäksi heidän julkaisunsa ja niiden saamien viittausten määrä analysoitiin.

Kaikkiaan mukaan ilmoittautui 136 tutkijayhteisöä ja noin 6 000 tutkijaa. Näistä yliopisto valitsi 43 tutkijayhteisöä, jotka palkittiin vuoteen 2016 asti ulottuvalla rahoituksella. Neljän vuoden aikana palkituilla tutkimusryhmillä on käytössä 30 000 euroa jokaista vastuullista tutkijaa kohti.

Oppiaineiden rajat ylittävä ryhmä palkittiin

Ranskalaisen filologian yliopistonlehtori Eva Havu.

Eva Havulle uutinen CoCoLaCin rahoituksesta tuli yllätyksenä.

Yksi palkituista tutkijayhteisöistä on kieliä ja kulttuureja vertaileva CoCoLaC. Monikielisessä tutkimusyhteisössä on kokeneita ja nuoria tutkijoita sekä tohtorikoulutettavia ranskan, saksan, italian ja espanjan kielen oppiaineista.

Yhteisön koordinaattorina toimiva ranskalaisen filologian yliopistonlehtori Eva Havu pitää uutista rahoituksesta loistavana.

– Toistaiseksi järjestämiemme seminaarien ja workshoppien kulut on maksettu tutkijoiden omasta pussista. Arvioinnin tulos osittaa, että varsin uuden ja oppiaineiden rajat ylittävän tutkimusyhteisön toimintamalli on tehnyt vaikutuksen, Havu sanoo.

Lisäksi nykykielten laitokselta palkittiin tiedekunnasta ainoana parhailla mahdollisilla pisteillä Kimmo Koskenniemen vetämä kieliteknologian  ja korpuslingvistiikan BAULT-tutkijaryhmä, Terttu Nevalaisen englannin kieltä tutkiva VARIENG ja Inkeri Vehmas-Lehdon käännöstieteen TraST. Lisäksi useita laitoksen tutkijoita on mukana Juha Janhusen vetämässä kielten diversiteettiä tutkivassa tutkimusryhmässä.

>> INTERNATIONAL EVALUATION OF RESEARCH AND DOCTORAL TRAINING AT THE UNIVERSITY OF HELSINKI 2005–2010
 
 

Mikrofoni niskassa 24 tuntia

Lingvistit Svetlana Stepanova ja Tatjana Šerstinova

Svetlana Stepanova ja Tatjana Šerstinova

Venäjällä on käynnissä mittava kielitieteellinen hanke. Aineiston keräämiseksi tutkijat kiinnittivät mikrofonit 50 pietarilaisen niskaan vuorokaudeksi. Helsingin yliopiston nykykielten laitoksen CLARIN-seminaarissa vierailleiden kielitieteilijöiden analysoimista tallenteista on noussut Venäjällä pienoinen kohu.

Venäläismediassa on kauhisteltu etenkin sitä, kuinka huonoa ihmisten käyttämä kieli puhuttuna on. Tallenteet osoittavat, että etenkin miehet kiroilevat enemmän kuin mitä yleisesti on ajateltu, kertovat ORD-nimellä kulkevaa Pietarin valtiollisen yliopiston hanketta vetävät lingvistit Svetlana Stepanova ja Tatjana Šerstinova.

Tutkittavat valittiin tarkoin edustamaan eri ikäryhmiä ja yhteiskuntaluokkia ja he kävivät läpi myös psykologiset testit. Tärkeä kriteeri oli, että tutkimukseen osallistuvat suhtautuivat luonnollisesti mukanaan kulkevaan mikrofoniin, jonka kautta audioraidoille tallentui puhetta aamiaispöydästä, metromatkoista, puhelinkeskusteluista ja kosteista illanvietoista.

Miksi tosi-tv ei kelpaa?

Tutkimukseen osallistuneiden 17–70-vuotiaiden lisäksi ääninäytteitä kertyi myös mikrofonia kantavien kanssa keskustelleilta, kaikkiaan 650 ihmiseltä.

Valtaosa eli yli 40 prosenttia keskusteluista käytiin työpaikalla. Tutkijoille oli yllätys, että töissä puhutaan etupäässä kaikesta muusta kuin työasioista.

– Lasten ongelmista, talouskriisistä ja edellispäivän jalkapallotteluista. Työasiat jäävät selvästi vähemmistöön, luettelee Stepanova.

Hankkeen tutkijajoukko on ollut aidosti poikkitieteellinen ja jatkossa korpuksen toivotaan auttavan esimerkiksi sosiologeja tulkitsemaan ihmisten mutkikasta käyttäytymistä.

Eikö tosi-tv:n materiaalia, jossa kamerat seuraavat ohjelmaan osallistuvia jopa vessaan, olisi voinut käyttää tutkimusaineistona?

– Ei missään nimessä, sillä ohjelmat eivät ole tarpeeksi todellisia. Mikrofoni kulki huomaamattomasti ihmisten mukana joka paikkaan. Nauhoitettavien kohtaamat ihmiset eivät tienneet, että heitä nauhoitettiin ja jopa tutkittavat itse unohtivat mikrofonin , Sherstinova selventää.

Hänen tulkintaansa tukee se, että materiaali sisältää monia näytteitä, joissa ihminen puhuu itsekseen. Tallennetuista keskusteluista on saatu analysoitua toistaiseksi noin kymmenen prosenttia. Tulokset ovat muun muassa osoittaneet, että miehet puhuvat kiinan ja englannin tapaan myös venäjää naisia nopeammin.

CLARIN – massiivinen ja tärkeä hanke

Helsingissä venäläiskollegoille esiteltiin valtavaa, yleiseurooppalaista CLARIN-hanketta, joka saattaa tuoda venäläiskorpukset suomalaisten saataville.

Sen tavoite on tuoda erilaiset korpukset, kuten suomalaisten sanomalehtien vuosikerrat tai ORD-hankkeen litteroidut aineistot niitä tarvitsevien ulottuville sähköisessä muodossa ja luoda samalla niiden esittämiselle yhtenäiset standardit. Tällöin päästäisiin eroon tutkimusta haittaavista tai sen estävistä löydettävyys-, saatavuus- ja lupaongelmista.

Suomessa hankkeen vetovastuu on nykykielten laitoksella kieliteknologian oppiaineessa.