Avoimista aineistoista avoimiin tutkimusmenetelmiin kielentutkimuksessa

Kieliaineistoja ja niiden käsittelyyn tarkoitettuja menetelmiä on jo pitkään ollut avoimesti saatavilla tutkijoiden käyttöön. Nyt kielentutkimuksessa ollaan siirtymässä avoimessa julkaisemisessa uuteen vaiheeseen, kun myös alan keskeisiin tutkimusmenetelmiin ja niiden opetukseen keskittyviä resursseja on alettu julkaista avoimesti selvästi aiempaa enemmän. Joulukuussa 2020 julkaistiin laaja kokoelma Kielentutkimuksen menetelmiä I–IV.

Teksti: Milla Luodonpää-Manni, Kaius Sinnemäki & Markus Hamunen

Kielentutkimuksessa on pitkät perinteet tutkimusaineistojen avoimeen keräämiseen ja avoimeen julkaisemiseen. Eri yliopistoissa on kerätty omia aineistoja, esimerkiksi ns. Oulun korpus 1970-luvulla Oulun yliopistossa, Lauseopin arkiston murrekorpus Turun yliopistossa 1970- ja 1980-luvuilla sekä Helsinki Corpus Helsingin yliopistossa 1980- ja 1990-luvuilla.

Vuodesta 1996 lähtien kieliaineistoja ja myös niiden käsittelyyn tarkoitettuja menetelmiä on ollut saatavilla tutkijoille keskitetysti Kielipankin kautta. Suomalaisten yliopistojen, Tieteen tietotekniikan keskuksen CSC:n ja Kotimaisten kielten keskuksen muodostama FIN-CLARIN-konsortio auttaa humanististen tieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja.

FIN-CLARINin nykyään ylläpitämä Kielipankki on kieliaineistoja käyttäville tutkijoille ja opiskelijoille keskeinen palvelukokonaisuus. Monet Kielipankin laajoista kirjoitetun ja puhutun kielen aineistoista sekä kielten analyysityökaluista ovat käytettävissä täysin avoimesti, osa vaatii yliopiston myöntämän tunnuksen. FIN-CLARINin kautta tutkijat pääsevät käyttämään myös kansainvälisen CLARIN ERIC -tutkimusinfrastruktuurin kieliaineistoja.

Menetelmien avoin saatavuus lisääntyy

Nyt kielentutkimuksen alalla ollaan siirtymässä avoimessa julkaisemisessa uuteen vaiheeseen, kun aineistojen lisäksi myös tutkimusmenetelmiin ja niiden opetukseen keskittyviä resursseja on alettu julkaista avoimesti selvästi aiempaa enemmän. Tästä muutoksesta on hyötyä niin tutkijoille kuin opiskelijoille. Joulukuussa 2020 alalla julkaistiin jopa kaksi laajaa menetelmiin keskittyvää resurssia. Avoimesti saatavilla oleva Kielitieteen metodipankki on suunnattu kielitieteellisistä aiheista opinnäytetyötä tekeville opiskelijoille. Se sisältää tietoa kielentutkimuksen tutkimusaloista, esimerkkejä graduaiheista ja niihin sopivista menetelmistä. Lisäksi mukana on käytännön harjoituksia.

Joulukuussa 2020 julkaistiin avoimesti myös kokoelma Kielentutkimuksen menetelmiä I-IV (Suomalaisen Kirjallisuuden Seura, SKS). Hanke on ennennäkemätön kielentutkimuksessa, sillä vastaavaa menetelmäkatsausta ei ole aiemmin ollut saatavilla. Teos sisältää neljä nidettä, 24 lukua ja laajan kielitieteen metodologiaa ja tieteenfilosofiaa taustoittavan johdannon. Teoksen päämääränä on esitellä ja selkiyttää menetelmällisten mahdollisuuksien kirjoa, menetelmällisten valintojen syitä ja seurauksia sekä eri menetelmien vahvuuksia ja heikkouksia. Lisäksi Teosta on ollut kirjoittamassa 46 kirjoittajaa, ja se on yhteensä yli tuhatsivuinen. Teos on julkaistu SKS:n avoimen julkaisemisen alustalla.

Hanke on ennennäkemätön kielentutkimuksessa, sillä vastaavaa menetelmäkatsausta ei ole aiemmin ollut saatavilla.

Kielentutkimuksen menetelmiä I-IV kirjan tavoitteena on tuoda esiin metodologisen ja laajemmin metateoreettisen tausta-ajattelun ilmaisemisen tärkeyttä kielentutkimuksessa. Nämä ovat tieteen perusteisiin käyviä aiheita, jotka ovat erittäin tärkeitä millä tahansa tieteenalalla. Samalla ne ovat usein niin laajoja aihealueita, että kollektiivinen yhteistyö on hyväksi, jopa edellytys, sillä yksi tutkija ei voi hallita kaikkea.

Avoimen yhteistyön foorumit ovat tällaisiin hankkeisiin oikein otollisia. Esimerkkinä tästä toimii suomalaisten kielentutkijoiden alulle panema Tieteen termipankki, joka kokoaa kaikkien Suomessa harjoitettavien tieteenalojen terminologiaa yhdelle wiki-alustalle. Se päivittyy jatkuvasti, ja kaikilla tieteenharjoittajilla on pääsy alustalle. Vastikään on lisäksi avattu uusi julkaisupalvelu Edition.fi avoimesti julkaistaville kirjoille (ks. myös ks. myös blogiartikkeli aiheesta).

Avoin tiede tutkimusekologiana

Avoin tiede ei tarkoita pelkästään avoimesti saatavilla olevia aineistoja, vaan se on kokonainen tutkimusekologia. Siihen kuuluvat myös avoimesti saatavilla oleva menetelmäkirjallisuus ja muu materiaali, jotka auttavat tutkijaa ja opiskelijaa perehtymään menetelmiin ja työkaluihin ja jotka opettavat niiden soveltamiseen. Avoimen julkaisemisen oheen on mahdollista luoda myös avoimia keskustelutiloja verkossa, josta hedelmällisellä tavalla voi kehkeytyä uudenlaisia tutkimusavauksia. Ihmistieteiden tutkimuskentässä kielentutkimus on pitkään ollut etulinjassa saattamassa aineistoja avoimeen käyttöön; tämä menetelmiin liittyvä askel antaa mahdollisuuksia avoimen tutkimusekologian uudenlaisen kehittämisen kielentutkimuksessa ja muussakin tutkimuksessa Suomessa.

Ihmistieteiden tutkimuskentässä kielentutkimus on pitkään ollut etulinjassa saattamassa aineistoja avoimeen käyttöön; tämä menetelmiin liittyvä askel antaa mahdollisuuksia avoimen tutkimusekologian uudenlaisen kehittämisen kielentutkimuksessa ja muussakin tutkimuksessa Suomessa.

Lisäksi tieteen avoimuushankkeet ovat tärkeitä myös ympäröivän yhteiskunnan kannalta. Enemmistö tutkimuksesta on julkisesti ja verovaroin tuotettua, jolloin on myös luontevaa, että tämän tutkimustyön tuotteet ovat avoimesti käytettävissä. Näin tutkimustieto on suoraan saatavilla tieteestä kiinnostuneelle kansalaiselle. Tutkimusta ja tieteellistä ajattelua on syytä julkaista myös suomen kielellä suomalaisen yhteiskunnan tarpeisiin.


Milla Luodonpää-Manni (ORCID, Tuhat) työskentelee kielididaktiikan yliopistonlehtorina Helsingin yliopiston kasvatustieteiden osastolla. Tutkimuksessaan hän keskittyy erityisesti kielentutkimuksen metodologiaan, kielen ja hyvinvoinnin väliseen suhteeseen sekä kieltenopetukseen liittyviin kysymyksiin.

Kaius Sinnemäki (ORCID, Tuhat) työskentelee apulaisprofessorina Helsingin yliopiston kielten osastolla. Hän johtaa parhaillaan ERC Starting Grant -hanketta GramAdapt.

Markus Hamunen (ORCID) työskentelee suomen kielen ja viestinnän lehtorina Kaakkois-Suomen ammattikorkeakoulussa. Hän opettaa myös Helsingin yliopistossa ja on opettanut aiemmin Tampereen yliopistossa suomen kieltä.