Puhetta työstetään paloina

Miten ymmärrämme jatkuvaa puhevirtaa, vaikka työmuistimme kapasiteetti on pieni? Tätä selvitetään nyt lingvistien ja neurotutkijoiden yhteishankkeessa. Vastaus saattaa löytyä kielellisestä palastelusta.

Anna Mauranen toivoo, että tutkimushankkeen tulokset tuovat apua kielellisten häiriöiden diagnosointiin ja kielten oppimiseen. Kuva: Mika Federley

Anna Mauranen toivoo, että tutkimushankkeen tulokset tuovat apua kielellisten häiriöiden diagnosointiin ja kielten oppimiseen. Kuva: Mika Federley

Lue lisää hankkeesta humanistisen tiedekunnan verkkosivuilla

Humanistit ja tietojenkäsittelijät lyövät hynttyyt yhteen

Digitaalinen humanismi pääsee pian vauhtiin, sillä sen edistämiseen on valittu kaksi puuhamiestä: Aatehistorioitsija Mikko Tolonen toimii professori Timo Honkelan sijaisena. Hänen aisaparikseen on palkattu tietojenkäsittelytieteilijä Eetu Mäkelä Aalto-yliopistosta.

Mäkelä ja Tolonen vierailivat 23.2. nykykielten laitoksella esittäytymässä ja tutustumassa digihumanismista kiinnostuneisiin tutkijoihin. Virallisesti kumpikin aloitti laitoksen leivissä 1. maaliskuuta.

Tutkimusongelma edellä

Tolonen painottaa sitä, että digihumanismissa ei tavoitella uutta tieteenalaa vaan monitieteistä yhteistyötä. Tärkeintä on tutkimuksellinen lisäarvo: digitaalisilla menetelmillä haetaan uusia näkökulmia ja vastauksia tutkimuskysymyksiin, jotka tulevat humanistisen tutkimuksen keskiöstä. Teema pitää sisällään myös digitaalisuuden tutkimuksen.

Laajojen datakokonaisuuksien avulla voi etsiä merkityksiä kysymyksille kuten ”mitä historia on”. Tolonen esitteli kaksi lähestymistapaa: tiedon kokoamisen suurista korpuksista tekstinlouhinnan avulla ja metadatan käyttämisen kvantitatiivisena työkaluna. Erityyppiset aineistot ovat yhdisteltävissä: voidaan sekä tutkia rakenteista dataa että liikkua siitä tekstilouhintaan. Tämä avaa uusia mahdollisuuksia.

– Käännetään esimerkiksi kirjastoluettelo päälaelleen: käytetään vanhaa aineistoa uuteen tarkoitukseen viemällä se avoimeen tieteelliseen laskentakirjastoon. Luettelosta voi kaivaa vaikkapa julkaisupaikkojen avulla tietoa siitä, missä jotain tieteenalaa kehitettiin aktiivisesti tiettynä aikana, Tolonen havainnollistaa.

Avoimuutta datan hyödyntämiseen

Kukin tietoaineisto ja tutkimus vaatii erityiskäsittelyä ja asiantuntijan panoksen. Aineiston puhdistaminen esimerkiksi kirjoitusvirheistä ja epäyhtenäisistä kirjoitusasuista on työlästä.

– Aineistoja kannattaa putsata automatisoidusti ohjelmakoodin avulla erilaisia sääntöjä kehittäen, Tolonen selittää.

Samalla osa työn tuloksista voidaan kohdistaa myös muihin vastaaviin aineistoihin – näin syntyy huomattavaa skaalattavuutta. Aineisto tarjotaan myös muiden tutkijoiden käytettäväksi: periaatteessa kuka tahansa voi osallistua työhön jo tutkimusprosessin aikana. Mitään ei korjata käsin ilman, että siitä jäisi palautettava jälki.

– Koko työkulku raakadatasta tulkintojen kautta johtopäätöksiin on tarkasteltavissa ja toistettavissa, Mäkelä korostaa.

Visualisointi auttaa näkemään uusia asioita

Mäkelä kehittää järjestelmiä datan käsittelyyn. Niiden hyödyllisyyden arviointi on haastavaa, ja siksi hän haluaakin palautetta työkalujen käyttäjiltä.

– Humanisteilla on vaikeita tutkimusongelmia ja paljon rikasta aineistoa, mutta ei tarpeeksi työkaluja sen tonkimiseen. Haluan mahdollistaa syväluotaavan sukelluksen raakadataan, Mäkelä kuvailee.

Mäkelä on laatinut esimerkiksi visualisointityökaluja. Yhteisiä nimittäjiä niille ovat karttojen ja aikajanojen hyödyntäminen sekä linkittäminen takaisin alkuperäiseen aineistoon.

Humanistiset aineistot ja tutkimus vaativat usein syvällistä tulkintaa. Tarvitaan työkaluja, jotka auttavat löytämään aineistosta kiinnostavia säännönmukaisuuksia ja jäsentämään raakadataa.

– Tarkoitus ei ole laatia dataa raksuttavia algoritmeja, jotka sylkäisisivät lopuksi ulos valmiin tuloksen. Haluan tarjota työkaluja nimenomaan ihmiselle: auttaa tutkijaa katsomaan aineistoaan eri tavalla, Mäkelä selittää.

Yhteistyökulttuuri juurrutettava tutkimukseen

Tolonen näkee tarpeen sosiaaliselle muutokselle. Humanistis-yhteiskunnallisen tutkimuksen merkittävä pullonkaula on moderniin data-analyysiin liittyvien menetelmien ja osaamisen puute sekä ratkaisujen hajanaisuus. Avoimet sähköiset aineistot ovat kaikkien saatavilla, mutta liian laajoja yksittäisen tutkijan hallittavaksi.

– Kasvavien aineistomäärien käyttöönottoon tarvitaan työkalujen lisäksi myös uudenlaista tutkimusyhteistyötä, samaan tapaan kuin esimerkiksi biotieteissä on ryhdytty toimimaan ihmisen perimän tutkimukseen liittyen. Lisäksi keskeistä on, että päätökset menetelmien käytöstä ja kehittämisestä syntyvät tutkijalähtöisesti, Tolonen sanoo.

4K: Kielen, kirjallisuuden ja kulttuurin kohtaamisia 14.1.–29.4.2015

4K on kaikille avoin luentosarja, jolla esitellään kielen-, kirjallisuuden- ja kulttuurintutkimuksen tuoreimpia tuulia.

Luennot järjestetään keskiviikkoisin klo 17:15–18:45 Metsätalon (Unioninkatu 40, Helsinki) salissa 2. Poikkeuksena on sarjan viimeinen luento 29.4., joka järjestetään salissa 1.

Luentosarjan järjestää nykykielten laitos.

4k_wordle

Ohjelma

14.1.

Bo Pettersson, Minna Palander-Collin, Matti Miestamo ja Tomi Huttunen: Kielen-, kirjallisuuden- ja kulttuurintutkimus tänään

21.1.

Eva Havu: Mitä on kielten ja kulttuurien vertaileva tutkimus? Tutkijayhteisö CoCoLaC esittäytyy

28.1.

Terttu Nevalainen: Englannin vaihtelu ja muutos – tutkimusta ja tutkimuksen tutkimusta

4.2.

Ulla Tuomarla: Verbaalinen aggressio sosiaalisessa mediassa
Mervi Helkkula: Kielteiset tunteet ja verbaalinen väkivalta ranskankielisessä kirjallisuudessa

11.2.

Tomi Huttunen, Liisa Bourgeot ja Riku Toivola: SLOVO: venäläinen sana ja sen tutkimus

18.2.

Anni Sairio, Minna Nevala ja Turo Vartiainen: Sinisukkia ja sarjamurhaajia: Identiteetin luominen ja arvottaminen englannin kielen historiassa

25.2.

Juhani Härmä: Ranska lingua francana Suomessa
Sabine Kraenker: French break-up letters in a love relationship

11.3.

Liisa Tiittula: Puhekielen suomentamisen muuttuvat normit
Nely Keinänen: Shakespeare suomeksi

18.3.

Krister Lindén: FIN-CLARIN – kieliaineistot ja -työkalut
Tuula Pääkkönen: Suomenkielinen sanomalehtiaineisto ja mitä siitä opimme Kansalliskirjaston koneoppimisen ja tekstinlouhinnan tutkimusprojekti Digrassa

25.3.

Bo Pettersson ja Merja Polvinen: Kuinka kaunokirjallisuuden maailmoja tutkitaan?

1.4.

Kristiina Taivalkoski-Shilov : Miten tutkia käännetyn tietokirjallisuuden vastaanottoa?
Svetlana Probirskaja: Sotatulkit Suomen ja Neuvostoliiton välisissä sodissa

15.4.

Mark Shackleton ja Tiina Wikström: Studying contemporary Native American writing

22.4.

Ekaterina Gruzdeva ja Juha Janhunen: Sahalinin alkuperäiskansojen parissa

29.4.

Anna Mauranen ja Svetlana Vetchinnikova: Kun kaikki kielet kohtaavat englannin: englanti globaalina lingua francana
(HUOM: Luento on poikkeuksellisesti Metsätalon salissa 1.)

Luentosarja on osa Helsingin yliopiston 375-juhlavuoden ohjelmaa.

Luentosarja on osa Helsingin yliopiston 375-juhlavuoden ohjelmaa.