Humanistit ja tietojenkäsittelijät lyövät hynttyyt yhteen

Digitaalinen humanismi pääsee pian vauhtiin, sillä sen edistämiseen on valittu kaksi puuhamiestä: Aatehistorioitsija Mikko Tolonen toimii professori Timo Honkelan sijaisena. Hänen aisaparikseen on palkattu tietojenkäsittelytieteilijä Eetu Mäkelä Aalto-yliopistosta.

Mäkelä ja Tolonen vierailivat 23.2. nykykielten laitoksella esittäytymässä ja tutustumassa digihumanismista kiinnostuneisiin tutkijoihin. Virallisesti kumpikin aloitti laitoksen leivissä 1. maaliskuuta.

Tutkimusongelma edellä

Tolonen painottaa sitä, että digihumanismissa ei tavoitella uutta tieteenalaa vaan monitieteistä yhteistyötä. Tärkeintä on tutkimuksellinen lisäarvo: digitaalisilla menetelmillä haetaan uusia näkökulmia ja vastauksia tutkimuskysymyksiin, jotka tulevat humanistisen tutkimuksen keskiöstä. Teema pitää sisällään myös digitaalisuuden tutkimuksen.

Laajojen datakokonaisuuksien avulla voi etsiä merkityksiä kysymyksille kuten ”mitä historia on”. Tolonen esitteli kaksi lähestymistapaa: tiedon kokoamisen suurista korpuksista tekstinlouhinnan avulla ja metadatan käyttämisen kvantitatiivisena työkaluna. Erityyppiset aineistot ovat yhdisteltävissä: voidaan sekä tutkia rakenteista dataa että liikkua siitä tekstilouhintaan. Tämä avaa uusia mahdollisuuksia.

– Käännetään esimerkiksi kirjastoluettelo päälaelleen: käytetään vanhaa aineistoa uuteen tarkoitukseen viemällä se avoimeen tieteelliseen laskentakirjastoon. Luettelosta voi kaivaa vaikkapa julkaisupaikkojen avulla tietoa siitä, missä jotain tieteenalaa kehitettiin aktiivisesti tiettynä aikana, Tolonen havainnollistaa.

Avoimuutta datan hyödyntämiseen

Kukin tietoaineisto ja tutkimus vaatii erityiskäsittelyä ja asiantuntijan panoksen. Aineiston puhdistaminen esimerkiksi kirjoitusvirheistä ja epäyhtenäisistä kirjoitusasuista on työlästä.

– Aineistoja kannattaa putsata automatisoidusti ohjelmakoodin avulla erilaisia sääntöjä kehittäen, Tolonen selittää.

Samalla osa työn tuloksista voidaan kohdistaa myös muihin vastaaviin aineistoihin – näin syntyy huomattavaa skaalattavuutta. Aineisto tarjotaan myös muiden tutkijoiden käytettäväksi: periaatteessa kuka tahansa voi osallistua työhön jo tutkimusprosessin aikana. Mitään ei korjata käsin ilman, että siitä jäisi palautettava jälki.

– Koko työkulku raakadatasta tulkintojen kautta johtopäätöksiin on tarkasteltavissa ja toistettavissa, Mäkelä korostaa.

Visualisointi auttaa näkemään uusia asioita

Mäkelä kehittää järjestelmiä datan käsittelyyn. Niiden hyödyllisyyden arviointi on haastavaa, ja siksi hän haluaakin palautetta työkalujen käyttäjiltä.

– Humanisteilla on vaikeita tutkimusongelmia ja paljon rikasta aineistoa, mutta ei tarpeeksi työkaluja sen tonkimiseen. Haluan mahdollistaa syväluotaavan sukelluksen raakadataan, Mäkelä kuvailee.

Mäkelä on laatinut esimerkiksi visualisointityökaluja. Yhteisiä nimittäjiä niille ovat karttojen ja aikajanojen hyödyntäminen sekä linkittäminen takaisin alkuperäiseen aineistoon.

Humanistiset aineistot ja tutkimus vaativat usein syvällistä tulkintaa. Tarvitaan työkaluja, jotka auttavat löytämään aineistosta kiinnostavia säännönmukaisuuksia ja jäsentämään raakadataa.

– Tarkoitus ei ole laatia dataa raksuttavia algoritmeja, jotka sylkäisisivät lopuksi ulos valmiin tuloksen. Haluan tarjota työkaluja nimenomaan ihmiselle: auttaa tutkijaa katsomaan aineistoaan eri tavalla, Mäkelä selittää.

Yhteistyökulttuuri juurrutettava tutkimukseen

Tolonen näkee tarpeen sosiaaliselle muutokselle. Humanistis-yhteiskunnallisen tutkimuksen merkittävä pullonkaula on moderniin data-analyysiin liittyvien menetelmien ja osaamisen puute sekä ratkaisujen hajanaisuus. Avoimet sähköiset aineistot ovat kaikkien saatavilla, mutta liian laajoja yksittäisen tutkijan hallittavaksi.

– Kasvavien aineistomäärien käyttöönottoon tarvitaan työkalujen lisäksi myös uudenlaista tutkimusyhteistyötä, samaan tapaan kuin esimerkiksi biotieteissä on ryhdytty toimimaan ihmisen perimän tutkimukseen liittyen. Lisäksi keskeistä on, että päätökset menetelmien käytöstä ja kehittämisestä syntyvät tutkijalähtöisesti, Tolonen sanoo.