Digihumanisti aukoo uusia uria

Koska yliopistossa ei ole enää virkoja, ei ole myöskään virkaanastujaisluentoja. Sen sijasta uudet professorit pitävät juhlaluennon. Viime viikon keskiviikkona oli yliopistolla todellinen juhlapäivä, kun 18 uutta professoria esiintyi. Yksi heistä oli Timo Honkela, jonka alakin on uusi: digitaalisten aineistojen tutkimus.

Viisivuotisen professuurin rahoitus on harsittu kokoon monesta lähteestä. Aktiivisimmin sitä ovat ajaneet Mikkelissä toimiva Kansalliskirjaston digitointi- ja konservointikeskus ja Mikkelin kaupunki. Nämä tahot ovat hankkineet myös EU-rahaa tehtävän perustamiseksi. Helsingin päässä tärkeitä tukijoita on tietojenkäsittelytieteen laitos ja Kansalliskirjasto.

Honkelan juuret johtavat Aalto-yliopistoon, josta Honkela siirtyi Helsingin yliopiston humanistisen tiedekunnan nykykielten laitokselle. Siellä on jo entuudestaan vahvaa kieliteknologian osaamista ja iso kielimateriaalien luomiseen ja käyttöön keskittyvä tutkimusinfrastruktuuri CLARIN.

Professuurin tehtäväala on osa laajempaa käsitettä digital humanities. Ilmaukselle ei ole vielä sopivaa suomenkielistä vastinetta, ehkä joku lukija keksii sellaisen. Tutkimuksen näkökulmasta se käsittää kaikki laajojen digitaalisten aineistojen laatimiseen ja käyttämiseen liittyvät kysymykset. Oikeastaan kyse on vieläkin isommasta aihepiiristä, jonka piiriin voidaan laskea myös konekääntäminen, tiedonlouhinta ja koneoppiminen. Digimaailmassa toimivat eri periaatteet myös markkinoinnissa, esimerkiksi siinä mihin vuorokaudenaikaan kannattaa lähettää twiitti tai pistää kuva facebookiin. Kaikki nämä teemat ovat tällä hetkellä tulikuumaa tavaraa digitaalisen median sovellusten kehittämisessä. Tämäntapaisia kysymyksiä ratkovat sadat tuhannet insinöörit ympäri maailmaa. Heidän joukossaan on toistaiseksi liian vähän humanisteja – kielen, kulttuurin ja ihmisen käyttäytymisen asiantuntijoita.

Juhlaluennoissaan Honkela demonstroi tiedonlouhintaa ja koneoppimista näyttävällä esimerkillä. Hän oli saanut käyttöönsä Suomen Akatemialle osoitetut tutkimushankehakemukset. Tutkijaryhmän laatima tietokonealgoritmi analysoi ne ja piirsi tältä pohjalta monivärisen kartan, johon hakemukset oli sijoitettu niiden ”sukulaisuusasteen” perusteella. Kentästä erottui selviä värien keskittymiä mutta myös rajapintoja. Jos kuvaan otettaisiin mukaan ajallinen perspektiivi, tämänkaltaisen automaattisen sisältöanalyysin avulla voitaisiin kuvata havainnollisesti tieteenalojen välistä ja niiden sisäistä temaattista kehitystä.

Honkela osoitti luennossaan digiajalle ominaista on line -henkeä. Hän linkitti edellä esiintyneiden teologi- ja juristiprofessorin aihepiirit nokkelasti ja rohkeasti omaan esitykseensä jopa niin, että se ei vaikuttanut aasinsillalta. Tällaista tieteidenvälistä otetta ja ripeää meininkiä tehtävässä tarvitaankin.

Viime aikojen tieteen megatrendejä on ollut big data – sekin ilmaus jolle ei ole vielä kunnon suomenkielistä vastinetta, iso aineisto kuulostaa kovin lattealta. Big data liitetään yleensä suuriin numeerisiin aineistoihin, joita syntyy esimerkiksi ilmaston ja geeniteknologisissa tutkimuksissa. Isot tekstimassat ovat myös big dataa, josta uudenlaisilla louhinta- ja analyysimenetelmillä voidaan paljastaa seikkoja, joita perinteisiä tutkimusmenetelmiä käyttävät tutkijat eivät ole huomanneet. Aiheena voi olla mikä tahansa: Shakespearen sonettien kuvakieli, itsenäisyysajattelun kehittyminen 1800-luvun lehtitekstien valossa tai twiittien aihepiirien kulttuurisen piirteet.

Olen viime vuosien aikana omissa tutkimuksissanikin ollut big datan suurkuluttaja. Käytössämme on ollut massiivinen venäläinen tietokanta Integrum, jossa on noin 50 miljardia sanaa sanomalehtikieltä. Sen avulla olemme tehneet monta uutta havaintoa venäjän kielestä. Nyt venäläiset itsekin ovat havahtuneet korpusten käyttöön. Kielimateriaalin pohjalta he ovat laatimassa aivan uudentyyppistä venäjän kielioppia. Yliopistomme tutkijat ovat hankkeessa mukana.

Sekä tieteen kehitys että käytännön tarpeet puoltavat digital humanities -alan kehittämistä. Muualla asian tärkeys onkin jo huomattu. Maineikkaassa Kalifornian yliopistossa (UCLA) on 15 tämän alan professoria. Helsingin yliopiston humanistinen tiedekunta aikoo myös keskittää voimavaroja näiden kysymysten tutkimukseen ja uusien sovellusten kehittämiseen yhteystyössä muiden tahojen kanssa. Yksi tavoite on saada tähän lahjoitusvaroja

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *