DHH15 – Digitaalisten ihmistieteiden hackathon

Kirjoittanut: tietojärjestelmäasiantuntija Tuula Pääkkönen

DHH15 eli Digital Humanities Hackathon 2015, järjestettiin 11.5.-15.5.2015 Helsingin Yliopiston Tutkijakollegiumissa. Järjestäjinä olivat professorit Mikko Tolonen, Eetu Mäkelä, ja mukana menossa oli myös Timo Honkela, joka oli hackathonin alkuperäisidean isä. Kiinnostusta teemaan osoitti osallistujien runsaslukuinen joukko, rekisteröityneitä osallistujia oli liki neljäkymmentä. Lisäksi päivien aikana paikalle tuli eri asiantuntijoita kertomaan omasta tutkimuksestaan tai muusta teemaan liittyvästä kiivaan ryhmätyötyöskentelyn välipaloiksi.

Ryhmän 2. FNewspapers posteri

Ideana hackathonissa oli saattaa historioitsijoita, humanisteja ja tietojenkäsittelytieteen lukijoita ja luoda uusia tutkimusaihioita annettujen aineistojen ja omien mielenkiinnonkohteiden pohjilta. Pyrkimys oli aitoon monitieteisyyteen ja lähteä tutkimuskysymysedellä ja katsoa mitä aineistoista löytäisi tietojenkäsittelytieteen menetelmin.

Aineistot

Aineistoja oli neljä: Kansalliskirjaston digitoitujen aineistojen (eli sanomalehtikirjaston) sivujen raakatekstit (n. 1,9 miljoonaa sivua) ja teknisten aikakauslehtien raakatekstit, korpus englantilaisista kirjeistä vuosilta 1400-1800 ja multimodaalinen sivukorpus Blue Wings –lehdestä. Hyvinkin moninaiset aineistot, jotka mahdollistivat erilaisia tutkimusaihioita. Osallistujat jaettiin kiinnostuksen mukaan neljään ryhmään, jotka pohtivat tutkimuskysymyksen ja kuinka aineisto voisi siihen vastata.

Kuva 1 Timo Honkela & Digital Humanities

Ensimmäisenä päivänä osallistujat tutustutettiin sekä aineistoihin, että hackathonin työmalliin. Professori Honkela kertoi kuinka digitaalisia ihmistieteitä voi soveltaa State of the Union-puheista abstraktin taiteen luokitteluun ja aina tekstinkorjauksiin. Mikko Tolonen johdatteli hackathonin rakenteeseen ja Eetu Mäkelä kertoi mm. hyödyllisistä työkaluista ja tiedon visualisointitavoista.

Kuva 2 Eetu Mäkelä ja Mikko Tolonen kertomassa DIGIHUM-opetuskokonaisuuden suunnitelmista

Ryhmät työskentelivät tiiviisti, jopa helatorstaina oltiin tekemässä tietojen analyysiä, loppuesityskalvoja ja julistetta, joka tiivisti tutkimusidean ytimen. Perjantaina ryhmät esittelivät tuloksensa kaikille avoimessa tapahtumassa kaikille avoimessa loppugaalassa. Tapahtuma oli myös osa Day of Digital Humanities -tapahtumia Suomen osalta.

Ryhmien tuloksista yleiskatsaus

Ryhmä 1. Varieng/CEEC-korpus tutki kuinka Skotlantia ja skotlantilaisista puhuttiin kirjeissä Englannin ja Skotlannin yhdistymisen aikaan. Tutkittiin millaisia termejä aineistoista nousee ja pyrittiin katsomaan kuinka yhden tietyn kirjeen poistaminen termin käsittelyä muuttaa (confidence interval).

Ryhmä 2. FNewspapers, tutki sosialismin käsitteitä ja sanastoa, vuosina 1895-1910, jolloin sosialismi saapui Suomessa julkaistuista sanomalehdistä. Ensin aineistosta valittiin sosialistiset sanomalehdet ja sitten tutkittiin tästä korpuksesta löytyviä useimmin esiintyviä sanoja suhteessa koko korpukseen ja verrattiin näiden eroja.

Ryhmä 3. TechHist, valitsi teknisistä aikakauslehdistä, hehkulampun kohteekseen ja tutki kuinka sähkövalon kehittyminen Suomessa näkyi näissä lehdissä.

Ryhmä 4. Multimodal, tutki tekstin lisäksi Blue Wings-lehden rakennetta ja kuvien ja tekstien suhdetta toisiinsa ja kuinka Suomea lehdessä kuvataan. Teksti ja kuvat yhdessä voivat rakentaa median visuaalisia genrejä ja toisaalta kuinka design niitä rakentaa.

Tulevaisuus!

Perjantaina kerrottiin myös suunnitelmista tulevaan digitalisten ihmistieteiden opintokokonaisuuteen. Alustavana ajatuksena oli, että mahdollisuuksien mukaan poimitaan soveltuvia kursseja eri tiedekunnista ja pyritään aidosti monitieteiseen kokonaisuuteen, joka mahdollistaa sekä enemmän teknisten että humanistisiin tieteisiin suuntautuvien yhteistyön ja ehkä jopa yhteisprojektit. Vaikka kaikkien ei tarvitse ohjelmointia osatakaan, on silti hyvä, että eri alojen asiantuntijat oppivat paremmin viestimään toistensa kanssa. Toivottavasti kurssi toteutuu ja mahdollisesti vielä osittain verkko-opetuksena, joka mahdollistaisi osallistumisen eri puolelta Suomea.

Lisäksi toistuva teema päivien aikana oli, että pitää vain rohkeasti kokeilla eri tekniikoita ja työkaluja. Erään osallistujan keksimä lentävä lause päivien aikana olikin:  ”Coming out from your comfort zone, … but it helps to know a little bit of python”. Kokeilemisen kautta saa kokemusta mikä toimii ja mikä ei, ja pitkällä tähtäimellä, tutkijat voivat helpottaa omaa tutkimustyötänsä hyödyntäen kuhunkin tarkoitukseen parhaiten soveltuvaa välinettä. Digitaaliset aineistot mahdollistavat monia käyttötapoja, joita kaikkia ei ehkä huomaakaan kuin ”törmäyttämällä” eri alojen ihmisiä pohtimaan asioita yhdessä – hyödyntäen eri osapuolten vahvuudet.

Kiinnostavaa oli myös useassakin ryhmässä syntynyt oivallus siitä, että laskennalliset menetelmät tarvitsevat kuitenkin ns. tarkkaa lukemista koneellisten menetelmien rinnalle. Kuten TechHist-ryhmässä huomattiinkin, ensimmäinen artikkeli, joka käsitteli hehkulamppua muistutti tyyliltään Kalevalaa, mitä ehkä ei koneellisella ”kaukolukemisella” voikaan havaita ja kuten professori, Helsingin Sanomat Foundation Fellow Caroline Basset kommentoikin yhden ryhmän kohdalla, että pohdittava onkin milloin käyttää lähi- ja milloin kaukolukemista  (close vs. remote reading) ja kuinka vaihdella näiden välillä.

Jos haluat lukea hackathonista lisää, niin tarkempia raportteja eri ryhmiltä on tulossa blogimuodossa, seuraa mm. Helsinki Digital Humanities Blogia: https://blogs.helsinki.fi/mstolone/   tai lue tunnelmia päivistä http://essetter.blogspot.fi/2015/05/digital-humaniora-i-praktiken.html


Teksti ja kuvat: Tuula Pääkkönen
Julisteen graafinen ilme ja toteutus: Susanna Ånäs (2. ryhmän jäsen)