Kati Katajisto: Digimurroksen unelmia ja uhkakuvia – ja mitä tapahtuu historian alalla?

Douglas Engelbart, kuuluisa tietokoneen hiiren keksijä, on väittänyt, että digitaalinen vallankumous on radikaalimpi muutos kuin kirjoitus- tai painotaidon keksiminen. Usein puhutaan myös kolmannesta teollisesta vallankumouksesta, jossa nyt höyryn ja sähkön tavoin digitalisaatio mullistaa ympäröivän maailmamme. Miten rajuksi muutos osoittautuu, sen vasta aika näyttää, mutta kieltämättä muutosvauhti tuntuu kiihtyneen, ja myös historioitsija huomaa sen. Toimintaympäristön muutokset tai yritykset muuttaa niitä, saattavat yllättää.

Viimeksi mainitusta käy esimerkiksi viime aikoina ajankohtaisena porissut keskustelu tiedonhallintalaista. Lain tavoitteena olisi parantaa kansalaisten tiedonsaantia ja viranomaistoimintaa sekä viranomaistiedon kaupallista hyödyntämistä. Hyvältä kuulostavia tavoitteita, mutta kun katsookin kaavailtua toteuttamistapaa, niin historiantutkijan karvat nousevat pystyyn. Kauhuskenaario on, että viranomaisten asiakirjahallinnon yhteentoimivuus murenee ja säilytettävä arkistoaineisto pirstaloituu ja jää puutteelliseksi. Onkin ironista, että samaan aikaan kun historiantutkimuksessa käytettävät digitoidut aineistot kasvavat vauhdilla ja erilaiset digitaaliset työkalut kehittyvät ja niiden käyttö lisääntyy, niin uhkakuvaksi nousee, ettei tulevaisuuden historiantutkijoilla olisikaan käytettävissä kunnon dataa tiedonhallintalain potentiaalisesti mahdollistaessa sen. Tiedonhallintalaista löytyy tarkemmin tietoa esimerkiksi: https://agricolaverkko.fi/tietosanomat/esitys-tiedonhallintalaiksi-herattaa-tyrmistynytta-vastarintaa/ sekä http://www.historiallinenaikakauskirja.fi/sites/historiallinenaikakauskirja.fi/files/media/HAiK_3_2018_suuntaviivoja_0.pdf.

Kiihtyvä toimintaympäristön muutosvauhti ja mahdolliset ennakoimattomat muutokset luovat sekä mahdollisuuksia että paineita – uhkakuvia ja unelmia tulevaisuudesta. Niin yritykset kuin eri toimijat vaikkapa akateemisessa maailmassa joutuvat pohtimaan, miten oman toimintaympäristön muutos todella vaikuttaa meihin? Mitä pitäisi tehdä? Miten muuttua ja pysyä kehityksen mukana? Pessimistisissä näkemyksissä digitalisaatio, robotiikka ja tekoäly vievät suuriman osan ihmisten perinteisistä töistä. Optimistisissa näkemyksissä taas korostetaan, miten käynnissä oleva muutos mahdollistaa yksitoikkoisten ja toistoa vaatien rutiinitöiden siirtämisen ihmisiltä koneille ja kuinka työviikkokin saattaisi muuttua nelipäiväiseksi. Historiantutkijan on vaikea kuvitella, että historian kirjoittaminen voitaisiin ulkoistaa ihmiseltä koneelle. Se on kaikkea muuta kuin rutiinia. Sen sijaan lähteiden ääreen pääsyssä ja niiden kokoamisessa ja läpikäymisessä digimurros avaa uusia mahdollisuuksia.

Voimakkaimmin toimintaympäristön muutos onkin näkynyt historiantutkimuksessa -ja opetuksessa tähän mennessä siinä, miten arkistot, kirjastot ja museot ovat digitoineet aineistojaan. Kansalliskirjaston Digi.Kansalliskirjasto.fi on yksi käytetyimpiä palveluja. Kansalliskirjasto on digitoinut kokoelmissaan olevat Suomessa vuosina 1771-1929 ilmestyneet lehdet, ja ne ovat tällä hetkellä kaikkien vapaassa käytössä. Lisäksi Kansallisarkiston ja Helsingin yliopiston humanistisen tiedekunnan kesken on sovittu pilottiprojektista, joka mahdollistaa kaikkien Digissä olevien aineistojen käytön aina vuoteen 2010 asti. Se on huomattava parannus aineistojen saatavuuteen, sillä aikaisemmin tekijänoikeuksien alaisia aineistoja on voinut tutkia joko mikrofilmiltä tai Kansalliskirjaston vapaakappaletyöasemilta.

Kansallisarkiston Digitaaliarkisto on toinen historioitsijoiden eniten käyttämistä digipalveluista. Kansallisarkisto on myös lähtenyt mukaan kehittämään virtuaalista tutkimusalustaa, Transkribusta, jota voi käyttää käsinkirjoitetun tekstin tunnistukseen. Lisäksi Transkribuksessa voi tehdä hakusanahakuja. Eurooppalaisen yhteistyön voimin kehitettävä virtuaalinen tutkimusalusta on uusi ja mielenkiintoinen avaus Kansallisarkistolta, ja sitä voi pitää ns. seuraavana askeleena muistiorganisaatioiden digimurroksessa. Enää ei tyydytä tarjoamaan pelkästään digitoituja aineistoja vaan myös digitaalisia työkaluja tutkia kyseisiä aineistoja. Transkribus tullaan integroimaan Kansallisarkiston palveluihin, mutta se on jo tällä hetkellä verkosta vapaasti ladattavissa https://transkribus.eu/Transkribus/.

Mielenkiintoinen uutuus digitaalisten verkkopalveluiden saralla on myös Biografiasampo (http://biografiasampo.fi/), johon on koottu tietoja kymmenistä tuhansista menneistä ja nykyisistä suomalaisista, näiden elämänvaiheista ja teoista sekä ihmisten yhteyksistä. Pohjana on Kansallisbiografian yli 13 000 pienoiselämäkertaa ja muista SKS:n henkilöhistoriallisista tietokannoista poimitut tekstit, joista on koostettu älykkään kieliteknologian avulla tietämysverkko (”knowledge graph”) ja data-palvelu.

Historiaa tutkivien saatavilla alkaakin olla jo varsin hyvin erilaisia digitaalisia lähteitä ja niihin liittyviä muita palveluja. Ulkomaisista palveluista ei ole sanottu tässä mitään, ja kotimaisistakin moni on jätetty mainitsematta kuten esimerkiksi digitoidut valtiopäiväasiakirjat 1907-2000 (http://avoindata.eduskunta.fi/digitoidut/) tai Helsingin kaupunginarkiston Sinetin kautta löytyvät digitaaliset aineistot (https://yksa3.darchive.fi/YKSA3/public/archive/HELKA/). Verkossa olevia lähde- ja tutkimusaineistoja sekä niihin liittyviä palveluja voi myös löytää kootusti kuten Agricolan Lähteille-sivustolta (https://agricolaverkko.fi/lahteille/).

Seuraava haaste onkin käyttää näitä uusia digitaalisia palveluja entistä kekseliäämmällä tavalla, sillä ne mahdollistavat esimerkiksi aivan uudenlaisten kysymysten esittämisen laajoille tekstimassoille tai uudenlaisen tavan koota lähdeaineistoja. Digimurros luo historiantutkimuksessakin upeita mahdollisuuksia, mutta aiheuttaa myös lähdekriittistä päänsärkyä sen osalta, että historiaa tutkivat tuntevat vielä huonosti digitaalisten palveluiden ja työkalujen takana olevaa ns. konelogiikkaa. Kurkkaa vaikka Biografiasammon Henkilöt-kohdan Olli Rehnin verkostoa, jossa on Kustaa III yhtenä linkkinä. Osaatko selittää sen?

Olli Rehnin Kansallisbiografia-artikkelissa viitataan Urho Kekkoseen ja Kekkosen sivulla taas todetaan, että tämän runnomaa Miettusen hätätilahallitusta voi verrata taktisessa suvereenisuudessaan Kustaa III:n vallankaappaukseen 1772. Ainakaan minulle tämä ei auennut muuten kuin kysymällä Biografiasammon tekijöiltä. Ja sen jälkeen voi alkaakin pohtia, miten kyseisen kaltaista henkilön verkosto-näkymää voi käyttää historiantutkimuksessa.

Onkin selvää, että digimurrokseen liittyviä haasteita tulee riittämään historian alalla jatkossakin – ja unelmia.

Kati Katajisto: Voyant – kokeilemisen arvoinen DH-työkalu

Digital humanities -työkalut kehittyvät koko ajan, mutta käytännössä niiden soveltaminen tutkimukseen on usein varsin aikaa vievää, sillä harva työkalu soveltuu sellaisenaan tutkimukseen. Useissa tapauksissa vaaditaan koodaustaitoja, jotta tutkimusdata ja työkalu saadaan muokattua tutkimuksen kysymyksenasetteluun soveltuvaksi. Jos aikasi tai mielenkiintosi eivät riitä syvempään perehtymiseen, mutta haluaisit kuitenkin kokeilla jotain uutta tutkimusaineistoosi, niin suosittelen Voyantia.

Voyant on web-pohjainen tekstianalyysi-sovellus, jolla on erittäin helppo päästä alkuun. Mene Voyantin sivulle osoitteeseen https://voyant-tools.org/ ja lisää tekstisi etusivun Add Texts –laatikkoon. Valitse Reveal ja ’dadaa’, edessäsi on Cirruksen muodostama sanapilvi lisäämästäsi aineistosta. Sivun keskellä on Reader, jossa lisäämäsi teksti näkyy kokonaisuudessaan. Valitsemalla sanapilvestä tietyn sanan (klikkaamalla sitä), näet Readerissä ne keltaisella. Sivuston oikeasta yläkulmasta voit valita lisää työkaluja ja oikealla alhaalla taas näkyy sanojen konteksti. Nyt ei kuitenkaan mennä syvemmälle näihin, vaan luodaan katse Cirrukseen.

Cirruksen sanapilvi paljastaa aineistossa kaikkein useimmiten käytetyt sanat, ja sen alapuolella olevassa tekstissä luetellaan lisäksi liittämäsi tekstiaineiston käytetyimmät sanat ja niiden lukumäärät. Jos sanapilvessä on häiritsevän paljon sanoja, joilla ei ole merkitystä analyysin kannalta (kuten esimerkiksi: että, ja, sekä, jos), niin valitse Cirruksen tehtäväpalkista Define options for this tool ja sieltä Edit list. Sen jälkeen lisää listaan, jokaiselle eri riville, sana (stop word), jonka et halua näkyvän sanapilvessä, ja tallenna (Save) ja varmista (Confirm).

Mitä sanapilvi sitten kertoo? Aineistonsa hyvin tuntevalle tutkijalle ei välttämättä mitään uutta, hän saa ennemminkin vain varmistuksen sille, että hän on löytänyt aineistoistaan keskeisimmät asiat. Varsinkin jos tutkimuksen tekstiaineisto on erittäin laaja, on tällainen ns. tarkistus varmastikin useimmille tutkijoille mukava varmistus. Sen sijaan sellaisissa aineistoissa, jotka ovat tutkijalle käytännössä mahdottomia käydä läpi niiden laajuuden vuoksi kuten Hillary Clintonin yli 30 000 sähköpostia (kts. https://www.historians.org/publications-and-directories/perspectives-on-history/summer-2018/digging-through-the-hillary-clinton-email-archive-using-voyant-tools-in-the-classroom), tarjoaa Voyant oivan mahdollisuuden kahlata aineistoa läpi.

Voyant on siis hyvä työkalu, kun tutkija haluaa käydä tekstiaineistoa läpi. Cirruksen avulla onnistuu ns. distant reading, jolloin tutkija voi löytää tietokoneen avulla laajasta aineistosta sanat ja kohdat, johon kohdistaa perinteinen ihmisen suorittama ns. close reading.

FT Kati Katajisto

 

Kati Katajisto: Miten määritellä digitaaliset ihmistieteet? Entä ns. digihistoria?

 

Suomen Akatemian määritelmän mukaan digitaaliset ihmistieteet on käsite, ”jolla viitataan uuden teknologian hyödyntämiseen humanistisessa ja yhteiskuntatieteellisessä tutkimuksessa”. Esimerkiksi tästä Suomen Akatemia mainitsee korpuslingvistiikan ja siihen sisältyvät laskennalliset menetelmät. Tämän näkemyksen mukaan laajojen aineistojen käyttö ja niistä kerättävä tutkimustieto koskevat ylipäätänsä humanistisia tutkimuksia, jolloin myös uudet teknologiat tulevat lähelle kaikkia humanistisen alan tutkijoita. Nostan seuraavassa esiin muutamia pointteja, jotka nousevat Suomen Akatemian Digitaaliset ihmistieteet (DIGIHUM) akatemiaohjelman 2016-2019  pohjalta seikoiksi, joiden voi katsoa kuvaavan sitä, mitä digitaaliset ihmistieteet käytännössä tarkoittaa:

  1. uudet menetelmät ja tekniikat, joissa käytetään digitaalista teknologiaa ja modernin datatieteen menetelmiä aineistojen KERUUSSA, HALLINNASSA JA ANALYYSISSÄ JA ILMIÖIDEN MALLINNUKSESSA
  2. laaja-alainen yhteistyö, joka tarkoittaa yhteistyötä tutkijoiden, teknologia-asiantuntijoiden ja muistiorganisaatioiden sekä tietokantojen ylläpitäjien ja kehittäjien kesken.(http://www.aka.fi/globalassets/32akatemiaohjelmat/digihum/ohjelmamuistio_digi_suomeksi_final.pdf).

Digitaalisesta humanismista ja historiatieteestä kirjoittanut Kimmo Elo on taas nojautunut digitaalisten ihmistieteiden määritelmässään Kathleen Fitzpatrickiin, että: ”digital humanities could be understood as a nexus of fields within which scholars use computing technologies to investigate the kinds of questions that are traditional to the Humanities” (Elo 2016, 17).

Elon lähtökohtana onkin, että määräävä tekijä määrittelyssä on se, “sovelletaanko tutkimushankkeessa tietojenkäsittelytieteille ominaisia menetelmiä vai ei”. Elo sulkee siis määritelmässään ulos sen, että digitaalisuutta tutkiva tutkimus olisi itsessään digitaalista humanismia. Elon määritelmän voikin katsoa olevan käytännössä saman sisältöinen kuin yllä mainitun Suomen Akatemian. Määriteltäessä, mitä digital humanities -tutkimus on, kyseisen kaltainen määritelmä voikin olla toimiva, mutta sen sijaan voi kysyä, onko näin myös digital humanities -opetuksen kannalta.

Elon toimittamassa kirjassa Digitaalinen humanismi ja historiatieteet, jossa hän määrittelee digitaalisen humanismin yllä kuvatulla tavalla, todetaankin Katja Fältin artikkelissa, että digitaalisen tutkimuksen apulaisprofessori Mark L. Sample on ”yksinkertaistanut digitaalisen humanismin” siten, että ”se perustuu pohjimmiltaan digitaaliseen objektiin, joko alun perin digitaaliseen tai analogiseen objektiin, joka on jollakin tavalla skannattu, valokuvattu, kartoitettu tai mallinnettu digitaalisessa ympäristössä” (Katja Fält 2016, 56). Samassa kirjassa myös Jaakko Suominen ja Anna Sivula toteavat artikkelissaan Digisyntyisten ilmiöiden historiantutkimus, että ”laajasti määriteltynä digitaalinen historiantutkimus (digihistoria) on mitä tahansa menneisyyden ilmiöitä tai muutosprosesseja käsittelevää tutkimusta, jossa kaikki tai osa lähteistä on digitaalisessa muodossa. Toisaalta se voi olla historiantutkimusta, jota ohjaa digitaalisuutta tai digitalisoitumista koskeva kysymyksenasettelu.” Digitaalisen historiantutkimuksen voi siis määritellä joko laajasti tai suppeasti. Suppeampi määritelmä edellyttää tietojenkäsittelytieteissä kehiteltyjä metodeja (Jaakko Suominen & Anna Sivula 2016, 105-106).

Seuraavassa pohditaankin lyhyesti sitä, miten digitaalisuus voitaisiin määritellä nimenomaan historiantutkimuksen- ja opetuksen kannalta. Ensi alkuun voi esittää kriittisen kysymyksen, miksi historioitsijoiden ylipäätänsä pitäisi olla kiinnostunut digitaalisuus -teemasta. Yksinkertainen ja selvä vastaus siihen on se, että digitalisoituminen muuttaa ja on jo muuttanut nykypäivän maailmaa niin paljon, että jos historioitsijat haluavat ymmärtää, miten yhteiskunnat ja globaali yhteisö ovat muuttuneet, niin heidän täytyy ymmärtää digitalisoitumisen vaikutuksia ja seurauksia. Historiaa ei tutkita eikä opeteta tyhjiössä, joten jo tästä perspektiivistä laajempi määritelmä tuntuu sopivan paremmin ns. digihistorian määritelmäksi. Digihistorian voisi siis määritellä karkeasti siten, että siihen kuuluvat neljä edellä mainittua osa-aluetta. Eli tiivistettynä:

  1. uudet menetelmät ja tekniikat, joissa käytetään digitaalista teknologiaa
  2. digitoidut lähteet
  3. laaja-alainen yhteistyö
  4. digitalisoitumisen tutkiminen ilmiönä

Määritelmä on hyvin laaja, eikä siinä siis oleteta, että kaikki neljä kohtaa täyttyvät. Ongelmana onkin, että digihistoria kuten digitaaliset ihmistieteet ovat erittäin laaja alue. Probleemi ei ole se, että digitaaliset ihmistieteet ei tarkoita mitään vaan se, että se tarkoittaa ”too much” , kuten professori Ted Underwoodin haastattelusta voi lukea (https://lareviewofbooks.org/article/digital-humanities-interview-ted-underwood/#!). Lisäksi digihistorian opetuksen kannalta omaksi numeroiduksi kohdaksi voisi myös laittaa sosiaalisen median, sen eri alustat kuten Twitterin ja erilaiset blogit, joilla voidaan julkaista historian tutkimukseen, opetukseen ja historiatietoon liittyvistä aiheista – jos kohta yksi halutaan ymmärtää rajattuna tietojenkäsittelytieteissä kehiteltyjen menetelmien käyttönä.

Näin laaja määritelmä saattaa herättää vastarintaa, varsinkin suppeamman määritelmän kannattajissa. Suppeampikaan määritelmä ei silti ole ongelmaton, jos sitä lähestyy konkreettisesti tutkimuksen tai opetuksen näkökulmasta. Mitkä olisivat ne käytännön uudet menetelmät ja tekniikat, joissa käytetään digitaalista teknologiaa, jotka tutkijoiden ja opiskelijoiden tulisi ottaa haltuun? Kysymys on kriittinen varsinkin opetuksen näkökulmasta, sillä varsinaisessa tutkimuksenteossa on aivan eri mahdollisuudet perehtyä eri työkaluihin sekä niiden mahdolliseen adaptoimiseen sopiviksi kulloinkin kyseessä oleviin tutkimuksiin. Netistä löytyy sivustoja, joille on koottu runsain mitoin digitaalisiin ihmistieteisin sopivia työkaluja. Esimerkiksi http://webhost.bridgew.edu/edubinsky/DH/tools.html ja https://dirtdirectory.org/.

Nähdäkseni digihistoria, digitaaliset historiatieteet ja niiden opetus, olisikin hyödyllistä määritellä ainakin vielä nykyvaiheessa laajan määritelmän mukaisesti, kattaen muun muassa digitoidut aineistot (digitoidut lähteet) ja erilaiset digitaaliset alustat, sillä digitalisaatiosta ei näytä olevan ylipäätänsä vielä yksiselitteistä tai vakiintunutta määritelmää. Tulevaisuudentutkija Miikka Heinäsmäki onkin tarkoittanut digitalisaatiolla ”digitaalista uusiutumista eli digiteknologian integrointia kaikkeen organisaation toimintaan” (https://blogs.helsinki.fi/avtenhun/2015/07/30/digitalisaatio/). Helsingin yliopistossa – kuten suomalaisessa yhteiskunnassa ylipäätään – voikin katsoa olevan käynnissä prosessin, jossa digiteknologiaa integroidaan kaikkeen toimintaan, ja erityisesti juuri opetuksen digitalisointi on yhtenä kehityksen kohteena Helsingin yliopiston strategiassa kaudella 2017-2020. Strategiassa painotetaan opetuksen digitalisoimista, jonka tavoitteena on, että digitaaliset opetusmuodot ja välineet saadaan kaikkien opiskelijoiden ja opettajien ulottuville ja käyttöön.

Edellisestä johtuen voikin todeta, että vasta kun digiteknologia on niin sanotusti integroitu kaikkeen toimintaan, niin yhä selvemmin alkaa hahmottua kuva siitä, miten nimenomaan digihistoria tulisi määritellä – erotuksena yleisestä digitalisaatiosta. Juuri nyt taas nimenomaan kaivataan historiantutkijoiden ja myös opiskelijoiden vuoropuhelua siitä, mitä digihistoria tarkoittaa konkreettisesti tutkimuksessa ja opetuksessa. Historiantutkijat ja –opettajat joutuvat joka tapauksessa tekemään käytännössä päätöksiä, muokkaamaan prosesseja ja priorisoimaan opetusta ja tutkimusta tavalla, joka määrittelee ja tulee määrittelemään sitä, mitä digihistoria on nyt ja tulevaisuudessa.

FT Kati Katajisto