Avoin data ja historia

 

Torstaina 5.4. järjestettiin Laiturilla Helsinki Loves Developers -tapaaminen. Kehittäjätapaamisessa esiteltiin vanhoja aineistoja ja aikasarjoja. Ohessa lyhyt kurkistus tapaamisen aiheisiin – ja ajatuksiin joita tilaisuus herätti historioitsijan näkökulmasta.

Tilaisuuden avasi Taina Lahti, Helsingin kaupunki/Helsinki Region Infoshare. Pääosa Helsinki Region Infosharen (www.hri.fi) sivuilla avatusta tiedosta on ajankohtaista tietoa pääkaupunkiseudun kaupunkien (Helsingin, Espoon, Vantaan ja Kauniaisten) taloudesta, väestöstä, päätöksenteosta ja liikenteestä. Uudemman tiedon lisäksi kaupunkien hallussa on runsaasti myös vanhempaa historiallista materiaalia, arkistoaineistoa ja pitkiä tilastoaikasarjoja. Myös näitä historiallisia data-aineistoja on avattu HRI:n kautta. HRI:n sivuilta löytyy tiivistelmä aineistoista, jotka ovat käytettävissä. Kyseiset aineistot ovat vapaasti kaikkien käytettävissä, kunhan vain muistaa mainita alkuperäisen lähteen.

Marjo Kaasila esitteli tilaisuudessa tilastotietoa Helsingin seudusta pitkinä aikasarjoina. Helsingin seudun aluesarjat löytyvät osoitteesta www.aluesarjat.fi. Vuosittain pidettäviä aikasarjoja ovat muun muassa asunto- ja rakennustuotanto 1960-luvulta lähtien ja työmarkkinatilastot 1970-luvulta. Tilastokantaan kuuluvat Helsingin historialliset tilastot perustuvat Helsingin tilastollisiin vuosikirjoihin ja Helsinki tilastoina 1800-luvulta nykypäivään –julkaisun tietoihin. Juuri nämä historialliset tilastot ovat käytettävissä myös HRI:n kautta. Historialliset tilastot sivulta löytyy myös linkki oppaaseen Helsingin historiaa numeroina kolmelta vuosisadalta, Opas Helsingin seudun aluesarjat tilastotietokannan pitkien aikasarjojen käyttöön.

Panu Haavisto kertoi tilaisuudessa Helsingin kaupunginarkiston SINETTI-arkistotietojärjestelmästä (https://yksa3.darchive.fi/YKSA3/public/archive/HELKA/index.jsp). Kaupunginarkiston aineistosta on digitoitu noin 150 hyllymetriä eli käytännössä vasta pisara meressä. SINETIN Haku –sivulta löytyy esimerkkejä digitoidusta aineistosta. Viite- ja kuvailutiedot löytyvät SINETISTÄ kotelon tarkkuudella. SINETISTÄ on tulossa myös pian uusi versio, jolla on avoin rajapinta Finnaan. Haasteita digitoitujen aineistojen suhteen tulee aiheuttamaan EU:n uusi tietosuoja-asetus, sillä esimerkiksi jo digitoiduissa kaupungin kunnalliskertomuksissa on henkilötietoja.

Historiantutkija Samu Nyström puolestaan piti puheenvuoron avoimesta datasta tutkijan, käyttäjän, näkökulmasta. Nyström nosti esiin, että tiedon löytämisessä on tapahtunut merkittävä muutos, eikä tutkijan tarvitse enää olla paikan päällä arkistossa tai kirjastossa. Tieto on myös helpommin tarkistettavissa kuin aikaisemmin, ja myös eri alojen ihmiset pääsevät helpommin tietojen äärelle. Lisäksi avoin data mahdollistaa entistä isommat ja laajemmat tutkimusteemat. Riskinä Nyström piti sitä, että tutkimus kapenee eli tutkitaan sitä, mitä on digitoitu.

Elena Iso-Pietilä esitteli koulurekisteriä (www.koulurekisteri.hel.fi), joka sisältää kattavat koulujen historia- ja nykytiedot, yhteensä 1550 koulua. Koulujen tiedot ovat myös georeferoitu. Koulurekisterissä on tiedot muun muassa koulujen nimistä ja rehtoreista, mutta ei tietoja oppilaista tai opettajista. Koulurekisterin tiedot saa myös HRI:n kautta.

Tuomas Myren esitteli Helsingin kaupunginmuseon aineistoja. Kaupunginmuseon hallussa on noin miljoona valokuvaa, joista 70 000 on digitoitu. Esineitä taas on 450 000, ja niistä taas noin 70 000 on digitoitu. Esineiden yhteyteen on kirjattu myös metatiedot. Kaupunginmuseon digitoidut aineistot löytyvät sivulta www.hkm.finna.fi. Kaupunginmuseon toiminnassa aineistojen digitoiminen on tarkoittanut ns. paradigman muutosta, suljetusta ja rajoitetusta on siirrytty avoimeen ja vapaasti käytettävään ns. avoimen datan paradigmaan. Avoimuus ja aineistojen vapaa käyttö ovatkin lisänneet hurjasti kaupunginmuseon näkyvyyttä.

Lisäksi Juuso Lehtinen esitteli koodaamaansa www.helsinkiennen.fi –sivustoa ja Tove Örsted puolestaan Open GLAM –verkoston toimintaa. Helsinki ennen -sivustolta voi valita kartan Helsingistä eri vuosikymmeneltä, ja kartalta löytyy paikkasijoitettuja valokuvia. Örsted taas kertoi GLAM-verkoston toiminnasta, johon kuuluvat esimerkiksi seminaarien ja hackhatonien järjestäminen. Örsted totesi muun muassa, että kaikki 50 vuotta vanhemmat kuvat tulisi olla public domain (PD) alaisia. Yhteisen kulttuuriperinnön pitäisi olla maksutonta.

Edellisten ohella allekirjoittanut, Kati Katajisto, esitteli Helsingin kaupungin historiatoimikunnan toimintaa (https://www.hel.fi/kanslia/fi/paatoksenteko/historiatoimikunta) sekä kommentoi, miltä avoimet data-aineistot näyttävät historian opetuksen ja tutkimuksen näkökulmasta. Helsingin historiatoimikunta on julkaissut perinteisesti laadukkaita tutkimuksia kaupungin historiasta, mutta on myös kiinnostunut etsimään uusia tapoja hyödyntää kaupungin rikasta historiaa. Eräs tällainen mahdollisuus voisi olla portaali, vastaavan kaltainen kuin Tukholman kaupungin ylläpitämä Stockholmskällan (https://stockholmskallan.stockholm.se/). Historian opetuksen ja tutkimuksen kannalta taas avoin data tarjoaa hienoja uusia mahdollisuuksia. Ohessa muutama pointti, joka nousi tilaisuuden keskusteluista mieleen historian opetuksen ja tutkimuksen näkökulmasta:

  1. Paljon uusia mahdollisuuksia lähteiden käytettävyyden ja löytämisen osalta.
  2. Haasteena se, miten avoin data otetaan haltuun kokonaisuudessaan eli se, mistä data löytyy ja miten dataa haetaan. Miten pysyä ajan tasalla, mitkä kaikki historialliset aineistot, joita digitoidaan koko ajan lisää, ovat saatavilla.
  3. Paljon potentiaalisia yhteistyömahdollisuuksia, sillä arkistot ja muistiorganisaatiot näyttävät olevan kiinnostuneita kuulemaan, mitä aineistoja tulisi digitoida. Samoin heitä kiinnostaa kuulla tutkimuksen ja opetuksen näkökulmasta se, mitä kaikkea jo digitoiduilla aineistoilla voisi tehdä. Digiopetusta voisikin räätälöidä yhdessä avointa dataa tarjoavien organisaatioiden kanssa, sillä näillä on parhaat tiedot saatavissa olevasta datasta ja miten se on käytettävissä, ja tutkijat, opettajat ja opiskelijat taas voisivat tuoda oman näkemyksensä ja kokemuksensa siihen, miten dataa käytetään parhaiten hyödyksi tutkimuksessa ja opetuksessa.
  4. Tutkijat ja opiskelijat tulevat tarvitsemaan uudenlaisia digivalmiuksia, ja osin myös yhteistyökumppanuuksia tietojenkäsittelytieteiden suuntaan. Ylipäätään eri alojen yhteistyötä tarvitaan lisää yliopiston/yliopistojen sisällä sekä kontakteja ympäröivään yhteiskuntaan.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *