Digitoidut kokoelmat digitaalisten ihmistieteiden tutkimusaineistona

Otsikko kuvaa työpajaa Informaatiotutkimuksen päivillä 2016, jota veti Digitalia-projektin  Kimmo Kettunen . Kansalliskirjaston digitaalisia aineistoja käytiin läpi hyvinkin monesta näkökulmasta – lähtien aineistojen nykytilasta ja laadusta ja siihen tehdystä tutkimuksesta, aina siihen kuinka aineistoja voisi kehittää edelleen ja hyödyntää sekä digitaalisten ihmistieteiden lähdemateriaalina. Kimmon oma esitys käsittely aineistoja kielitieteellisestä näkökulmasta ja sivukeskusteluissa huomattiinkin, että mm. sanalaskelmat joita projektin puitteissa on tehty, onkin oleellista tietoa, joka voisi auttaa vaikka olemassaolevien datasettien edustavuuden arvioinnissa. Lisäksi Digitalian naapuriprojekti Aviisi oli esillä mm. Aviisin käyttöpilottien ja erilaisten käyttäjäryhmien, kuten tutkijoiden ja opetuskäytön osalta.

TAKO-Tampere Kuvan lähde: “Tämä rakennus eristetään ja sisustetaan Takon rakennusaineilla”, 01.01.1936, s. 20 http://digi.kansalliskirjasto.fi/pienpainate/binding/345930/articles/97153?page=20 Kansalliskirjaston Digitoidut aineistot

 

Tieteen vaikuttavuuden mittarit

2. päivä informaatiotutkimuksen päivillä alkoi tieteen vaikuttavuuden mittareiden arvioinnista. Helsingin yliopiston kirjastosta Mikko Ojanen kertoi kuinka tutkijoita motivoidaan avoimen tieteen käytäntöihin altmetriikan avulla. Altmetriikka pohjautuu pitkälle automatisointiin, jossa sekä tutkijan tunnistaminen ORCID:llä ja taas artikkelien tunnistaminen jollakin pysyvällä tunnisteella on välttämätön ennakkoehto. Tosin esimerkit kertoivat, että automatiikka ei osaa vielä käsitellä kaikkia eri julkaisutilanteita.

Kiintoisa oli myös tutkimus, jossa tutkittiin kuinka arvioida saman tieteenalan sisällä julkaisemisen vaikeudesta – tähän liittyen kehitettiin vaihtokurssi, joka korjaa nykyisiä mittareita suhteuttaen julkaisut toisiinsa. Jotkin lehdet olivat tiukempia kriteereissään, minkä tulokset myös kertoivat.

Vaikuttavuuteen datasta

Päivässä puhuttiin myös raakadatasta, tutkimusdatasta ja miten sen saisi jakoon ja kuinka päivittäiset käytännöt ja työkalut tukisivat tutkijoita aineiston säilyttämisessä. Pysyvät tunnisteet nousivat jälleen pintaan, mutta kommenteissa tuli myös ilmi se, että joillakin aloilla tähän on jo perinteitä, eikä datan jakamisessa ole mitään uutta.

Esitettyjen teemojen lisäksi vaikuttavuutta voidaan myös mitata koko infrastruktuurin osalta, mitä esim. Dariah-verkostossa on tehty ja siellä onkin kehitetty laaja-alainen malli, jolla eri osa-alueita voi sekä seurata ja mitata. Alkuvaiheissa malli vois soveltua osviittana siihen, mitä osa-alueita tutkimusdatan tai -infrastruktuurin kehityksessä halutaan panostaa.

 

Lainsäädännön kiemurat ja humanistinen tutkimus

“Rajoittaako lainsäädäntö humanistista tutkimusta?” oli Tietoarkiston,   Kielipankin ja Avoin tiede ja tutkimus -hankkeen yhdessä järjestämä seminaari syyskuun puolivälissä.

Oli kiintoisaa taas kuulla mm. Kielipankin toiminnoista ja millaisilla käyttöoikeuksilla eri aineistoja saa, perusmallina oli kolmikanta

  • PUB: julkinen käyttö (avoimet lisenssit)
  • ACA: tutkimus- ja opetuskäyttö (kirjautuminen korkeakoulun tunnuksilla)
  • RES: rajoitettu käyttö (henkilökohtainen käyttöoikeus)

joiden lisäksi on vielä lisätarkenteita. Kulttuuriperintöaineistojen osalta Europeana on juuri uusinut oikeuksien merkitsemiskäytäntöjä, ja siellä lähdetään tekijänoikeudellisesta näkökulmasta, pääjakona on ns. “in copyright, no copyright ja other” luokat, joista on sitten luotu 12 eri tasoa. Saa nähdä tuleeko tarvetta myös samanlaiselle lisenssinvalitsemelle, minkä mm. Creative Commons-organisaatio on luonut jo suhteellisen tutuille lisensseilleen.

Lähde: Käsikirja sähkövalaistus- ja voimalaitoksia varten, 01.01.1922, s. 26 http://digi.kansalliskirjasto.fi/pienpainate/binding/339480/articles/1889777?page=26 Kansalliskirjaston Digitoidut aineistot

 

EU:n tietosuoja-asetus ja tieteellinen tutkimus

Anna Hänninen , Tietosuojavaltuutetun toimistosta kertoi tietosuoja-asetuksessa tulevia muutoksia ja kuinka Suomessa uusiin säännöksiin ollaan valmistautumassa.

“Luonnollisten henkilöiden suojelu on henkilötietojen käsittelyn yhteydessä perusoikeus”.

Tähän liittyen rekisterinpitäjille tuleekin tietosuojan osoittamisvelvollisuus siitä, että niissä toimitaan määrättyjen ehtojen suhteen. Kuten professori Voutilainen kertoikin jo Digitalian kesäkoulussa, näytetyssä kalvossa henkilötietolaista ja tietosuoja-asetuksessa näyttää olevan monta toisiinsa vaikuttavaa artiklaa ja nykyistä lakia, joiden pohtimisessa ministeriöiden yhteinen työryhmä on alkanut puurtamaan. Positiivista oli, että pyritään myös aktiivisesti välttämään vähäriskisiä toimien ylisääntelyä, jolloin “varmuuden varalta” ei tarvitse tehdä suojatoimenpiteissä mahdollisesti kalliitakin muutostöitä. Osoitusvelvollisuus kuitenkin toimii jo omanlaisenaan ohjaamiskeinona tai itsetarkistuskeinona, joka toivottavasti auttaa.

Tutkimuskannalta jo tässä esityksessä mutta myös myöhemmissä nostettiin esille tutkijan vastuuta aineistojen käsittelyssä. Suostumus, anonymisointi ja pseudonymisointi on keinoja käsitellä aineistoja tutkimuskäyttöön, mutta kuten Aviisi projektin kansalaisopiston kurssilla kuulimme, joskus käyttötarkoitus onkin taiteellinen, jolloin käyttölupia on pohdittava toisin. Tietosuoja-asetuksen 89 artiklassa, kuten rekisterinpitäjän tapauksessa, edellytetään oiekasuhtaista käsittelyä. Kuten päivän aikana kommentoitiinkin, kyse on myös huolellisuudesta – data-aineiston sisältö tulsi ymmärtää ja käsitellä sitä koko tutkimusprosessin ajan sen vaatimalla tavalla.

Marjut Salokannel, joka teki myös analyysiä tietosuoja-asetuksesta Kansalliskirjaston Aviisi-projektiin, kertoi sosiaalisen median aineistojen käytöstä tutkimuksesta. Esimerkiksi kiintoisat ovat erilaisten some-palvelujen käyttöehdot – yhdysvaltalaisen käytännön mukaan tutkimuskäyttö voi onnistua, muta välttämättä ei suomalaisen.

Tekijänoikeuslaissa ei ole tutkimusta oikeuttavaa poikkeussäännöstöä => tutkimuskäyttöön edellytetään oikeudenhaltijan lupaa

 

Niinpä esim. Suomi24-aineiston osalta Kielipankki on luonut sopimuksen Aller Median kanssa aineistojen tutkimuskäytöstä ja tämän vuoksi aineistoja pääseekin katsomaan pyytämällä luvan. Marjut ja myöhemmätkin puhujat nostivat esille tutkimussuunnitelman eettisen arvioinnin, sekä juridiselta kannalta että muutoin. Tutkimussuunnitelmat ja datan käyttö- ja arkistointisuunnitelmat alkavat olla kuitenkin vaadittuja  tutkimusten rahoittajilta, joten sekin motivoi siinä, että aineistojen käyttöä  pohditaan jo etukäteen, jolloin tarvittavat toimet voidaan hoitaa ennakoiden. Tietoarkiston blogissa käsiteltiin myös some-aineistojen tutkimuskäyttöä.

Tapauskohtaista, tapauskohtaista…

 

Päivän aikana tuli kuitenkin ilmi se, että eri tilanteet vaikuttavat saatavilla olevien ratkaisujen määrään. Riippuen siitä missä roolissa tutkija toimii, kuka on rekisterinpitäjä ja mistä aineistosta on kyse, on erilaisia käyttömahdollisuuksia. Esimerkiksi Kansalliskirjastosta kommentoitiin, että esim. viimekertaisten eduskuntavaalien aineistoa on haravoitu verkosta eri palveluista ja käytettävissä se on vapaakappalekirjastojen työasemilla — aktiivisesti kuitenkin pohditaan kuinka se saataisiin vielä paremmin tutkijoiden käytettäväksi. Yksi tutkijoista sanoikin, että aineistoja kyllä kaivattaisiin, sillä tällä hetkellä toimitaan esimerkiksi suoraan some-palveluiden rajapintojen kautta, joita käyttöön jokainen tutkimusryhmän tarvitsee pohtia omat ratkaisumallinsa ja ylipätään voiko ja miten aineistoja käyttää.

 

Tallenna

Tallenna

Digitaalinen historiantutkimus, digitaalinen

Koneen säätiön rahoittamassa “Towards a Roadmap for Digital History in Finland: Mapping the Past, Present & Future, 2016.”-projektissa tehtiin kesällä kyselytutkimus historiantutkijoille digitaalisuudesta historiantutkimuksessa. Raportin tiivistelmä löytyy digihistfinland’in blogista ja koko raportti löytyy myös edellisestä linkistä.

Maanantaina, torstaina ja lauwantaina Kuopiossa

Lähde: Tapio, 07.11.1877, nro 87, s. 4 http://digi.kansalliskirjasto.fi/sanomalehti/binding/441272/articles/1882704?page=4 Kansalliskirjaston Digitoidut aineistot

Digitaalisia tutkimusaineistoja

Yksi raportissa nostetuista asioista oli tutkimusdatan sijaintipaikka, tehtyjä tai muokattuja aineistoja on palautettu takaisin oikeuden omistajille, mutta tietoisuus näistä (mitä ja missä) voisi vaatia hieman työtä. Tietoaineiston tallentaminen alkuperäiseen paikkaansa onkin hyvä asia, sillä tällöin ns. “lähdeorganisaatio” voi hyödyntää dataa itsekin ja auttaa myöhempääkin tutkimusta antaen joka alkuperäisen aineiston tai muokatun aineiston seuraaville tutkijaryhmille — lähtien tutkimuksen toivomuksista, halutaanko toisintaa aiempaa eri tulokulmalla vai jatkaa edellisen tuloksista eteenpäin.

Vastaajiin näytti sattuneen myös (ainakin) yksi digitaalisia ja digitoituja sanomalehtiä käyttänyt joka oli vastannut

— mahdolisuus on n. 1910 vuoteen saakka, mutta toivoisin sen muuttuvan niin, että vapaasti käytössä olisi digitoidut lehdet jotka ovat vähintäin 50 vuotta vanhoja.

Viime aikoina nykyään voimassa olevasta rajavuodesta onkin tullut paljon palautetta, mutta lisääkin voi toki laittaa http://digi.kansalliskirjasto.fi -palvelun palautteisiin, niin laitamme Digitalia-projektissakin asiaa seteenpäin ainakin ko. palvelun osalta. Vapaakappalekirjastoissa voi kuitenkin jo nyt käydä lukemassa sekä digitoituja ja haravoituja aineistoja, joita löytyy  aineistolajista toiseen.

Lisäksi monipuolinen saatavuus nostettiin esille, yksittäiset koneet joissa tutkimusaineisto löytyy voi tuntua liian rajatulta, mutta tämän pulman toivottavasti aika korjaa, jos voitaisiin järjestää vaikka tunnistautumisen ja sopimusten kautta oikeuksia tutkijoille jopa tekijänoikeuksien alaiseen aineistoon. Tehokas tutkimuskäyttö Suomessa tai maailmalla kehitetyillä työkaluilla ja menetelmillä voi kuitenkin vaatia että aineistoja on käsiteltävä useammallakin koneella, aineistojahan kuitenkin käsittelisi vain työkalu, skripti tai algoritmi ja vain osin ihmissilmä. Luulisi kuitenkin, että oikeudenomistajia, alkuperäisiä tekijöitäkin kiinnostaisi mitä tutkijat saisivat aineistoista irti, osana suurempaa aineistokokonaisuutta tai tutkimuskysymystä.

Kiintoisa kysymys on, että mihin aineistoon viitataan riippumatta siitä onko tutkimuksessa käytetty elektronista vai analogista aineistoa?  Petri Paju  (2016, 5) oli raportissaan viitannut yhdessä alaviitteessä HAIK:n kätevästi kahdella tavalla : “Rasila, Viljo: ”Tietokone historiantutkimuksessa”. Historiallinen aikakauskirja 65, 2/1967, 140–146, tai Kansalliskirjaston Digitoidut aineistot: http://digi.kansalliskirjasto.fi/aikakausi/binding/499240?page=20  “. Riippuen tilanteesta ja mitkä käyttöoikeudet on kenelläkin voimassa, eri lukijoille eri muodot voivat olla saatavampia helpommin. Esim. Historiallinen aikakauskirja eli HAIK on avattu Peri+-sopimuksen nojalla useimpiin yliopistoihin, digi.kansalliskirjasto.fi – palvelun kautta, mutta toisaalta muualla ko. linkki vie vain virheeseen eikä teksti avaudu.

Viestintää ja verkostoja

Historiantutkijat halusivat yhteyksiä tietojenkäsittelijöihin ja olettaisin, että toive on myös toisinpäin, ymmärrystä tarviaan molemmin puolin, mutta kiinnostavat pulmat innostaa tutkimuksessa mainittuja “digi-ihmisiä”, joten ongelmia kannattaisi laittaa koukkuun , jolloin tietojenkäsittelijät voisivat niihin tarttuakin. Esimerkiksi paikallisen Hacklabin kanssa voi luoda yhteistyötä tai vaikka OKF:n, jolloin voisi toivoa, että joku tietää jonkun, joka voi auttaa pulmassa alkuun.  Lisäksi nykyään jos ohjelmakoodi on avattu esimerkiksi Githubissa, niin sopivasti lähestymällä olisi mahdollista tutustua ja luoda yhteistyötä tietyn työkalun tekijöiden kanssa.

 

Digitalian kuuma kesäkoulu

Digitaalisen tiedonhallinnan tutkimus- ja kehityskeskus Digitalia järjesti 22.8-24.8. kesäkoulun noin 50:lle hengelle, joista noin 30 suoritti koko kurssin ja muut osallistuivat luennoille. Kurssi järjestettiin Kansalliskirjaston auditoriossa, Helsingissä, jossa loppukesän aurinkoisina päivinä oli kuuma tunnelma.

Luennot

Luennoijat olivat monipuolinen kattaus professoreita ja kokeneita tutkijoita, jotka toimivat digitaalisuuden eri puolien parissa. 1. päivänä teema oli Digitaalisuus ja etiikka. Itä-Suomen yliopistosta (UEF) paikalla oli professori Tomi Voutilainen ja HTK Denis Galkin, joiden molempien esitykset pohtivat tietosuoja- ja tekijänoikeuskulmilta erilaisten aineistojen käyttöä. Professori Voutilainen kertoi kertoi suomalaisen oikeusrakenteen taustoista, joka on johtunut siihen, että lait viittaavat toisiinsa ja sieltä löytyy myös paljon toistuvia fraaseja, joilla “halutaan varmistaa, että varmasti on asiasta säädetty”. Saa nähdä nostaako EU:n tietosuoja-asetus, jonka vaikutuksia kulttuuriperintöaineistoille on pohdittu myös Kansalliskirjaston Aviisi-projektissa, keskustelua laajemminkin.

https://twitter.com/TuulaP/status/767611890969247744

Varmaankaan toistuvat säädökset ja entisaikojen hallintorakenteiden aiheuttamat lakikiemurat eivät aivan suoraan olisi näkyvissä Aalto-yliopiston Seco-tutkimusryhmän 2016 avaamasta semanttisesta Finlexistä , mutta kiinnostavaa olisi voisiko 2. päivänä puhutusta toistuvien uutisten/tekstikappaleiden tapahtuvasta uutisvirtojen seuraamisesta, menetelmiä, joita voisi käyttää muuallakin.

UEF:lla oli myös juuri tehty kyselyä asiantuntijoille suhteessa lainsäädännön nykytilaan, jota koettiin ainakin osittain sekavaksi ja uutta tiedonhallintakaarta pidettiin mahdollisuutena selkeyttää tilannetta.

Eräs digitaalisen tiedonhallinnan ongelmista nostetuista käytännön esimerkki oli että esimerkiksi verotiedot saa sähköpostilla, mutta ei ns. “teknisen väylän” kautta, jossa jopa määrittely vielä puuttuu.  Oikeus 2/2016 -lehdestä löytyy aiheesta artikkeli. Digitalisaatio on kuitenkin yksi hallituksen kärkihankkeista http://vm.fi/digitalisaatio, tai esimerkiksi http://digisuomi.fi -avaukset joten toivoisi, että sekä uuden EU:n tietosuojadirektiivin että em. tutkimuksen asiantuntijoiden vastauksissa toivottu tiedonhallintakaari olisi mahdollisuus saada tätä puolta eteenpäin.

Denis Galkin käsitteli henkilön omien tietoaineistojen käyttöä, joka on nykyään mydata ja erinäisten kauppojen keräämien tietojen takia monella tuoreessa muistissa. Käytiin läpi tiedollinen itsemääräämisoikeus, mitä kaikkea henkilötiedolla tarkoitetaan, rekisterinpitäjän velvollisuudet ja pohdittiin myös erityisesti sähköpostiaineistoja.

Vaikka joku olisi salassapidettävän aineiston julkaissutkin, niin se ei oikeuta levittämään sitä eteenpäin. Tutkijoilla voisi joskus olla mahdollisuuksia käyttää joitakin aineistoja historialliseen tai tilastolliseen käyttöön ja kuten päivän keskusteluissa pohdittiinkin aina on mietittävä eettiset kysymykset myös, koska aineisto(i)ssa voi olla henkilötietoja, jne. Kuitenkin esimerkiksi toimittajilla voi olla laajemmat oikeudet joissakin tapauksissa johtuen heidän roolistaan tiedon jakajina – ehkäpä siksi tuoreiden tapausten uutisointi tapahtuukin mediatalojen toimesta. Toisaalta, joskus taas aineistoja voi hyödyntää yksityiseen käyttöön, mutta ei taas muutoin. Kuitenkin luulisi olevan mahdollista luoda yleiskäyttöisä menetelmiä sähköpostiaineistojen käsittelyyn, mitä Digitaliassa MAMK:lla  tutkitaan – kuinka sähköpostiaineistoja selataan, käsitellään ja säilytetään.

Tampereen yliopistosta Tuija Kautto nosti tärkeän näkökulman eettisyydestä asiakirjahallinnassa:

Tuija kertoi että eettisiä säännöstöjä on useita, mutta organisaation tulisi pohtia omat käyttötarkoituksensa ja tarkentaa ja prosessoida, kun eettisen säännöstön haluaa ottaa käyttöön. Kuten myös aiemmin mainituissa tietovuototapauksissa, “jokaisen ammattilaisen tulisi pohtia omaa eettistä moraalipohjaansa”. http://digitalethics.org/

Avoin tiede ja tutkimus-hankkeessa on kerätty mm. datapolitiikkoja eri organisaatioilta, joissa saatetaan käydä läpi myös eettisiä kysymyksiä.  MAMK:n tutkimusjohtaja Noora Talsi pohti eettisyyttä taas tutkimusaineistojen puolelta, hyvä tieteellinen käytäntö ohjaa, sidonnaisuudet tulisi mainita, ja tutkija on itse vastuussa myös tutkimusprosessinsa eettisyydestä.

Kulttuuriperintöaineistot ja digitaalinen tiedonhallinta

Toinen päivä lähti vauhdikkaasti liikkeelle digitaalisen humanismin keinoin. Perusteista alkaen professori Mikko Tolonen esitti eri tapoja määritellä digitaalisen humanismin, perinteisestä, Suomen Akatemian käyttämiin, edeten työpaikkailmoituksiin, joita sekä HY:ltä , että Aallolta on ilmestynyt.

Paneelissa pohdittiin mm. että jossakin kohtaa pitää luopua “uuden teknologian käytöstä” DH:n määritelmässä tai kun aika kehittyy lisää, ehkä myös digitaalisuus sanasta tippuu sanasta, kunhan kulttuurimuutos etenee vuosien myötä. Digitalian tutkimuskoordinaattori Kimmo Kettunen muisteli tutkimusdatan käsittelyn vaihtoa aiemmin data pidettiin itsellä, nykyään pyritään avaamaan:

https://twitter.com/TuulaP/status/767972463028400128

Paneeli pohti myös, että nykyään haaste voi olla, että data on jollakin hallussa, mutta tutkijoiden käyttötarve olisi saada se aineistopakettina itselleen, jotta aineistoa voidaan pyöritellä omassa ympäristössä. Kehitettävät menetelmät kuitenkin voivat luoda yhteistä hyvää sekä alkuperäiselle organisaatiolle, kuten myös koko tutkijayhteisölle.

Digihistorian historiasta Suomessa kertoi professori Hannu Salmi, käyden läpi mm. Historiallisesta aikakauskirjasta löytyneitä artikkeleita aiheen kehityksestä kautta vuosien. Aiemmin oli mm. kuvattu tekstin editointiprosessin eroja tietokoneella tai käsin kirjoittaen, mitä ei ehkä nykypäivänä tule eri tekstinkäsittelyohjelmia käyttäessä edes pohtittuakaan. Jaakko Suominen muisteli,  että ennen digitointia, aineistoja käytiin läpi käsin – ilman kokotekstihakua tai edes listauksia lehdistä löytyvistä artikkeleista.

Kansalliskirjaston Digitalian osaprojektissa kohdeaineistona ovat digitoidut sanomalehdet, jotka ovat jo aiemmin paljon käytettyä aineistoa, mutta uudet menetelmät antavat vielä lisää mahdollisuuksia. Tutkijakoordinaattori Kimmo Kettunen kertoi digitoinnin jälkikäsittelyn haasteista, koska monet asiat tekevät tekstintunnistuksesta (OCR – Optical Character Recognition) vaikeaa, joka luo esteitä aineistojen löydettävyydelle ja käytettävyydelle. Kimmo puhuikin siitä, kuinka eri käyttötarkoituksiin on erilaisia tapoja käyttää, esimerkiksi digin peruskäyttöliittymänä, raakadata (josta on ensimmäinen kokeilupaketti saatu Comhis-projektin käyttöön) ja Kielipankin Korp-palvelu, jonka kautta pääsee aineistoja analysoimaan. Jälkikeskusteluissa kuulosti, että myös digitointia voitaisiin pohtia laajemmin yhdessä – miten aineisto valitaan digitointiin ja kuinka hallita tekniset pulmat tekstintunnistus, aina kasvava levytilan tarve, pitkäaikaissäilytys jne.

Digitaalisen tiedonhallinan kesäkoulu 23.8.2016

Digitaalisen tiedonhallinan kesäkoulu 23.8.2016

Professori Mikko Tolonen, puhui digitaalisten aineistojen käytöstä tutkimuksesta, korostaen, että oleellista on lähteä tutkimuskysymyksestä, joka luo pohjan käytetyille menetelmille ja työkaluvalinnoille. Mm. vuoden 2016 DHH16-hackathonissa yksi ryhmistä lähtikin analysoimaan siirtolaisuuden viestintää sanomalehdissä suhteessa siihen mitä reaalimaailmassa tapahtui. Comhis-projektista Hannu Salmi kertoi puolestaan tekstien uudelleenkäytön tunnistamisesta. Pyritään löytää keinoja löytää mm. klustereita toistuvista teksteistä , kuitenkin siten, että mahdollisesti eri paikoissa olevat OCR-virheet eivät tätä prosessia huonontaisi. Joitakin näitä esimerkkejä siirtyneistä artikkeleista löytyy aina sattumalta aineistoja selatessa, mutta hauskaa olisi jos voisimme tehdä linkkauksia muihinkin digitaalisiin aineistoihin.

Pearson's Magazine vs. NykyaikaPäivässä pohdittiin myös sähköisenä syntyneitä aineistoja, lähtien Suomi24-aineistosta, jonka professori Jaakko Suominen mainitsi olevan tunnetuin keskustelupalstana, mutta ensimmäisinä vuosinaan se toimi yleisportaalina. Aineisto on laaja: 53 miljoonaa kommenttia 6,8 miljoonassa eri ketjussa aina vuodesta 2001 lähtien. Aineistosta lisää löytyy “Suomi24 – muodonantoa aineistolle” raportista joka tehtiin Citizen Mindscapes-projektissa keväällä.

 

Summa summarum

On digitaalisia aineistoja, on laajoja digitaalisia aineistoja, on laajoja aineistoja jotka vaativat paljon esikäsittelyä, on sähköisesti syntynyttä aineistoa, on ns. analogisia aineistoja, joita ei koskaan digitoida, on digitaalisia aineistoja joihin ei ole käyttölupaa (tekijänoikeudet, tietosuoja, maksumuuri …) tai vain rajoitetusti, on dataa joka on kadoksissa tai väärässä muodossa, jolla on puutteellinen metadata tai aineistoa , jonka käsittelyyn ei ole keinoja tai prosesseja. Tällaista listaa pystyisi luonnostelemaan, kun pohti eri puolella toimivien ihmisten tutkimusaihioita. Eikä tässä vielä kaikki, tutkimusaineiston hallinta koko sen elinkaaren ajan, tiedonhallinta, prosessien kuvaaminen,  tietojärjestelmäprojektit (mistä niitä järjestelmiä oikein tuleekaan…), asiakaslähtöisyys ja aineistojen saatavuus tutkijoille mainittiin myös. Hyvää oli se, että kehityskohteita oli löydetty ja innostusta oli lähteä niitä selvittelemään – työtä kyllä digitaalisen tiedonhallinan tutkimukselle ja kehitykselle tuntuu kyllä riittävän jatkossakin.

Digital data, source http://xkcd.com/1683/

“digital data” – lähde: http://xkcd.com/1683/

Joitakin linkkejä päivien lomasta:

 

Lisää kokemuksia päivistä löytyy jo “Sukututkijan loppuvuosi”-blogista:  http://sukututkijanloppuvuosi.blogspot.fi/2016/08/digitaalisen-tiedon-kesakoulussa-mati.html  ja  http://sukututkijanloppuvuosi.blogspot.fi/2016/08/arkistoasiaa-ja-kirjallisuushistoriaa.html ja lisäksi twitteristä aihetunnisteella #Digitaliafi , voi selata päivien twiittejä ja mitä Digitaliassa tapahtuu jatkossa.

 

Tallenna

Tallenna

Tallenna

Tallenna

Tallenna

Tallenna

Tallenna

Tallenna

Engelin helmi


Kuvan alkuperäislähde rakennusselvitys 2011

Eteläsali Pohjoissali sali4

Avajaisista

 

Ohjeet esteettömään kulkuun ja video

Peruskorjauksesta

 

 Perustietoa

  • Kansalliskirjaston päärakennus on valmistunut vuonna 1840.
  • Arkkitehti on Carl Ludvig Engel  jonka töitä myös mm. Valtioneuvoston linna ja Tuomiokirkko.
  • Suurissa saleissa on yli 600 m kirjahyllykköjä (Rungot kunnosti Vanalinna ehitus OÜ , ja hyllylevyt (1700 kpl) Wooden Oy [4]

 

Eteläsali
* Severin Falkman on maalannut saleihin eri tieteiden allegoriset kuvat.[3]
* 20 tutkijapaikkaa
* Lukusali

Pohjoissali

* Magnus Enckellin maalaus Kulta-aika (1904)
* Lukusali


Kupolisali

* Kattomaalauksissa arkkitehti Frans Sjöströmin suunnittelemat hyveitä edustavat linnut [3]
* Paikoin on näkyvissä esiinotettua värikerrosta 1880-luvulta

Takaisin ylös

 

Suomen rakennustaide meidän päivinämme (Valvoja, 01.01.1903, nr. 1, s. 23-26)
Engelin muistelun 50-vuotisjuhla / Päivälehti, 14.05.1890, nro 110, s. 1

Takaisin perustietoihin

Lisätietoja/lähteitä

[1] Kansalliskirjaston rakennusselvitys 2011 https://www.kansalliskirjasto.fi/extra/Rakennushistoriaselvitys_220911.pdf

[2] Kansalliskirjaston aikajana / Arkkitehtuuri https://www.kansalliskirjasto.fi/extra/aikajana/tl_win1845ark.html

[3] “On muitakin sanoja”-Taidetta Kansalliskirjastossa https://blogs.helsinki.fi/verkkari-lehti/on-muitakin-sanoja-taidetta-kansalliskirjastossa

[4] Kansalliskirjasto-lehti 1/2016, https://issuu.com/kansalliskirjasto/docs/kansalliskirjasto_lehti_1_2016

Takaisin ylös

Tallenna