Mikä voisi olla tiedekirjaston rooli tutkimusdatan arkistoinnin edistämisessä?

Maria Forsmanin ja Veera Ristikartanon ajatuksia 35. IASSIST/IFDO -konferenssin virittämänä

Tutkimusdatan ja -aineistojen arkistointi on noussut tärkeäksi ja ajankohtaiseksi keskustelunaiheeksi viime vuosina eri puolilla maailmaa. Tiedehallintoa ja tutkimusrahoittajia tutkimusaineistot ovat alkaneet kiinnostaa julkaisujen ohella, koska tutkimuksessa käytetty data on avain tutkimuksen verifiointiin. Lisäksi monet tieteellisten lehtien julkaisijat edellyttävät, että tieteellisen artikkelin lähdeluettelossa ilmoitetaan, missä käytettyä dataa säilytetään. Näitä kysymyksiä on pohdittu eri näkökulmista ja eri tieteenaloijen tarpeista käsin myös Helsingin yliopistossa, jossa rehtori asetti vuosi sitten Tutkimusdatan ja -aineistojen saatavuutta selvittävän työryhmän.

Tutkimusdatan arkistointi ei kuitenkaan ole maailmalla mikään uusi asia. Eri tieteenaloilla on kansallisia ja kansainvälisiä data-arkistoja. Yhteiskuntatieteiden alalla ensimmäinen kvantitatiivisia aineistoja koonnut data-arkisto perustettiin jo 1946 (The Roper Public Opinion Research Center, Williams College) ja 1960-luvulla niitä perustettiin Yhdysvaltoihin, Kanadaan, Saksaan, Alankomaihin ja Britanniaan. Suomeen perustettiin Yhteiskuntatieteellinen arkisto (http://www.fsd.uta.fi/) Opetusministeriön tukemana vuonna 1999.

Kanadassa data-arkistot ovat yhtä lukuun ottamatta yliopistokirjaston osa, Yhdysvalloissa yliopistokirjastoissa on lähes puolet data-arkistoista, minkä lisäksi siellä on suuria kansallisia data-arkistoja ja -keskuksia. Muualla maailmassa data-arkistot ovat usein yliopiston yhteydessä tai arkistolaitoksen osana, mutta ei kirjastossa.

Yli 250 yhteiskuntatieteellisestä tutkimusdatasta kiinnostunutta asiantuntijaa eri puolilta maailmaa kokoontui 26.-29.5.2009 Tampereelle pohtimaan ajankohtaisia kysymyksiä Teemana oli “Mobile Data and the Life Cycle”,  ja konferenssin taustalla olivat International Association for Social Science Information Service & Technology (IASSIST) ja International Federation of Data Organisations for the Social Science (IFDO). (http://www.fsd.uta.fi/iassist2009/index.html). Konferenssin paikallisena järjestäjänä oli Yhteiskuntatieteellinen tietoarkisto (FSD). Osallistujina oli it-osaajia, kirjasto- ja tietopalveluväkeä, tutkijoita ja ennen kaikkea tutkimusdatan parissa eri maiden tietoarkistoissa työskenteleviä asiantuntijoita.

Konferenssi rakentui yleisluennoista ja rinnakkaisista eri aihetta käsittelevistä sessioista. Lisäksi esillä oli postereita ja ennen varsinaista konferenssia järjestettiin asiantuntijatapaamisia ja temaattisia workshoppeja. Aihepiirit vaihtelivat tutkimusdatan kuvailusta ja formaateista teknisiin kysymyksiin ja käyttäjätutkimuksista erityyppisten datojen käyttöön liittyviin pohdintoihin. Huoli datan asianmukaisesta tallentamisesta oli esillä, samoin se miten ja minkälaisin ehdoin tallennettua dataa voisi jatkokäyttää ja kuinka näistä mahdollisuuksista tulisi tiedeyhteisössä viestiä.

Tältä seisovalta pöydältä konferenssin osallistujalla oli mitä valita. Pyrimme omissa valinnoissamme hakemaan näkökulmia siihen, mikä yliopiston kirjaston rooli voisi olla tutkijan tiedonhallintaprosessissa ja miten kirjasto voisi tehdä tunnetuksi tutkijoille, opettajille ja opiskelijoille kaikkia niitä mahdollisuuksia, joita jo on olemassa.

Konferenssin ensimmäinen yleisesitelmä olikin jo lupaava. Otsikkona oli “Digital Challenges – Bridging the gap between publication and data”, ja esitelmän piti Adam Farquhar British Library’sta. Esitystä voi seurata myös verkosta: *http://www.fsd.uta.fi/iassist2009/presentations/videos/iassist2009_p1.html

Farquhar kertoi mm. siitä työstä, mitä British Libraryssa on tehty julkaisujen ja datan välisen kuilun kaventamiseksi, samoin eurooppalaisesta yhteistyöstä tämän tiimoilta. Yleensähän julkaisut ovat kirjastoissa ja datat tietoarkistoissa, ja niiden linkittäminen ei ole aina kovin yksinkertaista. Hän muistutti Brysselin julistuksesta, jonka mukaan tutkimusdatan tulisi olla vapaasti kaikkien tutkijoiden käytössä. Pariisissa tämän vuoden maaliskuussa kuusi eurooppalaista kirjastoa allekirjoitti muistion, jossa todetaan seuraavaa:

“Recognizing the importance of research datasets as the foundation of knowledge and sharing a common commitment to promote and establish persistent access to such datasets, we, the signed parties, hereby express our interest to work together to promote global access to research data. Our long term vision is to support researchers by providing methods for them to locate, identify, and cite research datasets with confidence.”

Allekirjoittajia ovat Technische Informationsbibliothek (TIB), Library or the ETH Zürich, L’Institut de l’Information Scientifique et Technique (INIST), Library of TU Delft, Technical Information Center of Denmark ja The British Library. Näihin pariin lauseeseen kiteytyy se, miten kirjastot voisivat tukea tiedeyhteisöä tutkimusaineistojen saralla.

Tämä teema oli esillä myös sessiossa, jonka otsikkona oli “Semi-Permeable Boundaries Among Institutions: Facilitating the Flow of Between Service Settings”. Laine Ruus (University of Toronto, Data Library Services) esitteli erilaisia ratkaisuja tutkimusaineistojen arkistoinnissa eri maissa ja erityisesti kanadalaisia käytäntöjä. Jon Stiles (UC Berkeley, UCDATA Archive) piti kaksikin esitystä, joissa hän pohti eri toimijoiden roolien muuttumista digitaalisessa maailmassa. Yhteistä tuntui olevan se, että selkeitä työnjaon periaatteita eri toimijoiden välillä ei ole.

Data Librarian tukee tiedeyhteisöä tutkimusaineistojen hallinnoissa

Kirjastonäkökulmasta yksi koko konferenssin kiinnostavimmista puheenvuoroista tuntui olevan UC Berkeleyn kirjastossa sosiaali-, talous- ja tilastotieteiden yhteysinformaatikkona toimivan  Harrison Dekkerin esitys “Data Services Cross Training for Librarians“, joka käsitteli sitä kuinka UC Berkeleyn perinteisen tietopalvelukoulutuksen saaneita kirjastonhoitajia oli kirjaston sisäisenä koulutuksena koulutettu tukemaan ympäröivää tiedeyhteisöä tutkimusaineistojen ja datasettien kuvailussa ja hallinoimisessa.

Koulutettujen kirjastonhoitajien, joista käytettiin erityistä tehtävänimikettä Data Librarian ja joista muodostui koulutuksen kautta verkosto kaikkiin yliopiston kirjastoyksiköihin, tehtäviin kuului myös yhteyksien ylläpito kansallisiin tutkimusdatan säilytys- ja hallinointiorganisaatioihin. Näin tutkimusaineistolleen sopivaa säilytysratkaisua etsivä tutkija saa monipuolista neuvontaa omasta tieteenalakirjastostaan, vaikka itse datan säilyttäminen ei lopulta olisikaan yliopiston vastuulla. UC Berkeleyn kirjastossa tutkimusdatan kuvailuun ja säilytykseen liittyvien tukipalvelujen kehittäminen nähtiin välttämättömänä uutena aluevaltauksena perinteiseksi mielletyn kirjastotyön vähetessä automaation ja digitalisoitumisen myötä.

Sama teema jatkui sessiossa ” Mobilizing Data in the Learning Environment”. Oli kiinnostava kuulla kokemuksia tutkimusaineistojen ja niiden käytön opetuksesta Venäjällä, Britanniassa ja Yhdysvalloissa. Käsitteet “quantitative literacy” ja “statistical literacy” – olisikohan suomeksi jotain sellaista kuin kvantitatiivisen aineiston ymmärtäminen ja tilastojen ymmärtäminen – tuntuivat olevan opetuksen tavoitteita.

Torstain yleisluennon “Data Archives in the 21st Century: evolving, adapting or endangered?” pitivät Deborah Mitchell (Australian Social Science Data Archive) ja Ben Evans (ANU Supercomputer Facility). He totesivat, että nyt viime vuosina erilaiset hallinnolliset organisaatiot ja tutkimuksen rahoittajat ovat ymmärtäneet sen, minkä data-asiantuntijat ovat tienneet jo kauan, että tutkimusdatalla on merkitystä ja arvoa uuden tiedon lähteenä ja että sen säilyttäminen ja käytön turvaaminen on tärkeää. He pohtivat myös sitä, miten monet luulevat, että googlaamalla saa kaiken tarvitsemansa datan. Tarvitaan parempaa tietämystä ja nykyistäkin enemmän kansainvälistä yhteistyötä siinä, että saatavilla oleva tutkimusaineisto on laadukasta, käyttökelpoista ja käytettävissä. Erilaisten formaattien ja standardien välille tarvitaan parempaa vuoropuhelua.

Perjantain yleisluennon piti Michael Batty (Centre for Advanced Spatial Analysis, University College London), ja hänen esityksensä otsikko oli “Collecting, Visualizing, Communicating, and Modeling Spatial Data in the Social Sciences”. Uusi teknologia antaa huikeat mahdollisuudet myös datan käsittelyyn ja tulosten visualisointiin.

Onnistuimme valitsemaan konferenssiohjelmasta sellaisia esityksiä, jotka vahvistivat uskoamme kirjastojen roolista myös tutkimusdatan ja erilaisten aineistojen tuntijana ja tietämyksen levittäjänä. Minkälaisiksi nämä palvelut muotoutuvat on pohtimisen arvoinen asia. Joka tapauksessa henkilöstön kouluttautumisen tarve ja organisaation osaamisen lisääminen tutkimusaineistoja koskevissa kysymyksissä on ilmeinen.

Yhteiskuntatieteiden alalla Suomessa on toiminut jo 10 vuoden ajan valtakunnallinen Yhteiskuntatieteellinen tietoarkisto, mutta usein tuntuu siltä, että sen tarjoamat mahdollisuudet eivät ole kovin hyvin Helsingin yliopiston tutkijakunnan tiedossa tiedossa.

Tutkimusaineistojen säilytyksen ja jatkokäytön tuki Helsingin yliopiston kirjastossa

Mutta mikä voisi olla tulevan Helsingin yliopiston kirjaston rooli tutkimusdataa ja -aineistoja koskevan tietämyksen levittämisessä? Näkisimme sen pitkälti UC Berkeleyn tapaan tiedon välittäjän ja opastajan roolina. Eri tieteenaloilla on luonteeltaan hyvin eri tyyppisiä aineistoja, jotka olisi hyvä arkistoida tutkimushankkeen aikana tai sen päätyttyä. Yhteiskuntatieteiden ja niiden lähitieteiden alalla tärkeää olisi olla tietoinen siitä, mitä tietoarkistossa tehdään ja mitä hyötyä siitä kaikesta on tutkijalle. Jo nyt mm. Valtiotieteellisen tiedekunnan kirjaston informaatikko on Yhteiskuntatieteellisen tietoarkiston kirjastoyhdyshenkilöverkoston jäsen ja on voinut jakaa asiantuntemustaan.

Helsingin yliopiston uudessa kirjastossa olisi hyvä olla muutama eri alojen tietoasiantuntija ja informaatikko, joiden toimenkuvaan kuuluisi myös oman alansa data-aineistojen ja niiden kuvailu- ja säilytyskäytäntöjen ja -mahdollisuuksien tunteminen. Ihanteellista olisi keskustakampuksen uuden humanistis-yhteiskuntatieteellisen kirjaston kannalta se, jos sinne voitaisiin saada sellainen tietoasiantuntijan tehtävä, johon kuuluisi ihmistieteiden tutkimusmenetelmien ja -aineistojen asiantuntemus.

Teksti:


Maria Forsman

Kirjastojohtaja
Valtiotieteellisen tiedekunnan kirjasto


Veera Ristikartano

Projektipäällikkö (Digitaaliset arkistopalvelut ja tutkimuksen tuki HY kirjastoissa)
Kirjastopalveluiden koordinointiyksikkö