Tutkija, jos aiot hakea Suomen Akatemian syyskuun haussa 3.9.–25.9.2019 ja haluat aineistonhallintasuunnitelmastasi data-asiantuntijan ennakkoarvion, lähetä suunnitelmasi 15.9.2019 mennessä osoitteeseen datasupport@helsinki.fi.
Yliopiston datatuki tarkistaa ja kommentoi yliopiston tutkijoiden aineistonhallintasuunnitelmia saapumisjärjestyksessä.
Huom! Datatuki tarjoaa myös aineistonhallinnan peruskoulutusta ja aineistonhallintasuunnitelun (DMP) työpajoja elo-syyskuussa. Tarkista oman kampuksesi ajat.
Lisätietoja aineistonhallinnasta ja sen suunnittelusta:
How to manage your research data effectively? How to define and describe research data and materials? How to make them openly available and where to store them safely? How to use DMPTuuli in research data management planning? These and other basic questions will be answered in a RDM basics (Research Data Management) lecture.
RDM Basics (Meilahti)
Lectures at Terkko Health Hub (Haartmanninkatu 4), PC-classroom, 1st floor.
February 26th, 9:30-11
March 21st, 9:30-11
Tutkimusdatan hallinnan perusteet (Viikki) suomeksi
The primary language of the lecture will be English except the lecture 5.3. in Viikki.
Target group: University of Helsinki researchers, graduate students and staff.
Enrollments
Enrollments in Henkka: http://www.helsinki.fi/trainingcalendar
You find our courses in Henkka beneath the topic: Digital tools and procedures, Arranging Organisation: Helsinki University Library.
Contact: datasupport@helsinki.fi if you have any problems or questions about enrollment.
If you are new to these issues, it is recommended that you start with the RDM basics and only after that attend the DMPTuuli workshop which are organized twice a year – next time during the March and April 2019, when the Academy of Finland call will be open. See all our courses and workshops: http://libraryguides.helsinki.fi/rdm/courses-workshops
How to manage your research data effectively? How to define and describe research data and materials? How to make them openly available and where to store them safely? How to use DMPTuuli in research data management planning? These and other basic questions will be answered in a RDM basics (Research Data Management) lecture.
RDM Basics (City Centre), spring 2019 lectures in the 5th floor IT class of Kaisa house (5057)
January 15th, 14-16 pm
February 12th, 10-12 am
March 20th, 12-14 pm
April 16th, 14-16 pm
May 16th, 12-14 pm
June 19th, 10-12 am
The primary language of the lecture will be English. Target group: University of Helsinki researchers.
Enrollments in Henkka: http://www.helsinki.fi/trainingcalendar
You find our courses in Henkka when you choose topic: Digital tools and procedures, Arranging Organisation: Helsinki University Library.
Contact: datasupport@helsinki.fi if you have any problems or questions about enrollment.
If you are new to these issues, it is recommended that you start with the RDM basics and only after that attend the DMPTuuli workshop which are organized twice a year – mainly when the calls of the Academy of Finland are open. See all our courses and workshops: http://libraryguides.helsinki.fi/rdm/courses-workshops
Tutkija, jos aiot hakea Suomen Akatemian syyskuun haussa 10.9.-1.10.2018 ja haluat aineistonhallintasuunnitelmastasi ammattilaisen ennakkoarvion, lähetä suunnitelmasi 19.9.2018 mennessä osoitteeseen datasupport@helsinki.fi. Yliopiston datatuki tarkistaa ja kommentoi yliopiston tutkijoiden aineistonhallintasuunnitelmia saapumisjärjestyksessä.
Huom! Kirjasto tarjoaa myös koulutusta aineistonhallinnan suunnitteluun elo-syyskuussa, tarkista oman kampuksesi koulutusten ajat.
Lisätietoja datanhallinnasta ja aineistonhallintasuunnitelmasta:
In the workshops, we will concentrate on the best practices of research data management and hands-on training of data management planning (DMP). During the workshop, we go through the Academy of Finland’s current DMP template.
Events are open and free of charge for all UH students, researchers and staff members.
DMPTuuli workshops / Spring 2018
City Centre Campus
DMPTuuli workshops in the 5th floor IT class of Kaisa house (5057)
The primary language of the workshop will be English. Help and instructions are also available in Finnish.
NB! If this is the first time you are writing a DMP or otherwise new to these issues, it is recommended that you start with the RDM basics lecture or otherwise acquaint yourself with the basic terminology and DMPTuuli. The DMPs are drafted with DMPTuuli (https://www.dmptuuli.fi/). Please, sing up for DMPTuuli account in advance!
The workshops are organized by the University of Helsinki DataSupport. Further help in research data management is provided by the University of Helsinki DataSupport via email at datasupport@helsinki.fi or phone: 02 941 23000 (in use only during the Academy of Finland’s September call)
How to manage your research data effectively? How to define and describe research data and materials? How to make them openly available and where to store them safely? How to use DMPTuuli in research data management planning?
These and other basic questions will be answered in a RDM basics (Research Data Management) lecture. A RDM basics lecture with the same content is running throughout the year. If you are new to these issues, it is recommended that you start with the RDM basics. Once your data management plan (DMP) is already in the making, please, join us in the DMPTuuli workshop.
Events are open and free for all University of Helsinki students, researchers and staff members.
RDM basics lectures in the 5th floor IT class of Kaisa house (5057) / Spring 2018
Helsingin yliopiston Datatuki on aloittanut teemalliset datanhallinnan klinikat, joista ensimmäinen pidettiin jo ennen joulua Viikin infokeskuksessa. Klinikan teemana oli ytimekkäästi tutkimusdatan tallennusja se oli suunnattu erityisesti Viikin ja Kumpulan tieteenalojen tutkijoille.
Tapahtumassa kirjaston ja tietotekniikkaosaston asiantuntijat esittelivät datan pitkäaikaissäilytykseen ja avaamiseen soveltuvia arkistopalveluita, sekä avasivat lähemmin Helsingin yliopiston tarjoamia datan tallennus- ja säilytysratkaisuja.
Tutkijoilla oli mahdollisuus esittää sekä ennakkoon että tapahtuman aikana omia dataan liittyviä kysymyksiään. Aktiivinen osallistuminen ja keskustelu osoittivat, että datan tallennukseen liittyvät asiat kiinnostavat tällä hetkellä. Jatkossa datanhallintaan tai -tallennukseen liittyviä teemaklinikoita onkin tarkoitus järjestää myös muilla kampuksilla.
Helsingin yliopiston henkilökunta voi tutustua tapahtuman esityksiin Flammassa.
“Helsingin yliopisto tarjoaa tutkijoille ja tutkimusryhmille tutkimusdatainfrastruktuurin, joka käsittää datan hallintaa, käyttöä, löytyvyyttä ja jakamista tukevia työvälineitä, palveluita sekä tallennus-, laskenta- ja käsittelykapasiteettia. Datainfrastruktuuri rakennetaan ja sitä kehitetään yhteistyössä kansallisten ja kansainvälisten toimijoiden kanssa, ottaen huomioon myös näiden tarjoamat palvelut ja infrastruktuurit.”
Lainaus on Helsingin yliopiston tutkimusdatapolitiikasta, joka hyväksyttiin helmikuussa 2015. Vuotta myöhemmin käynnistyi Mildred-hanke, joka toteuttaa yliopiston linjausta käytännössä. Mildredissä siis rakennetaan työkaluja, joilla Helsingin yliopiston tutkijat voivat toteuttaa datanhallintaa parhaalla mahdollisella tavalla.
Mildredin ensimmäinen vaihe päättyy vuodenvaihteessa, ja on hyvä luoda silmäys siihen, mitä Mildred-hankkeen viidessä osaprojektissa on puolentoista vuoden aikana saatu aikaan. Osaprojektien laajemmat englanninkieliset katsaukset julkaistiin viime viikolla Mildred-blogissa. Tässä esittelemme tekstien lyhennelmät.
Mildred 1: Datatukea yhdeltä luukulta
Mildred 1 -osaprojektin tavoitteena on tuoda datapalvelut helposti tutkijoiden saataville Think Open -sivustolle. Tämä toteutuu kahdella tapaa: kokoamalla olemassa olevat datapalvelut tutkijoiden saataville yhden palvelukanavan kautta ja suunnittelemalla palveluiden itsepalvelutoiminnot.
Palveluidea on suunnilleen sama kuin Book Navigatorissa: useiden palveluntarjoajien palvelut kootaan yhden käyttöliittymän alle. Palveluiden yhteenkokoamiselle on suuri tarve, sillä tutkijat eivät tiedä yliopiston tarjoamista tutkimusdatapalveluista.
“Tarkoitus on koota datan tallentamiseen ja julkaisemiseen liittyviä palveluja yhteen paikkaan, jotta tutkijan olisi helpompi löytää ne”, Mildred 1 -projektipäällikkö Aija Kaitera kiteyttää.
Helsingin yliopiston eri toimijoiden tarjoamat datapalvelut on kuvattu ja luetteloitu kesän aikana, ja julkaisukanavan toteutus painottuu syksyyn. Myös tutkijoilla on ollut mahdollisuus osallistua julkaisukanavan pilotointiin. Viiden yliopisto-organisaation yhteistyönä toteutettu Datatuki toimii jo tällä hetkellä.
Tulevaisuudessa palvelukanavan kautta voi hankkia myös ulkopuolisten palveluntarjoajien, kuten Tieteen tietotekniikan keskuksen (CSC), palveluja. Jatkossa on myös mahdollista, että palvelukanavaan tulee automatisoituja itsepalvelutoimintoja (mm. maksamiseen tai levytilan hankkimiseen) ja erilaisia personointimahdollisuuksia (esim. ostoskori, suosittelut tieteenalan perusteella).
“Niin pitkälle ei tänä vuonna päästä, mutta nämä toisivat kivaa lisäarvoa tutkijoille. Käyttäjän kirjautuessa kuitenkin tiedämme, missä yksikössä he toimivat, ja olisi mahdollista saada vaikka minkälaista informaatiota”, Kaitera sanoo.
Olennainen osa Mildred-hanketta on teknisen infrastruktuurin rakentaminen datapalveluille. Tätä työtä tehdään Tietotekniikkakeskuksen johdolla osaprojekteissa 2 ja 4. Mildred 2:ssa rakennetaan tutkimusdatan tallennuspalvelu (data repository service), joka auttaa tutkijoita tutkimusdatan hallinnassa, jakamisessa ja säilyttämisessä.
Tallennuspalvelu on jaettu kahteen osaan, EUDATin työkalujen käyttöönottoon ja oman tallennuspalvelun (repository) rakentamiseen. EUDAT-työkalut on tarkoitettu tutkimusprosessin aikaiseen tallentamiseen, jakamiseen ja yhteistyöskentelyyn sekä valmiiden datasettien julkaisemiseen ja kuvailuun. Oman tallennuspalvelun tarkoituksena on tarjota työkaluja niille tutkijoille, joiden dataa ei syystä tai toisesta voi laittaa EUDAT:n kaltaiseen pilvipalveluun.
Data ja metadata kuuluvat kiinteästi yhteen eikä niitä voi varsinkaan datan hallintaan ja elinkaareen liittyvissä asioissa irrottaa toisistaan. Mildred 2 painottuu kuitenkin ennen kaikkea dataan.
“Mildred kolmosessa tulee [metadataan perustuvaa] data story tellingiä, joka on kuuminta hottia tällä hetkellä. Kakkonen tuottaa vain raaka-aineen saataville – se on enemmän vuorovaikutusta tutkijan ja tutkimusprosessin kanssa. Varmistamme, että se data, josta kertomus tehdään, on saatavilla”, Mildred 2 -projektipäällikkö Ville Tenhunen sanoo.
“Jos ruoanlaittoon vertaa, annamme keittiön ja ruoka-ainekset. Jonkun asia on sitten tehdä reseptin mukaan se herkullinen ruoka”, Mildred 2 -projektin omistaja Minna Harjuniemi sanoo.
“Tai olemme vähän kuin jääkaappi, jonne tyypit käyvät laittamassa porkkanansa. Sitten kokki tulee, ja duunaa niistä jotain. Me toimitetaan vain se jääkaappi, mutta jääkaappejakin on aika monella tavalla erilaisia”, Tenhunen sanoo.
Kun rakennetaan järjestelmää, joka mahdollistaa tutkimusdatan hallinnan, jakamisen ja säilyttämisen, pelkkä tutkimusdata ei riitä. Tarvitaan myös metadataa. Vasta metadata tekee tutkimusdatasta ymmärrettävää, löydettävää ja käyttökelpoista.
Mildredin osaprojektissa 3 on kyse juuri metadatasta. Tavoitteena on, että Helsingin yliopiston tutkijoiden julkaisema tutkimusdata olisi helposti löydettävissä ja monipuolisesti hyödynnettävissä. Osaprojektissa toteutettava datan julkaisupalvelu pyrkii tekemään dataa julkaisevan tutkijan työstä mahdollisimman sujuvaa ja houkuttelevaa.
“Jos haluat julkaista datasi, olisi olemassa paikka, jossa voit sen tehdä. Siellä olisi ohjeistus koskien datan säilytyspaikkaa, metadataa ja lisenssiasioita. Kun esivaatimukset on täytetty, seuraa työnkulku, jossa voi lisätä tekstejä ja visualisointeja. Ja datasetille tehdään oma sivu”, Mildred 3 -projektipäällikkö Pauli Assinen kuvailee.
Tällä hetkellä Mildred 3:ssa ollaan siirtymässä tutkijalle näkyvään vaiheeseen. ThinkOpen-sivulla pilotoidaan datatietojen haku- ja julkaisupalvelun käyttöliittymää (ks. Mildred-pilotit). Lopullinen versio valmistuu loppuvuodesta.
Helsingin yliopiston tutkijoiden varsinainen data voi sijaita jatkossakin eri paikoissa. Olennaista on kerätä tietoa siitä – siis metadataa – yhteen paikkaan Think Open -sivustolle. Osaprojektiin kuuluu tutkimusdataa koskevan tiedon haravointi eri lähteistä. Tämä toteutetaan ATTX-projektin työkaluilla.
“ATTX:n avulla tehdään sellainen haravointikone, jossa haravoidaan kolmesta tietolähteestä (Etsin, Zenodo, B2Share/EUDAT). Tällä luodaan pohja. Tämän jälkeen on helppo lisätä mikä tahansa muu ‘data repository’, jolla on toimiva rajapinta. Kun data on saatu haravoitua ATTX:n sisäiseen tietokantaan, voimme rikastaa sitä esimerkiksi OpenAIREn palveluja hyödyntämällä”, Pauli Assinen sanoo.
Metadata on datan käytettävyyden ydinasioita, mutta siihen liittyy myös paljon kysymyksiä. Kuka datan kuvailee (tutkija vai kirjasto)? Miten paljon kuvailua voi automatisoida?
“Tässä tasapainoillaan sen kanssa että mitä voidaan olettaa tutkijan tallentavan ja mitä repositoryn hallinnoijat tarvitsevat, jotta he voivat hoitaa hommansa. Julkaisupuolella kirjasto vastaa asiasanoituksesta, pitäisikö se tehdä myös datan puolella?” Pauli Assinen kysyy.
Mildred 4: Tallennustilaa big data -tutkijoille – ja turvaa kaikille
Jos Mildred-osaprojekti 2 liittyi ennen kaikkea datan tallentamiseen, jakamiseen ja hallinnoimiseen, osaprojekti 4 liittyy lähinnä tallennuskapasiteettiin ja varmuuskopiointiin (data storage and backup).
Mildred 4:ssä varmistetaan, että tutkijat voivat saada joustavasti lisää tallennuskapasiteettia ja säilyttää tutkimusdatan mahdollisissa ongelmatilanteissa. Kapasiteettipalveluista ja datan varmuuskopioinnista hyötyvät kaikki tallennuspalveluita käyttävät, mutta erityisesti ne tutkijat, jotka pyörittävät suuria datamassoja.
“Teemme ‘data storagea’, joka sopii big data -tyypeille. Pienemmät aineistot yritetään saada hallittua Mildred 2:n palveluilla”, Mildred 4 -projektipäällikkö Ville Tenhunen kertoo.
“Mildred 4:n ‘storage’ liittyy ehkä enemmän tutkimuksenaikaiseen työhön. Kun joku datasetti on valmis julkaistavaksi, kyse on enemmän kakkosesta ja kolmosesta. Nelonen liittyy selvemmin siihen työstämisvaiheeseen”, Mildred 4 -projektin omistaja Minna Harjuniemi sanoo.
Dataintensiivisille tutkimushankkeille tarkoitetussa storagessa pilotoidaan Cephiä ja GlusterFS:ää. Hankinnat on tarkoitus tehdä syksyllä. Datan varmuuskopiointipalvelu on jo valmis hankittavaksi.
“Varmuuskopiointiin ei mitään käyttäjäpilotointia tarvita, koska se on niin vakiintunutta peruspalvelua”, Ville Tenhunen sanoo.
Koko Mildred-projektin lähtökohtana on tutkimusprosessiin liittyvän datanhallinnan laadun parantaminen. Hyvää datanhallintaa vaatii niin Suomen Akatemia kuin EU, ja laadukas aineistonhallintasuunnitelma (data management plan, DMP) on se perusta, jonka päälle kaikki Mildred-palvelut rakentuvat. Ja toisinpäin, laadukkaat Mildred-palvelut antavat tutkijoille välineet toteuttaa aineistonhallintasuunnitelmaa käytännössä.
Mildredin osaprojekti 5 keskittyy aineistonhallinnan suunnitteluun. Aineistonhallinnan suunnitteluun tarkoitettu työkalu DMPTuuli on se palanen, joka kytkee kaikki Mildred-palvelut yhteen.
“DMPTuuli markkinoi muita Mildredin palveluita, ja DMPTuuliin tulee linkki kaikkiin näihin palveluihin”, Mildred 5 -projektipäällikkö Mari Elisa Kuusniemi eli MEK sanoo.
DMPTuuli on ollut käytössä viime vuodesta lähtien. Tällä hetkellä Mildredin osaprojekti 5:ssä laaditaan tieteenalakohtaista ohjeistusta DMPTuulin käyttöön. Ohjeistusta tehdään yhteistyössä tutkijoiden kanssa.
DMPTuulin toteuttaminen ja käyttöönotto on tapahtunut yhteistyössä Suomen Akatemian kanssa. Vuosi sitten Helsingin yliopistosta lähti Akatemialle 1000 hakemusta, joista 800 oli käyttänyt DMPTuulia. Akatemian rahoituskierros teki aineistonhallintaa tunnetuksi tutkijoiden keskuudessa. Samalla se antoi DMPTuulin ylläpitäjille informaatiota palvelun kehittämiseen (mm. toive kirjautua palveluun HY-tunnuksilla ja esimerkillisten suunnitelmien julkaiseminen).
“Itse työkalu on helppokäyttöinen, siinä ei ole suuria kehitystarpeita. Haasteena on enemmän sisältö. Aineistonhallinta on kuitenkin isolle osalle tutkijoista uusi asia. Kyse on siitä, miten aineisto hallitaan, miten se kerätään, kuvataan ja järjestetään jo tutkimuksen aikana mahdollisimman fiksusti. Ja miten se parhaiten julkaistaan, kun tutkimustuloksia saadaan. Ja miten se säilytetään. Tähän liittyy kaikenlaisia prosesseja ja sopimuksia. Asia ei siis ole helppo, mutta työkalu on”, MEK sanoo.
Aineistonhallintasuunnittelun korostumisen taustalla on tutkimuskulttuurin muutosprosessi, jossa hyvä aineistonhallinta on yhä keskeisemmässä osassa.
“On tärkeätä lisätä tutkijoiden ymmärrystä siitä, mitä aineistonhallintasuunnitelmilla tavoitellaan. Kyse on siitä, että suunnitelmaa ei tehdä vain Akatemiaa varten, vaan tutkijaa itseään varten, että hän voisi paremmin hallinnoida dataansa”, Mildred 5 -projektin omistaja Pälvi Kaiponen sanoo.
DMPTuuli soveltuu aineistosuunnitelman laadinnan ohella myös opetuskäyttöön. Tavoitteena on, että työkalua voitaisiin käyttää opetuksessa jo kanditasolta lähtien. Samalla luotaisiin pohjaa avoimen tieteen kulttuurille, jossa tutkimusaineiston hallinta on avainasioita.
“On ajateltu, että opettajat voisivat ottaa tämän helposti mukaan kurssille, vaikkapa tutkimusmenetelmäkurssille. Hyvät aineistonhallinnan taidot ovat myös tärkeitä perustyöelämätaitoja. On tiedettävä, minne kannattaa kopioida, on tiedettävä varmuuskopioinnin, versionhallinnan ja kuvailun tärkeys. Tällaisia perustaitoja tarvitaan kaikissa akateemisissa ammateissa”, MEK toteaa.