Datatuki juhlii – kymmenen kysymystä kymmenvuotiaalle tienraivaajalle

Helsingin yliopiston Datatuen juuret johtavat kymmenen vuoden päähän, kun Viikin kampuskirjastossa käynnisteltiin tutkijoiden ja kirjaston asiantuntijoiden yhteistä Solmu-hanketta. Tutkimusdatalla ja datanhallinnalla oli hankkeessa keskeinen rooli, ja näkemys datapalveluiden tarpeellisuudesta vahvistui. Kohta kuvaan tulivat myös muut yliopistopalvelut, erityisesti tietotekniikkakeskus, ja nykymuotoinen Datatuki-verkosto alkoi syntyä. Tässä blogiartikkelissa Datatuen historiaan eri tavoin osallistuneet henkilöt kertovat näkemyksiään datatukipalveluiden vaiheista. Lopuksi luodaan silmäys myös tulevaisuuteen, Datatukeen vuonna 2029 ja valitaan Datatuen tunnusbiisi.

Helsingin yliopiston Datatuki täyttää tänä vuonna kymmenen vuotta, ja kymmenvuotissynttäreitä vietetään ensi maanantaina 21.10.2019 Tiedekulmassa osana Avoimen tieteen iltapäivää.

Nykymuotoisten datatukipalveluiden perustuksia alettiin kaivaa jo vuonna 2008, kun rehtorin asettama tutkimusdatan ja -aineistojen saatavuutta selvittävä työryhmä aloitti puolentoista vuoden mittaisen työnsä oikeudellisten asioiden asiantuntijan Marjut Salokanteleen johdolla.

Varsinainen Datatuen muotoutuminen alkoi Viikin kampuskirjaston kolmivuotisesta Solmu-hankkeesta. Vuonna 2009 käynnistynyt Solmu toi yhteen tutkijoita ja kirjaston asiantuntijoita, jotka ratkoivat yhdessä muun muassa tutkimusdatan hallintaan liittyviä kysymyksiä. Samalla alkoi muodostua näkemys datapalveluista ja koulutuksesta – sekä kirjastolaisille että tutkijoille.

Datatuki toimii yhden luukun periaatteella. Palvelupyynnöt tulevat datasupport@helsinki.fi-osoitteeseen, josta ne ohjautuvat Datatuki-verkoston asiantuntijalle kirjastoon, tietotekniikkakeskukseen, tutkimushallintoon, tutkimuksen juristeille, keskusarkistoon tai tutkimusrahoituksen palveluihin.

Helsingin yliopiston kaltaisissa suurissa organisaatioissa kirjastolla on usein tutkimusdatapalveluiden ”muutosagentin” tai koordinoijan rooli. Datatuen toiminnan punainen lanka liittyy ennen kaikkea yhteistyöhön, erityisesti tietotekniikkakeskuksen, kirjaston ja tutkimushallinnon kesken.

”Tutkimusdatan hallinta on niin suuri kokonaisuus, että siihen tarvitaan monia osapuolia – tutkijasta hallintojohtajaan ja rehtoriin asti. Kirjaston rakentaessa tutkijoille tutkimusdatapalveluja on verkostoiduttava vahvasti oman organisaation tärkeisiin toimijoihin tietotekniikkapalveluista lakimiehiin, arkistoon, tutkijakouluihin ja tutkimushallintoon”, Helsingin yliopiston datatukipalveluiden parissa alusta asti toiminut tietoasiantuntija Liisa Siipilehto totesi kirjoituksessaan vuonna 2014.

Helsingin yliopistossa Datatuki-yhteistyötä on toteutettu eri muodoissa: yhteisistä palavereista työpajapäiviin – työpajatraditio alkoi vuonna 2015 ja edellinen työpaja oli 15:s – ja edelleen yhteiseen datanhallinta- ja DMP-koulutukseen (data management plan) sekä datatukipäivystykseen.

Datatuen kymmenvuotisjuhlan merkeissä laadimme kymmenen kysymystä päivänsankariin liittyen, ja pyysimme vastauksia Datatuen historiaan eri tavoin osallistuneilta ihmisiltä. Vastaajat saivat vapaasti vastata haluamiinsa kysymyksiin – tai keksiä itse omia kysymyksiä ja vastauksia. Seuraavassa esittelemme viikon aikana saadut vastaukset.

1. Datatuen historian alkaa muotoutua tutkimusaineistojen saatavuutta koskevasta selvityksestä vuosina 2008–2009. Mitkä seikat johtivat rehtorin päätöksen asettaa selvitystyöryhmä ja mitä seurauksia selvityksellä oli?

”Ilmeisesti Suomen Akatemia edellytti apurahan hakijoilta jo vuonna 2008 aineistonhallintasuunnitelmaa. Myös monet kansainväliset rahoittajat ja kustantajat edellyttivät datan avaamista. Pääsin mukaan Marjut Salokanteleen työryhmään seuraamaan selvityksen tekoa ja varhaista yhteistyötä tutkijoiden (professoreiden), opettajien, tietotekniikkakeskuksen, lakimiesten ja kirjaston välillä.

Kirjaston tutkimusdataprojekti 2011–2012 jatkoi datapalveluiden tarpeen kartoitusta: ”Pilotin kautta paljastui varsin karu todellisuus siitä, miten tutkijat kamppailevat työssään puutteellisen ohjeistuksen ja suunnittelun sekä olemattomien datanhallintaresurssien kanssa, käytännöllisesti katsoen ilman mitään käytännön tukea.”

Selvityksessä yritettiin kartoittaa laitoksilta, millaista dataa ja kuinka paljon tutkijoilla oli hallussaan tietoinfrastruktuurin kehittämistä varten. Selvityksen tuloksena tehtiin ensimmäinen ehdotus yliopiston datapolitiikasta, mutta sitä ei vahvistettu missään. Selvitys ja datapolitiikka tallennettiin kuitenkin Heldaan. Kyllä tällä selvityksellä saatiin herätettyä tietoisuus aiheen monimutkaisuudesta. Ja varmaan myös ymmärrettiin, miten suuri tarve tutkijoilla on erilaisille datan tallennusratkaisuille, miten tärkeää on saada arvokkaat datat säilytettäväksi ja mitä tietosuojaan ja omistajuuteen liittyviä asioita tulee huomioida datan käsittelyssä. Tämä selvitys johti tai liittyi itse asiassa varmaan myös kansalliseen Tutkimuksen tietoaineistot -hankkeeseen (TTA).” (tietoasiantuntija Liisa Siipilehto, Helsingin yliopiston kirjasto)

2. Kirjasto on hyvin edustettuna selvitystyöryhmässä ja myös data-asiantuntijoiden koulutus alkoi kirjastossa 2012. Miksi kirjastolla on ollut näin keskeinen rooli – ja miksi kirjaston aktivoituminen data-asioissa alkoi Viikin kampuskirjastosta?

”Omasta näkökulmastani ajatellen tässä on taustalla yksittäinen visionääri, joka näki datanhallinnan tärkeyden tutkimusprosessissa, ymmärsi haasteet sekä selkeän tarpeen tuelle. Hän näki datanhallinnan osana tiedonhallintaa ja piti siksi datanhallinnan tukea kirjaston tehtävänä. Hän toimi tuolloin Viikin kampuskirjaston johtajana. Siirtyessä vuonna 2011 Terkon johtajaksi, hän käynnisti vastaavan hankkeen Terkossa. Kyseessä on siis yksittäisen henkilön merkittävä panos. Ja tämä henkilö on siis Annikki Roos.” (tietoasiantuntija Mari Elisa Kuusniemi)

Omasta näkökulmastani ajatellen tässä on taustalla yksittäinen visionääri, joka näki datanhallinnan tärkeyden tutkimusprosessissa, ymmärsi haasteet sekä selkeän tarpeen tuelle. Ja tämä henkilö on siis Annikki Roos.

Viikki näytti tietä muille, kuten tiedekirjaston 10-vuotisjuhlaseminaarin otsikkokin 2009 kertoi. Juhlista raportoi Verkkari-verkkolehti.

”Viikin tiedekirjaston johtaja Heli Myllys yhdessä professori Yrjö Engeströmin kanssa aloittivat Solmu-projektin pilottihankkeena Viikin kampuksella. Viikin kampuskirjaston johtajaksi valittiin Helin jälkeen Annikki Roos, joka oli rehtorin asettaman työryhmän jäsenenä jo Kansanterveyslaitoksen aikoina. Annikki oli yksi avoimen tieteen edistäjiä ja puolestapuhuja-pioneereita Suomessa. Hän edisti vahvasti tutkimusdatan hallinnan palvelujen järjestämistä yliopistossa ja kansainvälisen mallin mukaan kirjastojen rooli muodostui aika keskeiseksi. Tai tätä roolia etsittiin vahvasti. Kirjastojen roolia ja tutkimuspalveluja piti koko ajan kehittää aineistojen digitalisoitumisen vuoksi. Kirjastolle datanhallintaan liittyvät palvelut sopivat myös siksi, että kirjastossa on aina ymmärretty tiedon järjestämiseen liittyvät tehtävät (tiedon saatavuus, löydettävyys, käytettävyys jne.). Aineistojen kuvailu eli metadatan tuottaminen on kirjastoille ollut aina tuttua hommaa, etupäässä julkaisujen kohdalla, mutta se on hyvin sovellettavissa myös tutkimusdataan. Yksi tärkeä pointti on myös se, että kirjasto on aina ollut puolueeton tai neutraali taho, jolla itsellään ei ole intressiä itse tiedon sisältöön. Ja kirjaston roolina on ollut aina edistää tiedon mahdollisimman hyvää löytyvyyttä ja siten avoin tiede on luonteva aate kirjastolle. Sitä paitsi kirjastolla oli jo tuolloin avoin julkaisuarkisto, jonka soveltuvuutta myös tutkimusdatan avaamiseen ryhdyttiin selvittämään.” (Liisa Siipilehto)

3. Muistellaanpa hieman Solmua, joka vietiin läpi 2009–2012 ja joka toimi alkusysäyksenä Datatuen kehitykselle. Millä tavoin se vaikutti datapalveluiden kehitykseen myöhempinä vuosina?

Solmu-hanke vahvisti datapalveluiden kehittämisen tarpeen. / Kuva: Liisa Siipilehto

”Solmu-hankkeessa päämääränä oli luoda kirjastojen ja tutkimusryhmien välille uudenlaista kumppanuutta solmutyöskentelyn avulla. Solmutyössä käytetään rajat ylittävää kollektiivista ongelmaratkaisutapaa työtehtävien suunnittelussa ja organisoinnissa. Projektissa kehitettiin käytännöllisiä työkaluja auttamaan tutkimusryhmiä tiedonhallintaan liittyvien haasteiden kanssa. Hankkeen keskeisenä ajatuksena oli nostaa esiin tutkimusryhmien palvelutarpeita, joihin kirjastolla oli keinoja vastata tai joita kirjastossa tuli kehittää. Viikin kampuksen hankkeessa nousi keskeisesti esiin tutkimusryhmien tarve datanhallinnan tukeen erityisesti Suomen akatemian rahoitushaun yhteydessä ja ensimmäinen DMP-tuki annettiin Cyanobakteerien tutkimusryhmälle. Työn tuloksen julkaistiin Viikin kampuksen tiedekunnille suunnattu verkkosivusto datahallintaan liittyvistä palveluista ja ohjeista. Myöhemmin sivustoa täydennettiin keskustakampuksen ohjeistuksella kampuksen solmuhankkeen myötä. Keskustakampuksella laadittiin datahallinnan ohjeistus kognitiotieteen tutkimukselle. Hankkeen myötä kirjastossa laajeni käsitys siitä, millaista osaamista tutkijat tarvitsevat datanhallinnan tuessa, ja miltä osin kirjasto voi tässä heitä auttaa ja miltä osin tarvitaan muita yliopiston toimijoita. Hankkeessa hankittu osaaminen loi pohjaa nykyiselle datatukiverkostotoiminnalle.” (palvelujohtaja Pälvi Kaiponen, Helsingin yliopiston kirjasto)

”Se oli selkeä murrosvaihe sille, että kirjastot voisivat tuottaa tutkimuspalveluja ja olla suoraan tekemisessä tutkijoiden kanssa, työskennellä tutkimusryhmien kanssa. Siinä huomattiin myös, että kirjaston asiantuntijuus ei tule riittämään yksin aineistonhallintasuunnitelman ja tutkimusdatapalvelujen tuottamisessa. Tarvitaan muita toimijoita mukaan, muun muassa tietotekniikkakeskus.” (Liisa Siipilehto)

Siinä huomattiin myös, että kirjaston asiantuntijuus ei tule riittämään yksin aineistonhallintasuunnitelman ja tutkimusdatapalvelujen tuottamisessa. Tarvitaan muita toimijoita mukaan, muun muassa tietotekniikkakeskus.

3,5. Ylimääräinen välikysymys koskien kirjaston roolia kouluttajana

Kirjaston rooli tutkimusdataan liittyvän koulutuksen käynnistäjänä ei tullut alkuperäisissä kysymyksissä riittävästi esiin, ja bibliometriikkaan erikoistunut tietoasiantuntija Eva Isaksson muotoili siihen liittyen vapaamuotoisen vastauksen:

Tudatupa-koulutus perehdytti kirjastolaisia datanhallinnan teemoihin.

”Syksyllä 2012 kirjastossa alkoi MEKin (tietoasiantuntija Mari Elisa Kuusniemi) aloitteesta Tudatupa-niminen matalan kynnyksen koulutus kirjastolle. Siinä tilanteessa muut toimijat eivät olleet konkreettisesti aktiivisia, koska heiltä se olisi arvatenkin edellyttänyt jonkinlaista resursointia tai toiminnan suunnittelua. Sen sijaan kirjastossa asiaa voitiin lähestyä sisäisenä henkilöstökoulutuksena, johon kipinä oli varmasti tullut siitä, että muuallakin kuin Suomessa oli samansuuntaista aktiivisuutta. Tudatupa oli työpaja, jossa valittiin aiheet, ja kukin perehtyi saamaansa aiheeseen ja veti muille siitä lyhyen powerpoint-esityksen. Väkeä oli joka kampukselta mukana. Myöhemmin oli myös kampuskohtaista itseopiskelua, joka keskittyi osaksi siihen, että tutkimusdata voisi olla mukana kirjaston koulutustoiminnassa. Sitä kautta se siirtyi osaksi tohtorikoulutuksen opetusta. Koska kirjasto piti asiaa esillä ja aktiivisesti kyseli ja teki selvityksiä, laitoksilla alettiin hahmottaa kirjaston asiantuntemus. Muita toimijoita pyydettiin mukaan tutkijoille suunnattuihin tilaisuuksiin, ja siitä yhteistyö vähitellen alkoi aidosti kehittyä, vaikka aiemmin oli ollut tapaamisia. Joka tapauksessa liitän oheen kuriositeettina kalvot, joissa on kirjaston roolia valaiseva tulos. Olimme Kumpulassa tehneet geotieteilijöille kyselyn, ja totta vieköön pelkästään olemalla aktiivisia olimme nousseet toiseksi luotetuimmaksi tahoksi heti omien kollegojen jälkeen.” (tietoasiantuntija Eva Isaksson, Helsingin yliopiston kirjasto)

4. Tutkimusdatayhteistyöpalaverit erityisesti tietotekniikkakeskuksen ja kirjaston sekä myöhemmin Kansalliskirjaston ja tutkimushallinnon kesken alkavat vuosikymmenen alussa, ja myöhemmin niistä jalostuu yhteisten työpajapäivien traditio. Miksi organisaatiorajat ylittävä yhteistyö, datatuki-verkosto – Datatuki – nähtiin tärkeäksi?

”Omasta puolestani sanottuna, yhteistyö on nähty tärkeäksi historian eri vaiheissa esimerkiksi siksi, että olemme ymmärtäneet tutkijan – asiakkaan, jos joku niin haluaa muotoilla – datan kanssa tapahtuvan toimintaprosessin sisältävän elementtejä eri osa-alueilta. Yhdellä organisaatiolla ei ole käsissään osaamista, välineitä eikä palveluita, joilla ratkoa tutkijan tutkimusdataan liittyviä kysymyksiä. Se huomattiin varhain ihan käytännössäkin, mutta myös maailmalta tuli sellaista viestiä, että kampuksilla on asioita ratkottu sisäiset organisaatiorajat ylittäen. Datatuki-verkosto varmaankin nähtiin yhdestä kulmasta tärkeäksi siksi, että näitä tukipyyntöjä alkoi tulla siihen malliin, että niitä pitää pystyä ratkomaan laajasti. Verkostomainen toimintatapa varmaankin nähtiin toimivaksi esimerkiksi siksi, että tosiasiassa se oli ainoa tapa saada edistettyä dataintensiivisen tukimuksen tukea yliopistolla. Samaan aikaan kansalliset projektit TTA (Tutkimuksen tietoaineistot) ja ATT (Avoin tiede ja tutkimus) ovat luoneet kokonaiskuvaa, mutta tutkijoiden kiinnostus data scienceen ja sen menetelmiin on luonut kysyntää. Matkan varrella on kyllä keskusteltu hyvinkin epävirallisesti erilaisista keskitetymmistä toimintamalleista, kuten ”tutkimusteknologiakeskuksesta”, joka ottaisi omistaakseen toimintaprosesseja ja sen kehittämistä – vrt. aikaisempi ”opetusteknologiakeskus” – mutta tällaisilla malleilla ei ole ollut realistista edellytyksiä edetä.” (tietotekniikkaprojektipäällikkö, IT for Science -ryhmän vetäjä Ville Tenhunen, Helsingin yliopiston tietotekniikkakeskus)

Datatuki-verkoston ensimmäinen työpajapäivä järjestettiin toukokuussa 2015.

”Hyvä tutkimusdatanhallinnan tuki vaatii monen toimijan yhteistyötä. Mikään yksittäinen toimija ei pysty vastaamaan kaikista osa-alueista yksin. Käytännössä vastuut menevät usein lomittain. Tavoitteena on katkeamattomat prosessit ja yhtenäinen viestintä. On tärkeää varmistaa, ettei prosessit katkea yksiköiden välillä ja jokin vaihe jää tyystin hoitamatta. Yhteistyön kautta olemme huomanneet yhä paremmin näitä yksiköiden väliin jääviä alueita. Tutkimusryhmien ja tutkijoiden vastuulle jää yhä palveluiden välisten kuilujen yli harppomista.” (Mari Elisa Kuusniemi)

”Yliopiston organisaatio on niin iso ja hajanainen, että tutkijoiden on lähes mahdotonta tietää, kuka hoitaa mitäkin asiaa. Nähtiin tärkeäksi, että tutkijan ei tarvitse tietää tätä, vaan palvelua pitäisi saada yhden luukun periaatteella. Myös palvelujen tuottajien puolella ei tiedetty toisista, kuka tekee mitäkin ja mitkä tehtävät kuuluvat kenellekin. Ja toisaalta tutkimusdatan hallinta kattaa paljon asioita, jotka eivät oikeastaan kuuluneet kenellekään tai niitä ei edes tiedostettu. Koettiin, että mitä paremmin tunnemme toisemme ja toisten tehtäväkentät ja asiantuntijuudet, sitä paremmin voimme kehittää palveluja ja toisaalta myös tarjota niitä tutkijoille.” (Liisa Siipilehto)

5. Mikä on Datatuen toiminnassa on mielestäsi erityisen arvokasta oman yksikkösi/organisaatiosi näkökulmasta?

CSC:n datanhallinnan palveluiden näkökulmasta on tärkeää, että meillä on asiakasorganisaatiossa yhteistyötaho, joka pystyy edustamaan organisaatiota laajasti ja kovalla substanssiasiantuntemuksella. Helsingin yliopiston Datatuki pystyy välittämään meille sekä hallinnon ja tukipalveluissa toimivien että tutkijoiden tarpeita, joiden perusteella kehitämme palveluja, ja me voimme kouluttaa datatuen edustajia neuvomaan tutkijoita palvelujemme peruskäytössä. HY:n datatuki on Suomessa tutkimusdatanhallinnan edelläkävijä, jonka kanssa tekemämme yhteistyö hyödyttää kaikkia Suomen tutkijoita ja korkeakouluja paremmin tutkimuksen tarpeita vastaamaan kehittyvien CSC:n palvelujen kautta.” (tutkimusdatan hallinnan palveluiden koordinaattori Heidi Laine, Tieteen tietotekniikan keskus CSC)

”Helsingin yliopiston Datatuki on tärkeä yhteistyökumppani Fairdata.fi -palvelukokonaisuudelle ja muille datanhallinnan palveluille, joita CSC tuottaa.” (vanhempi koordinaattori Jessica Parland-von Essen, Tieteen tietotekniikan keskus CSC)

Tietoarkisto on ollut olemassa jo 20 vuotta. Teimme vuosikaudet töitä niin, että data-asioita tuntevia keskustelukumppaneita ja kollegoja löytyi vain Suomen ulkopuolelta. Helsingin yliopiston datatuella on ollut merkittävä vaikutus suunnannäyttäjänä kirjastojen datatukitoiminnan syntymiseen – eikä vähiten DMPTuuli-projektin myötä. Samalla myös tietoarkistolaisille on löytynyt aina enemmän asiantuntevia data-asioiden kollegoja Suomen sisältä. Tutkimusaineistojen avoimuuden kulttuuriin siirtyminen vaatii kirjastoissa ennen kaikkea yhteistyötä. Helsingin yliopiston Datatuki on verkoston luojana ja innostuksen ylläpitäjänä juhlansa ansainnut. Tietoarkisto onnittelee Helsingin yliopiston Datatukea ja toivoo sille kaikkea hyvää myös jatkossa!” (kehittämispäällikkö Arja Kuula-Luumi, Tietoarkisto)

Tietoarkisto on ollut olemassa jo 20 vuotta. Teimme vuosikaudet töitä niin, että data-asioita tuntevia keskustelukumppaneita ja kollegoja löytyi vain Suomen ulkopuolelta. Helsingin yliopiston datatuella on ollut merkittävä vaikutus suunnannäyttäjänä kirjastojen datatukitoiminnan syntymiseen.

”Arvokkaita asioita on varmaan paljonkin, mutta oman yksikköni näkökulmasta tärkeää on se, että saadaan iso kuva haltuun ja toimintaprosessi edes jollain tavalla ketjuksi sen sijaan, että se olisi kaikkia osapuolia turhaan työllistävä joukko irrallisia tehtäviä. Tutkijoiden ajan säästäminen on tärkeää ja jos tutkijat joutuisivat itse etsimään jokaista asiaa varten erikseen palvelunsa, niin sitä aikaa kuluisi ihan turhaan. Yksinkertaisella palveluprosessilla – sähköpostiosoitteella – voidaan (A) yksinkertaistaa prosessia tutkijalle js (B) piilottaa hajanaisuus tutkijoilta.” (Ville Tenhunen)

”On todella avartavaa työskennellä eri yksiköiden ja eri alan asiantuntijoiden kanssa ja saada uusia näkökulmia asioihin. Oppii koko ajan uusia asioita ja ymmärrys tutkimusdatan hallinnan eri osa-alueista lisääntyy. Datatuki, kun se on koko yliopiston yhteinen palvelu, lisää mielestäni kirjaston toiminnan vaikuttavuutta sekä tutkijoiden että myös tutkimushallinnon suunnasta. Kirjastosta on tullut tärkeä yhteistyökumppani tutkimuspalveluiden järjestämisessä.” (Liisa Siipilehto)

Tuuli-verkoston toiminta on hyvä esimerkki kansallisesta yhteistyöstä data-asioissa. Kuva on helmikuun 2017 päätösseminaarista. / Kuva: Jussi Männistö

6. Mikä merkitys Helsingin yliopiston datanhallintaan liittyvällä kehitystyöllä ja Datatuen toiminnalla on ollut kansallisella tasolla?

”Se on toiminut ja toimii kansallisena suunnannäyttäjänä ja hyvien käytäntöjen laboratoriona.” (Heidi Laine)

”Helsingin yliopisto aloitti tukipalveluiden kehittämisen varhain ja on isona yliopistona pystynyt panostamaan datanhallintaan erikoistuneeseen henkilöstöön. Nämä datanhallinnan asiantuntijat osallistuvat kehitystyöhän myös kansallisissa ja kansainvälisissä projekteissa ja työryhmissä. Datatuki jakaa osaamistaan myös isännöimällä erilaisia vierailuja, kertoo kokemuksistaan ja julkaisee aktiivisesti.” (Mari Elisa Kuusniemi)

”Kyllähän tämä toiminta on ollut monille muille yliopistoille enemmän tai vähemmän esimerkkinä, jota on ehkä sovellettu tai seurattu, kukin mahdollisuuksiensa mukaan. Lisäksi on niinkin, että Datatuen piirissä toimivat henkilöt ovat tyypillisesti olleet myös kansallisen kehityksen keskeisiä toimijoita. Esimerkiksi kelpaa vaikkapa DMPTuulin synnyttäminen ja kehittäminen.” (Ville Tenhunen)

”Helsingin yliopiston Datatuki kuuluun maamme kärkijoukkoihin. Esimerkiksi upea työ DMPTuulin ja pitkäaikaissäilytyksen kohdalla on ollut todella tärkeää kansallisessa avoimen tieteen ja tutkimusaineistojen hallinnan kehittämisen hankkeissa.” (Jessica Parland-von Essen)

7. Millainen yhteistyökumppani ja palveluntarjoaja Datatuki on asiakkaan näkökulmasta?

”Toivottavasti hyvä, tehokas, aktiivinen ja hyödyllinen. Pitäisi kysyä asiakkaalta…” (Ville Tenhunen)

”Minulle Datatuki on näyttäytynyt hyvin palveluhenkisenä kumppanina. Lisäbonuksena on tieteenalariippumattomuus eli ratkaisut eivät rajoitu oman alan tutkimusinfrojen tms. käytäntöihin, jotka on toisinaan hiukan kapeakatseisesti tehtyjä.” (tutkija Pasi Kolari, Helsingin yliopiston Ilmakehätieteiden keskus)

”Tällä hetkellä vielä aika tuntematon ehkä, ei tunnisteta, mitä kaikkea Datatuelta voisi pyytää. Tai ehkä ei hyödynnetä vielä tarpeeksi.” (Liisa Siipilehto)

Lue myös Think Open -blogiartikkeli: Mitä hyötyä Datatuen DMP-palveluista on ollut? Neljä tutkijaa kertoo oman näkemyksensä (4.9.2019)

Historiantutkijat työstivät yhdessä Datatuen asiantuntijoiden kanssa historian DMP-ohjeita juhannusviikon työpajassa 2017. / Kuva: Jussi Männistö

8. Missä tutkimusdataan liittyvissä asioissa – Helsingin yliopistossa ja Suomessa – on tapahtunut eniten kehitystä viimeisen kymmenen vuoden aikana ja missä pitäisi skarpata?

”Yleinen tietoisuus datanhallinnasta ja sen tärkeydestä on kasvanut huomattavasti. Korkeakoulut ja tutkimuslaitokset ovat tuottaneet datapolitiikkoja ja kehittäneet kapasiteettiaan datanhallinnassa niin tietojärjestelmien kuin neuvontapalvelujen osalta. Hyvä ja teknisesti ajanmukainen datanhallinta on kuitenkin liikkuva maali. Datapolitiikkoja pitää päivittää vastaamaan datanhallinnan kehittyviä tarpeita ja palveluekosysteemiä. Kehittyvä lainsäädäntö haastaa myös sopeutumaan, esimerkkeinä GDPR (yleinen tietosuoja-asetus) ja PSI-direktiivi (koskien julkisen sektorin datan uudelleenkäyttöä). Lainsäädäntöön liittyvään neuvontaan tulisi panostaa organisaatioissa nykyistä enemmän: tutkijaa ei pidä jättää yksin tulkitsemaan lakitekstejä. Panoksena on paitsi organisaation maine, myös tutkimusetiikka sekä tieteen luotettavuus ja uskottavuus yhteiskunnassa.” (Heidi Laine)

”Kehitystä on tapahtunut sisällöissä eli on tajuttu kokokuva ja sen pulmat. Kehitystä on tapahtunut aika paljonkin palveluiden puolella, eli on kehitetty RDM Basics ja DMP-työpajat sekä koko joukko erilaisia datapalveluita uusimpana Datacloud. Viimeisen kymmenen vuoden aikana on tosiasiassa tapahtunut se, että tutkimusdatasta on tullut laajemmin oma genrensä ja se, että tutkimusdata tunnistetaan ja osin tunnustetaankin oikeaksi yliopistotason tieteen ja tutkimuksen tekemisen haasteeksi sekä mahdollisuudeksi. Onhan meillä toki ollut vuosikymmeniä tutkimusaloja, joissa datalla on ollut väliä, mutta viimeisen kymmenen vuoden aikana tutkimusdatasta on tullut kaikkien tiedekuntien laajuinen ilmiö. Skarpata pitäisi monessakin asiassa eli tutkimusdatan tarjoamiin mahdollisuuksiin pitäisi tarttua rohkeammin ja poikkitieteellisemmin. Traditiot eri tieteenalojen välillä ovat erilaisia, jolloin tukitarpeetkin ovat kovin erilaiset. Yliopiston valitettava resurssitilanne ei valitettavasti ole mahdollistanut resurssien pitämistä kysyntää ja tarvetta vastaavalla tasolla. Eli skarppausta tarvitaan siinä, että tutkimusdataan suhtauduttaisiin yhä määrätietoisemmin ja rajat ylittävämmin sekä resursoimalla toiminta niin, että se mahdollistaisi entistä kunnianhimoisempien tavoitteiden kurkottelun tiedepuolella. Itse asiassa tätä skarppausta tarvittaisiin lähivuosina siksikin, että kansalliset uudet laskentaympäristöt luovat paljon uusia mahdollisuuksia ja uutta dataa ihan uusiin tutkimuskysymyksiin. Datatulva ei ole laantumassa, vaan päinvastoin, olemme nähneet vasta laineet.” (Ville Tenhunen)

Viimeisen kymmenen vuoden aikana tutkimusdatasta on tullut laajemmin oma genrensä ja tutkimusdata tunnistetaan ja osin tunnustetaankin oikeaksi yliopistotason tieteen ja tutkimuksen tekemisen haasteeksi sekä mahdollisuudeksi. Onhan meillä toki ollut vuosikymmeniä tutkimusaloja, joissa datalla on ollut väliä, mutta viimeisen kymmenen vuoden aikana tutkimusdatasta on tullut kaikkien tiedekuntien laajuinen ilmiö.

”Yksi asia, jossa kehitystä on tapahtunut, on tutkijoiden lisääntynyt tietoisuus tietosuoja-asioista ja henkilötietojen keruun lainsäädäntövaatimuksista. Tähän on vaikuttanut varmasti osaksi GDPR:n voimaantulo sekä yleensäkin uutisointi tietosuojasta ja henkilötietojen käsittelyyn liittyvistä haasteista. Tutkijat tunnistavat tarpeen tietosuojan kehittämiselle, mutta esimerkiksi lainsäädännön vaatimukset ja tietosuojan peruskäsitteet eivät välttämättä ole vielä kovinkaan tuttuja.” (tutkija Anna Rohunen, Oulun yliopisto)

”Eniten kehitystä on tapahtunut datanhallinnan opastuksessa, koulutuksessa ja tikettijärjestelmän avulla tuotetussa neuvontapalvelussa. Skarppausta tarvitaan metadatan tuottamisessa laajemmin ja ammattimaisemmin. Myös omistajuuskysymyksiin ja datan käyttöön liittyviin sopimuksiin kaivataan edelleen selkeimpiä ohjeita. Datatuen moniammatillisuus pitäisi saada vielä todellisemmaksi tiiviimmällä yhteistyöllä ja esimerkiksi laajempien koulutusten järjestämisellä yhdessä.” (Liisa Siipilehto)

9. Miksi, missä muodossa ja millä tavalla Datatuki on edelleen olemassa vuonna 2029?

”Datatuki vuonna 2029 on nykyistä enemmän kehityspainotteinen ja entistä lähempänä tutkimusryhmiä kampuksilla. Vuonna 2029 datanhallinnan perusteet ovat osa jokaisen tutkijan peruskoulutusta ja ammattitaitoa. Datatuki on tukiorganisaatio, joka tukee ja kehittää tähän liittyvän osaamisen edistämistä sekä aktiivisesti etsii ja kehittää keinoja säästää tutkijoiden aikaa datan kanssa toimimisesta sekä varmistaa, että datanhallinta on niin FAIR:ia kuin se voi ollakin. Vuonna 2029 moni rutiiniasia on siirretty tekoälyn hoidettavaksi ja Datatuki on se, joka tuota tekoälyä kouluttaa.” (Ville Tenhunen)

Datatuki vuonna 2029 on nykyistä enemmän kehityspainotteinen ja entistä lähempänä tutkimusryhmiä kampuksilla. Vuonna 2029 datanhallinnan perusteet ovat osa jokaisen tutkijan peruskoulutusta ja ammattitaitoa.

”Datatuki on Helsingin yliopiston datanhallinnan asiantuntijoiden muodostama vapaaehtoinen verkosto. Tästä johtuen se pystyy tuottamaan vain konsultatiivisia palveluita, kuten neuvontaa, koulutuksia ja ohjeita. Datanhallinnan palveluiden kehittyminen kuitenkin vaatisi myös työkalujen kehittämistä. Jos tutkimuksen tarvitsemien datanhallinnan perustyökalun rahoittamisesta päästään yliopistolla sopimukseen, datatukeen saattaa löytyä tekijöitä myös vuonna 2029.” (Mari Elisa Kuusniemi)

Datanhallinnan palveluiden kehittyminen vaatisi myös työkalujen kehittämistä. Jos tutkimuksen tarvitsemien datanhallinnan perustyökalun rahoittamisesta päästään yliopistolla sopimukseen, datatukeen saattaa löytyä tekijöitä myös vuonna 2029.

”(Digitaalinen) data, niinkuin mikään muukaan tietotekniikkaan liittyvä ei ikinä lopeta muuttamasta muotoaan. Tulee olemaan ikuisesti tarve tukea yksittäisiä tutkijoita ymmärtämään sen hetkiset järjestelmät ja datamuodot. Tarvitseeko tekoälylle vielä vuonna 2029 jonkun erikseen selittää nämä, vai pystyykö se haalimaan tiedon ja toimimaan tutkijoitten tukena itsenäisesti?” (laboratorioinsinööri Mika E. Virtanen, Oulun yliopisto)

Tässä on Datatuen väkeä viime vuodelta. Miltä näyttää Datatuki vuonna 2029? / Kuva: Jussi Männistö

”Datatuen merkitys tulee vain kasvamaan. Tulevaisuudessa aineistojen hallinta on avainasemassa tutkimuksen rahoituksen, laadun ja vaikuttavuuden varmistamisessa. Ilman datatukea ei voi olla hyvää tiedettä isossa yliopistossa!” (Jessica Parland-von Essen)

”Tavoitehan voisi olla se, että Datatukea ei tulevaisuudessa tarvita. Ohjeet ja opastus ovat niin hyviä tai tutkijat ovat niin taitavia, että he eivät tarvitse ulkopuolista apua. Tulevaisuudessa datanhallinta on niin kiinteä osa tutkimustoimintaa, ettei sitä voida oikeastaan enää edes erottaa. Datatuen tehtävänä on lähinnä tehdä kehitystyötä ja tuottaa palveluja niin monipuolisesti, että henkilökohtaista vastaamista tai ohjaamista ei enää tarvita. Tai sitten data-asiantuntijat toimivat kiinteässä yhteistyössä tutkijoiden kanssa tutkimusryhmän osana – tämä tuntuu kivemmalta vaihtoehdolta…” (Liisa Siipilehto)

”Ihminen ei tule koskaan enää varmasti toimeen ilman dataa, mutta ei datakaan ilman ihmistä. Koneella ei ole tunteita ja datan ymmärtämiseen, hallintaan ja hyödyntämiseen ja lopulta päätöksentekoon tarvitaan aina ihmistä. Datatuki tulee olemaan myös vuonna 2029 tukemassa datan hyödyntäjiä ja auttamassa heitä tekemään entistä parempia päätöksiä.” (tutkija, data-asiantuntija Elina Hyrkäs, Oulun yliopisto)

”Eri hallinnonalojen välinen yhteistyö toivottavasti tiivistyy entisestään. Tutkimusdataan liittyvät kysymykset näkyvät jossain määrin kaikkien yliopistopalveluissa toimivien työpöydillä. Datatukea kuunnellaan tarkalla korvalla yliopiston strategiaa tehtäessä ja täytäntöön pantaessa. Tutkimusdatakeskustelun ja tuen tarpeen painopiste siirtyy tallennusratkaisuista – koska kaikille on jo itsestäänselvää, että dataa ei säilytetä muistitikulla eikä pöytälaatikkoon sullotulla ulkoisella kovalevyllä tms. – datan laatuun, eli metadatan tuottamiseen ja semanttiseen yhteentoimivuuteen. Näitä tarvitaan yhä yleistyvien tekoälyratkaisujen mahdollistamiseksi. Datatuki tulee olemaan CSC:n palveluiden kannalta tutkijan ensisijainen yhteyspiste, joka opastaa palveluiden käyttöönotossa ja peruskäytössä. Datatuki jalkautuu entistä enemmän tiedekuntiin tarjotakseen tieteenalakohtaista neuvontaa. Tutkijataustaisten data-agenttien verkosto on tässä tärkeä resurssi. Yhteiskuntatietelijöiden ja humanistien datatarpeet työllistävät datatukea muita aloja enemmän johtuen datan laadullisesta ja määrällisestä moninaisuudesta.” (Heidi Laine)

Tutkimusdatakeskustelun ja tuen tarpeen painopiste siirtyy tallennusratkaisuista – koska kaikille on jo itsestäänselvää, että dataa ei säilytetä muistitikulla eikä pöytälaatikkoon sullotulla ulkoisella kovalevyllä tms. – datan laatuun, eli metadatan tuottamiseen ja semanttiseen yhteentoimivuuteen. Näitä tarvitaan yhä yleistyvien tekoälyratkaisujen mahdollistamiseksi.

10. Mikä laulu, runo tai mietelause sopisi juhlistamaan Datatuen syntymäpäivää?

”Queenin ’Don’t Stop Me Now’.” (Heidi Laine)

”Minkä taakseen jättää, sen eestään löytää.” (Mari Elisa Kuusniemi)

”Hmm… tällaiset ovat hankalia kysymyksiä. Erroll Garnerin luoma ja muun muassa Sarah Vaughnin esittämä ’Misty’ sopii varmaan tähänkin biisiksi.” (Ville Tenhunen)

”’All by my side’, Celine Dion tai joku muu esittäjä. Kuvaa mielestäni hyvin tätä datatukea esimerkiksi, että ’yksin ei ole kiva olla, ja apua on siis tarjolla’, voi olla kaukaa haettu, mutta jotenkin tämä tuli mieleeni, pilke silmäkulmassa.” (Elina Hyrkäs)

”’Pop Corn’. Löytyy albumilta Music to Moog by Gershon Kingsley, vuodelta 1969.” (Mika E. Virtanen)

”Sammy Babitzin: ’Daa-Da Daa-Da’ (1972). Ja Tommy Tabermannin runo: ”Ei ole olemassa muureja, on vain siltoja. / Ei ole olemassa suljettuja ovia, on vain portteja.” (Liisa Siipilehto)


Lue myös: