Siirry sisältöön

LogoHelsingin yliopisto

Think Open

Digitaalisista tutkimuspalveluista ja avoimesta tieteestä / About digital research services and open science

Missä lääketieteen alan tutkija säilyttää ja julkaisee aineistonsa?

Julkaistu 2019-04-012019-05-07 kirjoittanut Deleted User

Lääketieteellinen tiedekunta (LTDK) ja Helsingin yliopiston Datatuki teki alkuvuonna 2019 LTDK:n vastuullisille tutkijoille kyselyn, jossa selvitettiin aineistojen säilytysratkaisuja tutkimusprojektin aikana ja aineistojen julkaisupaikkoja projektin jälkeen. Kyselyyn vastasi lähes 50 vastuullista tutkijaa, joista yli puolet oli yliopiston puolelta ja noin neljäsosa sekä HUS:n että yliopiston palveluksessa.

(This post is also available in English.)

Aineiston säilytys projektin aikana

Kyselyssä selvisi se, mikä oli ennaltakin selvää: tutkijat tarvitsevat apua arkaluontoisen aineiston suojaamisessa projektin aikana. Arkaluontoinen ja luottamuksellinen tieto on sellaista, joka voi paljastuessaan aiheuttaa vahinkoa. Tällaisista tiedoista on mahdotonta tehdä kattavaa listausta, mutta näitä ovat esimerkiksi arkaluontoinen henkilötieto, kuten tiedot terveydestä, sairastumisriskeistä, seksuaalisesta suuntautumisesta, etnisestä alkuperästä tai uskonnollisesta vakaumuksesta. Henkilötiedon lisäksi luottamuksellista tietoa voi olla sensitiivinen lajitieto, patentit, maanpuolustukseen liittyvä tieto tai liikesalaisuudet. Tutkijan vastuulla on tunnistaa arkaluontoinen ja luottamuksellinen tieto, joka paljastuessaan olisi haitallista tutkittavalle tai muulle kohteelle.

Arkaluontoisen aineiston suojaaminen vaatii erityistä huomiota; tietoturvallisten tallennusratkaisujen lisäksi 85% tutkijoista kertoi arkaluontoisen aineiston olevan suojattu: aineisto oli joko kryptattu, pseudonymisoitu tai anonymisoitu. Anonymisointi on paras tapa tehdä arkaluontoisesta aineistosta tietoturvan ja tietosuojan näkökulmasta vaaraton, koska tällöin yksittäinen havainto (esimerkiksi henkilö) ei ole kohtuullisin keinoin tunnistettavissa. Tällöin henkilötietoaineistoissa myöskään EU:n tietosuoja-asetus (GDPR) ei enää koske tietoja. Lisätietoa tunnisteellisuudesta ja anonymisoinnista Aineistohallinnan käsikirjasta.

Arkaluontoisen aineiston suojaaminen helpottaa myös tallennusratkaisujen valintaa. Suojauksesta ja aineiston arkaluontoisuuden laadusta riippuen tutkija voi käyttää Helsingin yliopiston tarjoamia perustallennusratkaisuja, kuten ryhmälevyä. Ota kuitenkin aina yhteyttä HY:n IT-asiantuntijoihin, kun suunnittelet arkaluontoisen aineiston säilytystä (datasupport@helsinki.fi).

Yliopiston tarjoamia arkaluontoisen aineiston tallennusratkaisuja ovat muun muassa UMPIO sekä virtuaali- että fyysiset palvelimet. Lisäksi CSC tarjoaa tutkijoiden käyttöön ePoutaa. ePoudasta ja muista CSC:n tarjoamista tallennusratkaisuista voi lukea CSC:n sivuilta. Kun tutkimuksen rahoitusta suunnitellaan, budjettiin ei välttämättä osata varata resursseja aineiston säilytystä varten. Etenkin arkaluontoisen aineiston säilytys voi tulla kalliiksi, jos sitä ei ole mahdollista suojata tai anonymisoida, mistä johtuen aineistoa ei voi säilyttää niin sanottujen perus IT-ratkaisujen puitteissa.

Huomattavan moni käyttää myös ulkoisia kovalevyjä aineiston tallentamiseen. Sitä, onko kyseessä varmuuskopio vai aineiston ainoa tallennusratkaisu, emme selvittäneet. Yliopiston ITtuen tarjoamat tallennusratkaisut varmuuskopioidaan automaattisesti ja esimerkiksi ryhmälevylle saa lisää tilaa pyydettäessä. Yliopiston tallennusratkaisut löytyy Datatuen sivuilta ja lisätietoa saa ottamalla yhteyttä datasupport@helsinki.fi.

Aineiston avaaminen tulosten julkaisemisen jälkeen

Kysyimme tutkijoilta säilytysratkaisujen lisäksi aineistojen avaamisesta tulosten julkaisemisen jälkeen. Tapauksissa, joissa aineiston avaaminen ei ole sen arkaluontoisuuden vuoksi mahdollista, kysyimme, onko aineiston metadata eli sen kuvailutiedot julkaistu. Positiivista oli huomata, että noin puolet vastaajista olivat avanneet aineistoja. Käytettyjä paikkoja olivat muun muassa EMBL-EBI (EGA, ENA, Array Express), NCBI (GEO, bdGaP), NIH, Open Science Framework, Zenodo, ResearchGate, GitHub sekä Biopankit. Lisää julkaisuarkistoja erityisesti biomolekulaariselle aineistoille löytyy Elixirin sivuilta.

Huolestuttavasti kyselyssä kuitenkin ilmeni, että arkaluontoisen aineiston kuvailutietojen julkaiseminen ei ollut lähes kenellekään tuttua. Suomen Akatemia esimerkiksi edellyttää seuraavaa: ”Jos tutkimusaineistoa ei voi avata jatkokäytettäväksi, sen metadata (kuvailutiedot) on kuitenkin tallennettava kansalliseen tai kansainväliseen hakupalveluun.” Tällaisia hakupalveluita ovat esimerkiksi kansallinen Etsin tai kansainvälinen Zenodo. Avoimen tieteen periaatteet eivät pakota avaamaan kaikkea aineistoa, vaan avoimuuden aste voi vaihdella perustelluista syistä kaikille täysin avoimesta salassa pidettävään. Aineistojen avaaminen muiden käyttöön parantaa tutkimustulosten jatkokäyttöä, edistää uusien havaintojen löytymistä sekä edistää tutkimusyhteistyötä.

Tilannekatsaus tutkijoiden arkeen

Kyselymme osoitti mitä palveluita tutkijat käyttävät, mitkä palvelut eivät ole tunnettuja, ja missä tutkijat kaipaavat tukea. Näiden tekijöiden selvittäminen on tärkeää palvelukehitykselle ja hyödyttää sekä Datatukea että Lääketieteellistä tiedekuntaa. Tärkeimpinä kehitettävinä asioina esille nousi, että aineistojen avaaminen tulosten julkaisemisen jälkeen on monelle tutkijalle tuntematonta sekä tutkijoiden avuntarve arkaluonteisten aineistojen käsittelyssä. Erityisesti tallennusratkaisuihin kaivataan selkeyttä ja helppoja ratkaisuita. Lääketieteellinen tiedekunta pyrkii vastaamaan tähän toiveeseen yhdessä HY:n Tietotekniikkakeskuksen kanssa; arkaluontoiselle aineistolle on kehitteillä uusi tallennuspalvelu jo olemassa olevien ratkaisuiden rinnalle. Tulemme varmasti kuulemaan siitä lisää tuonnempana.

Tällaisten kyselyiden avulla on mahdollista saada hyvä käsitys siitä, miten tutkijat toimivat tällä hetkellä ja mitkä ovat päivänpolttavat kysymykset. Tutkimuksen uusiminen muutaman vuoden päästä voikin olla hyödyllistä, jotta tukipalvelut saavat arvokasta tietoa siitä, missä asioissa on edistytty ja mitä pitää lähteä kehittämään.

KategoriatAvoin data / Open Data, Avoin julkaiseminen / Open Access, Avoin tiede / Open Science, Tietosuoja / Data Protection, Tietoturva / Information Security, Tutkimuksen näkyvyys / Visibility of Research, Tutkimusdatanhallinta / Research Data Management (RDM), Tutkimusinfrastruktuurit / Research Infrastructures, Tutkimuspalvelut / Research Services Avainsanatavoin data, datan avaaminen, Datasupport, Datatuki, FAIR, lääketiede, metadata, RDM, research data management, selvitys, sensitiivinen data, tutkimusaineistot

Think Open Blog

Tietoa blogista / About this blog >>

Toimitusneuvosto / Editorial Board >>

Kirjoittajaohjeet / Instructions for writers >>

Aiheet / Topics

  • Avoin data / Open Data (111)
  • Avoin julkaiseminen / Open Access (169)
  • Avoin opetus / Open Education (29)
  • Avoin tiede / Open Science (318)
  • Digihumanismi / Digital humanities (19)
  • Kansalaistiede / Citizen Science (3)
  • Tietosuoja / Data Protection (29)
  • Tietoturva / Information Security (21)
  • Tutkimuksen näkyvyys / Visibility of Research (61)
  • Tutkimuksen työkalut / Research Tools (62)
  • Tutkimusdatanhallinta / Research Data Management (RDM) (121)
  • Tutkimusinfrastruktuurit / Research Infrastructures (73)
  • Tutkimuspalvelut / Research Services (237)
  • Tutkimustunnisteet / Research Identifiers (16)

Kaikki blogitekstit julkaistaan CC-BY 4.0 -lisenssillä. Lisenssi ei koske kuvia. / All the blog texts are licensed under a CC-BY 4.0 license. The license does not apply to images.

Asiasanat / Tags

  • aineistonhallintasuunnitelma (23)
  • APC (38)
  • avoimet oppimateriaalit (20)
  • avoin data (33)
  • avoin julkaiseminen (98)
  • avoin opetus (25)
  • avoin oppiminen (20)
  • avoin tiede (118)
  • cOAlition S (23)
  • data (43)
  • data cleaning (25)
  • Data Cleaning Week (23)
  • datan avaaminen (23)
  • datanhallinta (58)
  • datasiivous (25)
  • Datasiivousviikko (21)
  • Datasupport (51)
  • Data Support (41)
  • Datatuki (47)
  • DMP (35)
  • Elsevier (22)
  • EU (25)
  • FAIR (31)
  • gold OA (30)
  • green OA (45)
  • HELDA (45)
  • Helda Open Books (28)
  • hybrid OA (22)
  • julkaisuarkistot (41)
  • kirjoittajamaksut (28)
  • metadata (28)
  • open access (148)
  • open data (20)
  • open science (58)
  • plan S (34)
  • RDM (58)
  • repositories (23)
  • research data (25)
  • research data management (51)
  • rinnakkaisjulkaiseminen (22)
  • rinnakkaistallennus (34)
  • Suomen Akatemia (31)
  • tiedekustantajat (22)
  • tutkimusdata (34)
  • tutkimusdatanhallinta (44)

Arkisto / Archives

  • maaliskuu 2023 (7)
  • helmikuu 2023 (4)
  • tammikuu 2023 (3)
  • joulukuu 2022 (6)
  • marraskuu 2022 (1)
  • lokakuu 2022 (6)
  • syyskuu 2022 (4)
  • elokuu 2022 (2)
  • toukokuu 2022 (6)
  • huhtikuu 2022 (4)
  • maaliskuu 2022 (10)
  • helmikuu 2022 (9)
  • tammikuu 2022 (2)
  • joulukuu 2021 (6)
  • marraskuu 2021 (10)
  • lokakuu 2021 (9)
  • syyskuu 2021 (4)
  • elokuu 2021 (3)
  • kesäkuu 2021 (1)
  • toukokuu 2021 (5)
  • huhtikuu 2021 (8)
  • maaliskuu 2021 (11)
  • helmikuu 2021 (8)
  • tammikuu 2021 (6)
  • joulukuu 2020 (4)
  • marraskuu 2020 (7)
  • lokakuu 2020 (12)
  • syyskuu 2020 (12)
  • elokuu 2020 (7)
  • kesäkuu 2020 (6)
  • toukokuu 2020 (10)
  • huhtikuu 2020 (5)
  • maaliskuu 2020 (7)
  • helmikuu 2020 (4)
  • tammikuu 2020 (6)
  • joulukuu 2019 (27)
  • marraskuu 2019 (9)
  • lokakuu 2019 (16)
  • syyskuu 2019 (9)
  • elokuu 2019 (8)
  • kesäkuu 2019 (3)
  • toukokuu 2019 (8)
  • huhtikuu 2019 (5)
  • maaliskuu 2019 (6)
  • helmikuu 2019 (4)
  • tammikuu 2019 (7)
  • joulukuu 2018 (5)
  • marraskuu 2018 (4)
  • lokakuu 2018 (9)
  • syyskuu 2018 (7)
  • elokuu 2018 (6)
  • heinäkuu 2018 (3)
  • kesäkuu 2018 (5)
  • toukokuu 2018 (5)

Meta

  • Kirjaudu sisään
  • Sisältösyöte
  • Kommenttisyöte
  • WordPress.org

Think Open blog

Tietoa blogista /
About this blog

Toimitusneuvoston jäsenet /
Members of the editorial board

Kirjoittajaohjeet /
Instructions for writers

Kirjaudu sisään / Log in

Palvelun tarjoaa WordPress