Miten siivous sujui? Pieni yhteenveto jouluisesta Datasiivousviikosta

Joulukuun Datasiivousviikko tuli ja meni, mitä jäi käteen – tuhottiinko turha data, virtaviivaistuvatko kansiorakenteet? Tässä blogiartikkelissa kuusi Datasiivousviikkoon osallistunutta yliopistolaista kertoo, miten he onnistuivat siivoushaasteissa. Helsingin yliopiston Datatuki järjesti Datasiivousviikon nyt toista kertaa, ja jatkoa on luvassa. Kaikki yliopistolaiset tutkijoista opettajiin, opiskelijoihin ja hallinnon väkeen ovat tervetulleita kertomaan, miten Datasiivousviikosta voisi tehdä vielä paremman.

Helsingin yliopiston Datatuen järjestämä Datasiivousviikko joulunalusviikolla 16.–20. joulukuuta kiinnitti huomiota datanhallinnan arkisiin asioihin, kuten datan tallentamiseen ja tuhoamiseen, tiedostorakenteisiin sekä kansioiden ja tiedostojen nimeämiseen. Kaikki Datasiivousviikon artikkelit ja videot on koottu Helsinki.fi-sivulle.

Tiedustelimme muutamilta Datasiivoukseen osallistuneilta, miten datasiivous sujui, oliko datanhallintaan tarkoitetusta 5S-metodista hyötyä ja miten Datasiivousviikkoa voisi kehittää.

”Datasiivousviikko meni tehokkaasti dataa siivotessa”

Helsingin yliopiston tutkija Anna-Stiina Suur-Uski (TUHAT, ORCID) haastoi Datasiivousviikolla itsensä puhdistamaan läppärin, jonne oli kasaantunut turhaa dataa (ks. Suur-Uskin siivoushaaste ja video).

”Datasiivousviikko meni tehokkaasti dataa siivotessa. Lopulta läppärin siivoaminen jäi toiseen kertaan (alkuperäinen haaste), kun CSC:n Taito-supertietokone poistuikin vuoden vaihteessa käytöstä. Kävimme läpi ja siivosimme vuosien aikana projektilevylle kertyneen materiaalin, sekä siirsimme tarvittavat datat talteen uuteen CSC:n Allas-järjestelmään. 5S-metodi teki työskentelystämme tehokasta, ja saimme Datasiivousviikon aikana puristettua lähtötilanteen noin 46 Teraa hyvin kompaktiksi ja helposti hallittavaksi kokonaisuudeksi”, Suur-Uski kertoo.

CSC:n palveluissa tapahtuneet muutokset – datan siirto Taito-järjestelmästä Puhtiin – vaikuttivat myös tohtoriopiskelija Aleksi Husson (TUHAT, ORCID) Datasiivousviikkoon, jonka aikana hän haastoi itsensä huolehtimaan erityisesti varmuuskopioinnista (ks. Husson siivoushaaste ja video).

”Datasiivousviikko tuli tarpeeseen erityisesti yliopiston käyttöjärjestelmäpäivityksen ja CSC:n isojen muutosten johdosta. 5S-järjestelmä on hyvä, mutta itse koen, että oma sovellettu järjestelmäni toimii paremmin kuin valmis standardi. Datasiivousviikko on mielestäni hyvä muistutus ainakin kerran vuodessa käydä järjestelmällisesti kaikki tiedostot läpi”, Husso kertoo.

Anu Lahtinen kertoo: ”Fyysisestä datan siivouksesta kertovat kaksi oheista kuvaa: yhtäältä hyllyssä on nättiä kuin missä, kun sain kirjaston poistokoteloita ja tuunasin työhuonettani yhdellä iskulla vihreämmäksi. Toisaalta homma jäi vielä vähän vaiheeseen, kuten lattialla olevat, vielä toimenpiteitä odottavat kotelot osoittavat. (Osa niistä siirtyi kyllä jo hyllyyn kuvan ottamisen jälkeen.) ’Kauhea joskin on puhdistustyömme…’ Eräs väitöskirjantekijä tuli jo sanomaan: ’Älä nyt kuitenkaan liikaa siivoa, kun tää sun huone on oma ilmiönsä.’ Luulen, että vähän voin kuitenkin vielä raivata.”.

Topeliassa oli meneillään tietokoneiden vaihto, joka tarjosi historiantutkija ja -opettaja Anu Lahtiselle (TUHAT, ORCID) tilaisuuden datasiivoukseen: eri tallennusalustoilla olevan datan siivoamiseen ja järjestämiseen (ks. Lahtisen siivoushaaste ja video).

”Datasiivous sujui sinänsä suht hyvin, kun uuden tietokoneen saapuminen antoi motiivia järjestellä dokumentteja, mutta kyllähän se vähän kesken taas jäi. Kaikenlaisia harhautuneita bittikokonaisuuksia ja paperinippuja tuli kuitenkin hävitettyä oikein tehokkaasti. Viiden ässän kohdasta systematisointi on ollut aiemminkin aika pitkällä, mutta aineisto on siinä mielessä aika henkilökohtaista, että menettelyt pysyvät ennen kaikkea omassa käytössä, mutta toki jaetaan kokemuksia ja menettelyjä. Joissakin hankkeissa minulla on ollut itselläni apuna arkistoalan asiantuntija, joka on miettinyt aineistolle valmiiksi ns. arkistokaavan eli sen, miten aineistot ryhmitellään ja talletetaan.”

”Datani olikin kuin venäläinen maatuska, mutta loputon sellainen”

Helsingin yliopiston kirjaston tietoasiantuntija ja Datatuen asiantuntija Tanja Lindholm (TUHAT, ORCID) haastoi itsensä tuhoamaan tarpeettomat tiedostot ja luomaan selkeän kansiorakenteen (ks. Lindholmin siivoushaaste ja video).

”Omalla kohdallani otin liian suuren tehtävän ja uuvuin heti alussa loputtomien kansioiden ja turhien tiedostojen kanssa. Jokaisen kansion sisältä paljastui taas uusia kansioita, joiden sisällä taas uusia kansioita sekä irrallisia tiedostoja. Datani olikin kuin venäläinen maatuska, mutta loputon sellainen. Lupaan kuitenkin yrittää mahdollisimman pian uudestaan, sillä erotuksella, että tällä kertaa olen varautunut siihen, mitä ulkoinen kovalevyni pitää sisällään”, Lindholm kertoo ja jatkaa:

”5S-metodi on todella toimiva metodi, vaikka itse en päässytkään alkua pidemmälle. Joitain uusia järkeviä kansiorakenteita sain luotua, mutta ne vielä odottavat lopullista sisältöään. Tähän palaan ja tätä käytän!”

Jokaisen kansion sisältä paljastui taas uusia kansioita, joiden sisällä taas uusia kansioita sekä irrallisia tiedostoja. Datani olikin kuin venäläinen maatuska, mutta loputon sellainen.

Helsingin yliopiston tutkija ja Tieteen termipankin geologian aihealueen koordinaattori Elina Lehtonen (TUHAT) vältti suururakan hankaluudet rajoittamalla siivoushaasteensa väliaikaisen datan säilytyskeinojen pohtimiseen (ks. Lehtosen siivoushaaste ja video).

”Datasiivous sujui hyvin. Valitsin yhden selkeän kehityskohteen, joka tuli toteutettua loppujen lopuksi aika pienellä vaivalla, kun ei datansiivouskeskittyminen hajaantunut moneen eri kokonaisuuteen – tai koko tietokoneeseen. Samaa yhden projektikansion järjestämisjumppaa olen jatkanut myös sen jälkeen ja toivon että kovalevy järjestyy pikkuhiljaa kokonaisuutena toimivaksi kokonaisuudeksi. 5S-metodi oli käyttökelpoinen. Eniten yllätti se, kuinka paljon tarpeettomiksi jääneitä tiedostoja jää lojumaan kansioiden nurkkiin.

Samaa yhden projektikansion järjestämisjumppaa olen jatkanut myös sen jälkeen ja toivon että kovalevy järjestyy pikkuhiljaa kokonaisuutena toimivaksi kokonaisuudeksi.

Tietokanta-asiantuntija ja koordinaattori Bess Hardwick (TUHAT) REC-tutkimuskeskuksesta (Research Centre for Ecological Change) haastoi itsensä poistamaan turhan datan koneelta (ks. Hardwickin siivoushaaste ja video).

”Se toimi, pääsin eroon seitsemästä gigasta tarpeetonta dataa sen puolen tunnin aikana, joka minulla oli käyttää tähän. Pääsin [5S-metodissa] vain ensimmäiseen kohtaan (Sorteeraus) asti. Koko 5S:n toteuttaminen on pidemmän aikavälin projekti, kun ottaa huomioon paljonko dataa minulla on. Mutta tulen tekemään sen, se kuulostaa hyvin zeniläiseltä!” Hardwick toteaa.

”Lisää näkyvyyttä hyvälle asialle”

Siivoustempaukseen tavalla tai toisella osallistuneet ovat antaneet Datatuelle myös ehdotuksia Datasiivousviikon kehittämiseksi:

  1. Tiedotus: Datasiivousviikko keräsi mukavasti huomiota sosiaalisessa mediassa ja Flammassakin, mutta yliopistolaisten tavoittamiseen on syytä jatkossa keksiä uusia keinoja, kuten Anna-Stiina Suur-Uski toteaa: ”Ilman Mekkiä [tietoasiantuntija Mari Elisa Kuusniemi] tieto Datasiivousviikosta ei olisi tavoittanut meidän kulmaamme yliopistolla, eli edelleen lisää näkyvyyttä hyvälle asialle?” Tai kuten Anu Lahtinen asian muotoilee: ”Datansiivousviikko vaatisi varmaan etukäteispohjustusta, vaikkapa tuon 5S-kaavion jakoa etukäteen kuvina esimerkiksi Twitterissä.”
  2. Ajankohta ja kesto: Viikko on lyhyt datan järjestämiseen, ja Datasiivousviikon perimmäisenä tavoitteena onkin tehdä datanhallinnasta niin arkinen asia, ettei erillisiä kampanjoita tarvita. Mutta sitä ennen on hyvä miettiä, voisiko datasiivoustempausta laajentaa: ”En tiedä, onko datansiivouskuukausi liian pitkä aika (huipentuen vaikka datansiivousviikkoon), mutta ehkä vuodessa voisi olla vaikka kaksi datansiivousviikkoa (toinen ennen kesälomia ja kenttäkausia).” Ajankohtana tammikuuta ehdotettiin parissakin vastauksessa, koska vuoden loppu on erittäin kiireistä aikaa: ”Ennen vuodenvaihdetta on aina monenmoista kyseisen vuoden puolella hoidettavaa asiaa. Ehkä ehdottaisin ajankohdaksi mieluummin ihan alkuvuotta, kun silloin monet ovat henkisesti muutenkin ’uusien’ asioiden kynnyksellä ja mahdollisesti tehneet/tekemässä muunkinlaisia uuden vuoden lupauksia ja niitä toteuttamassa”, eräs kommentoija totesi.
  3. Vastausten joukossa oli myös useita kiinnostavia konkreettisia sisältöehdotuksia Datasiivousviikolle (tai Datasiivouskuukaudelle) – tässä muutamia:
    • ”Pidempään datansiivoukseen voisi kannustaa (ehkä) esimerkiksi keksimällä 30 päivän haasteen, jossa on joka päivälle joku datansiivousidea, jonka toteuttamiseen menee lyhyt aika. Tuollaisen A4:n, josta voi edistymistään raksia, voisi sitten printata vaikka työhuoneen seinälle”, Elina Lehtonen hahmottelee.
    • ”Voisiko datansiivousviikolla tarjota myös konkreettisia ohjeita datan järjestämiseen esimerkkien kautta. Millainen on esimerkiksi toimiva kansiorakenne? Toki tämä riippuu aina projektista, mutta voisi olla vaikka hypoteettinen esimerkki siitä miten järjestää tutkimusprojektin/opinnäytetyön kansio. Tästä voisi olla apua yliopistolaisille aina kandiopiskelijoista tutkijoihin”, Elina Lehtonen ehdottaa. Joitain ohjeita ja esimerkkejä aloittelijoille löytyy 5S-ohjesivulta ja Datanhallinnan perusoppaasta. Näitä Lehtonen nostaisi enemmän esiin, ja kannustaisi erityisesti kuvallisiin esimerkkeihin: ”Kuvalliset ohjeet toimivasta kansiorakenteesta voisi tukea sanallisia ohjeita. Infograafeihin on myös kiireellisemmässäkin hetkessä helpompi tarttua.”
    • Bess Hardwick ehdottaa datasiivoukseen liittyvien haastetehtävien konkretisoimista ja rajaamista: ”Ehkä mukana pitäisi olla todella matalan tason haaste, kuten ’paljonko dataa ehdit poistamaan puolessa tunnissa?'”
    • Ideoita datasiivoamisen hyvien käytänteiden levittämiseksi tarvittaisiin myös – niitä voisi tuoda paremmin esiin Datasiivousviikon yhteydessä: ”Toivoisin, että ne joiden data on siistiä, innostaisivat kollegoitaan mukaan ja järjestäisivät pieniä datasiivoustapahtumia datansiivousviikon aikana”, Tanja Lindholm sanoo.

Keskusteluun Datasiivousviikosta voivat osallistua muutkin – joko tämän blogipostauksen kommenttiketjussa, Twitterissä (hashtagilla #5sdata) tai vaikka lähettämällä sähköpostia suoraan Datatuelle: datasupport@helsinki.fi.

Datasiivousviikon 2019 mainos kutsui yliopistolaisia joulusiivoukseen.