iRODS (OR2009 5/10)

Konferenssissa esiteltiin aDORe djatokan rinnalla Integrated Rule-Oriented Data System eli tuttavallisemmin iRODS. IRODS on jatkoa Data Intensive Cyber Environments –ryhmän kehittämälle SRB:lle (Storage Resource Broker), joka sai huomiota suuria datamääriä käsittelevien organisaatioiden keskuudessa 1990-luvun lopulla. iRODS on ns. väliohjelmisto (engl. middleware), joka tarjoaa yhden liittymän useaan datavarastoon, minkä vuoksi sen avulla suuri datamäärä voidaan hajauttaa useaan varastoon ja hallita yhdestä paikasta. Tällainen datavarasto voi olla arkisto tai mikä tahansa muu digitaalinen aineiston lähde (esim. verkko, tietokanta tai tiedostojärjestelmä). Sitä voi käyttää myös ohjelmistona digitaaliarkistolle.irods Continue reading

Digitaalisen arkiston työkalupakki (OR2009 3/10)

John Kunze kertoi omassa esityksessään suuresta DataONE-hankkeesta (Data Observation Network for Earth), jossa tuodaan yhteen eri datalähteitä kaikkeen maapalloon liittyvästä mittaus- ja tutkimusdatasta. Itse hanketta kiinnostavampi oli kuitenkin California Digital Libraryn lähestymistapa säilytykseen, josta Stephen Abrams jatkoi esityksessään ”Permanent Objects, Disposable Systems”.

Kunzen ja Abramsin mielestä  monoliittiset säilytysjärjestelmät ovat kankeita ja joustamattomia. CDL:ssä ideana on ollut kehittää mahdollisimman yksinkertaisia ja pieniä ns. mikropalveluita, joita voidaan käyttää yhdessä toteuttamaan monimutkaisempia toimenpiteitä. Continue reading

Planets ja käytännön harjoitteita pitkäaikaissäilytyksessä

planets_logo

EU:n rahoittaman suurhankkeen PLANETS:n tuloksia on odotettu hartaasti sen käynnistymisvuodesta 2006 alkaen. Hankkeen ensimmäisessä koulutustilaisuudessa Kööpenhaminassa oli mahdollista saada ensikäden tietoa siitä, mitä hankkeeseen laitetulla 14 miljoonalla eurolla on saatu aikaan. Olin paikalla koko tilaisuuden ajan eli yhteensä kolme päivää.

PLANETS-hanke (eli Preservation and Long-term Access Through NETworked Services) on kooltaan massiivinen, siihen kuuluu 16 organisaatiota, joista useat – mm. British Library, Hollannin kansalliskirjasto ja Glasgow’n yliopiston HATII – ovat hyvin kokeneita digitaalisen aineiston säilyttäjiä. PLANETS julkaisee vuoden kuluttua hankkeen päättyessä tuloksensa, joista tärkeimmät ovat

  • PLATO – työkalu säilytyksen suunnitteluun
  • XCDL – Digitaalisten objektien kuvauskieli
  • Palvelut digitaalisten objektin migraatioon ja emulaatioon

Kaikki PLANETS:n tuotokset tulevat olemaan vapaasti käytettäviä avoimen lähdekoodin ohjelmistoja. Tarkastelen tässä merkinnässä yhtä näistä tuotoksista, nimittäin Platoa, joka on tuloksista ehkä kiinnostavin.

Continue reading

Perinteellisten kansien vakauttamisen ja säilytyksen tutkimusohjelman digitaalikirjasto?

Fakkiterminologia on vaikeaa. Oltuani jo toista vuotta mukana työryhmässä, joka kääntää pitkäaikaissäilytysarkiston viitemallia (OAIS) suomeksi, tiedän että alan terminologia on todella kimuranttia ammattilaisillekin. Kateeksi ei siis käy maallikoita, joiden pitäisi yrittää näitä asioita jotenkin ymmärtää.

Pahimpaan rakoon on joutunut hollantilainen käännöstoimisto, joka on saanut tehtäväkseen kääntää kaikki Euroopan kansalliskirjastojen yhteisportaaliin The European Libraryyn liitettyjen kansallisten kokoelmien kuvaukset kaikkiaan 27 eri kielelle. Slovakian kansalliskirjasto on asettanut tarjolle pitkäaikaissäilytyshankkeen puitteissa rakennetun digitaalisen kokoelman Memoria slovacan, jonka (tsekistä käännetty?) englanninkielinen kuvaus kuuluu: “Digital library of the research programme for stabilisation and preservation of traditional carriers”. Maallikkokääntäjä on saanut siitä tuotettua suomennoksen “Perinteellisten kansien vakauttamisen ja säilytyksen tutkimusohjelman digitaalikirjasto”. Continue reading

Palkinto luvassa vanhimmille musasivuille

Osoitteessa http://www.jazzpoparkisto.net/varhainen_musiikkinetti.php on lisätietoja Suomen Jazz & Pop Arkisto JAPAn julistamasta kilpailusta. JAPA etsii Suomen ensimmäistä musiikkiesiintyjän kotisivua osana projektia, jossa kerätään talteen musiikkialan varhaisia nettisisältöjä. Vaikka aineisto ei enää ole verkossa, sitä saattaa löytää levykkeiltä ja kovalevyjen uumenista.  Palkinnoksi on luvassa 20 tuntia äänitedigitointia tai vastaava määrä muuta digitointipalvelua sekä JAPAn levyjä ja kirjoja.

Mitäs sitä silloin kuunneltiinkaan, kun isoisä WWW:n osti? Tätäkö?

Mitä se olikaan mitä teet työksesi?

Asiat voidaan esittää monella tavalla. DPE:lla lienee ollut hauskaa, kun ovat saaneet aikaan seuraavan animaation.

Team Digital Preservation

 

Animaatio on sarjan ensimmäinen osa. Tulevat animaatiot julkaistaan DPE:n “YouTube-kanavalla”.

Minulle tuli mieleen lapsille tehty valistusanimaatio hammaspeikosta ja hammaslääkäristä. Mutta onhan animaatio hauska, ehkä näin lapset innostuvat ja toivovat olevansa isona ei palomiehiä ja lääkäreitä, vaan kansalliskirjaston setiä ja tätejä. Tai sitten digitaalisen pitkäaikaissäilytyksen sanoman ymmärtää useampi, ei välttämättä oma lapsi, vaan myös kanssaihmiset.

UDFR – tuo uusi tiedostomuotorekisteri

Monelleko on tuttu käsite “tiedostomuotorekisteri”? Luultavasti harvalle, mutta digitaalisessa pitkäaikaissäilytyksessä niillä on oma, merkittävä roolinsa – ainakin periaatteessa, kuten myöhemmin selviää.

Tavallisen tietokoneen käyttäjän huolena on lähinnä se, onko hänellä tarvittavaa ohjelmaa lukea ja käsitellä esimerkiksi sukujuhlista otettuja digivalokuvia tai miten hän voi avata ystävän lähettämän uuden XML-pohjaisen Microsoft Office -tiedoston joitakin vuosia vanhalla Microsoft Officellaan.

Tiedostoja vuosikymmeniä tai vuosisatoja säilyttävän tahon huolenaiheena on puolestaan se, miten säilytettäviä tiedostoja voidaan käyttää teknologian muuttuessa. Ohjelmistot ja käyttöjärjestelmät, laitteistoja unohtamatta, korvautuvat väistämättä. Säilyttäjän on oltava perillä tiedostojen teknisistä ominaisuuksista, millä ohjelmistolla ne on luotu, miten niitä voidaan käsitellä ja niin edelleen. Tiedostomuotorekistereihin kerätään tällaista tietoa säilyttäviä tahoja varten. Tämän johdatuksen jälkeen voidaankin siirtyä varsinaisen asian pariin. Continue reading

Päivä ministeriössä (eli mitä ihmiset tekevät)

Maanantaina allekirjoittanut vietti kokonaisen työpäivän Meritullinkadulla opetusministeriössä Kansallinen digitaalinen kirjasto -hankkeen äärellä. Ensin aamupäivällä kokoontui kokonaisarkkitehtuurityöryhmä, ja iltapäivällä oli pitkäaikaissäilytysjaoston vuoro. Hankkeen tiedotus on vieläkin jotensakin niukkaa, mutta lyhyesti sanoen kyseessä on iso projekti, jossa luodaan yhteisiä palveluita koko muistiorganisaatioiden kentälle, siis kirjastoille, arkistoille ja museoille. Continue reading

Hallintaa, säilytystä vai molempia?

Ohjelmistoyhtiö Ex Libriksellä on merkittävä rooli suomalaisten tiedekirjastojen toiminnassa. Sieltä tulee kirjastojärjestelmä Voyager, yhteisluettelo Lindan käyttämä Aleph-ohjelmisto sekä Nelliportaalin pohjalla olevat MetaLib ja SFX. Ohjelmistojen ajankohtaisia asioita käsitellään vuosittain “System Seminarissa”, ennen kaikkea systeeminhoitajille ja kehittäjille suunnatussa tapahtumassa. Continue reading