Maailman verkkoarkistot

Kansalliskirjasto ei ole ainoa organisaatio, jonka uuvuttavana ja loppumattomana tehtävänä on mm. internetin sisällön kerääminen. Meitä on muitakin! Verkkoarkistoja on muodostettu ajan saatossa moniin muihin valtioihin sen väitteen turvin, että maa ei ole nykyaikainen sivistysvaltio ellei se kerää talteen ja vaali painetun kulttuurin ohella myös uutta, digitaalisessa muodossa olevaa kulttuuria (Unesco).

IIPC eli pienen joukkion tuntema International Internet Preservation Consortium on listannut sivuilleen maailman verkkoarkistot. Alan ihmisille lista on hyödyllinen, koska toistaiseksi tietoa ei ole ollut kootusti saatavilla. Aiemmin oli erikseen selvitettävä, millä kaikilla mailla verkkoarkisto on ja minkä organisaation vastuulle se kussakin maassa kuuluu.

Lue loppuun

iRODS (OR2009 5/10)

Konferenssissa esiteltiin aDORe djatokan rinnalla Integrated Rule-Oriented Data System eli tuttavallisemmin iRODS. IRODS on jatkoa Data Intensive Cyber Environments –ryhmän kehittämälle SRB:lle (Storage Resource Broker), joka sai huomiota suuria datamääriä käsittelevien organisaatioiden keskuudessa 1990-luvun lopulla. iRODS on ns. väliohjelmisto (engl. middleware), joka tarjoaa yhden liittymän useaan datavarastoon, minkä vuoksi sen avulla suuri datamäärä voidaan hajauttaa useaan varastoon ja hallita yhdestä paikasta. Tällainen datavarasto voi olla arkisto tai mikä tahansa muu digitaalinen aineiston lähde (esim. verkko, tietokanta tai tiedostojärjestelmä). Sitä voi käyttää myös ohjelmistona digitaaliarkistolle.irods Lue loppuun

Adore djatoka -kuvapalvelin (OR2009 4/10)

Los Alamosin tutkimuskirjastolla oli uutta esiteltävää tänäkin vuonna: aDORe djatoka. Itse aDORe on hieman julkaisuarkiston kaltainen digitaaliarkisto-ohjelmisto, joka ei ole juuri levinnyt Los Alamosin ulkopuolelle. Djatokalla tulee uskoakseni olemaan suurempi tilaus maailmalla.

Adore djatoka on avoimen lähdekoodin palvelinohjelmisto JPEG2000-kuvien käyttämiseen. Se ei kuulosta erikoislaatuiselta innovaatiolta, mutta tätä djatoka ei olekaan. Ohjelmisto on käytännössä kuitenkin varsin käytettävä, yksinkertainen ja nopea ratkaisu hyvin suuriresoluutioisten kuvien tarkasteluun. Tavallisesti verkossa esiintyvien kuvien käyttämiseen ei tarvitse tietenkään mitään erikoista käyttöliittymää kuvien katsomiseen saati tarkoitukseen omistettua kuvapalvelinta. Kun kuvien koko kasvaa satoihin mega- tai gigatavuihin, kuvien käyttäminen ei ole enää niin yksinkertaista. Digitoinnin tuloksena näin suuria kuvatiedostoja syntyy, kun kuvantarkkuus halutaan pitää mahdollisimman korkealaatuisena. Joitakin kaupallisia käyttöliittymätuotteita suurien kuvien käyttämiseen on, mutta niissäkin on omat rajoituksensa. Adore djatoka kehitettiin avoimen lähdekoodin vastineeksi kaupallisille tuotteille. Djatokan eduksi voi laskea myös, että sen ovat kehittäneet alan asiantuntijat, jotka tuntevat kirjastojen ja museoiden tarpeet hyvin. Lue loppuun

Digitaalisen arkiston työkalupakki (OR2009 3/10)

John Kunze kertoi omassa esityksessään suuresta DataONE-hankkeesta (Data Observation Network for Earth), jossa tuodaan yhteen eri datalähteitä kaikkeen maapalloon liittyvästä mittaus- ja tutkimusdatasta. Itse hanketta kiinnostavampi oli kuitenkin California Digital Libraryn lähestymistapa säilytykseen, josta Stephen Abrams jatkoi esityksessään ”Permanent Objects, Disposable Systems”.

Kunzen ja Abramsin mielestä  monoliittiset säilytysjärjestelmät ovat kankeita ja joustamattomia. CDL:ssä ideana on ollut kehittää mahdollisimman yksinkertaisia ja pieniä ns. mikropalveluita, joita voidaan käyttää yhdessä toteuttamaan monimutkaisempia toimenpiteitä. Lue loppuun

Artikkelin tallettaminen julkaisuarkistoon suoraan Microsoft Wordista (OR2009 2/10)

Konferenssissa esiteltiin muutamia hedelmällisiä SWORD:n ja OAI-ORE:n laajennuksia. Vielä viime vuoden konferenssissa Southamptonissa molemmat, aineiston syöttöön ja siirtoon tarkoitetut protokollat olivat uusia, ja monelle jäi epäselväksi, miten niitä voitaisiin käytännössä menestyksellisesti hyödyntää. Kiinnostavimmasta SWORD:n sovelluksesta kertoi Pablo Fernicola esityksessään. Microsoft on kehittänyt lisäosan Word 2007:aan, jolla Wordissa kirjoitettu dokumentti voidaan lähettää suoraan julkaisuarkistoihin. Artikkelien kirjoittajat voivat olla varsin tyytyväisiä tähän lisään: artikkelin julkaisuarkistoon tallettaminen on parhaimmillaan vain yhden hiirenpainalluksen päässä. Parhaimmillaan julkaisun tallettamisen kynnys alenee, kun kirjoittajan ei tarvitse opetella käyttämään ja muistaa käyttää taas yhtä uutta järjestelmää eli julkaisuarkistoa julkaisunsa tallettamiseen. Lue loppuun

Open Repositories 2009 (OR2009 1/10)


Atlanta skyline

Järjestyksessään neljäs Open Repositories (OR) järjestettiin Atlantassa toukokuussa. OR kokoaa yhteen avoimella lähdekoodilla toimivien julkaisuarkistojen käyttäjiä esittelemään ja kuulemaan alan viimeisimpiä kuulumisia. Vakiintuneeseen tapaan tilaisuudet koostuivat sekä kolmen käyttäjäryhmän (DSpace, E-Prints ja Fedora) erillisistä että yhteisistä tilaisuuksista. Yhteisten tilaisuuksien aiheina olivat mm. pitkäaikaissäilytys, tekijänoikeudet, avoin tutkimusdata ja oppimisympäristöt ja niiden suhde julkaisuarkistoihin. Osallistuimme yhteisten tilaisuuksien lisäksi DSpace-käyttäjäryhmän omiin tilaisuuksiin, minkä vuoksi keskitymme näiden kolmen julkaisuarkisto-ohjelmiston esityksistä DSpacea käsitteleviin esityksiin.

Luvassa on yhdeksänosainen kirjoitussarja konferenssin esityksistä. Alla on ”sisällysluettelo” merkinnöissä käsiteltävistä aiheista:

Kaikki konferenssissa pidetyt esitykset löytyvät tapahtumaa Atlantassa isännöineen Georgia Techin julkaisuarkistosta. Ohjelma taas tapahtuman kotisivulta.

Planets ja käytännön harjoitteita pitkäaikaissäilytyksessä

planets_logo

EU:n rahoittaman suurhankkeen PLANETS:n tuloksia on odotettu hartaasti sen käynnistymisvuodesta 2006 alkaen. Hankkeen ensimmäisessä koulutustilaisuudessa Kööpenhaminassa oli mahdollista saada ensikäden tietoa siitä, mitä hankkeeseen laitetulla 14 miljoonalla eurolla on saatu aikaan. Olin paikalla koko tilaisuuden ajan eli yhteensä kolme päivää.

PLANETS-hanke (eli Preservation and Long-term Access Through NETworked Services) on kooltaan massiivinen, siihen kuuluu 16 organisaatiota, joista useat – mm. British Library, Hollannin kansalliskirjasto ja Glasgow’n yliopiston HATII – ovat hyvin kokeneita digitaalisen aineiston säilyttäjiä. PLANETS julkaisee vuoden kuluttua hankkeen päättyessä tuloksensa, joista tärkeimmät ovat

  • PLATO – työkalu säilytyksen suunnitteluun
  • XCDL – Digitaalisten objektien kuvauskieli
  • Palvelut digitaalisten objektin migraatioon ja emulaatioon

Kaikki PLANETS:n tuotokset tulevat olemaan vapaasti käytettäviä avoimen lähdekoodin ohjelmistoja. Tarkastelen tässä merkinnässä yhtä näistä tuotoksista, nimittäin Platoa, joka on tuloksista ehkä kiinnostavin.

Lue loppuun

Mitä se olikaan mitä teet työksesi?

Asiat voidaan esittää monella tavalla. DPE:lla lienee ollut hauskaa, kun ovat saaneet aikaan seuraavan animaation.

Team Digital Preservation

 

Animaatio on sarjan ensimmäinen osa. Tulevat animaatiot julkaistaan DPE:n “YouTube-kanavalla”.

Minulle tuli mieleen lapsille tehty valistusanimaatio hammaspeikosta ja hammaslääkäristä. Mutta onhan animaatio hauska, ehkä näin lapset innostuvat ja toivovat olevansa isona ei palomiehiä ja lääkäreitä, vaan kansalliskirjaston setiä ja tätejä. Tai sitten digitaalisen pitkäaikaissäilytyksen sanoman ymmärtää useampi, ei välttämättä oma lapsi, vaan myös kanssaihmiset.

UDFR – tuo uusi tiedostomuotorekisteri

Monelleko on tuttu käsite “tiedostomuotorekisteri”? Luultavasti harvalle, mutta digitaalisessa pitkäaikaissäilytyksessä niillä on oma, merkittävä roolinsa – ainakin periaatteessa, kuten myöhemmin selviää.

Tavallisen tietokoneen käyttäjän huolena on lähinnä se, onko hänellä tarvittavaa ohjelmaa lukea ja käsitellä esimerkiksi sukujuhlista otettuja digivalokuvia tai miten hän voi avata ystävän lähettämän uuden XML-pohjaisen Microsoft Office -tiedoston joitakin vuosia vanhalla Microsoft Officellaan.

Tiedostoja vuosikymmeniä tai vuosisatoja säilyttävän tahon huolenaiheena on puolestaan se, miten säilytettäviä tiedostoja voidaan käyttää teknologian muuttuessa. Ohjelmistot ja käyttöjärjestelmät, laitteistoja unohtamatta, korvautuvat väistämättä. Säilyttäjän on oltava perillä tiedostojen teknisistä ominaisuuksista, millä ohjelmistolla ne on luotu, miten niitä voidaan käsitellä ja niin edelleen. Tiedostomuotorekistereihin kerätään tällaista tietoa säilyttäviä tahoja varten. Tämän johdatuksen jälkeen voidaankin siirtyä varsinaisen asian pariin. Lue loppuun