Ranskan kansalliskirjasto Googlen kelkkaan

Uunituore uutinen kertoo, että Ranskan kansalliskirjasto eli Bibliothèque Nationale de France on päässyt Googlen kanssa sopimukseen kokoelmiensa digitoinnista.

Uutinen tuntuu äkkiseltään yllättävältä, sillä Ranska on ollut yksi aktiivisimmista Google-kriitikoista, ja muutama vuosi sitten saman kirjaston silloinen johtaja Jean-Noël Jeanneney kirjoitti jopa Google-kriittisen pamfletin, “Google and the Myth of Universal Knowledge”  (vapaasti saatavilla – kuinkas muuten – Google Booksin kautta), josta Riippumaton asiantuntija juuri muutama viikko sitten julkaisi ansiokkaan arvion. Jeanneney visioi Googlelle kilpailijaksi eurooppalaisten muistiorganisaatioiden yhteistä verkkopalvelua, joka on sittemmin toteutunutkin Europeana-nimisenä. Lue loppuun

TDL ja keskitetyn julkaisuarkistotoiminnan ratkaisuja (OR2009 10/10)

Texas Digital Library (TDL) on Teksasin yliopistojen konsortio, jonka tarkoituksena on huolehtia jäsentensä digitaalisten tuotosten pitkäaikaissäilytyksestä ja jakamisesta Open Access-periaatteella. Toimintaa pyritään tehostamaan sekä taloudellisesti että laadullisesti: Kulut, tekniset resurssit ja suunnittelutyö jaetaan yhdessä. Sen sijaan, että jokainen yliopisto suunnittelisi ja ylläpitäisi omia järjestelmiään, pyritään löytämään yhdessä parhaat ratkaisut ja käyttämään niitä mahdollisimman yhdenmukaisesti. Lopputuloksen toivotaan olevan loppukäyttäjän kannalta selkeämpää, kun useamman yliopiston materiaalit löytyvät yhdestä paikasta ja yhtenäisesti kuvailtuna. Palvelukokonaisuuden kaksi keskeistä komponenttia ovat keskitetty julkaisuarkisto sekä syöttö- ja hallinnointijärjestelmä Vireo. Lue loppuun

Tulevaa DSpace-rintamalta (OR2009 9/10)

Open Repositories -konferenssissa kuultiin uutisia mm. uusista, tulossa olevista DSpace-versioista, joista etenkin alkuvuodesta 2010 lupailtu DSpace 2.0 tuo mukanaan perustavanlaatuisia  muutoksia koko ohjelmiston rakenteeseen ja toimintaan. Lue loppuun

Kevyttä ja nopeasti (OR2009 8/10)

Useammassa Open repositories -konferenssin esityksessä kannustettiin käyttämään julkaisuarkistojen teknisessä kehitystyössä kevyitä ja helposti mukautuvia ratkaisuja. Aiheesta oli jopa erillinen esityskin, Matt Zumwalt esitteli nopean sovelluskehityksen (rapid application development, RAD) ideaa. Motiivina esityksessä on toteamus, että data on tärkeää, ei niinkään sitä käsittelevät ohjelmat. ”Avoin data on tärkeämpää kuin avoin lähdekoodi”. Ohjelmien on tarkoitus toimia ikkunana dataan. Nämä ikkunat ovat usein elinkaareltaan lyhyitä, arkistoissa majaileva data sen sijaan usein pitkäikäistä. Sovellukset muuttuvat eri aikojen ja käyttötarkoitusten mukaan ja tämän vuoksi on järkevää olla rakentamatta monoliittista sovellusta, jota on vaikea tai mahdoton mukauttaa nopeasti uusia tarpeita vastaavaksi. Lue loppuun

Cloud Computing ja julkaisuarkistot (OR2009 7/10)

Cloud computing on suhteellisen uusi termi, jolla tarkoitetaan tietotekniikkapalveluiden ulkoistamista verkon yli. Palvelut voivat olla mm. sovelluksia tai tallennustilaa. Cloud computing -palvelu on dynaamisesti skaalautuva ja verkon ylitse käytettävissä. Sen etuja ovat mm. palvelinylläpitoon liittyvien tehtävien ulkoistaminen verkossa olevaan ”pilveen”. Käyttäjän ei tarvitse huolehtia ulkoistettavien palveluiden osalta palvelimien raudan tai sovellusten päivityksestä, tietoturvasta, varmistuksista yms. ylläpidollisista seikoista. Cloud computing termiin yhdistetään usein myös joustava hinnoittelu; monesti palveluista maksetaan vain käytön mukaan. Sovelluksia voidaan tyypillisesti käyttää selaimella, jolloin ne eivät vaadi työasemilta mitään spesiaalia. Lue loppuun

DSpace ja Fedora hallinnolliseen yhteistyöhön (OR2009 6/10)

DSpace Foundation ja Fedora Commons liittävät voimansa yhteen heinäkuussa 2009 toimintansa aloittavan DuraSpace-organisaation muodossa. Yhdistymisellä haetaan massaa rahoituksen ja kehityksen tueksi ja pyritään edistämään yhteisiä innovaatioita ja muuta yhteistyötä kilpailun sijasta. DSpace ja Fedora pysyvät silti erillisinä sovelluksina hamaan tulevaisuuteen, elleivät aina. Molemmista sovelluksista puuttuvia ominaisuuksia pyritään kuitenkin tekemään jatkossa yhteistyössä.

DuraSpacen alla tulee toimimaan tiimejä eri tehtävissä, kuten Fedora Repository-, DSpace-, Mulgara- ja Duraspace Team. Kaksi ensimmäistä tiimiä jatkavat olemassa olevien sovellusten kehittämistä. Mulgara team keskittyy samalla nimellä kulkevan RDF-tietokannan kehittämiseen. Mulgarassa tieto mallinnetaan tripleinä (subjekti-objekti-predikaatti). Tätä mallinnustapaa pidetään relaatiomallia sopivampana julkaisuarkistoille, joissa on usein monimutkaisia suhteita objektien välillä. DuraCloudista kerrotaan tarkemmin seuraavassa merkinnässä.

iRODS (OR2009 5/10)

Konferenssissa esiteltiin aDORe djatokan rinnalla Integrated Rule-Oriented Data System eli tuttavallisemmin iRODS. IRODS on jatkoa Data Intensive Cyber Environments –ryhmän kehittämälle SRB:lle (Storage Resource Broker), joka sai huomiota suuria datamääriä käsittelevien organisaatioiden keskuudessa 1990-luvun lopulla. iRODS on ns. väliohjelmisto (engl. middleware), joka tarjoaa yhden liittymän useaan datavarastoon, minkä vuoksi sen avulla suuri datamäärä voidaan hajauttaa useaan varastoon ja hallita yhdestä paikasta. Tällainen datavarasto voi olla arkisto tai mikä tahansa muu digitaalinen aineiston lähde (esim. verkko, tietokanta tai tiedostojärjestelmä). Sitä voi käyttää myös ohjelmistona digitaaliarkistolle.irods Lue loppuun

Adore djatoka -kuvapalvelin (OR2009 4/10)

Los Alamosin tutkimuskirjastolla oli uutta esiteltävää tänäkin vuonna: aDORe djatoka. Itse aDORe on hieman julkaisuarkiston kaltainen digitaaliarkisto-ohjelmisto, joka ei ole juuri levinnyt Los Alamosin ulkopuolelle. Djatokalla tulee uskoakseni olemaan suurempi tilaus maailmalla.

Adore djatoka on avoimen lähdekoodin palvelinohjelmisto JPEG2000-kuvien käyttämiseen. Se ei kuulosta erikoislaatuiselta innovaatiolta, mutta tätä djatoka ei olekaan. Ohjelmisto on käytännössä kuitenkin varsin käytettävä, yksinkertainen ja nopea ratkaisu hyvin suuriresoluutioisten kuvien tarkasteluun. Tavallisesti verkossa esiintyvien kuvien käyttämiseen ei tarvitse tietenkään mitään erikoista käyttöliittymää kuvien katsomiseen saati tarkoitukseen omistettua kuvapalvelinta. Kun kuvien koko kasvaa satoihin mega- tai gigatavuihin, kuvien käyttäminen ei ole enää niin yksinkertaista. Digitoinnin tuloksena näin suuria kuvatiedostoja syntyy, kun kuvantarkkuus halutaan pitää mahdollisimman korkealaatuisena. Joitakin kaupallisia käyttöliittymätuotteita suurien kuvien käyttämiseen on, mutta niissäkin on omat rajoituksensa. Adore djatoka kehitettiin avoimen lähdekoodin vastineeksi kaupallisille tuotteille. Djatokan eduksi voi laskea myös, että sen ovat kehittäneet alan asiantuntijat, jotka tuntevat kirjastojen ja museoiden tarpeet hyvin. Lue loppuun

Digitaalisen arkiston työkalupakki (OR2009 3/10)

John Kunze kertoi omassa esityksessään suuresta DataONE-hankkeesta (Data Observation Network for Earth), jossa tuodaan yhteen eri datalähteitä kaikkeen maapalloon liittyvästä mittaus- ja tutkimusdatasta. Itse hanketta kiinnostavampi oli kuitenkin California Digital Libraryn lähestymistapa säilytykseen, josta Stephen Abrams jatkoi esityksessään ”Permanent Objects, Disposable Systems”.

Kunzen ja Abramsin mielestä  monoliittiset säilytysjärjestelmät ovat kankeita ja joustamattomia. CDL:ssä ideana on ollut kehittää mahdollisimman yksinkertaisia ja pieniä ns. mikropalveluita, joita voidaan käyttää yhdessä toteuttamaan monimutkaisempia toimenpiteitä. Lue loppuun