IGeLU09 : Ajankohtaista Rosettasta

Rosetta on Ex Libriksen pitkäaikaissäilytysjärjestelmä. Yaniv Levi esitteli sitä; tässä on referoitu esitystä tuoreeltaan ilman syvällisempää kiritiikkiä.

Rosetta otettiin käyttöön Uuden-Seelannin kansalliskirjastossa vajaa vuosi sitten, ja tulossa käyttöön Singaporen kansalliskirjastossa. Versio 2.0 on luvassa noin puolen vuoden päästä. Uudessa-Seelannissa sillä hallitaan noin puolta miljoonaa tiedostoa eli kymmentä teratavua. Continue reading

IGeLU09 : URM – yhtenäiseen aineistojen hallintaan

URM – Uniform Resource Management – on seuraavan sukupolven kirjastojärjestelmä. Kuten nimestä voi päätellä, pyrkimys on tällä kertaa kohti systeemien suurempaa yhtenäisyyttä. On ehkä liioiteltua puhua monoliittisestä järjestelmästä, mutta suurempi kurinalaisuus lienee tähtäimessä. Ilmeisesti “standardit ja avoimet rajapinnat” eivät kenties ihan sellaisenaan riitäkään nivomaan kaikkia nykyisiä järjestelmiä yhteen. Mitä enemmän data virtaa, sitä helpommin sen on virrattava. Vaikka modulaarisuus epäilemättä on tullut jäädäkseen, modulien yhteensopivuutta täytyy vaalia entistä tarkemmin.

Yksi selkeästi yhtenäistämistä kaipaava asia on painettujen, lisensoitujen sekä itse hallittujen digitaalisten aineistojen hallinta, ne kun kaikki elävät nykyään hyvin tiukasti omaa elämäänsä. Tästä syntyy kaikenlaisia hankaluuksia, kun vaikkapa Fennicassa oleva (painettu) kirja digitoidaan ja pannaan saataville johonkin toiseen järjestelmään.

Toinen merkittävä visio URMissa on paikallisen toiminnan ja laajempien kontekstien yhdistyminen. Data voi olla omaa tai yhteistä; ja palvelut voivat olla itse ylläpidettyjä tai ulkoistettuja. Samoin yhteistoiminnalla on tärkeä rooli, niin yhteistoiminnalla asiakkaiden kesken, kirjastojen kesken kuin kirjastojen ja asiakkaiden välilläkin. Continue reading

Julkinen kuuleminen Europeanan tulevaisuudesta

Euroopan komissio on käynnistänyt julkisen kuulemisen Europeana-palvelun tulevaisuudesta. Vastausaikaa on marraskuun 15. päivään 2009 asti, ja komissiota kiinnostaa kuulla näkemyksiä mm. seuraavista kysymyksistä (täydelliset kysymykset ja vastausohjeet löytyvät tästä pdf-dokumentista):

  • Kuinka voidaan varmistaa digitoidun aineiston tarjonta kuluttajille koko EU:ssa?
  • Tarvitaanko parempaa yhteistyötä kustantajien kanssa tekijänoikeussuojatun aineiston suhteen?
  • Kannattaisiko perustaa eurooppalaiset rekisterit orvoille ja loppuunmyydyille teoksille?
  • Kuinka Europeanan rahoitus tulisi hoitaa pitkällä aikavälillä?

Hyviä kysymyksiä siis. EU:n sivuilla julkaistussa uutisessa lainataan komissaari Vivienne Redingiä, joka esittää myös kriittisiä huomioita digitoinnin ja digitoitujen aineistojen saatavuuteen liittyen: Continue reading

TDL ja keskitetyn julkaisuarkistotoiminnan ratkaisuja (OR2009 10/10)

Texas Digital Library (TDL) on Teksasin yliopistojen konsortio, jonka tarkoituksena on huolehtia jäsentensä digitaalisten tuotosten pitkäaikaissäilytyksestä ja jakamisesta Open Access-periaatteella. Toimintaa pyritään tehostamaan sekä taloudellisesti että laadullisesti: Kulut, tekniset resurssit ja suunnittelutyö jaetaan yhdessä. Sen sijaan, että jokainen yliopisto suunnittelisi ja ylläpitäisi omia järjestelmiään, pyritään löytämään yhdessä parhaat ratkaisut ja käyttämään niitä mahdollisimman yhdenmukaisesti. Lopputuloksen toivotaan olevan loppukäyttäjän kannalta selkeämpää, kun useamman yliopiston materiaalit löytyvät yhdestä paikasta ja yhtenäisesti kuvailtuna. Palvelukokonaisuuden kaksi keskeistä komponenttia ovat keskitetty julkaisuarkisto sekä syöttö- ja hallinnointijärjestelmä Vireo. Continue reading

Kevyttä ja nopeasti (OR2009 8/10)

Useammassa Open repositories -konferenssin esityksessä kannustettiin käyttämään julkaisuarkistojen teknisessä kehitystyössä kevyitä ja helposti mukautuvia ratkaisuja. Aiheesta oli jopa erillinen esityskin, Matt Zumwalt esitteli nopean sovelluskehityksen (rapid application development, RAD) ideaa. Motiivina esityksessä on toteamus, että data on tärkeää, ei niinkään sitä käsittelevät ohjelmat. ”Avoin data on tärkeämpää kuin avoin lähdekoodi”. Ohjelmien on tarkoitus toimia ikkunana dataan. Nämä ikkunat ovat usein elinkaareltaan lyhyitä, arkistoissa majaileva data sen sijaan usein pitkäikäistä. Sovellukset muuttuvat eri aikojen ja käyttötarkoitusten mukaan ja tämän vuoksi on järkevää olla rakentamatta monoliittista sovellusta, jota on vaikea tai mahdoton mukauttaa nopeasti uusia tarpeita vastaavaksi. Continue reading

Cloud Computing ja julkaisuarkistot (OR2009 7/10)

Cloud computing on suhteellisen uusi termi, jolla tarkoitetaan tietotekniikkapalveluiden ulkoistamista verkon yli. Palvelut voivat olla mm. sovelluksia tai tallennustilaa. Cloud computing -palvelu on dynaamisesti skaalautuva ja verkon ylitse käytettävissä. Sen etuja ovat mm. palvelinylläpitoon liittyvien tehtävien ulkoistaminen verkossa olevaan ”pilveen”. Käyttäjän ei tarvitse huolehtia ulkoistettavien palveluiden osalta palvelimien raudan tai sovellusten päivityksestä, tietoturvasta, varmistuksista yms. ylläpidollisista seikoista. Cloud computing termiin yhdistetään usein myös joustava hinnoittelu; monesti palveluista maksetaan vain käytön mukaan. Sovelluksia voidaan tyypillisesti käyttää selaimella, jolloin ne eivät vaadi työasemilta mitään spesiaalia. Continue reading

DSpace ja Fedora hallinnolliseen yhteistyöhön (OR2009 6/10)

DSpace Foundation ja Fedora Commons liittävät voimansa yhteen heinäkuussa 2009 toimintansa aloittavan DuraSpace-organisaation muodossa. Yhdistymisellä haetaan massaa rahoituksen ja kehityksen tueksi ja pyritään edistämään yhteisiä innovaatioita ja muuta yhteistyötä kilpailun sijasta. DSpace ja Fedora pysyvät silti erillisinä sovelluksina hamaan tulevaisuuteen, elleivät aina. Molemmista sovelluksista puuttuvia ominaisuuksia pyritään kuitenkin tekemään jatkossa yhteistyössä.

DuraSpacen alla tulee toimimaan tiimejä eri tehtävissä, kuten Fedora Repository-, DSpace-, Mulgara- ja Duraspace Team. Kaksi ensimmäistä tiimiä jatkavat olemassa olevien sovellusten kehittämistä. Mulgara team keskittyy samalla nimellä kulkevan RDF-tietokannan kehittämiseen. Mulgarassa tieto mallinnetaan tripleinä (subjekti-objekti-predikaatti). Tätä mallinnustapaa pidetään relaatiomallia sopivampana julkaisuarkistoille, joissa on usein monimutkaisia suhteita objektien välillä. DuraCloudista kerrotaan tarkemmin seuraavassa merkinnässä.