Ajankohtaista julkaisuarkistoista

Julkaisuarkistoihin liittyvä uutisointi on viime aikoina jäänyt muiden kiireiden takia vähemmälle, joten tässä hieman koostetta viime aikojen tapahtumista: DSpace-ohjelmistosta on ilmestynyt uusi versio. Theseuksen käyttöönotto etenee hyvää vauhtia. Oulun yliopisto on ottamassa käyttöön Fedoraa. Itä-Suomen yliopisto on avannut julkaisuarkiston. Maailman julkaisuarkistoista on julkaistu uusi ranking-lista. Continue reading

Historialliset kartat 2.0

Tässäpä vaihteeksi ihan oikea web 2.0 -hengessä toteutettu verkkopalvelu.

Jyväskylän yliopiston Historian ja etnologian laitos on julkaissut verkossa dosentti Heikki Rantatuvan mukaan nimetyn karttakokoelman, joka löytyy osoitteesta http://www.vanhakartta.fi. Continue reading

TDL ja keskitetyn julkaisuarkistotoiminnan ratkaisuja (OR2009 10/10)

Texas Digital Library (TDL) on Teksasin yliopistojen konsortio, jonka tarkoituksena on huolehtia jäsentensä digitaalisten tuotosten pitkäaikaissäilytyksestä ja jakamisesta Open Access-periaatteella. Toimintaa pyritään tehostamaan sekä taloudellisesti että laadullisesti: Kulut, tekniset resurssit ja suunnittelutyö jaetaan yhdessä. Sen sijaan, että jokainen yliopisto suunnittelisi ja ylläpitäisi omia järjestelmiään, pyritään löytämään yhdessä parhaat ratkaisut ja käyttämään niitä mahdollisimman yhdenmukaisesti. Lopputuloksen toivotaan olevan loppukäyttäjän kannalta selkeämpää, kun useamman yliopiston materiaalit löytyvät yhdestä paikasta ja yhtenäisesti kuvailtuna. Palvelukokonaisuuden kaksi keskeistä komponenttia ovat keskitetty julkaisuarkisto sekä syöttö- ja hallinnointijärjestelmä Vireo. Continue reading

Kevyttä ja nopeasti (OR2009 8/10)

Useammassa Open repositories -konferenssin esityksessä kannustettiin käyttämään julkaisuarkistojen teknisessä kehitystyössä kevyitä ja helposti mukautuvia ratkaisuja. Aiheesta oli jopa erillinen esityskin, Matt Zumwalt esitteli nopean sovelluskehityksen (rapid application development, RAD) ideaa. Motiivina esityksessä on toteamus, että data on tärkeää, ei niinkään sitä käsittelevät ohjelmat. ”Avoin data on tärkeämpää kuin avoin lähdekoodi”. Ohjelmien on tarkoitus toimia ikkunana dataan. Nämä ikkunat ovat usein elinkaareltaan lyhyitä, arkistoissa majaileva data sen sijaan usein pitkäikäistä. Sovellukset muuttuvat eri aikojen ja käyttötarkoitusten mukaan ja tämän vuoksi on järkevää olla rakentamatta monoliittista sovellusta, jota on vaikea tai mahdoton mukauttaa nopeasti uusia tarpeita vastaavaksi. Continue reading

Cloud Computing ja julkaisuarkistot (OR2009 7/10)

Cloud computing on suhteellisen uusi termi, jolla tarkoitetaan tietotekniikkapalveluiden ulkoistamista verkon yli. Palvelut voivat olla mm. sovelluksia tai tallennustilaa. Cloud computing -palvelu on dynaamisesti skaalautuva ja verkon ylitse käytettävissä. Sen etuja ovat mm. palvelinylläpitoon liittyvien tehtävien ulkoistaminen verkossa olevaan ”pilveen”. Käyttäjän ei tarvitse huolehtia ulkoistettavien palveluiden osalta palvelimien raudan tai sovellusten päivityksestä, tietoturvasta, varmistuksista yms. ylläpidollisista seikoista. Cloud computing termiin yhdistetään usein myös joustava hinnoittelu; monesti palveluista maksetaan vain käytön mukaan. Sovelluksia voidaan tyypillisesti käyttää selaimella, jolloin ne eivät vaadi työasemilta mitään spesiaalia. Continue reading

DSpace ja Fedora hallinnolliseen yhteistyöhön (OR2009 6/10)

DSpace Foundation ja Fedora Commons liittävät voimansa yhteen heinäkuussa 2009 toimintansa aloittavan DuraSpace-organisaation muodossa. Yhdistymisellä haetaan massaa rahoituksen ja kehityksen tueksi ja pyritään edistämään yhteisiä innovaatioita ja muuta yhteistyötä kilpailun sijasta. DSpace ja Fedora pysyvät silti erillisinä sovelluksina hamaan tulevaisuuteen, elleivät aina. Molemmista sovelluksista puuttuvia ominaisuuksia pyritään kuitenkin tekemään jatkossa yhteistyössä.

DuraSpacen alla tulee toimimaan tiimejä eri tehtävissä, kuten Fedora Repository-, DSpace-, Mulgara- ja Duraspace Team. Kaksi ensimmäistä tiimiä jatkavat olemassa olevien sovellusten kehittämistä. Mulgara team keskittyy samalla nimellä kulkevan RDF-tietokannan kehittämiseen. Mulgarassa tieto mallinnetaan tripleinä (subjekti-objekti-predikaatti). Tätä mallinnustapaa pidetään relaatiomallia sopivampana julkaisuarkistoille, joissa on usein monimutkaisia suhteita objektien välillä. DuraCloudista kerrotaan tarkemmin seuraavassa merkinnässä.

Artikkelin tallettaminen julkaisuarkistoon suoraan Microsoft Wordista (OR2009 2/10)

Konferenssissa esiteltiin muutamia hedelmällisiä SWORD:n ja OAI-ORE:n laajennuksia. Vielä viime vuoden konferenssissa Southamptonissa molemmat, aineiston syöttöön ja siirtoon tarkoitetut protokollat olivat uusia, ja monelle jäi epäselväksi, miten niitä voitaisiin käytännössä menestyksellisesti hyödyntää. Kiinnostavimmasta SWORD:n sovelluksesta kertoi Pablo Fernicola esityksessään. Microsoft on kehittänyt lisäosan Word 2007:aan, jolla Wordissa kirjoitettu dokumentti voidaan lähettää suoraan julkaisuarkistoihin. Artikkelien kirjoittajat voivat olla varsin tyytyväisiä tähän lisään: artikkelin julkaisuarkistoon tallettaminen on parhaimmillaan vain yhden hiirenpainalluksen päässä. Parhaimmillaan julkaisun tallettamisen kynnys alenee, kun kirjoittajan ei tarvitse opetella käyttämään ja muistaa käyttää taas yhtä uutta järjestelmää eli julkaisuarkistoa julkaisunsa tallettamiseen. Continue reading

Open Repositories 2009 (OR2009 1/10)


Atlanta skyline

Järjestyksessään neljäs Open Repositories (OR) järjestettiin Atlantassa toukokuussa. OR kokoaa yhteen avoimella lähdekoodilla toimivien julkaisuarkistojen käyttäjiä esittelemään ja kuulemaan alan viimeisimpiä kuulumisia. Vakiintuneeseen tapaan tilaisuudet koostuivat sekä kolmen käyttäjäryhmän (DSpace, E-Prints ja Fedora) erillisistä että yhteisistä tilaisuuksista. Yhteisten tilaisuuksien aiheina olivat mm. pitkäaikaissäilytys, tekijänoikeudet, avoin tutkimusdata ja oppimisympäristöt ja niiden suhde julkaisuarkistoihin. Osallistuimme yhteisten tilaisuuksien lisäksi DSpace-käyttäjäryhmän omiin tilaisuuksiin, minkä vuoksi keskitymme näiden kolmen julkaisuarkisto-ohjelmiston esityksistä DSpacea käsitteleviin esityksiin.

Luvassa on yhdeksänosainen kirjoitussarja konferenssin esityksistä. Alla on ”sisällysluettelo” merkinnöissä käsiteltävistä aiheista:

Kaikki konferenssissa pidetyt esitykset löytyvät tapahtumaa Atlantassa isännöineen Georgia Techin julkaisuarkistosta. Ohjelma taas tapahtuman kotisivulta.