Rinnakkaisjulkaisemisen vaikea alkutaival

Charles W. Bailey Jr pohtii DigitalKoans-blogiin kirjoittamassaan artikkelissa “Institutional Repositories: DOA?” julkaisuarkistojen rakentamisen nykytilaa. Alkuinnostuksen hiivuttua on monissa tapauksissa tullut tilalle pikemminkin pettymys siihen miten tahmeasti aineistojen tallentaminen on lähtenyt liikkeelle. Onko julkaisuarkisto siis kuolleena syntynyt keksintö? Miltä julkaisuarkistojen tilanne näyttää tällä hetkellä Suomen näkökulmasta? Continue reading

Primon pilotti

Ainakin korkeakoulujen kirjastoväen piirissä “Primo” on jo varmasti monelle tuttu. Kyseessä on eräänlainen seuraavan sukupolven Nelliportaali-tyyppisten palvelujen järjestelmä. Ohjelmiston tekijä on Nelliportaalin taustalla toimivien MetaLib- ja SFX-ohjelmistojenkin taustalta löytyvä Ex Libris.Vanderbilt University on julkistanut Primon pilottiversion osoitteessa http://alphasearch.library.vanderbilt.edu/. Continue reading

Shakespearen kovalevy

Mitä oikein löytäisimme, jos pääsisimme kurkistamaan William Shakespearen tietokoneen kovalevylle? Löytyisikö jostain sen syövereistä kenties tiedosto, jonka nimi on Hamlet.doc? Voisimmeko päätellä kovalevylle tallentuneiden selaimen historiatietojen perusteellä, millä internet-sivuilla kirjailija oli surffannut edellisenä iltana ennen kuin aloitti tiedoston muokkaamisen? Continue reading

Kokemuksia eurooppalaisen väitöskirjaportaalin rakentamisesta

Joint Information Systems Committee (Iso-Britannia), Ruotsin kansalliskirjasto ja SURF Foundation (Hollanti) ovat testanneet yhteiseurooppalaista, OAI-PMH:n varaan rakennettua väitöskirjaportaalia. Portaaliin on toistaiseksi haravoitu noin 10000 väitöskirjan metatiedot yhteensä viidestä eri maasta (Hollanti, Iso-Britannia, Ruotsi, Saksa ja Tanska). Continue reading

Parlamenttikirjasto

Maamme kirjastoblogien toistaiseksi melko harvalukuinen katras on saanut uuden jäsenen. Eduskunnan kirjasto on avannut pari viikkoa sitten oman blogin, joka löytyy osoitteesta

http://parlamenttikirjasto.blogspot.com/

Blogi sisältää Digijulkaisujen tavoin kirjaston henkilökunnan epävirallisia ajatuksia ja vinkkejä ajankohtaisiin dokumentteihin. Vaikuttaa lupaavalta!

Unesco ja avoimen lähdekoodin ohjelmistot

UNESCO on julkaissut mielenkiintoisen, vaikkakin suppeahkon selvityksen “Towards an Open Source Repository and Preservation System” avoimen lähdekoodin ohjelmistoista ja työkaluista, joita voidaan käyttää pitkäaikaissäilytykseen keskittyvän arkiston rakentamisessa. Taka-ajatuksena UNESCO:lla on luoda ohjeistus ja suositukset, jotta yksittäisten pienempien kulttuuri- ja muiden instituutioiden olisi helppoa ja kustannustehokasta säilyttää omia digitaalisia aineistojaan luotettavasti pitkällä aikavälillä. Lähtökohtana voi olla vaikka muutama tavallinen PC-mikro. Selvitys esittelee nipun avoimen lähdekoodin ohjelmistoja ja ratkaisuja ja punnitsee niiden toimivuutta. Continue reading

OhioLink (ALA, 6.posti)

Sessio: “Issues and Trends in Digital Repositories of Non-textual Information: Support for Research and Teaching”.

Thomas Dowling esitteli OhioLINKin Digital Resource Commonsia. OhioLINK on Ohion osavaltion kirjasto- ja tietopalveluverkosto – konsortio, joka monessa suhteessa muistuttaa Suomen FinELibiä ja Linnea-konsortiota. Paitsi, että kuten Amerikkaan sopii, se on ainakin joissain suhteissa isompi. Muun muassa se lataa lisensoiduista tietokannoista artikkelit paikalliseen tietokantaan, jossa niitä onkin sitten 9 miljoonaa, ynnä muutamia tuhansia e-kirjoja.

OhioLINKillä on ollut ja on monenlaisia digitaalisen aineiston järjestelmiä – OhioLINK electronic theses and dissertatioms (http://www.ohiolink.edu/etd), OhioLink Digital Media Center (http://dmc.ohiolink.edu/) jne. Niinpä mieleen onkin siellä tullut, pitäisikö kaikki digitaaliset kokoelmat siirtää yhteen järjestelnmään – joka olisi toteutettu avoimen lähdekoodin ohjelmistoilla.

Dowling oli vahvasti sitä mieltä, että vapaa lähdekoodi – ajateltakoon nyt sellaisia tapauksia kuin Apache, Lucene, Tomcat ym. – voi tarjota alansa parhaan ratkaisun. Niinpä Fedora on ollut se alusta, jolle OhioLINKissä on alettu rakentaa.

Tässä välissä sopinee huomauttaa, että DSpace ja Fedora ovat olleet ne arkistoinnin OSS-ratkaisut, jotka kerta kerran jälkeen ovat seuraamissani sessioissa tulleet esiin. Jos jotakin muuta on ollut, se on useimmiten ollut yliopiston kokonaan itsensä rakentamaa. Kaupallisia tuotteita kukaan ei ainakaan ole kehdannut ääneen mainita.

Se, mikä lisäksi kiinnitti huomiota, on se, että kaikki Fedorasta puhuneet ovat koristelleet puheensa sivuhuomautuksilla siitä, kuinka raskasta ja aikaavievää sen implementointi on ollut – jos nyt mitään valmista edes vielä on ollut esittää. Pitkällä aikavälillä ratkaisun on kuitenkin vakuutettu olevan oikea. Ehkäpä todellakin pitkällä aikavälillä Fedoran ympärille kehittyy lisäosia, joiden avulla sitä voi päästä oikeasti käyttämään, mutta se kehitys on kyllä vielä kesken. Kovasti uskoa ja lujaa luottamusta vielä tarvitaan, ynnä pivollinen koodareita, jos Fedoraa aikoo käyttää.

Fedoran lisäksi OhioLINKIssä on ollut agendalla Ohion-laajuisen DSpace-järjestelmän rakentaminen, mikä on kuitenkin viivästynyt muiden kiireellisten tehtävin takia. Haastetta ei pienennä se, että asiakkaina olisi 85 instituutiota. Tässä yhteydessä Dowling sivusi myös OAI-PMH-protokollan tiettyjä rajoituksia. Kyse ei ole niinkään itse protokollan puutteista, vaan sen oikeasta käytöstä. Jos esimerkiksi Ohiossa 85 tahoa alkaa haravoimaan toisiaan, tuloksena on kaaos. Jonkinlainen keskittäminen on siis paikallaan. OAI-hygieniaan pitänee vielä palata tässäkin blogissa!

Kuka julkaisisi julkaisuarkistossa? (ALA, 5, posti)

Collecting for Institutional Repositories: All the News That’s Fit to Keep. Tällä kertaa vuorossa oli kolme esitystä meillä Suomessakin ajankohtaisesta kysymyksestä: mitä julkaisuarkistoihin pitäisi panna ja miten se saadaan sinne. Vastaus: laitokset ja tutkijat tietävät parhaiten, mitä kannattaa julkaista, ja loppu onkin vain tarmokasta mainontaa, markkinointa ja hihasta nykimistä.

Esityksiä oli taas kolme: Susan Gibbons Rochesterin yliopistosta; Jim Ottaviani Michiganin yliopistosta sekä George Porter California Institute of Technologysta.

Susan Gibbons kertoi ensin pitkästä ja huolellisesta suunnittelusta, jossa toimintaperiaatteita ja prosesseja työstettiin monen työryhmän voimin. Loppujen lopuksi kuitenkin kävi niin, että suuri osa tuosta työstä ei osoittautunut kovinkaan hyödylliseksi. Monet visiot julkaisuarkiston käytöstä eivät toteutuneet, ja monia yllättäviä ksymyksiä on ilmaantunut toiminnan kehittyessä. Hän korosti, että kun kyse on uudenlaisesta toiminnasta, joustavuus on todella tarpeen.

Sisältökriteereitäkin oli pohdittu paljon, mutta parhaaksi politiikaksi oli osoittautunut antaa aineiston luovuttajien tehdä päätökset. Kenenkään intressissä ei tunnu olevan roskan julkaiseminen. Kaikeella sillä aineistolla, jota julkaisarkistoon oli pantu, oli myös ollut käyttöä, joten siinäkin suhteessa itseohjautuva sisällönvalinta on ollut onnistunut ratkaisu.

Sisältöä ei ole myöskään rajattu vain rinnakkaisjulkaisemiseen. Mukana on “student papers” – mitä kaikkea termi pitääkään sisällään – sekä myös primaariaineistoa, kuten eism. digitoitu kokoelma harvinaisia nuotteja. Sellainen periaate kuitenkin on ollut, että aloitteen aineiston lisäämiseen on tultava laitoksilta – toisin sanoen kirjasto ei omasta aloitteestaan lisää aineistoja. Tätä pn pidetty tärkeänä, jotta laitokset todella tuntisivat palvelun omakseen.

Itsearkistointi ei ole ollut niin yleistä kuin oli toivottu, ja sen edistämiseksi on vielä tehtävä työtä, Gibbons kertoi. Plajon tavallisempaa on, että arkistoinnin tekee jokin välikäsi – laitoksen hallintohenkilökunta, opiskelijatyöntekijät tai – kaikkein useimmin – kirjasto. Kirjaston iso rooli ei ole pitkällä aikavälillä kestävä ratkaisu, vaikkakin dialogista laitosten kanssa on näin lakuvaiheessa llut myös paljon hyötyä.

Arkisto on toteutettu DSpacella, kuten myös seuraavaksi esitelyt Deep Blue (ei nähtävästi sukua samannimiselle shakinpelaajalle). Rochesterin arkisto on osoitteessa https://urresearch.rochester.edu/

Rochesterissa ollaan asetettu joitakin pitkäaikaissäilytyksen sanelemia vaatimuksia luovutettavalle aineistoille, mutta ei kovin tiukkoja. Tiedostomuotojen tulee olla sellaisia, että niiden dokumentaatio on saatavissa. Näin ollen PDF kelpaa, mutta Word ei.

Tekijänoikeudet aiheuttivat alussa paljon kyselyä. Avoimessa julkaisuarkistossahan arkisto kuitenkin saa ainoastaan ei-yksinoikeudellisen levitysoikeuden, eli tekijänoikeudet eivät oikeastaan siirry. Tekijänoikeusasioissa aineiston arkistoja on autettu paljon ja kädestä pitäen. Tutkija on esimerkiksi voinut tuoda julkaisuluettelonsa kirjastoon, joka on sitten selvitellyt, mitkä nimekkeet on mahdollista panna julkaisuarkistoon.

Seuraavaksi esiintyi Jim Ottaviani ja kertoi Deep Bluesta (ks. http://deepblue.lib.umich.edu/)Myös Jim Ottaviani tähdensi julkaisuarkistojen myymistä yliopistolla, Kyseessä on loppujen lopuksi varsin uudenlainen palvelu, jossa kirjastot ovat tekemisissä tutkijoiden ja opettajien kanssa uudenlaisissa yhteyksissä.

Ottaviani vertasi laitoksia riikinkukkoihin: markkinoinnissa ei pidä kertoa, millä tavalla julkaisuarkistot tekevät maaimasta paremman paikan, vaan millä tavalla ne hyödyttävät laitosta ja tuovat sille mainetta ja kunniaa, ehkä rahaakin.

Hän käytti myös vertausta “ohjaajan versio”. Julkaisuarkistossa voidaan julkaista liikkuvaa kuvaa, jota ei lehdissä voi käyttää; ja siellä voidaan julkaista värikuvia, joiden saaminen lehteen maksaisi maltaita. Oikeastaan ainoa rajoitus, joka julkaisemiselle on asetettu, on se, että keskeneräisiä dokumentteja ei julkaista.

Michiganissa DSpacen hierarkia on hyvin litteä, tai oikeastaan sitä ei ole ollenkaan: kaikki laitokset löytyvät samalta tasolta. Paljon oli pantu painoa toimivan itsearkistointilomakkeen suunnitteluun.

Markkinoinnissa oli panostettu isoihin avajaisiin, joita varten arkistoon oli hankittu aineistoa edeltäkäsin, osin kirjoittajien tietämättä! Neljän ison kustantajan kanssa oli lisenssineuvotteluissa otettu mukaan sellainen klausuuli, että yliopistolla on oikeus siirtää tutkijoidensa artikkeleita omiin julkaisuarkistoihinsa. Tutkijat saattoivat hieman hätkähtää, mutta olivat kyllä luopuneet oikeudesta artikkeleihinsa siinä määrin, ettei heidän oikeuksiaan prosessissa loukattu.

Markkinointia oli tehty kosolti mm. seuraavilla argumenteilla:

  • Julkaisuarkistossa julkaiseminen lisää siteerauksen määrää 25 – 250 prosenttia.
  • Kirjasto huolehtii aineiston säilymisestä
  • Julkaisulisenssi on parin kolmen kappaleen pituinen eikä aiheuta stressiä
  • Itsearkistoinnissa kysytään vain kolme asiaa: nimeke, tekijä ja julkaisuaika.

Caltechin George Porterilla oli esityksessään enemmän hauskoja kaskuja kuin mitään erityistä perussanomaa. Kyse oli ennen kaikkea elektronisten opinnäytteiden julkaisemisesta Caltechissa. Se herätti huomiota, että väitöskirjan julkaisemisesta on kieltäytynyt ainoastaan kaksi henkilöä. Laitoksilla on alempien opinnäytteiden suhteen hyvin vaihtelevia käytäntöjä, ja sen kanssa on pystytty elämään.

Myös Caltechissa kirjastolla on varsin laajat tekijänoikeuspalvelut. Verkkojulkaisujen suhteen kirjasto myös omaksuu vastuun mahdollisista rikkeistä, päinvastoin kuin esim. Rochesterissa (jossa kyllä otetaan asianomaiseen yhteyttä, jos silmiin sattuu joku ilmeisen luvaton julkaisutapaus).

Kaikki totesivat yhteisesti, että pre- ja postprintit eivät ole merkittäviä arkistojen sisällössä. Niiden julkaisemiselle voisi olla enemmän tilausta ajan myötä; otettiin esimerkki lehdistä, joissa artikkelien jonotusaika on pari vuotta – luulisi preprintin julkaisemisen silloin kiinnostavan kirjoittajaa.