Kaikki hyvin, julkaisuarkistot?

Jos julkaisuarkistojen kehitystä seuraa pelkästään open access -evankelistien blogien välittämän propagandan kautta, koko ilmiöstä saattaa piirtyä kovin ruusuinen kuva. Miltä tilanne näyttää ruohonjuuritason ahkerien ahertajien, julkaisuarkistojen rakentajien ja ylläpitäjien näkökulmasta?

Dorothea Salon räväkkä parikymmensivuinen pamfletti “Innkeeper at the Roach Motel” tarjoaa yhden vastauksen tähän kysymykseen.  Salo kritisoi julkaisuarkistojen ja julkaisuarkisto-ohjelmistojen nykytilaa ja nostaa myös esiin useita sellaisia ongelmia, jotka ovat julkisuudessa tähän asti pääosin hautautuneet virallisen hymistelyn alle.

Arkistorotta jää yksin

Wisconsinin yliopistossa julkaisuarkistoa pyörittävä Salo väittää, etteivät julkaisuarkistot nykymenoa kykene täyttämään niihin kohdistuvia odotuksia. Amerikkalaisiin julkaisuarkistoihin tallennetaan nykyisellään keskimäärin yksi artikkeli päivässä, mitä ei voi pitää osoituksena kovin suuresta menestyksestä. Salon mukaan julkaisuarkistojen perustamisen taustalla ollut ajatus tutkijoiden oma-aloitteisesta itsearkistoinnista (“build it and they will come”) on osoittautunut pätemättömäksi, eivätkä ne ole saaneet riittävää institutionaalista tukea sen paremmin yliopistojen kuin kirjastojenkaan taholta.

Salon mukaan julkaisuarkiston ylläpitäjä (“repository rat”) on edelleen outo kummajainen sekä kampuksella että kirjaston organisaatiossa. Lähes kaikki arkistot ovat toivottoman heikosti resurssoituja ja niiden pyörittäminen on usein yhden yksittäisen ihmisen varassa. Vielä hankalammaksi tilanteen tekee se, ettei arkiston ylläpitäjällä tyypillisesti ole mitään tukiverkostoa kampuksilla, eikä arkiston rakentaminen kytkeydy kunnolla sen paremmin yliopiston kuin yliopiston kirjastonkaan muuhun toimintaan.

Pahimmillaan tämä tarkoittaa loputonta yksinäistä taistelua organisaation ja sen henkilökunnan välinpitämättömyyttä vastaan. Käytännössä tämä on usein johtanut siihen, että arkistojen ylläpitäjät ovat toimintansa perustelemiseksi haalineet arkistoonsa kaikenlaista saatavilla olevaa aineistoa, riippumatta sen tasosta tai tieteellisestä arvosta, mikä puolestaan ei ole ollut omiaan kohottamaan arkistojen profiilia tai arvostusta.

Salo pohtii myös muunlaisia organisaatiomalleja (mm. usean organisaation yhteiset arkistot), mutta näkee niissäkin ongelmia. Hänen mukaansa olisi kuitenkin tärkeää saada yliopistojen ja kirjastojen hallinto ymmärtämään, että julkaisuarkisto tarvitsee tuekseen kunnolliset resurssit, riittävästi ylläpitohenkilökuntaa ja tukipalveluita tallentajille. Ne eivät siis toimi itsestään, toisin kuin intomielisimmät open access -evankelistit – onnetonta kyllä – joitakin vuosia sitten esittivät.

Ohjelmistot eivät vastaa käyttäjien tarpeisiin

Osasyynä julkaisuarkistojen odotettua heikompaan menestykseen ovat Salon mukaan olleet nykyisten julkaisuarkisto-ohjelmistojen puutteelliset ominaisuudet. Salon hampaissa on erityisesti hänen oman arkistonsa käyttämä ohjelmisto, eli DSpace. Kilpailijat (EPrints ja Fedora) pääsevät vähemmällä, mutta syynä saattaa olla enemmän vieraskoreus kuin se, että nämä ohjelmistot olisivat kaikilta osin oleellisesti parempia.

Perusongelma on Salon mukaan se, että ohjelmistot on rakennettu hyvin kapeasti itsearkistointivision ympärille, eivätkä ne vastaa yliopistojen tai tutkimuslaitosten todellisia tarpeita kuin pieneltä osin. Tämä näkyy sekä tallennuslomakkeissa että ohjelmistojen käyttöliittymissä ja rajapinnoissa. Ohjelmistojen valmiit työprosessit, tallennuslomakkeet ja hallintatyökalut ovat kömpelöitä ja niitä on vaikea muokata organisaation tai tallennettavan aineiston tarpeiden mukaan. Ne eivät tarjoa kunnollista tukea sen paremmin luonnosten ja saman työn eri versioiden kuin tutkimusdatankaan tallentamiseen.

Ohjelmistojen käyttöliittymien intuitiivisuudessa ja käytettävyydessä on lisäksi merkittäviä puutteita, ja EPrintsiä lukuunottamatta niistä puuttuu esim. kunnollinen käytön tilastointi, joka kuitenkin olisi tärkeää arkiston toiminnan legitimoinnin kannalta. Julkaisuarkistoa onkin hyvin hankala markkinoida potentiaalisille tallentajille, jos arkiston ylläpitäjän täytyy tarjota pelkkää “ei-oota” lähes kaikkien näiden kaipaamien ominaisuuksien kohdalla.

Ongelman taustalla on Salon mukaan suurelta osin ohjelmistojen kehitystyön kaoottisuus, joka ei ole tarjonnut riittävän vankkaa pohjaa uusien innovaatioiden kehittämiseen. Vaikka kyse on open source -ohjelmistoista, joita kuka tahansa voi periaatteessa kehittää tarpeidensa mukaan, harvalla kirjastolla on kuitenkin tähän sen paremmin resursseja kuin osaamistakaan.

Lisäongelmia aiheutuu siitä, että etenkin DSpacen kohdalla ohjelmiston kehittäminen ajautuu usein umpikujiin – hyviäkään paikallisesti kehitettyjä ratkaisuja ei välttämättä saada integroitua ohjelmiston virallisiin versioihin, ja niinpä erilaiset patchit lyövät toisiaan korville ja lakkaavat jossain vaiheessa versiopäivitysten mukana toimimasta, ellei niitä ylläpidetä jatkuvasti.  Salo kritisoi myös ohjelmiston kehittäjien asennetta: sensijaan että nämä kuuntelisivat tarkkaan käyttäjien toiveita ja kritiikkiä, ohjelmiston kehitystyötä on priorisoitu pikemminkin kehittäjien omien tarpeiden ja mielihalujen mukaan.

Miten eteenpäin?

Salo ei kuitenkaan halua nähdä tilannetta tyystin toivottomana, vaan hänen päämääränään on nostaa ongelmat esiin ja herättää keskustelua, jotta julkaisuarkistojen kehittäminen saataisiin takaisin raiteilleen. Pamflettinsa lopuksi Salo esittää joukon suosituksia, joista tässä ehkä kannattaa toistaa vain osa:

  • Julkaisuarkisto tarvitsee instituutionaalista tukea.  Arkistosovellusta ei kannata pistää pystyyn ilman tallennusmandaattia tai selkeää suunnitelmaa / lupausta siitä mitä organisaation tuottamaa aineistoa (esim. opinnäytteet) sinne tallennetaan
  • Julkaisuarkiston tulee pyrkiä vastaamaan yliopiston ja tutkijoiden tarpeisiin. Arkiston tulee olla valmis tallentamaan muitakin aineistoja kuin vertaisarvioitujen tieteellisten artikkeleiden kokotekstiversioita, ja sen pitää pyrkiä mahdollisimman saumattomaksi osaksi yliopistojen muuta atk-infrastruktuuria
  • Julkaisuarkistolla pitää olla aktiivinen rooli sisällön keräämisessä ja tallentamisessa, ja sillä pitää itsearkistointimahdollisuuden lisäksi olla resurssit myös aineistojen tallentamiseen tutkijoiden puolesta (“mediated deposit”)
  • Julkaisuarkistojen ylläpitäjien tulee pyrkiä vaikuttamaan ohjelmistojen kehitystyöhön siten, että niihin saadaan kunnolliset avoimet tekniset rajapinnat ja parempia työkaluja mm. käyttöliittymien ja työprosessien muokkaamiseen ilman vaativaa ohjelmointityötä

Lisää luettavaa

Salon mainioon Caveat Lector -blogiin on mieli tehnyt viitata jo moneen otteeseen aiemminkin. Lisäksi Salo on pyrkinyt aktiivisesti herättämään keskustelua dspace-general-sähköpostilistalla. Myös Salon Skotlannissa Repository Fringe -tapahtumassa pitämä esitys Le IR, c’est mort. Vive le IR! käy hyvänä johdatuksena aihepiiriin.