Tapaus JSTOR – käytännön opetuksia digitointiprojektien hallinnoijille

jstor.jpgRoger C. Schonfeldin kirjoittama “JSTOR. A History” on ilmestynyt jo vuonna 2003, mutta törmäsin siihen vasta viime vuoden puolella. Nimensä mukaisesti kirja on amerikkalaisen, satojen tieteellisten lehtien vanhat vuosikerrat digitoineen JSTOR-palvelun (http://www.jstor.org) historia. Kirja on suositeltavaa luettavaa kaikille digitointiprojekteista ja verkkoaineistojen lisensioinnista kiinnostuneille.

Verkkoaikakauden historiaa

Verkkoaikakauden ilmiöistä saati niiden historiasta on toistaiseksi kirjoitettu olemattoman vähän vakavasti otettavia tutkimuksia. Tässä sellainen kuitenkin on. Aiheeltaan Schonfeldin kirja on tavattoman mielenkiintoinen, sillä JSTOR on Suomessakin laajassa käytössä, ja digitaalisten aineistojen julkaisemisen pioneerina se on toiminut esikuvana monille muille palveluille (ks. myös oma vanha juttuni). Monet kirjassa käsitellyistä teemoista ovat sellaisia, joihin törmää väistämättä kaikissa vastaavissa projekteissa.

Schonfeldin kirja tarkastelee JSTOR:in vaiheita pikemminkin ylhäältä päin projektinjohdon kuin  ruohonjuuritason työntekijöiden näkökulmasta. Ajoittain siltä olisikin kaivannut strategisen päätöksenteon kuvauksen lomaan vielä tarkempaa paneutumista palvelun rakentamiseen liittyneisiin teknisiin ja käytännöllisiin ratkaisuihin. Samoin kirjassa kuvattujen vaiheiden historiallista kontekstia ja kulttuurista merkitystä olisi voinut käsitellä laajemminkin, mutta tämä on ehkä liikaa vaadittu näin tuoretta ja suurimmaksi osaksi edelleen kirjoittamatonta historiaa käsittelevältä teokselta.

Tyyliltään Schonfeldin kirja on lähinnä kuivakka, asioita väännetään moneen kertaan rautalangasta, ja keskeiset päätelmät toistetaan vielä erikseen kunkin luvun lopussa. Tämä on perusteltavissa sillä, että teosta on aivan eksplisiittisestikin kirjoitettu oppikirjaksi suurten digitointihankkeiden ja maksullisten verkkopalveluiden toteuttamisesta. Vaikka kirja ei olisi totta puhuen kärsinyt lennokkaammasta otteesta tai hauskoista anekdooteista, sen käsittelemät teemat ovat sen verran kiinnostavia, että ne kantavat oikein hyvin ilmankin – etenkin jos lukija on jo valmiiksi kiinnostunut aihepiiristä.

Kirja kuvaa yksityiskohtaisesti etenkin JSTOR:in alkuvaiheita 1990-luvun puolivälissä. Kirjoittajalla on ollut käytettävissään hankkeen johtohenkilöiden kirjeenvaihtoa ja muutakin arkistomateriaalia, jota hän on täydentänyt haastatteluilla. Vaikka kyseessä on pohjimmiltaan JSTOR:in taustavoimien kanssa yhteistyössä toteutettu tilaushistoriikki, se ei kuitenkaan tarjoile pelkkää hymistelevää kiiltokuvahistoriaa, vaan pyrkii säilyttämään kriittisen näkökulman siihen mitä hankkeessa tehtiin ja miksi. Schonfeld korostaa lisäksi sitä, että myös suunnittelun harhapolut olivat monilta osin opettavaisia, sillä hylätyiksikin tulleiden vaihtoehtojen tutkiminen auttoi monin tavoin projektin fokuksen määrittelyssä.

Säätiön voimin liikkeelle

Vaikka ongelmia ei Schonfeldin kirjassa lakaista tyystin maton alle, JSTOR:ista muodostuu kuitenkin kuva projektinhallinnan mestarinäytteenä. Hanke lähti liikkeelle vuonna 1994 Andrew W. Mellon Foundationin presidentin William G. Bowenin aloitteesta ja säätiön omalla rahoituksella. Keskeisiä toimijoita olivat nimenomaan säätiön johtohenkilöt, eli hankkeella oli alusta lähtien takanaan vankka poliittinen tuki. Äveriäällä säätiöllä oli myös omasta takaa toiminnan käynnistämiseen tarvittavat taloudelliset resurssit.

Projektin alkuperäisenä lähtökohtana oli ajatus siitä, että tieteellisten aineistojen digitointi ja säilyttäminen digitaalisessa muodossa vähentäisi merkittävästi tieteellisten kirjastojen tilakustannuksia, kun päällekkäisistä kokoelmista voitaisiin luopua. Tätä perua on myös palvelulle vakiintunut nimi, joka on lyhennelmä sanoista Journal Storage. Hankkeen ajoitus oli kuitenkin onnekas, sillä World Wide Web oli juuri lyömässä itseään läpi, ja pian mukaan tuli myös ajatus aineistojen välittämisestä verkon kautta. Tätä kautta sille avautui myös ennakoitua laajempia kaupallisia mahdollisuuksia. Näin jälkeenpäin ajatellen tämä ja monet muut JSTOR:in valitsemista ratkaisuista kuulostavat lähinnä itsestään selviltä, mutta vuosina 1994-1995 kyse oli vielä suurelta osin hypystä tuntemattomaan.

Mellon-säätiö ei ymmärrettävää kyllä halunnut ryhtyä kehittämään digitointipalveluita säätiön omin voimin, vaan alusta lähtien tavoitteena oli etsiä yhteistyökumppaneita ja pyrkiä mahdollisuuden mukaan hyödyntämään jo olemassa olevia teknisiä ratkaisuja ja valmiita palveluita. Hakukäyttöliittymän kehittelyyn ja projektin käytännön toiminnan pyörittämiseen löytyi vuoden 1994 kuluessa partneriksi Michiganin yliopisto, joka oli 1990-luvun puolivälissä muutenkin kehittämässä digitaalisen kirjaston ohjelmistoja (JSTOR:in lisäksi myös mm. Elsevierin verkkopalvelut hyödynsivät yliopistossa kehitettyä teknologiaa). Aineistojen digitointi ja indeksointi puolestaan kilpailutettiin ja ulkoistettiin alkuvaiheessa kokonaan kaupalliselle yritykselle.

Vaikka JSTOR yhtiöitettiin ja irrotettiin muodollisesti Mellon-säätiön alaisuudesta jo vuonna 1995, se päätettiin kuitenkin säilyttää voittoa tavoittelemattomana organisaationa. Michiganin yliopiston kanssa tehtävästä yhteistyöstä huolimatta palvelun toimintaa johdettiin edelleen New Yorkista käsin. New Yorkin toimisto vastasi myös kustantajasuhteista ja palvelun markkinoinnista.

Kokoelmaa rakentamassa

Useita vaihtoehtoja tutkittuaan JSTOR päätyi ratkaisuun, jossa lehdet digitoitiin kokonaan sivu kerrallaan, eikä esim. artikkeleiksi paloiteltuina. Yllättävää kyllä tämän päätöksen keskeisin perustelu liittyi tekijänoikeuksiin: jos alkuperäinen lehti julkaistiin sisällöltään täysin muuttumattomana, artikkelien julkaisemiselle ei tarvinnut enää hankkia uudestaan tekijöiden lupaa, vaan oikeuksista voitiin sopia JSTOR:in ja lehden kustantajan kesken. Luonnollisesti ratkaisu sopi myös hyvin yhteen lehtien arkistointiin liittyvien tavoitteiden kanssa.

Sen sijaan että mukaan olisi haalittu kaikkea mahdollista aineistoa, JSTOR pyrki alusta lähtien kokoamaan keskeisistä ydinlehdistä koostuvia selkeitä kokoelmia, jotka palvelisivat mahdollisimman hyvin palvelun oletettuja asiakasryhmiä. Alussa kokoelmia oli vain yksi, lopulta yli sadan lehden laajuiseksi päätynyt Arts and Sciences I. Vanhojen vuosikertojen kattavan arkistoinnin lisäksi JSTOR tutki alkuvaiheessa myös mahdollisuutta julkaista lehtien uusia numeroita. Kustantajien nihkeän vastaanoton vuoksi tästä kuitenkin luovuttiin, ja useimpien lehtien kohdalla otettiin käyttöön ns. “moving wall”, eli tuoreimmat vuosikerrat jätettiin määräajaksi palvelun ulkopuolelle.

Vaikka hankkeen puuhamiesten henkilökohtaiset verkostot auttoivat hyvään alkuun lehtien kiinnostuksen herättämisessä ja kustantajien kanssa solmittavien sopimusten neuvottelussa, kyseessä oli kuitenkin pitkä prosessi, joka ei kaikkien lehtien kohdalla johtanut ainakaan välittömään tulokseen. Käytännössä kunkin kustantajan kanssa jouduttiin neuvottelemaan erikseen, mikä sitoi runsaasti resursseja. Kustantajat piti vakuuttaa kokonaan uuden liiketoimintamallin mielekkyydestä tilanteessa jossa koko liiketoimintamalli oli vasta kehitteillä. Etenkin alkuvaiheessa elektroninen julkaiseminen saatettiin nähdä uhkana lehden vakiintuneille tuloille. JSTOR:in periaatteisiin kuului lisäksi se, ettei lehdille maksettu tekijänoikeuskorvauksia aineistojen käytöstä, vaan niille luvattiin jakaa jälkikäteen osa toiminnasta mahdollisesti jäävästä ylijäämästä. Tämä edellytti yhteistyökumppaneiksi lähteviltä kustantajilta luonnollisesti melkoisesti luottamusta palvelun toimintaan.

Projektinhallinnan ja organisoinnin sudenkuoppia

Mellon-säätiöllä oli itsellään alusta lähtien varsin selkeä käsitys oman roolinsa rajoista, eikä tehokkaimpien ratkaisujen etsimisessä ja käytännön toiminnan ulkoistamisessa ollut sen kannalta mitään henkistä kynnystä. Useista toimijoista koostuvan projektin hallinnointi johti kuitenkin lähes väistämättä myös ajoittaisiin ristiriitoihin, eikä eri organisaatioissa toimivien prosessien rajapintojen yhdistäminen sujunut täysin kitkattomasti. Projektin suunnittelussakaan ei kaikesta järjestelmällisyydestä huolimatta ollut osattu kaikilta osin ennakoida tuotantoprosessin monimutkaisuutta.

Aineistojen digitointi ja tekstintunnistus oli ulkoistettu kaupalliselle yritykselle, ja käytännössä työ tehtiin halpatuotantomaassa eli Barbadoksella. Digitoitavien julkaisujen kerääminen, indeksoinnin periaatteiden määrittely ja digitoinnin laadun kontrollointi oli alkuvaiheessa sijoitettu Michiganin yliopistoon. Ensimmäiset digitointitulokset eivät kuitenkaan menneet tiukan laatukontrollin läpi, ja etukäteen laaditut tuotantosuunnitelmat osoittautuivat ylioptimistisiksi. Ongelma ratkaistiin vähitellen prosesseja kehittämällä ja digitointiyrityksen kanssa tehtyjä sopimuksia tarkistamalla, ja kesään 1997 mennessä tuotanto pyöri 100 000 sivun kuukausivauhdilla.

Toinen keskeinen ongelma liittyi JSTOR:in ja Michiganin yliopiston suhteeseen. Käytännössä Michiganin yliopiston kirjasto mielsi JSTOR:in vain yhdeksi omista digitaalisten kirjastojen palveluiden kehittämisprojekteistaan vielä siinä vaiheessa kun palvelun piti olla jo kovaa vauhtia menossa kohti tuotantokäyttöä. Hanketta pyöritettiin monilta osin puolittaisilla resursseilla muiden tehtävien ohessa, eikä hankkeen yhteydessä kehitettyjen ohjelmistoratkaisujenkaan oikeuksien omistuksesta ollut tehty selkeitä sopimuksia. Tilanne saatiin ratkaistua neuvotteluteitse, ja palvelun Michiganin yliopistossa toimiva henkilökunta koottiin eri puolilta kampusta yhteen toimipaikkaan, mutta vaihtoehtojen lisäämiseksi JSTOR perusti joka tapauksessa 1990-luvun lopulla Michiganin rinnalle toisen tuotantolinjan Princetonin yliopistoon.

Mutta entäs asiakkaat?

Vaikka aineistojen välittäminen kirjastoihin CD-ROM-levyillä oli heti projektin alkuvaiheessa hylätty epäkäytännöllisenä, myös aineistojen levittämiseen verkon kautta liittyi merkittäviä haasteita, joiden ratkaisut eivät vielä 1990-luvun puolivälissä tuntuneet ilmeisiltä. Kuvamuodossa tallennettujen sivujen välittäminen verkon kautta kulutti runsaasti kaistaa, mutta tämän ongelman oletettiin sentään – aivan oikein – helpottavan ajan myötä sitä mukaa kun yhteydet kehittyivät. Visaisempi kysymys oli sen sijaan se, pitäisikö aineistojen käyttöoikeus rajata pelkästään kirjaston tiloihin vai olisiko ne mahdollista antaa koko yliopiston kampuksen laajuiseen levitykseen. Kustantajien epäilyksistä huolimatta jälkimmäinen vaihtoehto todettiin järkevämmäksi. Aineistojen etäkäyttöä ei tässä vaiheessa sentään vielä osattu pohtia.

JSTOR:in kaltaisille tieteellisiä aineistoja välittäville verkkopalveluille ei vielä 1990-luvun puolivälissä ollut valmiita toimivia käytäntöjä, ja palvelun kysyntää oli myös vaikea ennakoida. Toimivan hinnoittelumallin luominen oli tämän vuoksi haastava tehtävä. Aluksi pohdittiin sitäkin, pitäisikö hinnan perustua suoraan käytön määrään, mutta tästä vaihtoehdosta kuitenkin luovuttiin, koska pelättiin sen estävän palvelun käytön yleistymistä. JSTOR ei toisaalta halunnut ryhtyä rakentamaan toimintamallia, jossa kaikkien asiakkaiden kanssa neuvotellaan erilliset sopimukset, vaan hinnoittelu päätettiin rakentaa organisaatioiden koon mukaan hyödyntäen julkisesti saatavilla olevia vertailulukuja. Oppilaitokset jaettiin kahdeksaan eri ryhmään toisaalta koon ja toisaalta niiden myöntämien tutkintojen tason perusteella – tutkimukseen suuntautuneiden korkeakoulujen oletettiin käyttävän aineistoja enemmän kuin opetukseen ja pelkkiin alempiin tutkintoihin keskittyneiden oppilaitosten.

Vuosimaksujen lisäksi asiakkaat joutuivat maksamaan erilliseen liittymismaksun (aluksi ”Database development fee”, myöhemmin “Archive capital fee”), jonka avulla oli tarkoitus kerätä pääomaa palvelun toiminnan pitkän aikavälin kehittämiseen sekä aineistojen pikäaikaissäilytyksen ja -saatavuuden takaamiseen. Mellon-säätiö oli tukenut JSTOR:in käynnistämistä useilla miljoonilla, ja JSTOR:in muodollisen itsenäistymisenkin jälkeen säätiö tuki lahjoituksilla uusien kokoelmien digitointia ja antoi joillekin vähävaraisille asiakkaille rahoitusta palvelun käyttöoikeuden hankkimiseen. Huolimatta läheisistä suhteista sekä Mellon-säätiöön että muutamiin muihinkin ulkopuolisiin rahoittajiin palvelulle haluttiin kuitenkin kerätä riittävästi omaa pääomaa niin, ettei se joutuisi elämään kädestä suuhun.

Asiakkaiden hankkiminen lähti sekin aluksi liikkeelle osittain Mellon-säätiön ja hankkeen puuhamiesten verkostojen kautta. Koska asiakkaita pyydettiin alkuvaiheessa sitoutumaan vielä keskeneräiseen tuotteeseen, kriittisen asiakasmassan kokoamiseen käytettiin myös alennuskampanjaa: kaikille vuoden 1997 huhtikuuhun loppuun mennessä mukaan liittyneille organisaatioille luvattiin reippaat 25%:n alennukset sekä Arts & Sciences I:n että myös kaikkien tulevien JSTOR-kokoelmien liittymismaksuista ja vuosimaksuista. Alennusten ja kirjastonjohtajille suunnatun aktiivisen markkinoinnin ansiosta aikarajan loppuun mennessä mukaan ilmoittautui yhteensä 190 kirjastoa.

Ironista kyllä alennuskampanjan ansiosta JSTOR:in suurimmat ja potentiaalisesti myös tuottoisimmat asiakkaat saivat palvelun suhteettoman halvalla. Suuret amerikkalaiset tutkimusyliopistot hankkivat palvelun lähes poikkeuksetta ensimmäisten joukossa, ja niiden osalta palvelun hinta oli jo muutenkin määritelty yliopistojen resursseihin nähden hyvin edulliseksi, eli ne eivät olisi edes tarvinneet alennuksia. Keskisuurten yliopistojen houkutteleminen mukaan osoittautui sen sijaan huomattavaksi hankalammaksi.

Keskikokoisille yliopistoille määritelty hinta ei ollut käytännössä oleellisesti suuria yliopistoja alempi, ja lisäongelmia aiheutui JSTOR:in joustamattomasta asenteesta kirjastojen muodostamiin konsortioihin, joiden avulla kirjastot pyrkivät neuvottelemaan itselleen yhteisvoimin edullisempia sopimuksia. JSTOR piti aluksi jääräpäisesti kiinni siitä, että palvelun hinnoittelumalli otti jo valmiiksi huomioon kaikenkokoisten organisaatioiden tarpeet, eikä se ollut halukas myöntämään asiakkaille lisäalennuksia vain sen takia, että ne sattuivat kuulumaan konsortioon. Käytännössä palvelu joutui ajan myötä jossain määrin tinkimään tästä politiikasta, ja se oli lopulta valmis ottamaan hinnoittelussa huomioon sen, että konsortioiden kanssa asioiminen oli sen omaltakin kannalta yksinkertaisempaa ja alensi siten kustannuksia. Erityisen selvää tämä oli ulkomaisten asiakkaiden kohdalla, sillä kieli- ja kulttuurierojen pelättiin muuten aiheuttavan ylimääräisiä ongelmia.

Lisää kokoelmia ja asiakkaita

Tuotantoprosessin käynnistysvaiheen ongelmista huolimatta Arts & Sciences I -kokoelma valmistui ennakoidun aikataulun mukaisesti vuoden 1999 lopulla. JSTOR oli jo sitä ennen käynnistänyt useiden muiden kokoelmien suunnittelun ja joiltakin osin myös tuotannon – seuraavina olivat tulossa General Science, Ecology & Botany, Arts & Sciences II, Business ja Languages & Literature. Voimakkaan laajentumisen tavoitteena oli estää JSTOR:in jääminen muiden toimijoiden jalkoihin – digitaalisen julkaisemisen pioneeriaika alkoi olla ohitse, ja laajentumisen viivyttäminen olisi helposti johtanut siihen, että yhä useammat lehdet ja kustantajat olisivat ryhtyneet vanhojen numeroidensa digitointiin joko omin voimin tai yhteistyössä jonkin kaupallisen aineistojen välittäjän kanssa.

Useiden kokoelmien oikeuksista neuvotteleminen samaan aikaan asetti kuitenkin uusia haasteita JSTOR:in toiminnan organisoinnille, sillä vaikka palvelun tuotantokoneisto kykeni käsittelemään suuria aineistomääriä, kustantajien kanssa käytävien neuvottelujen etenemistä oli vaikeampi ennakoida, eikä uutta aineistoa aina saatu käsiteltäväksi tasaista vauhtia. Kilpailun koveneminen näkyi siinäkin, että JSTOR pyrki pitämään kustantajia tyytyväisinä lupaamalla näille aiempaa suurempaa osuutta palvelun tuottamasta voitosta. Kustantajien näkökulmasta myös JSTOR:in pelkästään keskeisiin lehtiin painottuva kokoelmapolitiikka vähensi sen tarjoaman vaihtoehdon houkuttelevuutta – JSTOR kun ei ollut valmis ottamaan digitoitavaksi saman tien kaikkia kustantajan lehtiä, vaan valitsi ainoastaan rusinat pullasta.

Kokoelmien laajentumisen ja myös hinnoittelumalliin tehtyjen tarkistusten myötä palvelun asiakasmäärä oli joka tapauksessa alkanut kasvaa nopeasti, ja vuosituhannen vaihteesta lähtien mukaan tuli yhä enemmän myös ulkomaisia asiakkaita. Mielenkiintoista kyllä Suomi oli mukana ensimmäisten joukossa, ja palvelun käyttö yleistyi täällä monia muita maita nopeammin. Esim. joulukuussa 2001 Suomesta oli FinELib-sopimuksen ansiosta mukana jo 19 asiakasta, mikä oli neljänneksi suurin luku Ison-Britannian (65), Kanadan (39) ja Japanin (25) jälkeen. Selkeä enemmistö palvelun yli tuhannesta asiakasorganisaatiosta tuli toki edelleen USA:sta.

Palvelun rajapinnat ja rajat

Erilaisten haku- ja indeksointipalveluiden, käyttöliittymien ja portaalien kehittymisen myötä myös JSTOR joutui vähitellen sopeutumaan siihen, että se näyttäytyi asiakkaille vain yhtenä käyttöliittymänä muiden joukossa, osana laajempia digitaalisen kirjaston palveluita. Ihan yksinkertaista ja itsestään selvää tämä ei kuitenkaan aluksi ollut. Mielenkiintoista kyllä JSTOR:in hallitus pohti vuosina 1999-2001 pitkään linkittämiseen liittyviä kysymyksiä. Osa hallituksen jäsenistä pelkäsi sitä, että suorat linkit ulkopuolelta palvelun aineistoihin vähentäisivät palvelun oman käyttöliittymän merkitystä ja samalla koko palvelun arvoa. Lopulta hallitus päätyi kuitenkin siihen, että palveluun sisältyville artikkeleille luotiin pysyvät osoitteet ja linkittäminen mahdollistettiin sekä tavallisille käyttäjille että hakupalveluita tarjoaville yrityksille – jälkimmäisille tosin erillistä maksua vastaan.

JSTOR on ollut kiistaton menestys melkein millä kriteerillä tahansa, mutta on selvää, että myös palvelun rajat voivat tulla jossain vaiheessa vastaan. Vaikka JSTOR:in kokoelmien määrä on lisääntynyt merkittävästi myös vuosituhannen vaihteen jälkeisinä vuosina (ks. täydellinen lista), ja maailmassa on kymmeniä tuhansia tieteellisiä julkaisuja (ellei enemmänkin, tieteellisyydelle asetetuista kriteereistä riippuen), vaikuttaa todennäköiseltä että ydinlehtien ulkopuolelle jäävien lehtien digitointi ei jossain vaiheessa välttämättä ole enää aivan yhtä kannattavaa bisnestä. Lisäksi JSTOR:in toiminnan oletuksiin kuuluu se, että sen sisältämät lehdet ovat saatavilla paperille painetussa muodossa, josta ne sitten skannataan digitaaliseen formaattiin. Tässä mielessä JSTOR on siis yhä sidoksissa paperiaikakauden käytäntöihin.

Itse ainakin jäin pohtimaan, mitä tapahtuu siinä vaiheessa jos ja kun tieteelliset lehdet eivät enää lainkaan ilmesty painetussa muodossa, eikä niiden sisältöä välttämättä enää voi muutenkaan ongelmattomasti tulostaa lineaarisesti etenevään printtimuotoon. Tyytyykö JSTOR siis tulevaisuudessa tähän rajattuun (ja sinänsä varmasti mielekkääseen) missioon, vai haluaako se jossain vaiheessa laajentaa skaalaa myös toisenlaisiin aineistoihin? Tähän kysymykseen Schonfeldin muutaman vuoden takainen kirja ei vielä tarjoa vastausta.

Lähdeteos:
Roger C. Schonfeld: JSTOR. A History. Princeton University Press, Princeton, 2003. ISBN 0-691-11531-1
(Kirja löytyy Linda-tietokannan mukaan ainoastaan Kauppakorkeakoulun kirjastosta, mutta se on edelleen saatavilla esim. Amazonin kautta.)