Tekeekö Google Book Search tutkimuskirjastoista tarpeettomia?

Harvardin yliopiston kirjaston johtaja, tunnettu 1700-luvun tutkija Robert Darnton kirjoittaa The New York Review of Books -lehden kesäkuun numerossa tutkimuskirjastojen tulevaisuudesta ja massadigitoinnista.

Darntonin oma kirjasto on yksi ensimmäisistä Googlen yhteistyökumppaneista, ja hän tunnustautuukin Google-intoilijaksi. Äkkiseltään voisi kuitenkin ajatella, että yhteistyöllä on myös kääntöpuolensa: Eikö se, että kaikki kirjat ovat löydettävissä digitoituna Googlesta, tee tutkimuskirjastoista tarpeettomia? Tilanne on täysin päinvastainen, vakuuttaa Darnton. Google tekee tutkimuskirjastoista jatkossa entistä tarpeellisimpia.

Darnton perustelee kantaansa seuraavasti:

Ajatus siitä, että Google Book Search kattaisi kaiken kirjallisuuden, on harhaanjohtava ja luo väärän mielikuvan palvelun luotettavuudesta. Kuinka suuren osan vaikkapa Yhdysvaltojen kirjastojen kokoelmista Google digitoi? 75 %? 50 %? 25 %? Vaikka digitoinnin kate olisi 90 %, herää kysymys, millaista tärkeätä aineistoa jätetään digitoimatta. Käsitys siitä, millainen aineisto on tärkeää, taas vaihtelee sukupolvesta toiseen. Tämän päivän kioskikirjat, tietokoneoppaat ja puhelinluettelot voivat olla jonain päivänä tutkijoille kullanarvoisia. Turvautuvathan esimerkiksi kirjallisuustieteilijät ja historioitsijat nykyisin almanakkoihin, arkkiveisuihin ja sanomalehtiin, jotka aikalaisten näkökulmasta olivat arvottomia eikä niitä turhaan säästetty.

Google tekee tällä hetkellä yhteistyötä 28 kirjaston kanssa Yhdysvalloissa ja Euroopassa. Yllättävää kyllä, ensimmäisten yhteistyökirjastojen kokoelmissa oli vain vähän päällekkäisyyttä: 60% Googlen digitoimasta aineistosta löytyi vain yhdestä kirjastosta (Anatomy of Aggregate Collections). Suurimmat harvinaisuudet ja hankalimmin saavutettavat aineistot ovat kuitenkin kirjastojen erikoiskokoelmissa, joiden digitointiin Google ei ainakaan vielä ole ryhtynyt. Erikoiskokoelmien digitointi jääneekin tutkimuskirjastojen itsensä toteutettavaksi.

Tutkimuskirjastot eivät viime kädessä voi luottaa muihin kuin itseensä: ne säilyvät vuosisadoista toiseen, mutta IT-maailman muutokset ovat nopeita, ja yrityksiä sekä palveluita syntyy ja kuolee. Digitoinnissa voi myös tapahtua virheitä: jokin sivu tai kokonainen kirja jää digitoimatta, kuvan laatu voi olla heikko jne. Myös aineiston pitkäaikaissäilytykseen liittyy omat riskinsä, mutta täydellistä menetelmää ei ole keksittykään. Tai lähes täydellinen on, toteaa Darnton: ennen 1800-luvun alkua lumppuperille käsin painettu kirja on kestävämpi tallennusmedia kuin mikään muu!

Oma ongelmansa liittyy tekijänoikeuksiin: Google Book Search tarjoaa kokotekstinä ainoastaan tekijänoikeusvapaata aineistoa, mutta entä uusi aineisto. Pystyykö Google huolehtimaan siitä? Darnton muistuttaa, että tutkimuskirjastojen tulisi pikemminkin lisätä hankintamäärärahojaan kuin luottaa jonkun muun huolehtivan uuden kirjallisuuden tarjoamisesta.

Kirjastonhoitajaa kiinnostaa myös Google Books Searchin hakualgoritmi. Koska Google aikoo digitoida useita saman teoksen laitoksia (mikä on tutkijan kannalta iloinen uutinen), herää kysymys miten hakutulokset järjestetään. Googlen yleinen hakukone järjestää dokumentit niihin johtavien linkkien määrän ja laadun mukaan. Tätä menetelmää ei kuitenkaan voida soveltaa digitoitujen kirjojen kohdalla, esimerkiksi Shakespearen tuotannon kohdalla käyttäjä joutuisi keskelle saman teoksen eri laitosten ja painosten sekasotkua.

Darnton muistuttaa myös, ettei digitoimalla voida tallettaa kaikkia kirjalle ominaisia piirteitä, kuten julkaisun kokoa ja paperin laatua, jotka etenkin vanhimpien kirjojen kohdalla ovat tutkijalle kullanarvoisia vihjeitä eli kyse ei ole ainoastaan lukukokemuksen romantisoinnista tai vanhakantaisuudesta. Suurimalle osalle lukijoista riittää tietenkin pelkkä tietosisältö.

Google Book Searchin merkitys tutkijoille ja muille tiedontarvitsijoille on suuri, mutta tutkimuskirjastoja se ei korvaa: “Long live Google, but don’t count on it living long enough to replace that venerable building with the Corinthian columns”, Darnton toteaa.

Darntonin artikkeliin ja sen herättämään keskusteluun voi tutustua NYR Booksin sivuilla:

10 thoughts on “Tekeekö Google Book Search tutkimuskirjastoista tarpeettomia?

  1. Pingback: Blogispotti.fi

  2. Kiitokset kiinnostavasta jutusta! Yksi kommentti: eikö ole melkoista optimismia olettaa että tutkimuskirjastot säilyvät vuosisadasta toiseen, mikäli siis tarkoitetaan kirjastoa sellaisena fyysisenä rakennuksena tai tilana jollainen se nyt on?

    Minulla on se käsitys, että jo nyt hyvinkin suuri osa luonnontieteilijöistä ei käytä enää kirjastoa kuten ennen, että sinne mentiin hakemaan kirjoja tai lukemaan aikakausijulkaisuja, koska kaikki relevantti tieto on jo tavoitettavissa netin kautta. Ehkä kirjasto organisaationa säilyy, mutta eikö ole aika todennäköistä, että se tulee muuttumaan rajusti toisenlaiseksi kuin me sen nyt käsitämme?

  3. Totta puhuen Darntonin argumentaatio ei tältä osin täysin vakuuttanut minuakaan.

    Vaikka merkittävä osa aineistoista on ainakin vielä hyvin pitkään käytettävissä vain kirjastojen sisällä, verkon kautta (vapaasti tai rajoitetusti) saatavilla olevan aineiston määrän kasvun voi kuitenkin ajatella marginalisoivan perinteisiä tutkimuskirjastoja lähinnä vain tiettyjen vielä digitoimattomien tai käyttöoikeudeltaan rajattujen erikoisaineistojen tarjoajiksi ja vanhan paperimuotoisen materiaalin varastoijiksi. Ihan pelkkä korinttilaisten pylväiden lumo tuskin riittää houkuttelemaan asiakkaita paikalle, jos lähes kaikki olennainen materiaali on muutenkin saatavilla missä tahansa ja milloin vain eikä kirjasto fyysisenä paikkana kykene tarjoamaan tutkijoille muuta lisäarvoa.

    Muutos on tuskin kuitenkaan aivan äkillinen: tällä hetkellä rajalinja tuntuu kulkevan jossain artikkelien ja monografioiden välillä. Artikkelien lukeminen verkon kautta alkaa olla useimmilla aloilla pikemminkin sääntö kuin poikkeus, mutta monografioiden kohdalla valtaosa asiakkaista preferoi edelleen perinteistä painettua formaattia. Niinpä esim. humanisteja saadaan todennäköisesti houkuteltua kirjaston seinien sisälle vielä varsin pitkään.

    Samalla on syytä korostaa sitä, että kirjastojen toiminta on jo muutaman viime vuosikymmenen aikana muutenkin muuttunut varsin paljon – moniko muistaa vielä aikaa ennen kirjastojen aineistotietokantoja ja kaikkia niiden mukanaan tuomia muutoksia? Kirjastomaailmassa tiedostetaan varsin hyvin se, että säilyäkseen kirjastojen täytyy kyetä uudistumaan. Esim. Suomessa kirjastot ovat panostaneet voimakkaasti elektronisten aineistojen hankintaan, ja ne ovat julkaisuarkistojen yleistymisen myötä hakemassa suurempaa roolia myös julkaisujen välittäjinä, tieteellisen tiedon julkaisijoina ja laajemminkin tieteellisen toiminnan tukena.

    Mutta jos tutkimuskirjastot (perinteisessä merkityksessä, tietyssä fyysisessä tilassa sijaitsevana kokonaisuutena) haluavat säilyttää merkityksensä, mikä on se ydin jonka ympärille toimintaa kannattaa – kokoelmien lisäksi – tulevaisuudessa rakentaa? Löytyykö vastaus korinttilaisista pylväistä, tiedonhankinnan niksien opettamisesta (kaikkihan kuitenkin osaavat käyttää Googlea…?), syvällisestä sisältöosaamisesta, yhteistyöprojekteista tutkijoiden kanssa vai kenties jostain muualta?

  4. Tulevaisuuden tutkijoiden informaatiokäyttäytymistä ja samalla tieteellisten kirjastojen tulevaisuudennäkymiä on selvitelty British Libraryn ja JISCin raportissa Information Behaviour of the Researcher of the Future
    http://www.bl.uk/news/pdf/googlegen.pdf . Siihen kannattaakin ehdottomasti tutustua.

  5. Palaan vielä tähän kirjaston tulevaisuus teemaan, sillä aihe on kyllä minusta aika mielenkiintoinen.

    Yrittäessäni selvitellä itselleni kunnolla tätä ontologia asiaa (kirjoittakaapas muuten te Yleinen suomalainen ontologia eli YSO:sta jotakin, miten se tulee muuttamaan tiedonhakua tulevaisuudessa?) lueskelin tätä Kamut2 raporttia, jossa oli minusta aika hyvin ja suhteellisen yksinkertaisesti tiivistetty ainakin minulle vaikeaselkoisia ja monimutkaisia asioita. Pitänee seuraavaksi lukea tuo British Libraryn/JISCin raportissa.

    Kamut2 tekstissä puhutaan siitä, miten ”tietopalveluorganisaatio” tulisi nähdä paremminkin ”suodattimena” tai ”vaihteena” informaation äärelle. Eikös tässä mielessä (tiede)kirjastoa ainakaan fyysisenä rakennuksena, sellaisena kuin me sen nyt tunnemme ei tarvittaisi? Laitan tähän lainauksen raportista, vaikka se on jo vuodelta 2004 on se silti kiinnostava. Miten lienevät arkkitehdit käsitelleet tätä kysymystä, luulisi asian tuottavan harmaita hiuksia juuri nyt monille?

    ”7.2 Visioita tulevaisuuteen

    Käsite digitaalinen muistiorganisaatio käsittää tulevaisuudessa koko verkosta käytettävien elektronisten resurssien kirjon tallennettuna yhteiskäytön mahdollistavin teknologioin. Tavoitteet ovat samat kuin ennenkin. Tiedon tarjonta käyttäjille silloin, kun sitä tarvitaan, ja käyttäjien avustaminen tiedon lähteille, jotta hän voi käyttää tietoa tehokkaasti. Ainoa poikkeus ovat elektroniset resurssit, joten yhtenä uutena päätehtävänä on resurssien jakelun ja organisoinnin lisäksi pääsyn tarjoaminen digitaalisiin resurseihin [Lancaster & Warner 2001]. Tietopalveluorganisaatio tulisi tulevaisuudessa pikemminkin nähdä suodattimena, joka etsii kaikkein relevanteimmat dokumentit ja tallettaa nämä resurssit omaan tietovarantoonsa.

    Tällä hetkellä osa asiantuntijoista näkee tietopalveluorganisaation tulevaisuudessa ilman kokoelmia. Esimerkiksi kirjastoa visioidaan pelkkänä ”vaihteena”, joka tarjoaa käyttäjille mahdollisuuden päästä eri puolilla sijaitsevaan informaatioon. Toinen ajattelutapa lisää ensimmäiseen tietopalveluorganisaation tehtäväksi myös tiedon organisoimisen, ts. hakemistojen ja muiden tiedonhakua helpottavien työkalujen kehittämisen. Näkemykset ovat kuitenkin saaneet kritiikkiä, koska esimerkiksi kirjaston ei uskota säilyvän pelkkänä ”tieto-vaihteena”. Tästä syystä kritisoijat esittävät, että esimerkiksi muistiorganisaation tulee tulevaisuudessakin toimittaa sille tällä hetkellä uskottuja tehtäviä. ”

    Raportti löytyy pdf-muodossa täältä:
    http://www.nba.fi/tiedostot/8c050dc5.pdf

  6. Googlen kirjadigitoinnista ja tulevaisuuden ennustettavuudesta

    Kiinnostava aihe ja toistuvasti esillä. Darntonin lausahdus lumppupaperille painetun kirjan kestävyydestä pitää varmaankin paikkansa. Olkoon tuttu todiste: Rabanus Mauruksen “De sermonum proprietate” vuodelta 1467 on yhä kuin kirjapainosta juuri tullut.

    Digitoidun aineiston säilyvyyttä ei voi ennustaa, mutta tähänastisen kokemuksen perusteella se ei missään tapauksessa säily satoja, saati tuhansia vuosia. Sen tulkinnassa on liian monta muuttuvaa tekijää ja kaikki kiivaan kaupallisen kehittelyn kohteena. Epäilemättä jotkut tieteen ja taiteen “bestsellerit” säilyvät yhä uusien digipainosten ansiosta, mutta unelma kaiken jo olemassa olevan kirjallisuuden digitoinnista ja säilymisestä on harhainen haave ja lisäksi typerä. On valtavasti aineistoa, jolla ei kannata digiarkistoja kuormata, niitä tarvitaan ani harvoin jos koskaan. Silti hyvä jos säilyvät painettuina joitakin satoja vuosia ja satunnaiset tutkijat ovat kiitollisia.

    Mistä yleensäkin tulee tämä vimma, että kaiken pitää säilyä, emmehän säily itsekään. Kuka meidät digitoisi. Mutta Kansalliskirjastojen kaltaisten laitosten suurena ja perin arvokkaana tehtävänä on koota ja säilyttää ja taistella ajan torahampaita vastaan. Painetun aineiston osalta siitä on kokemusta satojen vuosien ajalta, digitaalisen osalta kirjasto voi onnistua vain tyydyttävästi, pitkässä juoksussa ehkä ei lainkaan. Mutta tämä jos mikä on tulevien sukupolvien huoli, ei meidän. Me säilömme vain omat silakkamme ja hillomme.

    Ennustamisen heikkous näkyy siinäkin, että vain yksi sukupolvi tarvittiin muutokseen: oma sukupolveni luki lukemasta päästyään kirjoja, lasteni sukupolvi ei lue kirjoja, mutta nettiä sitä enemmän ja tuotemainoksia. Käyttöliittymänä kirja on kova sana, mutta menköön jos on mennäkseen. Jos aioitte julkaista muistelmanne tai runokokoelman, tehkää se painettuna.

    Kirjastojen tulevaisuutta on yhtä mahdotonta ennustaa. Voi arvata että jotain vastaavia maksuttomia kokoontumispaikkoja tulee olemaan, joissa voi istua alas, olla vain ja ihmetellä ihmisen ainaista aherrusta ja luovuutta – olipa dokumentoinnin välineenä sitten sähköinen kuva, painettua paperia, performanssia tai vaikkapa vain maisemamaalaus seinällä.

    Eniten laskisinkin ihmisen luontaisen uteliaisuuden ja tarmon varaan, tarpeeseen monistaa itseään ja luovuuttaan, tässä ihminen on aina ollut Jumalan repsikkana vertaansa vailla, niin hyvässä kuin pahassa.

  7. En ota kantaa digitaalisen aineiston säilymiseen, mutta se on käytettävyydeltään ylivoimaista. Digitointi myös helpottaa kirjojen (vanhojenkin) kirjojen saatavuutta.

  8. Digitaalinen aineisto on käytettävyydeltään ylivoimaista, jos on tarpeen etsiä tietoa tai tarkistaa joitakin asioita. Mutta jos kyseessä on monografia, on kirjan käytettävyys ylivoimainen digitaaliseen aineistoon tai tulosteeseen verrattuna.

  9. Digitaalisessa säilyvyydessä itseä mietityttää että vaikka olen kaikki lataamani ja tuottamani bitit arkistoinut 20 vuoden ajan, joukossa ainakin muutamia kotimaisia tuotoksia jotka voivat olla jo muualta hävinneet, niin mitä sitten kun minä en enää ole tuosta digiarkistostani huolehtimassa? Varmaan joutaa kaatopaikalle. Silti itselle sen sisältö on kuitenkin erittäin arvokas ja varmasti kertoo minusta ja tekemisistäni enemmän kuin joku valokuva esimerkiksi.

    Ensin ajattelin että ehkä olisi joku kirjasto joka voisi tuollaisia levyjä ottaa vastaan mutta eihän ne voisi ainakaan niiden sisältöä julkaista varmaan sataan vuoteen kun siellä voi olla jotain non-public-domain materiaaliakin.

    Parempi idea olisikin kehittää jonkinlainen “kirjasto torrent” joka olisi kaikki maailman ip, tieto ja media yhdessä torrentissa jota voisi sitten jatkuvasti laajentaa sitä mukaa mitä ihmiset lisäävät tavaraa. Sitä voisi ehkä rajoittaa siten että jos tänään lisään kirjastoon arkistoni, niin siinä olisi vaikka 10 vuoden viive ennenkuin torrent palvelin hyväksyisi datan jolla on se tarkistussumma (esm SHA-1/MD5) jonka tänään tarjosin. Tämä mekanismi tarjoaisi oikeudenhaltijoille kohtuullisen 10 vuoden ajan tehdä rahaa tuotoksillaan ennenkuin se olisi kaikkien saatavilla tuolta kirjasto-torrentista jota on sitten aivan mahdoton oikein implementoituna sammuttaa. Kaksi erittäin merkittävää eroa siis perinteiseen p2p/torrent jakeluun. Käytännössä ei vielä kovin käytännöllinen mutta kunhan up-kaista ja isot levykoot vielä yleistyvät niin on hyvin käytännöllistä että muistitikulle mahtuu kaikki maailman tieto ja media.

Comments are closed.