Amazon on parempi kuin kirjasto

Posted on 14.5.2007 by Esa-Pekka Keskitalo

Kyllä on, asiakkaiden mielestä. Ainakin sikäli kuin he vertailevat Amazonin ja kirjastoluetteloiden käyttöliittymiä. Äskettäin pidetyssä 31. European Library Automation Group -kokouksessa professori Maja Žumer Ljubljanan yliopistosta herätteli kirjastoväkeä miettimään, miksi ei riitä, että kirjastot “ovat verkossa” (1).

Asiakkaat kokevat kirjastoluettelot vaikeiksi käyttää. Tämä tiedetään ja on tutkimuksissa osoitettu (2, 3).

Nyt etenkin huomattu, että asiakkaat ovat alkaneet käyttää Amazonia myös kirjastojen käyttöliittymänä. He etsivät kirjan Amazonista, kopioivat sen ISBN-numeron ja tekevät sen perusteella haun kirjastoluetteloon (4).

Kirjastoammattilaisen silmin tämä näyttää aivan käsittämättömältä touhulta. Miksi asiakkaat eivät käytä hyväkseen luetteloiden hakumahdollisuuksia? Siksi, että asiakkaat eivät ole kirjastoammattilaisia. Se, mikä tiskin takana tuntuu maailman yksinkertaisimmalta rutiinilta, ei tunnu kaikista samalta.

Voidaan väittää, että kirjastojen ei pidä tyytyä jäljittelemään hakukoneita, amazoneita sun muita “liian yksinkertaisia” käyttöliittymiä, koska ne voisivat tarjota niin paljon enemmänkin. Mutta on ilmeistä, että nykyiset menetelmät sen enemmän tarjoamisessa ovat epäonnistuneita – tai ainakin vanhanaikaisia.

Voi hyvinkin olla, että kirjastoluettelon tehokkaan käytön oppiminen ei olisi kovin vaikeaa. Vaikeus ja helppous ovat kuitenkin suhteellisia. Kirjaston käyttö ei ole kovin läpikäyvä elementti useimpien ihmisten elämässä. Kirjastot eivät sen takia voi ohjata sitä, mikä ihmisistä tuntuu oikealta ja luontevalta tavalta toimia. Valtavirrasta poikkeaville hakukäytännöille käy kuin piirustuspöydän ääressä vedetyille puistokäytäville: kansa kulkee mieluummin nurmikon poikki kuin arkkitehdin suunnitelmien mukaan, olipa arkkitehdillä ratkaisulleen kuinka mainiot perustelut hyvänsä.

Žumer listasi joitakin ajatuksia siitä, mitä pitäisi tehdä. Ideat eivät suinkaan ole uusia, vaan perustuvat toisaalta siihen, mitä voi oppia hakukoneilta yms., ja toisaalta ilmiöihin, jotka informaatiotutkimuksessa on tunnettu jo vuosikymmeniä.

Yksinkertainen haku. Useimmissa kirjastojärjestelmissä sellainen jo onkin, piilotettuna jonkin mystisen ilmauksen taakse, kuten Helkan “sanahaku -(katkaisu=?)”. Helmetissäkin on sanahaku, mutta se pitää ensin valita “opastetuista hauista”.

Hakutulosten relevanssi on usein kirjastojärjestelmien heikko kohta; pikemminkin perinteisesti tulos järjestetään julkaisuvuoden mukaan. Tähän pitäisi hakualgoritmien kehittelyssä kiinnittää huomiota.

Kirjankansien kuvan liittäminen kuvailutietoihin. En itse oikein sisäistä tämän merkitystä, mutta mitäpä siitä: asiakkaat arvostavat kansikuvia ja pulinat pois.

Suositukset – eli bibliometriseen kytkentään perustuvat vinkit: henkilöt, jotka ovat lainanneet tätä kirjaa, lainasivat myös tuota.

Kirja-arviot: asiakkaat pitävät toisten asiakkaiden arvioita hyödyllisinä. Yksittäisen kirjaston asiakaskunta saattaa olla liian pieni tuottamaan riittävää määrää arvioita. Voisi aprikoida, riittäisikö Suomeen yksi ainoa arviointijärjestelmä, jonka sisältö olisi tietenkin nähtävissä eri luetteloiden kautta. Helppo visioida, hieman vaikeampi toteuttaa!

—

(1) Amazon: competition or complement to OPACs PDF Document (abstract) / Maja Žumer (University of Ljubljana). – Saatavissa: http://elag2007.upf.edu/papers.htm. – [Luettu 14.5.2007]

(2) Why Are Online Catalogs Still Hard to Use? / Christine L. Borgman. – Journal of the American Society for Information Science, 1996, 47, 7, 493. – Saatavissa (lisensoitu aineisto): http://proquest.umi.com/pqdlink? did=639283961&Fmt=2&clientId=23404&RQT=309&VName=PQD. – [Luettu 14.5.2007]

(3) Research And Design Review : Improving User Access to Library Catalog and Portal Information : Final Report (Version 3) / Marcia J. Bates. – Library of Congress Bicentennial Conference On Bibliographic Control For The New Millennium : Task Force Recommendation 2.3, 2003. – Saatavissa: http://www.loc.gov/catdir/bibcontrol/2.3BatesReport6-03.doc.pdf. – [Luettu 14.5.2007]

(4) Rethinking How We Provide Bibliographic Services for the University of California : Final Report: December 2005. – The University Of California Libraries. Bibliographic Services Task Force. – Saatavissa: http://libraries.universityofcalifornia.edu/sopag/BSTF/Final.pdf. – [Luettu 14.5.2007]

11 thoughts on “Amazon on parempi kuin kirjasto”

Lurker on 15.5.2007 at 9:04 said:

Kiitos erinomaisesta jutusta, jatkakaa samaan malliin. Kannattaa kuitenkin ehkä korjata kohta “ei tunnu kakista samalta”. 😉
blogin toimitus on 15.5.2007 at 9:34 said:

Em. kirjoitusvirhe korjattu!
Monoxide on 15.5.2007 at 10:47 said:

Yhteisen kirja-arvion lisäksi riittää ehdottomasti yksi luettelo. Nykytekniikalla yhteiseen luetteloon voidaan kytkeä helposti yleiset hakukoneet ja lisäksi oheistietoja sekä sijaintitietoja.
KSaari on 15.5.2007 at 10:59 said:

Uusimmassa Tietolinjassa (2007, 1) Juha Hakala kirjoitti mm.
“Perinteiset integroidut kirjastojärjestelmät ovat nykyisellään kovin samanlaisia ja mahdollisesti VTLS:n Virtuaa lukuun ottamatta jo vanhahtavia tuotteita: yhden esimerkin mainitakseni, yhdessäkään kirjastojärjestelmässä ei ole tehokasta hakukonetta.” Voisitteko vähän avata tätä teknistä aspektia?

Ja toinen asia: Amazon ON monipuolinen – tai ainakin sillä on kaikki mahdollisuudet siihen: ne kansikuvat, kokotekstien indeksointi, näytesivut, sisällysluettelot, KWIC-hakutulokset, sanojen frekvenssinäytöt (vai onko se “tag cloud”?), you name it. Jos Google ja Amazon saisivat lapsia, yksi olisi varmaankin universaali kirjastoluettelo…
Matti L on 15.5.2007 at 11:10 said:

Kaikkein hauskinta tässä kehityskulussa on, että todelliset edistysaskeleet otetaan nykyään jossain aivan muualla kuin vakiintuneiden kirjastojärjestelmätoimittajien palatseissa. Esimerkiksi hakukoneyhtiö Endecan ja North Carolina State Universityn kirjastojen yhteistyönä syntyi melkoisen näppärä näyttöluettelo (http://www2.lib.ncsu.edu/catalog/).

Yleisten kirjastojen puolella vastikään julkaistu mahdollisuus yhdistää LibraryThing-dataa näyttöluettelotietoihin tulee taatusti asettamaan suuntia tulevalle kehitykselle. Kaiken muun hyvän lisäksi tämä ratkaisu on järjestelmäriippumaton.
Matti L on 15.5.2007 at 11:11 said:

Edelliseen liittyvä linkki: (http://www.librarything.com/thingology/2007/05/danbury-ct-kicks-off-librarything-for.php)
Spammifiltteri näyttäisi olevan aika ärhäkkä, sillä se sallii vain yhden linkin per kommentti
Mikko Airaksinen on 15.5.2007 at 13:49 said:

HelMetin sanahakuun mennään suoraan etusivulta, kuten esim. nimeke- tai tekijähakuun. http://www.helmet.fi
Minna Rouhiainen on 15.5.2007 at 18:22 said:

Kansikuvat ovat minusta erittäin hyödyllisiä oikean teoksen löytymisessä. Itselläni ainakin näkömuisti tässä toimii.

Suosittelusta lainauksen perusteella mainitsisin sen verran, että kirjaston asiakkaiden lainahistoriaa takautuvasti ei saa tietosuojasyistä tallentaa (ainakaan ilman asiakkaan lupaa). Kun asiakas palauttaa teoksen, linkki asiakkaan ja lainan välillä katkeaa. Tästä seuraa se, että suositus voidaan tehdä vain sen perusteella mitä asiakkailla juuri tällä hetkellä on lainassa, mikä ei todennäköisesti tuota tarpeeksi suurta massaa. (Yhdysvalloissa on erilainen yksilönsuojalainsäädäntö kuin meillä, joten se mikä sikäläisissä verkkokaupoissa on ihan yleistä, ei käy meillä).
Juha Hakala on 15.5.2007 at 20:27 said:

Hei,

minua pyydettiin kertomaan tarkemmin miksi olen Tietolinja-artikkelissani sitä mieltä että integroidut kirjastojärjestelmät ovat vanhahtavia, ja mitä se merkitsee että niissä ei ole tehokasta hakukonetta. Aloitan tuosta jälkimmäisestä; Voyager käy hyvästä esimerkistä.

Hyvä indeksointiohjelmisto ei saa nikotella isojen tulosjoukkojen kanssa. Voyagerissa pää kolahtaa kattoon jo 10.000 viitteen kohdalla, mikä estää esimerkiksi vuosilukujen ja koodien käytön Boolen haun rajauksina. Useat kirjastojärjestelmät pärjäävät tässä suhteessa onneksi Voyageria paremmin. Mutta kieliteknologista parannettavaa olisi paljon: kirjastojärjestelmien indeksointimodulit eivät tunnista käytettyä kieltä eivätkä siis kykene vaikkapa palauttamaan indeksoituja sanoja perusmuotoon. Englanninkielessä tästä ei ehkä ole paljoa haittaa, mutta suomalainen käyttäjä toivoisi välttyvänsä sen miettimiseltä, mistä hakutermi pitää katkaista.

Unicoden myötä morfologisesta analyysistä on pakko tulla osa kirjastojärjestelmien perustoiminnallisuutta, koska monista kielistä – esimerkiksi thaista – ei saa selvää ellei ensin pysty erottamaan (yhteenkirjoitettuja) sanoja toisistaan.

Hyvä indeksointiohjelmisto sinänsä ei tietenkään vielä auta, lisäksi indeksoitaessa pitää ymmärtää MARC-tietueen sisältö. Innovativen uudessa Encore-sovelluksessa on avoimen lähdekoodin hakukoneen (Lucent) päälle rakennettu MARC-tietueen tulkintamoduli, ja tulokset näyttävät mielenkiintoiselta.

Kirjastojärjestelmän moderniuden asteen määrittely on tietenkin vaikeaa hommaa, koska mitään yleisesti hyväksyttyä kriteeristöä ei ole olemassa. Mikään yksittäinen tekijä kuten vaikkapa se, sovelletaanko relaatiotietokantaa vai ei (jota muistan eräässä kotimaisessa järjestelmähankkeessa sovelletun tärkeänä kriteerinä – ei kerro koko totuutta eikä aina edes osatotuutta.

Arkijärki sanoo, että jos sovelluksessa on paljon vanhoja rakenneratkaisuja ja koodia, se ei välttämättä ole enää ajan tasalla. Vanha tekninen perusta ei välttämättä näy normaalissa toiminnassa, mutta se voi hankaloittaa uudentyyppisten ominaisuuksien rakentamista. Hyvä esimerkki on FRBR-tuen lisääminen nykyisiin kirjastojärjestelmiin. Minusta yksi järjestelmän moderniuden kriteeri on se, miten (bibliografinen) data tallennetaan, ja mitä operaatioita tuolle datalle voidaan tehdä.

Vanhimmissa kirjastojärjestelmissä MARC-tietueita ei sellaisenaan tallenneta minnekään, koska suunnittelussa keskeinen tavoite oli tilan säästäminen. MARC-tietueet rakennetaan tarvittaessa yksittäisistä tietoelementeistään, mikä vanhoilla palvelimilla oli raskas operaatio.

Levytilan halventuessa järjestelmiä muutettiin niin, että MARC-tietueiden “kuvat” ja korttinäytöt tallennettiin kantaan ikään kuin valmiiksi. Tällä tavoin “tulostus” näytölle saatiin nopeaksi, mutta kovin joustava järjestelmät eivät edelleenkään olleet. FRBR-toteutus onnistuu tällöin vaikkapa Danbibin malliin siten, että tietokantaan ja tietueisiin ei kosketa, mutta tulosjoukot analysoidaan FRBR-algoritmilla, ja asiakkaalle annetaan ensin nähtäväksi näin syntyneet teostason tietueet.

Moderni kirjastojärjestelmä voisi toimia vaikkapa niin, että bibliografista ja mahdollisesti muutakin dataa ei palastella indekseihin eikä jäädytetä MARCin kaapuun, vaan tiedot tallennetaan XML-muodossa. Tietosisältöjä ja datan näyttömuotoja voidaan tällöin “säätää” helpommin kuin edellä mainituissa ratkaisuissa, jos ohjelmisto on suunniteltu hyvin. Virtuassa bibliografisten tietojen sisäinen tallennusmuoto on XML, ja yrityksen edustajien mukaan tämä on keskeinen syy sille, miksi FRBR-implementointi tietokannan tasolla oli heille ilmeisesti melko helppoa. Samantyyppiseen XML-pohjaiseen ratkaisuun on päätynyt OCLC uudessa WorldCatissa. Muitakin XML-vetoisia järjestelmiä voi alallamme olla tuotannossa tai kehitteillä, mutta minulla on tiedossani vain nämä kaksi tapausta. Sekä OCLC että VTLS joutuivat näitä sovelluksia rakentaessaan melko koville; hankkeiden aikataulut lipsuivat alkuperäisestä.

Järjestelmän rakenteen modernisointi ei todellakaan ole helppoa, siinä ovat epäonnistuneet täydellisesti alan suurista yrityksistä esimerkiksi DRA (Taos-ohjelmisto) 2000-luvun taitteessa ja aivan äskettäin Sirsi/Dynix Corinthian-hankkeessaan. Tätä taustaa vasten on ymmärrettävää, jos kirjastojärjestelmien modernisointihankkeissa edetään varovasti, askel kerrallaan.

Ja paraskaan sisäinen arkkitehtuuri ei takaa järjestelmän menestymistä, jos sen tarjoamat palvelut eivät tyydytä kirjastojen henkilökuntaa ja asiakkaita. Ehkäpä moderniutta pitäisikin mitata ennen muuta sillä, miten helpoksi tiedonhaku saadaan. Milleniumin Encore saattaa olla ensimmäinen merkittävä askel tähän suuntaan, mutta se tulee varmasti saamaan nopeasti kilpailijoita jotka luultavasti eivät, toisin kuin edeltäjänsä, ole enää sidoksissa MARC-formaattiin.
KSaari on 16.5.2007 at 9:35 said:

Kiitos, Juha!
Heikki Poroila on 16.5.2007 at 9:48 said:

Hakuja on niin monenlaisia…

Amazon & Co:n hakujärjestelmät on rakennettu maksimoimaan kenen tahansa palveluun tupsahtavan ostaminen. Minusta se on hiukan eri asia kuin koettaa auttaa yksilöä löytämään juuri se tai sitä, mitä etsitään. Meillä on varmasti opittavaa myös amazoneilta, mutta en pidä järkevänä kehittää kirjastojen tietojärjestelmiä yksi yhteen kaupan malliin.

Aivoni eivät osaa mielikuvitella niitä teknisiä ratkaisuja, joilla asiakkaan päässä oleva kysymys tai tiedontarve saadaan parhaiten koodattua sanoiksi tai lausekkeiksi. Siksi pidän toista ihmistä parhaana tulkkina, kunhan tämä toinen osaa hakujärjestelmän tekniikat. Epäilen, että kaikkien tiedonhakijoiden tehokkaan palvelun edellyttämä järjestelmä on ikiliikkujan kaltainen kangastus.

Olen vahvasti sitä mieltä, että kirjastojen bibliografiset tietokannat ja niihin kytketyt yleisönpalvelujärjestelmät ovat monella tavalla kankeita ja vanhanaikaisia. Riittää kun toteaa, kuinka vähän käytetään hyväksi ihmisen käsityskyvylle niin tärkeätä visuaalisuutta eli grafiikkaa. Systeemimme luottavat ihmisten hyviin kielellisiin valmiuksiin. Niitäkin on, muttei kaikilla.

Jos pitäydymme bibliografistyyppisen informaation käytössä, visuaalisuutta voidaan ja täytyy lisätä. Se lisännee kirjaston tietokannan käytön mukavuutta ja luultavasti volyymiäkin.

Kirjastojärjestelmien arvo – sanoisin pysyvä arvo – verrattuna amazonien tarjouksiin on kyvyssämme strukturoida sisältödokumentteihin liittyvää hakuinformaatiota. Ainakin itse olen täysin kyllästynyt amazonien tapaan tarjota kaupallisista syistä kaikkea muutakin kuin mitä haen. Kirjaston tietokannassa voi kohtuullisen hyvin rajata haun vain siihen, mitä tarvitaan. Kaupallisella puolella se on paljon vaikeampaa, koska yleisöä miellyttävien tekniikoiden tarkoituksena on myydä mahdollisimman paljon.

MARC on ollut varsin nokkela tapa ratkaista kansainvälisesti bibliografisen informaation strukturointi. Hakumuotojen standardointi on ehkä vielä tärkeämpi keksintö, jota kaupallisella puolella ei juurikaan hyödynnetä (se on liian työläs ja siis kallis). Jonkinlaisesta perus-MARCista täytyy ehkä pitää kiinni, ellei joku hyvin perustellen esitä sille vaihtoehtoa. Myös hakutiedon standardoinnin periaatteet ovat mielestäni kestäneet verkkoympäristössäkin varsin hyvin.

Kirjastojen järjestelmissä pitäisi mielestäni sanoa selkeästi ja kiertelemättä, mitä hakutapoja on jokamiehelle (grafiikkaa, animaatiota, vähän tekstiä) ja mitä hakutapoja on sille, joka motivoituu käyttämään monipuolisempia työkaluja. Esimerkiksi HelMetin etusivu on karmea esimerkki siitä, miten erityyppisiä hakuja ei mitenkään hahmoteta, vaan useimmille todennäköisesti helpoin lähtökohta eli sanahaku on melkein piilotettu monien näennäisesti samankaltaisten tekstirivien joukkoon.

Kirjastopalvelua helpottavan verkkotiedonhaun ei tarvitse mielistellä asiakasta tai pyrkiä “myymään” mahdollisiman monta lainaa. Sitä sopii kuitenkin kehittää roimasti asiakkaan parhaaksi. Esimerkiksi hakutulosten relevanssin ilmaisemisessa olemme tosiaan huonoja.

Heikki Poroila