Huomioita FinELibin käyttäjäkyselyn tuloksista

Kansalliskirjastossa toimiva Kansallinen elektroninen kirjasto FinElib vietti tänään kymmenvuotisjuhliaan Helsingin yliopiston pienessä juhlasalissa järjestetyssä koko päivän seminaarissa. Lähes samanaikaisesti juhlien kanssa julkistettiin myös FinELibin tuoreimman, huhtikuun aikana tehdyn käyttäjäkyselyn ensimmäiset tulokset.

Kyselyn formaattia on uudistettu jonkin verran aiempiin vuosiin verrattuna, ja tulokset ovat monilta osin hyvin mielenkiintoisia. Kyselyn mukana tulleet kuulemma erittäin lukuisat avoimet kommentit eivät tosin vielä ole saatavilla, mutta niistäkin pitäisi olla tulossa jonkinlainen kooste, kunhan aineisto saadaan ensin käytyä läpi.

Kyselyyn tuli kuukauden aikana yhteensä 5573 vastausta, joista yliopistoista tuli 1882, ammattikorkeakouluista 2154, tutkimuslaitoksista 611 ja yleisistä kirjastoista 926. Kyseessä oli vapaaehtoinen nettikysely, eli siihen vastanneet eivät välttämättä ole edustava otos kaikista aineistojen potentiaalisista käyttäjistä, mutta tästä huolimatta tuloksista saa kuitenkin hyvän käsityksen elektronisten aineistojen käytön trendeistä. Yleisellä tasolla kyselyn vastaukset näyttävät osoittavan, että kirjastojen tarjoamia elektronisia aineistoja arvostetaan, ja niillä on myös ollut positiivinen vaikutus korkeakouluissa ja tutkimuslaitoksissa tehtävään työhön (kysymys 2.10).

FinELibin sivuille on tallennettu myös alkuperäiset kyselylomakkeet, mistä onkin vastauksia tulkitessa hyötyä. Esim. viitetietokantojen suosion vähäisyydestä (kysymys 2.6) on ehkä turha tehdä kovin hätäisiä johtopäätöksiä, kun vaihtoehtoina olivat myös elektroniset kokotekstiaineistot ja vastaajia pyydettiin valitsemaan kahdeksasta vaihtoehdosta kolme ensisijaisinta ja tärkeintä. Jos samat aineistot olisivat saatavilla myös kokotekstinä, kukapa valitsisi pelkän viitetietokannan?

Asiakkaiden eniten kaipaamissa aineistoissa on ehkä odotetustikin suuria sektorikohtaisia eroja. Yliopistoissa ja tutkimuslaitoksissa ulkomaiset tieteelliset lehdet ovat ylivoimaisesti halutuin aineisto, mutta ammattikorkeakouluissa ja etenkin yleisissä kirjastoissa niiden kysyntä on huomattavasti vähäisempää. Sanakirjat ja hakuteokset ovat toisaalta suosittuja sektorista riippumatta.

Omalta kannaltani mielenkiintoista on mm. se, miten tärkeänä aineistona yliopistojen ja ammattikorkeakoulujen opinnäytteitä ja elektronisia julkaisuja pidetään kaikilla sektoreilla – ammattikorkeakouluissa ne ovat jopa kaikkein toivotuin aineisto. Korkeakoulujen elektroniset julkaisut ovat jo nyt pääosin vapaasti saatavilla verkossa, eli kysymyksen muotoilun (“minkä tyyppisiä elektronisia aineistoja ensisijaisesti toivoisit hankittavan [organisaatiosi] käyttöön”) ei olisi pitänyt edes suosia niiden valitsemista.

Yliopistojen julkaisujen menestyksen lisäksi tuloksissa herättää lisäksi huomiota myös kotimaisten lehtien suuri suosio. Tutkimuslaitoksia lukuun ottamatta ne ovat kaikilla sektoreilla neljän halutuimman aineiston joukossa. Kansalliskirjaston ylläpitämän, nimenomaan kotimaisia tieteellisiä artikkeleita julkaisevan Elektra-palvelun käyttö voisi olla runsaampaakin, mutta kysynnän puutteesta asian ei siis pitäisi olla kiinni. Ilmeisesti kotimaisten aineistojen paketointia, haettavuutta ja markkinointia pitäisi vielä kehittää.

Kyselyssä tiedusteltiin myös sitä, olisivatko vastaajat valmiita luopumaan painetuista aineistoista, jos ne olisivat saatavilla elektronisena versiona. Lehtien kohdalla vastaus oli selkeä “kyllä”, samoin sanakirjojen ja hakuteosten, mutta painettujen monografioiden osalta vastaus näyttää yhä pääosin olevan “ehdottomasti ei”. Vastaavat ulkomaiset kyselyt ovat tiettävästi tuottaneet samansuuntaisia vastauksia, eli kyseessä ei ole mikään suomalainen erikoisuus. Selitystä tälle kannalle löytyy varmaankin kysymyksestä 2.11., jossa tiedusteltiin elektronisten aineistojen käytön ongelmista. Sektorista riippumatta vastauksissa toistuu vaihtoehto “ruudulta on hankala lukea”.

Yksi kysymyksistä (3.1) koski myös sitä, missä elektronisia aineistoja käytetään. Oman työhuoneen suuri suosio yliopistoissa ja tutkimuslaitoksissa ei ehkä ole yllätys, mutta toisaalta on mielenkiintoista huomata, miten paljon aineistoja käytetään myös kotona. Esim. yliopistoissa kodin osuus eletronisten aineistojen edellisenä käyttöpaikkana on yli 30%, kun taas kirjastojen, oppimiskeskusten ja atk-asemien osuus on yhteensä vain alle puolet tästä. Eli jos kirjaston paikalliskäyttäjät näyttävät vähentyneen, todennäköinen syy löytyy todellakin siitä, että käyttäjät istuvat nyt joko omassa työhuoneessa tai kotona. Vastaajat olivat myös sektorista riippumatta lähes yksimielisiä siitä, että tärkein elektronisia aineistoja koskeva tiedonlähde ovat kirjaston omat kotisivut.

Jäähyväiset CD-levylle?

New York Times -lehti uutisoi tänään (Jeff Leeds: “Plunge in CD Sales Shakes Up Big Labels“), että CD-levyjen myynti on pudonnut USA:ssa tänä vuonna jo 20%. Artikkelissa haastateltu konsultti uskoo, että joulu 2007 on CD-levyjen myynnin viimeinen huippusesonki ja sen jälkeen kaikki alkaa olla tämän formaatin osalta ohi.

Vaikka CD-levyllä saattaa tällaisista tuomiopäivän ennusteista huolimatta olla armonaikaa vielä joitakin vuosia, näyttää kuitenkin varmalta, että sille on vääjäämättä käymässä samalla tavoin kuin aiemmin mm. savikakuille, vinyylilevyille ja C-kaseteille. Itse kuulun vielä siihen sukupolveen, jolle musiikin ”oikea” tallennusformaatti oli analoginen vinyylilevy, eikä myöhemmin lanseerattuun CD-formaattiin koskaan kehittynyt aivan samanlaista suhdetta. Henkinen askel konkreettisista, käsin kosketeltavista tallenteista pelkkänä tiedostona levitettävään musiikkiin tuntuu kuitenkin yllättävän suurelta, vaikka kuinka yrittäisi uskotella itselleen, että tietokoneen kovalevylle ja CD-levylle on tallennettu täsmälleen samat bitit, eikä niissä siten pitäisi olla mitään eroa.

Nuorimmat sukupolvet eivät kuitenkaan enää yhdistä musiikkia samalla tavalla fyysisiin tallenteisiin, ja nuorisolle musiikin hankkiminen tiedostomuodossa kavereilta, vertaisverkoista tai verkkokaupoista onkin jo arkipäivää. Musiikin markkinointia ja jakelua vuosikymmenien ajan hallinneiden suurten levy-yhtiöiden kannalta on tosin kiusallista, ettei tiedostomuodossa ”laillisesti” kaupattavan musiikin myynti ole kasvanut läheskään samaa vauhtia CD-levyjen myynnin laskun kanssa. Kuten New York Timesin artikkeli toteaa, yhtiöt saavat syyttää tästä suurelta osin itseään. Ne lähtivät aivan liian myöhään mukaan verkkobisnekseen, ja niiden lanseeraamat mutkikkaat ja hankalat DRM-suojaukset ovat myös olleet omiaan karkottamaan asiakkaita.

Mitä tämä kaikki oikein merkitsee kirjastojen kannalta? Fyysisten tallennusvälineiden katoaminen on tietysti iso muutos myös musiikkikirjastoille. Intervalli-lehti on ollut hyvin ajan tasalla, ja parin kuukauden takainen numero (saatavilla pdf-muodossa) tarjoaa kiinnostavia pohdiskeluja tallennusformaattien muutoksen musiikkikirjastotoiminnalle aiheuttamia haasteista. Kansalliskirjaston ja sen ylläpitämän Kansallisen äänitearkiston näkökulmasta taas myös verkossa levitettävään musiikkiin ulottuva uusi vapaakappalelaki tuntuu aina vain kiireellisemmältä.

Mutta nyt taitaa olla aika siirtyä takaisin Ebay:n sivulle metsästämään aina yhtä kiehtovia alkuperäisiä 45 kierroksen vinyylisinglejä…

Terveisiä triangelipäiviltä

Järjestyksessä kolmannet triangelipäivät järjestettiin 22.-24.5. Tampereen ammattikorkeakoulussa Tampereen seudun kirjastojen yhteisvoimin. Triangelipäivissä yhdistyvät Voyagerin ja Metalib-SFX:n käyttäjäryhmien kokoukset, ja lisänä on yleisemmin kirjastopalveluihin ja erityisesti niiden kehittämiseen, tekniikkaan ja yhteensopivuuteen liittyviä esityksiä.

Päivien ohjelma on osoitteessa http://www.uta.fi/laitokset/kirjasto/triangeli/index.htm

Päiville oli kutsuttu puhumaan Richard Wallis Talis Groupista, joka on brittiläinen kirjastojärjestelmäfirma. Esitys käsitteli Kirjasto 2.0:aa, joka nyt on kaikkien huulilla. Esityksen pääpiirteet käyvät ilmi Richardin blogista, http://blogs.talis.com/panlibus/archives/2007/
05/openness_and_sh.php

Päivistä varmaan poikii vielä lisääkin sanottavaa. Ehkäpä ensi vuonna olemme jo oppineet siihen, että blogaamme samalla kun kuuntelemme esityksiä. Ellei sitten ensi vuonna ole jo ihan uudet tekniikat.

Tässä täytyy vielä erityisesti kiittää kaikkia asianosaisia mainioista järjestelyistä!

Kirjastojen käyttämän metadatan lähteistä

OCLC:n varapresidentti Lorcan Dempsey pohtii tuoreessa blogimerkinnässään (“Four sources of metadata about things“) erilaisia aineistoja kuvailevan metadatan lähteitä, jotka hän luokittelee neljään eri ryhmään.

1.) Ammattimaisesti tuotettu metadata

Tähän kirjastojen näkökulmasta tutuimpaan ja perinteikkäimpään ryhmään kuuluvat esim. kirjastonhoitajien luettelointisääntöjen mukaan kirjastotietokantaan tuottamat kuvailutiedot.

2.) Käyttäjien ja tekijöiden tuottama metadata
Dempsey käyttää termiä “contributed metadata”, jolle en keksi tähän hätään luontevaa suomennosta. Dempsey luokittelee joka tapauksessa saman termin alle sekä aineistojen tekijöiden tuottaman metadatan että esim. LibraryThingin kaltaisten palveluiden satunnaisten käyttäjien tuottamat kuvailutiedot. Molemmat ryhmät ovat toki kirjastojen näkökulmasta pääosin ulkopuolisia, mutta tietojen luotettavuudessa voi kuitenkin olettaa olevan eroa (mihin Dempsey viittaa vain epäsuorasti)…

3.) Ohjelmallisesti tuotettu metadata
Digitaalisista aineistoista automaattisesti koottu metadata – esim. digitoiduista lehdistä automaattisesti poimitut otsikko- tai tekijätiedot.

4.) Intentionaalinen metadata
Aineistojen käyttöön ja käyttötapoihin pohjautuva tieto – esim. Amazonin asiakkaidensa käyttäytymisen (ostetut kirjat, katsotut sivut) pohjalta koostamat suositukset tai Googlen www-sivujen linkkeihin perustuva PageRank-luokitus.

Jos tätä luokittelua katsoo kansalliskirjastolaisen näkökulmasta, ainoa kokonaan vieras alue taitaa olla intentionaalinen metadata (ks. myös “Amazon on parempi kuin kirjasto” ja etenkin Minna Rouhiaisen kommentti). Vaikka käyttäjien tuottama metadata on vielä tulevaisuuden asia, tekijöiden toimittamaa metadataa käytetään jo nyt esim. E-thesis-palvelussa. Ohjelmallisesti tuotettua metadataa hyödynnetään taas esim. Mikkelin digitointikeskuksessa.

Kuten Dempsey aivan oikein toteaa, näitä erilaisista ja eritasoisista lähteistä koottuja metatietoja ei ole syytä asettaa vastakkain, vaan pikemminkin on syytä pohtia sitä, miten kuvailutietojen muodostama kokonaisuus saadaan pysymään hallinnassa ja miten niiden pohjalta pystytään rakentamaan mielekkäitä palveluita. Hyvä kysymys on myös se, millaisten aineistojen kuvailuun tarvitaan tulevaisuudessa ammattilaisten työpanosta ja mitkä kuvailutiedot on järkevämpää tuottaa jossain muualla tai jollain muulla menetelmällä.

Amazon on parempi kuin kirjasto

Kyllä on, asiakkaiden mielestä. Ainakin sikäli kuin he vertailevat Amazonin ja kirjastoluetteloiden käyttöliittymiä. Äskettäin pidetyssä 31. European Library Automation Group -kokouksessa professori Maja ŽŽumer Ljubljanan yliopistosta herätteli kirjastoväkeä miettimään, miksi ei riitä, että kirjastot “ovat verkossa” (1).

Asiakkaat kokevat kirjastoluettelot vaikeiksi käyttää. Tämä tiedetään ja on tutkimuksissa osoitettu (2, 3).

Nyt etenkin huomattu, että asiakkaat ovat alkaneet käyttää Amazonia myös kirjastojen käyttöliittymänä. He etsivät kirjan Amazonista, kopioivat sen ISBN-numeron ja tekevät sen perusteella haun kirjastoluetteloon (4).

Kirjastoammattilaisen silmin tämä näyttää aivan käsittämättömältä touhulta. Miksi asiakkaat eivät käytä hyväkseen luetteloiden hakumahdollisuuksia? Siksi, että asiakkaat eivät ole kirjastoammattilaisia. Se, mikä tiskin takana tuntuu maailman yksinkertaisimmalta rutiinilta, ei tunnu kaikista samalta.

Voidaan väittää, että kirjastojen ei pidä tyytyä jäljittelemään hakukoneita, amazoneita sun muita “liian yksinkertaisia” käyttöliittymiä, koska ne voisivat tarjota niin paljon enemmänkin. Mutta on ilmeistä, että nykyiset menetelmät sen enemmän tarjoamisessa ovat epäonnistuneita – tai ainakin vanhanaikaisia.

Voi hyvinkin olla, että kirjastoluettelon tehokkaan käytön oppiminen ei olisi kovin vaikeaa. Vaikeus ja helppous ovat kuitenkin suhteellisia. Kirjaston käyttö ei ole kovin läpikäyvä elementti useimpien ihmisten elämässä. Kirjastot eivät sen takia voi ohjata sitä, mikä ihmisistä tuntuu oikealta ja luontevalta tavalta toimia. Valtavirrasta poikkeaville hakukäytännöille käy kuin piirustuspöydän ääressä vedetyille puistokäytäville: kansa kulkee mieluummin nurmikon poikki kuin arkkitehdin suunnitelmien mukaan, olipa arkkitehdillä ratkaisulleen kuinka mainiot perustelut hyvänsä.

ŽŽumer listasi joitakin ajatuksia siitä, mitä pitäisi tehdä. Ideat eivät suinkaan ole uusia, vaan perustuvat toisaalta siihen, mitä voi oppia hakukoneilta yms., ja toisaalta ilmiöihin, jotka informaatiotutkimuksessa on tunnettu jo vuosikymmeniä.

Yksinkertainen haku. Useimmissa kirjastojärjestelmissä sellainen jo onkin, piilotettuna jonkin mystisen ilmauksen taakse, kuten Helkan “sanahaku -(katkaisu=?)”. Helmetissäkin on sanahaku, mutta se pitää ensin valita “opastetuista hauista”.

Hakutulosten relevanssi on usein kirjastojärjestelmien heikko kohta; pikemminkin perinteisesti tulos järjestetään julkaisuvuoden mukaan. Tähän pitäisi hakualgoritmien kehittelyssä kiinnittää huomiota.

Kirjankansien kuvan liittäminen kuvailutietoihin. En itse oikein sisäistä tämän merkitystä, mutta mitäpä siitä: asiakkaat arvostavat kansikuvia ja pulinat pois.

Suositukset – eli bibliometriseen kytkentään perustuvat vinkit: henkilöt, jotka ovat lainanneet tätä kirjaa, lainasivat myös tuota.

Kirja-arviot: asiakkaat pitävät toisten asiakkaiden arvioita hyödyllisinä. Yksittäisen kirjaston asiakaskunta saattaa olla liian pieni tuottamaan riittävää määrää arvioita. Voisi aprikoida, riittäisikö Suomeen yksi ainoa arviointijärjestelmä, jonka sisältö olisi tietenkin nähtävissä eri luetteloiden kautta. Helppo visioida, hieman vaikeampi toteuttaa!

(1) Amazon: competition or complement to OPACs PDF Document (abstract) / Maja ŽŽumer (University of Ljubljana). – Saatavissa: http://elag2007.upf.edu/papers.htm. – [Luettu 14.5.2007]

(2) Why Are Online Catalogs Still Hard to Use? / Christine L. Borgman. – Journal of the American Society for Information Science, 1996, 47, 7, 493. – Saatavissa (lisensoitu aineisto): http://proquest.umi.com/pqdlink? did=639283961&Fmt=2&clientId=23404&RQT=309&VName=PQD. – [Luettu 14.5.2007]

(3) Research And Design Review : Improving User Access to Library Catalog and Portal Information : Final Report (Version 3) / Marcia J. Bates. – Library of Congress Bicentennial Conference On Bibliographic Control For The New Millennium : Task Force Recommendation 2.3, 2003. – Saatavissa: http://www.loc.gov/catdir/bibcontrol/2.3BatesReport6-03.doc.pdf. – [Luettu 14.5.2007]

(4) Rethinking How We Provide Bibliographic Services for the University of California : Final Report: December 2005. – The University Of California Libraries. Bibliographic Services Task Force. – Saatavissa: http://libraries.universityofcalifornia.edu/sopag/BSTF/Final.pdf. – [Luettu 14.5.2007]

Creative Commons License

Selvitys ammattikorkeakoulujen julkaisutoiminnasta

eAineistot oppimisen resurssi -blogi uutisoi ammattikorkeakoulujen julkaisutoiminnasta tehdystä selvityksestä, joka perustuu syksyllä 2006 tehtyyn kyselyyn. Kyselyyn vastasi yhteensä 21 ammattikorkeakoulua, joista 15:llä oli tällä hetkellä omaa julkaisutoimintaa.

Enni Harrinkari & Lea Mustonen: Selvitys Arene ry:n viestintätyöryhmälle ammattikorkeakoulujen julkaisutoiminnan nykytilanteesta ja julkaisuyhteistyöhalukkuudesta. Hämeenlinna: Hämeen ammattikorkeakoulu, 2007.

Ammattikorkeakoulut ovat myös käynnistämässä opetusministeriön tuella omaa yhteistä Open Access -hankettaan. Hanke koostuu kahdesta osakokonaisuudesta, jotka ovat avoin tieteellinen verkkolehti ja elektroninen opinnäytetyökirjasto.

Wikipedia ja asiantuntijat

Verkon hakukoneita käyttävät tiedonhakijat törmäävät nykyään lähes väistämättä Wikipedian erikielisiin versioihin. Vaikka Wikipedian luotettavuudesta varoitellaan, itsekin huomaan turvautuvani siihen yhä useammin. Mitä Wikipediasta ja sen luotettavuudesta pitäisi ajatella? Millaista asiantuntemusta Wikipedia oikein tarjoaa?

Wikipedia-workshop Hankenilla

Harmikseni en päässyt paikalle Hankenilla 11.4. pidettyyn Wikipedia-workshopiin. Tuoreessa Verkkari-lehdessä Eeva Peltonen kertoo kuitenkin seminaarin tapahtumista otsikolla “Wikipedia, informaatiolukutaitoa edistävä tietosanakirja?“. Peltosen mukaan osa seminaarin esityksistä saattaa myös olla myöhemmin ilmestymässä artikkeleiksi muokattuina Tieteessä tapahtuu -lehdessä. Hyvä niin.

Peltonen pohtii omassa artikkelissaan myös Wikipedian luotettavuutta tietolähteenä, tosin lähinnä positiivisesta näkökulmasta: Wikipedian lukijat saavat hänen mukaansa hyvää informaatiolukutaidon opetusta joutuessaan arvioimaan itsenäisesti sen tarjoaman tiedon luotettavuutta. Toisaalta hän lainaa myös yliassistentti Jussi Silvosen esitystä, jossa kaivattiin nykymuotoisen Wikipedian rinnalle avoimeen lähdekoodiin perustuvia “aitoja tietosanakirjoja”, joissa kontrolloitaisiin tiukemmin sisällön laatua ja kirjoittajien asiantuntemusta.

Wikipedian alkuvaiheet: Nupedia

Asiantuntijoiden ja maallikoiden tuottaman sisällön välinen suhde on yksi keskeisistä kiistakysymyksistä Wikipedian historiassa. Wikipedian omat juuret ovat yllättävää kyllä nimenomaan vertaisarviointiin ja asiantunteviin kirjoittajiin perustuvassa projektissa, ja sen nykyinen populistinen toimintaidea syntyi oikeastaan puoliksi vahingossa.

Jimmy Walesin ja Larry Sangerin perustaman, vuosina 2000-2003 toimineen Nupedia-nimisen avoimen verkkoensyklopedian oli tarkoitus sisältää laadukkaita, asiantuntijoiden kirjoittamia artikkeleita. Työ eteni kuitenkin tuskastuttavan hitaasti, sillä perimätiedon mukaan ensimmäisen vuoden aikana Nupedian aluksi hyvin mutkikkaan hyväksymisprosessin läpäisi vain 24 artikkelia.

Jo 1990-luvun puolivälissä kehitettyä wiki-tekniikkaa hyödyntävä Wikipedia syntyi alunperin Nupedian rinnalle mahdollistamaan artikkelien raakaversioiden luomisen yhteistyössä ennen kuin ne siirtyivät Nupedian virallisen vertaisarviointiprosessin käsittelyyn. Käytännössä tämä vähemmän byrokraattinen malli osoittautui nopeasti niin suosituksi, että Wikipedia alkoi elää omaa elämäänsä ja alkuperäinen Nupedia jäi kokonaan sen jalkoihin.

Anti-elitistinen Wikipedia?

Edellä esitetystä taustasta huolimatta Wikipedian suhde asiantuntijakirjoittajiin on ollut hyvin ongelmallinen. Nupedian ja Wikipedian alkuperäinen päätoimittaja Larry Sanger on kuvaillut palveluiden alkuvaiheita valottavissa muistelmissaan ristiriitoja, joita syntyi alkuperäisessä Nupedia-hankkeessa mukana olleiden asiantuntijoiden ja Wikipedian maallikkokirjoittajien välille.

Jotta Wikipediaan olisi saatu mukaan mahdollisimman paljon kirjoittajia, hankaliakin osallistujia suvaittiin mahdollisimman pitkälle ja häiriköintiin puututtiin voimallisesti vain ääritapauksissa. Monien mukana olleiden asiantuntijoiden kärsivällisyys ei lopulta kuitenkaan riittänyt jatkuvaan kiistelemiseen lukuisien hankalien persoonallisuuksien ja kiihkeästi omia uskomuksiaan puolustaneiden maallikoiden kanssa, ja niinpä he luopuivat Wikipedian avustamisesta.

Sanger onkin myöhemmin pitänyt Wikipedian käytännöissään omaksumaa anti-elitismiä suurimpana esteenä sen kehittymisessä oikeasti laadukkaaksi tietosanakirjaksi. Koska Wikipedia näyttää jääneen projektin alkuvaiheessa luotujen (osittain tilapäisiksi tarkoitettujen) toimintaperiaatteiden vangiksi, Sanger on ryhtynyt käynnistämään uutta wiki-ensyklopediaa Citizendiumia, jonka editointiprosessissa ja organisaatiossa on yritetty ottaa opiksi Wikipedian heikkouksista.

Wikipedia ja tekijyys

Wikipedian yhteydessä korostetaan usein sitä, että sen artikkelit ovat päivittäjien muodostaman laajan yhteisön tekemän kollektiivisen työn tulosta ja niiden laatu syntyy vähitellen päivitysten/päivittäjien suuren määrän ansiosta. Jossain määrin näin toki onkin, mutta asiaa on kuitenkin turha mystifioida tai romantisoida. Laadukkaiden artikkelien tuottamiseen tarvitaan Wikipediassakin asiantuntevia kirjoittajia, jotka ovat valmiita sitoutumaan niiden tekemiseen ja käyttämään niihin merkittäviä määriä aikaa ja vaivaa. Tämä asia selviää varsin nopeasti laadukkaiden Wikipedia-artikkelien muokkaushistoriaa selaillessa.

Wikipedian artikkelin keskeinen sisältö syntyy yleensä yhden (tai muutaman) kirjoittajan tekemänä työnä. Suurin osa muiden käyttäjien muokkauksista kohdistuu tyypillisesti kirjoitusvirheisiin ja yksittäisiin detaljeihin. Lisäksi suuri osa “korjauksista” saattaa olla virheellisiä tai muuten artikkelin kokonaisuuden kannalta epäedullisia. Laadukkaidenkin artikkelien taso saattaa pahimmillaan heikentyä asiantuntemattomien käyttäjien tekemien muokkausten myötä.

Wikipedian arvo

Toinen kysymys on sitten se, miten laadukasta verkkotietosanakirjan sisältämän tiedon pitäisi olla ja miten paljon tällä laadukkuudella on lopulta merkitystä palvelun suosion kannalta. Wikipedia on jo nykymuodossaan kiistaton menestystarina, sillä sen sisältämät tiedot ovat joka tapauksessa puutteistaan huolimatta kätevästi kaikkien verkossa liikkuvien tiedontarvitsijoiden tavoitettavissa ja hyödynnettävissä.

Roy Rosenzweig ja Dan Cohen ovatkin esittäneet, että Wikipedian kaltaiset avoimesti hyödynnettävät tietoresurssit voivat olla epätäydellisyydestään huolimatta arvokkaampia kuin vastaavat käyttöoikeuksiltaan rajatut palvelut, vaikka niiden sisältämä informaatio olisi sinällään merkittävästikin laadukkaampaa. Vaikka Wikipedia ei kenties sinällään kelpaa lähdeteokseksi opinnäytteeseen tai tieteelliseen tutkimukseen, se on kuitenkin käytännöllinen tiedonlähde moniin muihin tarkoituksiin.

Lähteitä:

Daniel J. Cohen: From Babel to Knowledge. Data Mining Large Digital Collections (D-Lib Magazine Volume 12, Number 3 (March 2006))
http://www.dlib.org/dlib/march06/cohen/03cohen.html

Nupedia (englanninkielisen Wikipedian artikkeli)
http://en.wikipedia.org/wiki/Nupedia

Eeva Peltonen: Wikipedia, informaatiolukutaitoa edistävä tietosanakirja? – Vaikutelmia Wikipedia-workshopista Hankenilla 11.4.2007. (Verkkari 4/2007).
http://www.helsinki.fi/kirjastot/verkkari/2007/04/wikipedia.html

Brock Read: Can Wikipedia Ever Make the Grade? (The Chronicle of Higher Education, October 27, 2006)
http://chronicle.com/temp/reprint.php?+id=z6xht2rj60kqmsl8tlq5ltqcshc5y93y

Roy Rosenzweig: Can History be Open Source? Wikipedia and the Future of the Past (The Journal of American History Volume 93, Number 1 (June, 2006))
http://chnm.gmu.edu/resources/essays/d/42

Larry Sanger: The Early History of Nupedia and Wikipedia: A Memoir (Slashdot, April 18, 2005)
http://features.slashdot.org/features/05/04/18/164213.shtml

Larry Sanger: The Early History of Nupedia and Wikipedia, Part II (Slashdot, April 19, 2005)
http://features.slashdot.org/features/05/04/19/1746205.shtml?tid=95

Larry Sanger: Why Wikipedia Must Jettison Its Anti-Elitism (Kuro5hin, December 31, 2004)
http://www.kuro5hin.org/story/2004/12/30/142458/25

Jussi Silvonen: Wikipedia ja käyttäytymistieteet (Esitys Wikipedia-workshopissa 11.4.2007)
http://oacs.shh.fi/wikiworkshop_files/silvonen.pdf

Tieteenalakohtaisista eroista väitöskirjojen verkkojulkaisemisessa

Kaikki Helsingin yliopiston väittelijät ovat täyttäneet huhtikuun alusta 2006 lähtien yliopiston yhteisen väitöstietolomakkeen, jolla kerätään E-thesis-palvelun ja yliopiston viestintäosaston tarvitsemat väitöstilaisuutta ja väitöskirjaa koskevat tiedot sekä väitöskirjan tiivistelmät. Lomakkeella kerätyistä tiedoista saa myös melko näppärästi koottua tilaston siitä, miten suuri osa kunkin tiedekunnan väitöskirjoista ilmestyy kokotekstiversiona E-thesis-palvelussa.

Seuraava tilasto kattaa noin neljäntoista kuukauden väitökset (huhtikuu 2006 – toukokuu 2007):

tiedekunta väitöksiä verkossa osuus
farmasian 13 13 100%
lääketieteellinen 126 121 96%
biotieteellinen 72 66 92%
matemaattis-luonnontieteellinen 79 72 91%
käyttäytymistieteellinen 39 33 85%
maa- ja metsätieteellinen 37 29 78%
teologinen 14 7 50%
valtiotieteellinen 52 25 48%
humanistinen 50 21 42%
oikeustieteellinen 11 3 27%
KOKO YLIOPISTO 502 399 79%

Kuten ehkä saaattoi odottaakin, luonnontieteissä ja lääketieteessä ylivoimainen enemmistö väitöskirjoista ilmestyy verkossa. Maa- ja metsätieteellisen tiedekunnan suhteellisen pientä osuutta selittää se, että osa tiedekunnan väitöksistä ilmestyy verkossa E-thesiksen sijasta Metsäntutkimuslaitoksen väitöskirjasarjassa.

Humanistis-yhteiskuntatieteellisellä alalla verkkojulkaiseminen on selkeästi vähäisempää, ja tilanne näyttää myös ainakin toistaiseksi vakaalta. Käyttäytymistieteellinen tiedekunta on ainoa merkittävä poikkeus yleisestä kaavasta, sillä siellä verkkojulkaisujen osuus yltää lähestulkoon luonnontieteilijöiden lukemiin.

Miten näitä eroja voi selittää? Suurelta osin kyse on tietysti yleisemmistä julkaisukulttuurin ja tieteenalojen perinteiden eroavaisuuksista. Elektroninen julkaiseminen on muutenkin yleistynyt nopeammin luonnontieteellisellä alalla, kun taas esim. humanistit tai oikeustieteilijät ovat pitäneet sitkeämmin kiinni painetuista julkaisuista.

Luonnontieteellisen alan väitöskirjat ovat pääasiassa aiemmin julkaistuista artikkeleista koostuvia artikkeliväitöskirjoja, joista E-thesis-palvelussa julkaistaan yleensä vain artikkelien keskeiset tulokset kokoava yhteenveto-osa. Olennaista on se, että artikkelit on julkaistu mahdollisimman arvovaltaisissa vertaisarvioiduissa lehdissä, eli niiden sisältämä tieto on jo käynyt läpi tiedeyhteisön sisäisen kontrollin. Niinpä väittelijät saattavat pyydellä anteeksi sitä, jos väitöskirja sisältää uutta, ennen julkaisematonta tietoa, mikä voi tuntua esim. humanistin näkökulmasta oudolta. Joka tapauksessa tämä tarkoittaa sitä, että kynnys väitöskirjan julkaisemiseen verkossa on useimmissa tapauksissa pysynyt matalana.

Humanistis-yhteiskuntatieteellisellä alalla väitöskirjat ovat tyypillisesti monografioita (vaikka myös artikkeliväitöskirjat ovat vähitellen yleistymässä). Ainakin humanistisessa tiedekunnassa väittelijöitä on saatettu jopa varoitella laittamasta teoksiaan verkkoon, sillä yleisen käsityksen mukaan etenkään suuret kansainväliset kustantajat eivät enää hyväksy aiemmin muualla ilmestyneitä töitä julkaistavakseen. Niinpä osa väittelijöistä tuottaa väitöskirjastaan väitöstilaisuutta varten ainoastaan monisteen, jolle ei välttämättä haluta edes ISBN-numeroa, jotteivät kustantajat vain erehtyisi epäilemään sitä aiemmin julkaistuksi. Näin siis humanistisilla tieteenaloilla lähestytään vaivihkaa anglosaksisen maailman väittelykäytäntöjä. Oman monografian saaminen arvostettuun kansainväliseen sarjaan on joka tapauksessa niin suuri meriitti, että sitä koskevat toiveet saattavat ajaa kotimaisten väitöskirjan julkisuutta koskevien perinteiden edelle.

Humanistis-yhteiskuntatieteellisen alan väitöskirjoja ilmestyy kansainvälisten sarjojen lisäksi myös kotimaisten kustantajien sarjoissa. Esim. huomattava osa historian väitöskirjoista ilmestyy kauniisti kuvitettuina ja toimitettuina Suomalaisen Kirjallisuuden Seuran julkaisemassa Bibliotheca Historica -sarjassa, eivätkä ne siten tule E-thesis-palveluun. Kyse ei ole kuitenkaan suurista kaupallisista intresseistä, vaan taustalla vaikuttavat enemmän tieteenalan perinteet ja painettujen monografioiden suuri arvostus. Vaikka historia lienee tieteenalana populaareimmasta päästä, myyntiluvut lienevät suomenkielisten väitöskirjojen osalta satunnaisia poikkeustapauksia lukuunottamatta korkeintaan joitakin satoja kappaleita. Ulkomaankielisiä, Suomessa julkaistuja väitöskirjoja myydään yleensä tätäkin vähemmän.

Tietolinja 1/2007 ilmestynyt

Kansalliskirjaston verkkolehden Tietolinjan uusin numero sisältää muiden kiinnostavien artikkelien ohessa myös useita digijulkaisuihin ja digitaalisen kirjaston järjestelmiin liittyviä juttuja.

Samu Viita kertoo matkaraportissaan tammikuussa San Antoniossa pidetystä Open Repositories 2007 -seminaarista, jossa mm. julkistettiin virallisesti Manakin-käyttöliittymäohjelmiston versio 1.0 ja kuultiin mielenkiintoisia uutisia DSpace-ohjelmiston tulevaisuudennäkymistä.

Esa-Pekka Keskitalo esittelee URN-tunnisteiden taustalla olevia ideoita ja tunnisteiden käytön nykytilannetta.

Ari Rouvari pohtii Nelli-portaalin vastauksia viimeaikaisten Kirjasto 2.0 -visioiden esittämiin haasteisiin.

Juha Hakala käy läpi kirjastoautomaation kehitystä parin viime vuosikymmenen ajalta artikkelissaan, joka käsittelee erikseen palvelinten, tallennusvälineiden ja ohjelmistojen kehitystä ja hahmottelee kirjastojen tietoteknisten järjestelmien tulevaisuudennäkymiä.

Lisäksi lehden artikkeleissa esitellään äskettäin julkistettua Yleistä suomalaista ontologiaa (YSO), kansallisen ONIX-keskuksen perustamiseen tähtäävää Kirjan tie -hanketta ja MARC21-formaattiin siirtymisen tämänhetkistä tilannetta.

Kirjastot paremman tiedonsaannin asialla

Kirjastoverkko ja Kansalliskirjasto ovat laatineet esityksen tiedonsaannin edistämiseksi Suomessa. Opetusministeriölle luovutetun esitys parantaisi toteutuessaan suomalaisen tutkimuksen olosuhteita sekä tukisi kansalaisten tasa-arvoista tiedonsaantia varmistamalla keskeisten elektronisten tietoaineistojen saatavuus.

Esitys pohjaa Kansallisen elektronisen kirjaston (FinELib) piirissä toimineen työryhmän kartoitustyöhön. Työryhmä on rakentanut kaksi aineistokokonaisuutta: tutkimuksen perusaineistot sekä kansalaisen perustietopaketin.

Tutkimuksen perusaineistot koostuvat keskeisistä tieteellisistä verkkoaineistoista kuten lehti- ja kirjapaketeista sekä tietokannoista, jotka ovat välttämättömiä korkeatasoiselle tutkimukselle.

Ehdotettuun kansalaisen perustietopakettiin kuuluu muun muassa lakitietoa, terveystietoa, hakuteoksista sekä sanakirjoja. Aineisto olisi vapaassa kansalaiskäytössä ja edistäisi siten tiedonsaannin tasa-arvoa ja tukisi laadukkaan verkkotiedon käyttöä opetuksessa.