Rinnakkaisjulkaisemisen vaikea alkutaival

Charles W. Bailey Jr pohtii DigitalKoans-blogiin kirjoittamassaan artikkelissa “Institutional Repositories: DOA?” julkaisuarkistojen rakentamisen nykytilaa. Alkuinnostuksen hiivuttua on monissa tapauksissa tullut tilalle pikemminkin pettymys siihen miten tahmeasti aineistojen tallentaminen on lähtenyt liikkeelle. Onko julkaisuarkisto siis kuolleena syntynyt keksintö? Miltä julkaisuarkistojen tilanne näyttää tällä hetkellä Suomen näkökulmasta? Continue reading

Kuka julkaisisi julkaisuarkistossa? (ALA, 5, posti)

Collecting for Institutional Repositories: All the News That’s Fit to Keep. Tällä kertaa vuorossa oli kolme esitystä meillä Suomessakin ajankohtaisesta kysymyksestä: mitä julkaisuarkistoihin pitäisi panna ja miten se saadaan sinne. Vastaus: laitokset ja tutkijat tietävät parhaiten, mitä kannattaa julkaista, ja loppu onkin vain tarmokasta mainontaa, markkinointa ja hihasta nykimistä.

Esityksiä oli taas kolme: Susan Gibbons Rochesterin yliopistosta; Jim Ottaviani Michiganin yliopistosta sekä George Porter California Institute of Technologysta.

Susan Gibbons kertoi ensin pitkästä ja huolellisesta suunnittelusta, jossa toimintaperiaatteita ja prosesseja työstettiin monen työryhmän voimin. Loppujen lopuksi kuitenkin kävi niin, että suuri osa tuosta työstä ei osoittautunut kovinkaan hyödylliseksi. Monet visiot julkaisuarkiston käytöstä eivät toteutuneet, ja monia yllättäviä ksymyksiä on ilmaantunut toiminnan kehittyessä. Hän korosti, että kun kyse on uudenlaisesta toiminnasta, joustavuus on todella tarpeen.

Sisältökriteereitäkin oli pohdittu paljon, mutta parhaaksi politiikaksi oli osoittautunut antaa aineiston luovuttajien tehdä päätökset. Kenenkään intressissä ei tunnu olevan roskan julkaiseminen. Kaikeella sillä aineistolla, jota julkaisarkistoon oli pantu, oli myös ollut käyttöä, joten siinäkin suhteessa itseohjautuva sisällönvalinta on ollut onnistunut ratkaisu.

Sisältöä ei ole myöskään rajattu vain rinnakkaisjulkaisemiseen. Mukana on “student papers” – mitä kaikkea termi pitääkään sisällään – sekä myös primaariaineistoa, kuten eism. digitoitu kokoelma harvinaisia nuotteja. Sellainen periaate kuitenkin on ollut, että aloitteen aineiston lisäämiseen on tultava laitoksilta – toisin sanoen kirjasto ei omasta aloitteestaan lisää aineistoja. Tätä pn pidetty tärkeänä, jotta laitokset todella tuntisivat palvelun omakseen.

Itsearkistointi ei ole ollut niin yleistä kuin oli toivottu, ja sen edistämiseksi on vielä tehtävä työtä, Gibbons kertoi. Plajon tavallisempaa on, että arkistoinnin tekee jokin välikäsi – laitoksen hallintohenkilökunta, opiskelijatyöntekijät tai – kaikkein useimmin – kirjasto. Kirjaston iso rooli ei ole pitkällä aikavälillä kestävä ratkaisu, vaikkakin dialogista laitosten kanssa on näin lakuvaiheessa llut myös paljon hyötyä.

Arkisto on toteutettu DSpacella, kuten myös seuraavaksi esitelyt Deep Blue (ei nähtävästi sukua samannimiselle shakinpelaajalle). Rochesterin arkisto on osoitteessa https://urresearch.rochester.edu/

Rochesterissa ollaan asetettu joitakin pitkäaikaissäilytyksen sanelemia vaatimuksia luovutettavalle aineistoille, mutta ei kovin tiukkoja. Tiedostomuotojen tulee olla sellaisia, että niiden dokumentaatio on saatavissa. Näin ollen PDF kelpaa, mutta Word ei.

Tekijänoikeudet aiheuttivat alussa paljon kyselyä. Avoimessa julkaisuarkistossahan arkisto kuitenkin saa ainoastaan ei-yksinoikeudellisen levitysoikeuden, eli tekijänoikeudet eivät oikeastaan siirry. Tekijänoikeusasioissa aineiston arkistoja on autettu paljon ja kädestä pitäen. Tutkija on esimerkiksi voinut tuoda julkaisuluettelonsa kirjastoon, joka on sitten selvitellyt, mitkä nimekkeet on mahdollista panna julkaisuarkistoon.

Seuraavaksi esiintyi Jim Ottaviani ja kertoi Deep Bluesta (ks. http://deepblue.lib.umich.edu/)Myös Jim Ottaviani tähdensi julkaisuarkistojen myymistä yliopistolla, Kyseessä on loppujen lopuksi varsin uudenlainen palvelu, jossa kirjastot ovat tekemisissä tutkijoiden ja opettajien kanssa uudenlaisissa yhteyksissä.

Ottaviani vertasi laitoksia riikinkukkoihin: markkinoinnissa ei pidä kertoa, millä tavalla julkaisuarkistot tekevät maaimasta paremman paikan, vaan millä tavalla ne hyödyttävät laitosta ja tuovat sille mainetta ja kunniaa, ehkä rahaakin.

Hän käytti myös vertausta “ohjaajan versio”. Julkaisuarkistossa voidaan julkaista liikkuvaa kuvaa, jota ei lehdissä voi käyttää; ja siellä voidaan julkaista värikuvia, joiden saaminen lehteen maksaisi maltaita. Oikeastaan ainoa rajoitus, joka julkaisemiselle on asetettu, on se, että keskeneräisiä dokumentteja ei julkaista.

Michiganissa DSpacen hierarkia on hyvin litteä, tai oikeastaan sitä ei ole ollenkaan: kaikki laitokset löytyvät samalta tasolta. Paljon oli pantu painoa toimivan itsearkistointilomakkeen suunnitteluun.

Markkinoinnissa oli panostettu isoihin avajaisiin, joita varten arkistoon oli hankittu aineistoa edeltäkäsin, osin kirjoittajien tietämättä! Neljän ison kustantajan kanssa oli lisenssineuvotteluissa otettu mukaan sellainen klausuuli, että yliopistolla on oikeus siirtää tutkijoidensa artikkeleita omiin julkaisuarkistoihinsa. Tutkijat saattoivat hieman hätkähtää, mutta olivat kyllä luopuneet oikeudesta artikkeleihinsa siinä määrin, ettei heidän oikeuksiaan prosessissa loukattu.

Markkinointia oli tehty kosolti mm. seuraavilla argumenteilla:

  • Julkaisuarkistossa julkaiseminen lisää siteerauksen määrää 25 – 250 prosenttia.
  • Kirjasto huolehtii aineiston säilymisestä
  • Julkaisulisenssi on parin kolmen kappaleen pituinen eikä aiheuta stressiä
  • Itsearkistoinnissa kysytään vain kolme asiaa: nimeke, tekijä ja julkaisuaika.

Caltechin George Porterilla oli esityksessään enemmän hauskoja kaskuja kuin mitään erityistä perussanomaa. Kyse oli ennen kaikkea elektronisten opinnäytteiden julkaisemisesta Caltechissa. Se herätti huomiota, että väitöskirjan julkaisemisesta on kieltäytynyt ainoastaan kaksi henkilöä. Laitoksilla on alempien opinnäytteiden suhteen hyvin vaihtelevia käytäntöjä, ja sen kanssa on pystytty elämään.

Myös Caltechissa kirjastolla on varsin laajat tekijänoikeuspalvelut. Verkkojulkaisujen suhteen kirjasto myös omaksuu vastuun mahdollisista rikkeistä, päinvastoin kuin esim. Rochesterissa (jossa kyllä otetaan asianomaiseen yhteyttä, jos silmiin sattuu joku ilmeisen luvaton julkaisutapaus).

Kaikki totesivat yhteisesti, että pre- ja postprintit eivät ole merkittäviä arkistojen sisällössä. Niiden julkaisemiselle voisi olla enemmän tilausta ajan myötä; otettiin esimerkki lehdistä, joissa artikkelien jonotusaika on pari vuotta – luulisi preprintin julkaisemisen silloin kiinnostavan kirjoittajaa.

ETD 2007 (4): Esimerkkejä maailmalta

[Tämä merkintä liittyy Uppsalassa 13.-16.6.2007 järjestettyyn opinnäytteiden verkkojulkaisemista käsittelleeseen ETD 2007 -konferenssiin, ks. myös ensimmäinen merkintä]

Huippuyliopistossa kaikki on huippua?

Kuten tavallista, monet Uppsalassa kuulluista esityksistä tarjosivat enemmän tai vähemmän uskottavia visioita erilaisista hienoista järjestelmistä ja päämääristä, joita tulevaisuudessa aiotaan toteuttaa. Tätä kontekstia vasten oli piristävää kuunnella Craig Thomasin esitystä, jossa kerrottiin aivan rehellisesti mitä kaikkea Massachusetts Institute of Technologyn väitöskirjajulkaisemissa oli mennyt vuosien varrella pieleen. MIT:n opinnäytejulkaisut ovat saaneet paljon julkisuutta, ja olen kuullut väitettävän, ettei yliopistossa enää olisi väitöskirjojen printtiversioita ollenkaan.

Thomasin mukaan yliopiston alkuperäinen elektronisten väitöskirjojen julkaisemista varten tarkoitettu järjestelmä kaatui, kun yliopisto joutui 2000-luvun alkuvuosina Internet-yhtiöiden osakekurssien romahdettua rahavaikeuksiin ja kolmasosa kirjaston henkilökunnasta irtisanottiin. Irtisanottujen joukossa olivat mm. kaikki julkaisujärjestelmän ylläpidosta vastanneet henkilöt. Syksyllä 2002 lanseeratusta DSpacesta tulikin MIT:n näkökulmasta eräänlainen pelastusvene, johon aiemman järjestelmän jäljiltä kodittomaksi jääneet digitaaliset dokumentit saatiin tallennettua (ks. MIT:n väitöskirjat DSpacessa). DSpacen valmiita syöttölomakkeita MIT ei sen sijaan ottanut käyttöön, vaan elektroniset väitöskirjat toimitetaan edelleen julkaistavaksi primitiivisemmillä menetelmillä.

MIT:n väitöskirjoista saadaan nykyään valmiiksi sähköisessä muodossa vain kymmenen prosenttia, ja loput skannataan kirjastossa paperiversiosta. Tällä hetkellä yliopisto tutkii mahdollisuuksia muualla kehitettyjen DSpace-työkalujen (mm. Manakin) käyttämiseksi tilanteen kohentamiseen ja elektronisten aineistojen tallentamisen helpottamiseen. Craig Thomas ei kuitenkaan ollut kovin toiveikas radikaalien muutosten suhteen: yliopisto koostuu lukuisista varsin itsenäisistä yksiköistä, joita on vaikea pakottaa omaksumaan yhtenäisiä käytäntöjä.

Yhteistyö on voimaa

Omalta kannaltamme kiinnostavimmasta päästä oli Adam Mikealin esitys Teksasin yliopistojen suunnittelemasta yhteisestä opinnäytekirjastosta (“Texas Digital Library“). Kansalliskirjaston Doriassa hyödyntämä Manakin-käyttöliittymäohjelmisto on peräisin nimenomaan Teksasista (ks. Samu Viidan matkaraportti Tietolinja-lehden numerossa 1/2007), ja Teksasissa on kehitetty myös osavaltion yhteistä MODS XML -skeemaa, joka sopisi erityisesti opinnäytteiden metadatan tallennukseen.

Teknisten edistysaskelten lisäksi Mikealin esityksessä oli huomionarvoista hankkeen laajuus ja sen takana oleva yhteinen poliittinen tahto: mukana olevissa teksasilaisyliopistoissa on yhteensä 65 kampusta ja yli 400 000 opiskelijaa. Tavoitteena on kuitenkin päästä hyvin keskitettyyn malliin, jossa kaikki opinnäytteet tallennetaan sähköisessä muodossa yhteiseen järjestelmään, ja niiden syöttämiseen käytetään yhtä yhteistä lomaketta. Yhteistä lomaketta pidettiin tarpeellisena, jotta metadata saadaan kerättyä ja tallennettua kaikista yliopistoista yhteensopivassa muodossa.

Plagiointia Amerikan malliin

Opinnäytetyössä tehty plagiointi on viime viikkoina taas kerran ylittänyt uutiskynnyksen myös Suomessa. Aihepiiriin tuntuu aina vain törmäävän kaikissa opinnäytejulkaisemiseen liittyvissä yhteyksissä, ja joskus tuntuu, että asia on saanut aivan liikaa huomiota vilppitapausten todelliseen määrään ja merkitykseen nähden. Juttelin konferenssin iltajuhlassa ProQuestin Austin McLeanin kanssa, ja hän kertoi että plagiointitapauksia tulee suurta opinnäytetietokantaa ylläpitävän ProQuestin tietoon parisenkymmentä vuosittain. Merkittävä osa tapauksista koskee vanhoja opinnäytetöitä, joita ProQuestin palvelussa on yhteensä kolmatta miljoonaa, eli kyseessä ei ole mikään erityisesti verkkoaikakauteen liittyvä ilmiö. Lisäksi on ilmeistä, että verkkojulkaiseminen on lisännyt merkittävästi kiinnijäämisen riskiä.

Minulta jäi valitettavasti väliin McLeanin ja Niamh Brennanin pitämä plagiarismia käsitellyt esitys (“Plagiarism and ETDs: Confronting the Reality”). Konferenssissa viitattiin kuitenkin useaan otteeseen Ohion yliopistossa Athensissa viime vuonna ilmitulleeseen plagiointitapaukseen, jossa kymmienien pääasiassa ulkomaalaistaustaisten opiskelijoiden epäiltiin syyllistyneen parin edellisen vuosikymmenen aikana plagiointiin. Tapauksen seurauksena kaksi töiden ohjaamisesta vastuussa ollutta yliopiston professoria sai lähteä.

[Takaisin ensimmäiseen merkintään]

ETD 2007 (3): Tieteellisen julkaisemisen tulevaisuus

[Tämä merkintä liittyy Uppsalassa 13.-16.6.2007 järjestettyyn opinnäytteiden verkkojulkaisemista käsittelleeseen ETD 2007 -konferenssiin, ks. myös ensimmäinen merkintä]

Irti paperijulkaisemisen kaavoista

Torstain keynote speaker, kemian tutkija ja Cambridgen yliopiston lehtori Peter Murray-Rust kritisoi PDF:ää tallennusformaattina, ja samaan aiheeseen palattiin myös sekä saman iltapäivän käytettävyyteen paneutuneessa paneelikeskustelussa että seuraavan päivän tutkimusaineistoja käsitelleessä paneelikeskustelussa.

Adoben jo 1990-luvun alkupuolella lanseeraama PDF on hyväksytty opinnäytejulkaisemisessa eräänlaiseksi väliaikaisratkaisuksi, josta vähitellen siirryttäisiin aidommin digitaalisen maailman ja datan hyödyntämisen ehdoilla toimiviin, esim. XML-pohjaisiin formaatteihin. PDF:n valtakausi on kuitenkin osoittautumassa paljon odotettua pidemmäksi, ja sen mukana tieteellinen julkaiseminen näyttää yhä jääneen yllättävän sitkeästi kiinni paperiaikakauden ajattelutapoihin ja toimintamalleihin.

Opinnäytteiden muokkaamista SGML- tai XML-formaatteihin on toki tehty myös käytännössä joissakin yliopistokirjastoissa, etenkin Saksassa ja Suomessa Oulun yliopistossa, mutta toiminnan vaatima tekninen osaaminen ja sen oletettu kalleus ovat kuitenkin pitäneet käytännön soveltajien määrän pienenä. Tällä hetkellä näyttää pikemminkin siltä, että muutoksen on lähdettävä tutkijoista ja tieteenalojen sisäisistä julkaisukäytännöistä, jolloin myös kunkin tieteenalan erityistarpeita voidaan ottaa paremmin huomioon kuin kirjastojen tekemissä väistämättä melko geneerisissä formaattimuunnoksissa.

Perjantain paneelikeskusteluun osallistunut tanskalainen biokemisti Lars Juhl Jensen kertoi esimerkkejä siitä, miten konservatiivisia useimmat perinteiset tieteelliset lehdet ovat. Niiden editorit suhtautuvat yleensä nihkeästi pieniinkin julkaisemisen käytäntöjä tai tallennusformaatteja koskeviin muutoksiin.

Coalition for Networked Informationin johtaja Clifford Lynch jatkoi samasta teemasta perjantaina konferenssin päätössanoissa. Hänen mukaansa olemme tulossa pisteeseen, jossa monet perinteiset tieteellisen julkaisemisen käytännöt alkavat murtua. Perinteisissä lehdissä julkaistavien artikkelien kautta tapahtuva muodollinen akateeminen pätevöityminen näyttää vähitellen eriytyvän yhä kauemmaksi erilaisten uusien ja usein epämuodollisten väylien kautta tapahtuvasta tieteellisestä kommunikaatiosta, jolla on itse tieteenteon kannalta yhä suurempi merkitys.

Tieteellisten artikkelien tulevaisuuden lisäksi Lynch nosti esiin myös kysymyksen tieteellisten monografioiden tulevaisuudesta. Monografioiden julkaiseminen ei ole kansainvälisellä tasolla enää taloudellisesti kannattavaa toimintaa, sillä myyntiluvut ovat yleensä melko pieniä. Käytännössä tämä tarkoittaa sitä, että esim. väitöskirjojen pohjalta muokattuja monografioita on yhä vaikeampi saada julkaistaviksi, etenkin jos ne käsittelevät suuren yleisön näkökulmasta marginaalisia aiheita.

Erityisesti humanistisella ja yhteiskuntatieteellisellä alalla monografioita pidetään kuitenkin edelleen tärkeänä asiana, ja niiden julkaisemista pyritään jatkamaan ongelmista huolimatta. Yhtenä mahdollisena tulevaisuuden mallina Lynch mainitsi American Historical Associationin Gutenberg-E-projektissa toteutettujen verkkokirjojen kaltaiset ratkaisut (Gutenberg-E:n taustasta ks. myös hanketta ideoimassa olleen kirjahistorioitsija Robert Darntonin haastattelu Ennen & Nyt –lehdessä 1/01). Suomalaisesta näkökulmasta on ehkä huomionarvoista, että Gutenberg-E:n julkaisut on muokattu nimenomaan valmiiden, hyväksyttyjen väitöskirjojen pohjalta: väitöskirjat sinällään ovat ainakin täällä Suomessa pysyneet formaatiltaan varsin konservatiivisina oppineisuuden osoituksina, joissa ei ole juuri uskallettu tehdä julkaisun muotoon liittyviä kokeiluita.

Lynch pohti myös julkaisujen ja dokumenttien rajojen merkitystä esim. interaktiivisuutta koskevien web 2.0 –henkisten toiveiden kannalta. Haluavatko kaikki tutkijat todella käydä loputtomia keskusteluita julkaisujensa sisällöstä? Jossain vaiheessa on kuitenkin hyvä saada työ loppuun ja siirtyä muiden aiheiden pariin. Lynch piti tärkeänä kysymyksenä myös sitä, missä kulkevat itse julkaisun ja siihen liittyvän taustamateriaalin väliset rajat.

Tutkimusdata ja julkaisuarkistot

Perjantain paneelikeskustelussa käsiteltiin erityisesti tutkimusdataa ja sen tallentamista, joka on ollut muutenkin ajankohtainen teema viime aikoina. Paneelikeskustelun osallistujat näyttivät pitävän laajoja alakohtaisia arkistoja ja tutkijoiden yhteistyössä tuottamia datapankkeja hajautettuja organisaatiokohtaisia julkaisuarkistoja mielekkäämpänä ratkaisuna. Kun oman alan data on saatavilla keskitetysti (ja mahdollisimman avoimesti) yhdestä paikasta, sitä on helpompi hyödyntää mm. tiedon louhintaan.

Datan määrän kasvu on luonnontieteissä huimaa: esim. biokemiassa kertyi pelkästään vuoden 2006 aikana enemmän uutta dataa kuin koko tieteenalan aiemman historian aikana yhteensä. Valtavien tietomassojen hallinnasta ja tutkijoiden välisestä datan jakamisesta onkin tullut tieteenalan keskeisiä menestystekijöitä. Tekijänoikeuslainsäädännön ja kustantajien kaupallisten intressien tiedon vapaalle hyödyntämiselle asettamista esteistä on kuitenkin edelleen paljon harmia.

Yleisön joukosta tulleessa kommentissa todettiin, että tutkijat haluavat päästä käsiksi nimenomaan suoraan dataan, eivätkä he ole niinkään kiinnostuneita sen pohjalta muodostetuista valmiista näkymistä tai jonkin ulkopuolisen tahon (lue: kirjastot?) tarjoamista käyttöliittymistä. Murray-Rust kritisoi myös DSpacen kaltaisten järjestelmien tapaa kätkeä data yksittäisinä palasina metadataa sisältävien sivujen taakse. Clifford Lynch huomautti, että kehitteillä oleva ORE-protokolla (joka mahdollistaa metadatan lisäksi myös julkaisuarkiston sisältämien dokumenttien haravoimisen) saattaa auttaa jossain määrin auttaa tähän ongelmaan.

Julkaisemisen työnjako

Clifford Lynch muisteli päätössanojensa yhteydessä 15 vuoden takaista tilannetta, jolloin yliopistojen IT-väki, kirjastot, yliopistopainot ja tiedekuntien edustajat kokoontuivat yhdessä miettimään digitaalisen maailman haasteita. Tuolloin kirjastot vielä empivät, uskaltavatko ne ottaa vastuuta elektronisten aineistojen säilyttämisestä.

Nykynäkökulmasta tarkasteltuna yliopistojen IT-palvelut ovat muuttuneet julkaisemisen kannalta lähes läpinäkyviksi, ja hyvä kysymys on myös se, miten kirjastojen rooli tulee kehittymään. Vaikka kirjastot ovat olleet etulinjassa opinnäytteiden julkaisemisessa ja myös julkaisuarkistojen perustamisessa, saattaa olla että laitosten ja yksittäisten tutkijoiden rooli kasvaa tulevaisuudessa. Esim. Murray-Rustin ja Jensenin esittelemien kemistien ja biokemistien käyttämien XML-pohjaisten merkintäjärjestelmien hyödyntäminen taitaa vaatia sellaista alakohtaista asiantuntemusta, ettei sitä useimmista kirjastoista löydy. Laitosten ja tiedekuntien henkilökunta pitäisi siis saada paremmin integroitua mukaan miettimään julkaisemisen ja julkaisupalveluiden kehittämistä.

Kansainvälisten alakohtaisten datapankkien perustaminen poikkeaa myös kirjastojen perinteisestä toimintaideasta nimenomaan omia paikallisasiakkaitaan palvelevana organisaationa. Toisaalta tämä liittyy suurempiin kirjastojen identiteettiä ja tulevaisuutta liittyviin kysymyksiin. Kuten klassillisen filologian tutkija Greg Crane totesi omassa torstaisessa keynote-esitelmässään, kirjastot ovat perinteisesti hankkineet muiden tuottamaa valmista ja sisällöltään pysyväksi oletettua aineistoa paikallisasiakkailleen. Digitaalisessa maailmassa tämä toimintamalli on joka tapauksessa jossain vaiheessa menneisyyttä, ja perinteisen paperimaailman tarpeita varten rakennetun kirjaston tilalle saatetaan tarvita kokonaan uudenlaista infrastruktuuria.

[Jatkuu seuraavassa merkinnässä]

ETD 2007 (2): Kansainvälistä yhteistyötä

[Tämä merkintä liittyy Uppsalassa 13.-16.6.2007 järjestettyyn opinnäytteiden verkkojulkaisemista käsittelleeseen ETD 2007 -konferenssiin, ks. myös ensimmäinen merkintä]

Opinnäytteet vs. julkaisuarkistot

Konferenssin ensimmäisenä päivänä pidettiin pääasiassa Euroopan tilanteeseen keskittynyt workshop, jossa esiteltiin yhteiseurooppalaisia GUIDE– ja DART-Europe-projekteja. Projektien aktiivit päätyivät toteamaan, ettei yhteisten hankkeiden edistys ollut kaikilta osin toivottua tasoa: eri maiden ETD-ihmisiä näyttää olevan vaikea motivoida mukaan yhteiseen toimintaan.

Tämän masentavan huomion myötä Gerard van Westrienen (SURF Foundation, Hollanti) käänsi keskustelun pohdiskeluksi siitä, ovatko eurooppalaiset opinnäytteet sellainen erityisala, jonka ympärille voidaan rakentaa toimintaa, vai kannattaisiko niitä käsitellä osana laajempia julkaisuarkistojen (institutional repository) perustamiseen liittyviä kysymyksiä. Julkaisuarkistoihin liittyviin projekteihin olisi todennäköisesti helpompi saada rahoitusta esim. EU:lta. Yleisön mielipiteet jakautuivat, eikä suurella osalla (minä mukaan lukien) näyttänyt olevan ainakaan äkkiseltään kovin vankkoja mielipiteitä suuntaan tai toiseen.

NDLTD:n johtaja, Virginia Techin tietojenkäsittelytieteen professori Edward Fox muistutti omassa hengenluontipuheessaan siitä, että julkaisuarkistojen saaminen liikkeelle on osoittautunut monissa tapauksissa mutkikkaaksi, kun taas opinnäytteiden kanssa on usein helpompi päästä eteenpäin ja saada aikaan konkreettisia tuloksia.

“Simple Dublin Core is not enough”

Etenkin ensimmäisen päivän projektiesittelyissä tuli esiin jo ennestään tuttu näkemys siitä, että opinnäytteitä ja muitakin julkaisuarkistomateriaaleja varten tarvitaan unqualified Dublin Corea rikkaampia kuvailuformaatteja. Erityisen suuria toiveita kohdistuu EPrints Application Profileen (ks. artikkeli Ariadnen tammikuun numerossa), josta toivotaan eräänlaista paikallisesti ja kansallisilla tasoilla käytössä olevia kuvailuformaatteja yhdistävää kattoformaattia.

Edward Fox toi toisaalta keskustelussa esiin sen, että myös NDLTD:n oma, vuosia sitten opinnäytteitä varten kehitetty metadataformaatti kaipaisi laajentamista ja päivittämistä, eli tätäkään työtä ei ehkä kannata tehdä pelkästään eurooppalaisesta näkökulmasta. Samalla olisi tietysti hyvä, jos kansainvälisiä metadataformaatteja laadittaessa voitaisiin ottaa huomioon myös pohjoismaisten artikkeliväitöskirjojen kaltaiset paikallisten julkaisukulttuurien erikoispiirteet.

[Jatkuu seuraavassa merkinnässä]

ETD 2007: Opinnäytejulkaisemista Uppsalassa

Opinnäytteiden julkaiseminen verkossa on yleistynyt maailmanlaajuisesti 1990-luvun puolivälistä lähtien. Mutta missä tällä hetkellä mennään ja millaisia ovat julkaisutoiminnan tulevaisuuden haasteet? Tästä sai hyvän kuvan Uppsalassa 13.-16.6.2007 järjestetyssä NDLTD:n vuosittaisessa opinnäytejulkaisemista käsittelevässä konferenssissa.

Uppsalan konferenssin rinnakkaisissa sessioissa pidettiin kymmeniä esityksiä, joista kuulin vain kolmasosan. Oheisiin merkintöihin on poimittu joitakin omia tulkintojani keskeisistä päivien aikana käsitellyistä teemoista sekä muutamia muita mielenkiintoisia huomioita yksittäisistä esityksistä:

ETD 2007(2): Kansainvälistä yhteistyötä

ETD 2007(3): Tieteellisen julkaisemisen tulevaisuus

ETD 2007(4): Esimerkkejä maailmalta

NDLTD eli viralliselta nimeltään Networked Digital Library of Theses and Dissertations on kansainvälinen järjestö, joka pyrkii edistämään nimenomaan opinnäytteiden verkkojulkaisemista. Tämänkertainen, nelipäiväisenä järjestetty ETD 2007: Added Values to E-theses oli mukavan pieni, erittäin kansainvälinen ja teemojensa puolesta suhteellisen hyvin fokusoitunut konferenssi. Osanottajia oli mukana puolentoista sataa yhteensä 37 maasta ja viidestä maanosasta. Vaikka konferenssi oli tällä kertaa näinkin lähellä, Suomesta oli Kansalliskirjaston joukkueen (minä ja Jussi Piipponen) lisäksi koko seminaarin ajan paikalla vain kansainvälisen ETD-yhteistyön veteraaneihin lukeutuva Rita Voigt TKK:lta.

Kokonaisuutena ETD 2007 oli oikein viihdyttävä konferenssi, jossa myös virallisen ohjelman ulkopuolella tapahtuvalle sosiaaliselle verkostoitumiselle (ja Uppsalan nähtävyyksiin tutustumiselle) jäi riittävästi aikaa. Seuraava ETD-konferenssi pidetään Aberdeenissa 4.-7. kesäkuuta 2008. Toivottavasti sinne saadaan Suomestakin mukaan runsaampi edustus

[Jatkuu seuraavassa merkinnässä]

Abstrakteista on konkreettista hyötyä

The Journal of Academic Librarianship -lehden kesäkuun numerossa selostetaan tutkimusta tiivistelmien merkityksestä tiedonhaussa1. Tutkimuksessa on tarkasteltu muutaman tiedonhakujärjestelmän lokitetoja (Science Direct, OhioLink, Nucleic Acids Research). Näissä ympäristöissä on myös kokoteksti saatavissa. Lokitietojen analyysi ja tutkittujen vastaukset kyselyyn tukivat oletusta, että tiivistelmät ovat hyvin suosittuja ja niillä on oleellinen rooli tieteellisessä tiedonhaussa.

Kirjoittajat kuvaavat tutkijan tiedonhakua pikemminkin horisontaaliseksi kuin vertikaaliseksi: yhden tiedonhakuympäristön käyttöön syvennytä pitkäksi aikaa, vaan mieluummmin käytetään aika “piipahtamalla” pintapuolisesti useammassa ympäristössä. Tällaista tiedonhakutapaa tiivistelmät tietenkin tukevat mainiosti.

Tiivistelmään tyytyivät herkimmin yhteiskuntatieteilijät, fyysikot ja tietojenkäsittelytieteilijät. Useimmiten kokotekstiin taas jatkoivat kemistit sekä insinööri- ja biotieteilijät. Mitä iäkkäämpi asiakas on, sitä useammin hän luottaa tiivistelmiin. Tämä johtuu kenties tottumuksesta, kenties kokemuksen tuomasta varmuudesta aineistojen nopeassa arvioinnissa, kenties siitä että he ovat edenneet tehtäviin, joissa ajankäyttö ja tiedontarpeet ovat erilaisia.

“Horisontaalinen tiedonhaku” on, luulemma, niitä ilmiöitä, joita voi joltakin näkökannalta paheksua, mutta joiden kanssa pitää elää. Tämäkin tutkimus tukee ajatusta, että myös tieteellisissä tiedonhakuympäristöissä tulisi tarjota helppoja hakuja ja nopeita tuloksia. Ja tiivistelmät ovat siis olennainen osa hyvää palvelua.

1David Nicholas, Paul Huntington and Hamid R. Jamali: The Use, Users, and Role of Abstracts in the Digital Scholarly Environment. The Journal of Academic Librarianship, Volume 33, Issue 4, July 2007, 446-453.
<http://dx.doi.org/10.1016/j.acalib.2007.03.004>

Creative Commons License

Selvitys ammattikorkeakoulujen julkaisutoiminnasta

eAineistot oppimisen resurssi -blogi uutisoi ammattikorkeakoulujen julkaisutoiminnasta tehdystä selvityksestä, joka perustuu syksyllä 2006 tehtyyn kyselyyn. Kyselyyn vastasi yhteensä 21 ammattikorkeakoulua, joista 15:llä oli tällä hetkellä omaa julkaisutoimintaa.

Enni Harrinkari & Lea Mustonen: Selvitys Arene ry:n viestintätyöryhmälle ammattikorkeakoulujen julkaisutoiminnan nykytilanteesta ja julkaisuyhteistyöhalukkuudesta. Hämeenlinna: Hämeen ammattikorkeakoulu, 2007.

Ammattikorkeakoulut ovat myös käynnistämässä opetusministeriön tuella omaa yhteistä Open Access -hankettaan. Hanke koostuu kahdesta osakokonaisuudesta, jotka ovat avoin tieteellinen verkkolehti ja elektroninen opinnäytetyökirjasto.

Tieteenalakohtaisista eroista väitöskirjojen verkkojulkaisemisessa

Kaikki Helsingin yliopiston väittelijät ovat täyttäneet huhtikuun alusta 2006 lähtien yliopiston yhteisen väitöstietolomakkeen, jolla kerätään E-thesis-palvelun ja yliopiston viestintäosaston tarvitsemat väitöstilaisuutta ja väitöskirjaa koskevat tiedot sekä väitöskirjan tiivistelmät. Lomakkeella kerätyistä tiedoista saa myös melko näppärästi koottua tilaston siitä, miten suuri osa kunkin tiedekunnan väitöskirjoista ilmestyy kokotekstiversiona E-thesis-palvelussa.

Seuraava tilasto kattaa noin neljäntoista kuukauden väitökset (huhtikuu 2006 – toukokuu 2007):

tiedekunta väitöksiä verkossa osuus
farmasian 13 13 100%
lääketieteellinen 126 121 96%
biotieteellinen 72 66 92%
matemaattis-luonnontieteellinen 79 72 91%
käyttäytymistieteellinen 39 33 85%
maa- ja metsätieteellinen 37 29 78%
teologinen 14 7 50%
valtiotieteellinen 52 25 48%
humanistinen 50 21 42%
oikeustieteellinen 11 3 27%
KOKO YLIOPISTO 502 399 79%

Kuten ehkä saaattoi odottaakin, luonnontieteissä ja lääketieteessä ylivoimainen enemmistö väitöskirjoista ilmestyy verkossa. Maa- ja metsätieteellisen tiedekunnan suhteellisen pientä osuutta selittää se, että osa tiedekunnan väitöksistä ilmestyy verkossa E-thesiksen sijasta Metsäntutkimuslaitoksen väitöskirjasarjassa.

Humanistis-yhteiskuntatieteellisellä alalla verkkojulkaiseminen on selkeästi vähäisempää, ja tilanne näyttää myös ainakin toistaiseksi vakaalta. Käyttäytymistieteellinen tiedekunta on ainoa merkittävä poikkeus yleisestä kaavasta, sillä siellä verkkojulkaisujen osuus yltää lähestulkoon luonnontieteilijöiden lukemiin.

Miten näitä eroja voi selittää? Suurelta osin kyse on tietysti yleisemmistä julkaisukulttuurin ja tieteenalojen perinteiden eroavaisuuksista. Elektroninen julkaiseminen on muutenkin yleistynyt nopeammin luonnontieteellisellä alalla, kun taas esim. humanistit tai oikeustieteilijät ovat pitäneet sitkeämmin kiinni painetuista julkaisuista.

Luonnontieteellisen alan väitöskirjat ovat pääasiassa aiemmin julkaistuista artikkeleista koostuvia artikkeliväitöskirjoja, joista E-thesis-palvelussa julkaistaan yleensä vain artikkelien keskeiset tulokset kokoava yhteenveto-osa. Olennaista on se, että artikkelit on julkaistu mahdollisimman arvovaltaisissa vertaisarvioiduissa lehdissä, eli niiden sisältämä tieto on jo käynyt läpi tiedeyhteisön sisäisen kontrollin. Niinpä väittelijät saattavat pyydellä anteeksi sitä, jos väitöskirja sisältää uutta, ennen julkaisematonta tietoa, mikä voi tuntua esim. humanistin näkökulmasta oudolta. Joka tapauksessa tämä tarkoittaa sitä, että kynnys väitöskirjan julkaisemiseen verkossa on useimmissa tapauksissa pysynyt matalana.

Humanistis-yhteiskuntatieteellisellä alalla väitöskirjat ovat tyypillisesti monografioita (vaikka myös artikkeliväitöskirjat ovat vähitellen yleistymässä). Ainakin humanistisessa tiedekunnassa väittelijöitä on saatettu jopa varoitella laittamasta teoksiaan verkkoon, sillä yleisen käsityksen mukaan etenkään suuret kansainväliset kustantajat eivät enää hyväksy aiemmin muualla ilmestyneitä töitä julkaistavakseen. Niinpä osa väittelijöistä tuottaa väitöskirjastaan väitöstilaisuutta varten ainoastaan monisteen, jolle ei välttämättä haluta edes ISBN-numeroa, jotteivät kustantajat vain erehtyisi epäilemään sitä aiemmin julkaistuksi. Näin siis humanistisilla tieteenaloilla lähestytään vaivihkaa anglosaksisen maailman väittelykäytäntöjä. Oman monografian saaminen arvostettuun kansainväliseen sarjaan on joka tapauksessa niin suuri meriitti, että sitä koskevat toiveet saattavat ajaa kotimaisten väitöskirjan julkisuutta koskevien perinteiden edelle.

Humanistis-yhteiskuntatieteellisen alan väitöskirjoja ilmestyy kansainvälisten sarjojen lisäksi myös kotimaisten kustantajien sarjoissa. Esim. huomattava osa historian väitöskirjoista ilmestyy kauniisti kuvitettuina ja toimitettuina Suomalaisen Kirjallisuuden Seuran julkaisemassa Bibliotheca Historica -sarjassa, eivätkä ne siten tule E-thesis-palveluun. Kyse ei ole kuitenkaan suurista kaupallisista intresseistä, vaan taustalla vaikuttavat enemmän tieteenalan perinteet ja painettujen monografioiden suuri arvostus. Vaikka historia lienee tieteenalana populaareimmasta päästä, myyntiluvut lienevät suomenkielisten väitöskirjojen osalta satunnaisia poikkeustapauksia lukuunottamatta korkeintaan joitakin satoja kappaleita. Ulkomaankielisiä, Suomessa julkaistuja väitöskirjoja myydään yleensä tätäkin vähemmän.