Nettiä pelastamassa (2): mitä tutkijat toivovat verkkoarkistoilta

IIPC:n General Assembly jatkui sessiolla, jossa käsiteltiin verkkoarkistojen tutkimuskäyttöä.

Sosiaalitieteilijät tutkivat ihmisiä, eivät webisivuja

Oxford Internet Institute tutkii Internetiä yhteiskunnallisena ilmiönä, sen muuttumista ja sen erilaisia rooleja.

Eric Meyer, Arthur Thoms ja Ralph Schroeder Oxford Internet Institutesta esittelivät ajatuksiaan siitä, miten nettiarkistoinnin tulisi tapahtua ollakseen mielekästä yleensä ja tutkijoiden kannalta erityisesti. Oxford Internet Institute tutkii Internetiä yhteiskunnallisena ilmiönä, sen muuttumista ja sen erilaisia rooleja.

Internetin tutkimus on vasta muotoutumassa; otti aikansa, ennen kuin netistä tuli vakavasti otettava tutkimuskohde. Nyt uskottavuutta toki on jo enemmän kuin kyllin, WWW:n alkuaikoihin alkaa olla perspektiiviä ja tähän mennessä syntyneet aikasarjatkin jo tarpeeksi pitkiä.

Esitys toi esiin, että ainakaan nämä tutkijat eivät oikeastaan välittäneet netin informaatiosisällöstä vaan tutkivat pikemminkin ihmisten ja teknologian välistä sekä ihmisten välistä vuorovaikutusta. Tästä näkökulmasta nykyiset verkkoarkistot ovat jokseenkin käyttökelvottomia. Puhujien kannalta välttämätöntä olisi esimekriksi käyttötapahtumien (kuka klikkaa mitä) ja käyttötilastojen arkistoiminen.  Verkkoarkistoja tulisi voida tutkia niin kuin Media Cloudilla voi tutkia varsinaista nettiä.

Huomiota kiinnitettiin myös siihen, että netti on yhä enemmän pikemminkin “dataa” kuin “dokumentteja” – ajateltakoon vaikka semanttista webiä ja avointa linkitettävää dataa. Eikä unohtaa sopisi tietenkään Second Lifea ja muita virtuaalimaailmoita sekä peliyhteisöjä.

Näiden tutkijoiden mielestä verkkoarkistojen palvelussa pitäisi korostaa datasettejä ja data-analyysia ja visualisointia sisällöllisen tietopalvelun sijaan.

BL: oikeita tutkijoita ja oikeaa tutkimusta

Helen Hockx‐Yu, British Librarysta, kertoi vuoden kestävästä hankkeesta, jossa kirjasto pyrkii lisäämään verkkoarkiston aktiivista tutkimuskäyttöä. Hankkeeseen voi tutustua sen blogin kautta. Kirjasto on aktiivisesti etsinyt kiinnostuneita tutkijoita, kehittänyt palvelujaan, esimerkiksi data-analyyseja. Hankkeessa on kahdeksan tutkijaa, joiden kanssa on sovittu tutkimussuunnitelmasta. Tutkimusaljoa ovat mm. digitaalisen kerronnan muodot, metodismin historia ja urheilun ja etnisyyden suhde. Tutkijoiden kanssa on pidetty työpajoja ja heille on tehty kyselytutkimus.

Näille tutkijoille “vakava” sisältö, kuten sanomalehdet, ei ole lainkaan tärkeää verkkoarkistossa, vaan he tarvitsevat ennen kaikkea sellaisia sisältöjä kuin blogit ja keskustelupalstat. Tutkijat kokevat, että työkaluja suurten datamäärien käsittelyyn pitäisi parantaa. British Library on rakentanut erikoiskokoelmia, ja niitä tutkijat käyttävät mieluummin.

Hollantilaisen blogosfäärin analyysia

Digital Methods Initiative Amsterdamin yliopistossa on  tutkinut alankomaalaisten blogien historiaa. Niitä kaivattuja visualisointeja on Anne Helmondin blogissa.Tutkimuksessa on käytetty Internet Archiven dataa. Tutkimuksella on analysoitu mm. blogialustojen kohtaloita. Eräs tulos on se, että blogit ovat teknisesti hollantilaistuneet, so. bloggaajat ovat vahvasti siirtyneet käyttämään alankomaalaisia alustoja. Sosiaalisen median vaikutus blogien määrään ja aktiivisuuteen on myös analyyseissa huomattavissa.

Web korpuksena

Paul Girard Sciences Po -yliopistosta kertoi siitä, miten webiaineistoja- ja siis myös webiarkistoja – voi käyttää korpuksien lähteenä.

Tutkijalle olemassa olevat arkistot ovat hieman hankalia. Ne ovat liian valikoimattomia; niiden käyttöön liittyy laillisia ja teknisiä ongelmia; ja niiden käyttö on tutkijoille vaikeata. Samaa voidaan tietenkin sanoa elävän netin kokonaisuudesta. Tutkijalle on hyödyllisempää “research driven crawling”, jossa aineiston valinta korpukseen perustuu siis tutkijan kiinnostuksen kohteeseen. Girardin tutkimushankkeissa onkin syntymässä uusia avoimen lähdekoodin työvälineitä korpusten luomiseen ja käsittelyyn.