IPRES, toisia vaikutuksia ensi päivältä

Muistiinpanoja iltapäivän esityksistä 20.9. IPRES 2010 -konferenssissa:

Eileen Fenton: “Preservation Repository Audit – The Portico Experience”

Porticohan on palvelu, joka säilyttää mm. elektronisia lehtiä ja kirjoja; ideana on, että vaikkapa tieteellisetä lehteä ei jokaisen tilaajan ynnä kustantajan kannata säilyttää erikseen, vaan sopimuksin voidaan päästä siihen, että yksi kopio palvelee kaikkia.Portico on ensimmäinen CRL:n (Center of Research Libraries) auditoimia ja sertifioima luotettu digitaalinen arkisto.

Onnistumisen taustalla on kuusi asiaa: kestävä taloudellinen pohja, selkeä sopimuskäytäntö, yhteistyö pitkäaikaissäilytyksen kehittämisessä, korkealuokkaiset tekniset ja toiminnalliset ratkaisut sekä toiminnan läpinäkyvyys.

Sertifiointiprosessi kesti noin vuoden. Suurin osa siitä koostui dokumenttien toimittamisesta, paikan päällä tarkastusta tehtiin vain yhden päivän ajan. Fenton korosto, kuinka tärkeää oli, että kaikki viestintä kävi yhden henkilön kautta.

Ensin Porticon tuli inventoida oma sisäinen dokumentaationsa. Sitä olip eilattava TRAC-vaatimuksiin, joita tarkastuksessa käytettiin. Kaiken kaikkiaan auditoinnissa teknisillä seikoilla ei ollut sellaista merkitystä kuin ehkä tulisi ajatelleeksi. CRL:n kritiikki kohdistui ennen kaikkea Porticon politiikkojen ajantasaisuuteen ja kysymykseeb siitä, voiko Portico saavuttaa “kriittisen massan” – eli aineistomäärät eivät vielä olleet kyllin suuria!

Kenet kaikki pitäisi auditoida? Erilaisten aineiston omistajien tulisi oikeastaan ensin asettaa itselleen oikeankoikoinen säilytyksen kunnianhimon taso. Tästää seuraa tietenkin, että jos säilytyksen varmuustaso ei ole tiukin mahdollinen, on auditointikin vastaavasti kevyempi.

Paul Conway: “Measuring Content Quality in a Preservation Repository”

Conway tarttui aiheeseen, jonka vastuukysymys on hieman epäselvä: voimme säilyttää informaatiota, mutta miten arvioimme sen teknistä laatua ja sen rajoittamaa hyödyllisyyttä. Koekaniinina on ollut Hathitrust, toinen yhteisesti rakennettu digitaalinen arkisto.

Sangen tekninen esitys esitteli tiukan regiimin virheiden metriikalle ja mittaamiselle. Tutkimuksessa on mm. luotu massadigitoinnin virhemalli, lista ainakin yleisimmistä virheistä: sormi kuvassa, sivuja skannattu kaksi kertaa, jne.

Näiden tulosten perusteella on tutkittu Hathitrustin aineistoa ja rakennettu aineiston informaation laadun mittaamisen menetelmää.

Oleellista on, että “Mutta lopun johtopäätökset olivat huomiota herättäviä. Puhuja argumentoi, että meidän olisi siirryttävä mittaamaan “digitoinnin laadun” sijasta “informaation laatua”. Informaation laatua taas tulee mitata käyttäjien tarpeista ja kokemuksesta lähtien. Tämä voi tuottaa perustavia muutoksia siihen, mihin digitoinnissa panostetaan.

Matt Schultz: “The Importance of Trust in Distributed Digital Preservation”

Erilaisia hajautettuja säilytysskenaarioita on useita; monet LOCKSS-pohjaisia. Hajautuksella on monia taloudellisia ja turvallisuushyötyjä, mutta monet osallistujat hakevat yhteistyöstä nimenomaan luotettuutta eli paitsi todellista myös osoitettavissa olevaa ja vertaisyhteisön hyväksymää vakautta säilyttäjänä.  Yhdessä on helpompaa rakentaa järjestelmiä, jotka esimerkiksi ovat OAIS-standardin mukaisia ja täyttävät TRAC-vaatimukset.

MetaArchive Cooperative on 16 organisaation muodostama konsortio, joka käyttää LOCKSS:ia ja säilyttää tällä hetkellä noin 245 teratavua dataa. MetaArchiville on tehty TRAC-auditointi, jossa nousi esiin tiettykä TRACin ongelmia. Monet niistä liittyvät juuri konsortioympäristöön. Nykyiset standardit ja mallit eivät luonnu yhteiskäyttöisten tai hajautettujen järjestelmien viitemalliksi.

Puhuja esitti toiveita sille, millaisia asiaoita ja millaisia eri yhteistyön malleja standardeissa tulisi ottaa huomioon. Näihin asioihin tullaan varmasti KDK:n parissa palaamaan!