Kirjastojen käyttämän metadatan lähteistä

OCLC:n varapresidentti Lorcan Dempsey pohtii tuoreessa blogimerkinnässään (“Four sources of metadata about things“) erilaisia aineistoja kuvailevan metadatan lähteitä, jotka hän luokittelee neljään eri ryhmään.

1.) Ammattimaisesti tuotettu metadata

Tähän kirjastojen näkökulmasta tutuimpaan ja perinteikkäimpään ryhmään kuuluvat esim. kirjastonhoitajien luettelointisääntöjen mukaan kirjastotietokantaan tuottamat kuvailutiedot.

2.) Käyttäjien ja tekijöiden tuottama metadata
Dempsey käyttää termiä “contributed metadata”, jolle en keksi tähän hätään luontevaa suomennosta. Dempsey luokittelee joka tapauksessa saman termin alle sekä aineistojen tekijöiden tuottaman metadatan että esim. LibraryThingin kaltaisten palveluiden satunnaisten käyttäjien tuottamat kuvailutiedot. Molemmat ryhmät ovat toki kirjastojen näkökulmasta pääosin ulkopuolisia, mutta tietojen luotettavuudessa voi kuitenkin olettaa olevan eroa (mihin Dempsey viittaa vain epäsuorasti)…

3.) Ohjelmallisesti tuotettu metadata
Digitaalisista aineistoista automaattisesti koottu metadata – esim. digitoiduista lehdistä automaattisesti poimitut otsikko- tai tekijätiedot.

4.) Intentionaalinen metadata
Aineistojen käyttöön ja käyttötapoihin pohjautuva tieto – esim. Amazonin asiakkaidensa käyttäytymisen (ostetut kirjat, katsotut sivut) pohjalta koostamat suositukset tai Googlen www-sivujen linkkeihin perustuva PageRank-luokitus.

Jos tätä luokittelua katsoo kansalliskirjastolaisen näkökulmasta, ainoa kokonaan vieras alue taitaa olla intentionaalinen metadata (ks. myös “Amazon on parempi kuin kirjasto” ja etenkin Minna Rouhiaisen kommentti). Vaikka käyttäjien tuottama metadata on vielä tulevaisuuden asia, tekijöiden toimittamaa metadataa käytetään jo nyt esim. E-thesis-palvelussa. Ohjelmallisesti tuotettua metadataa hyödynnetään taas esim. Mikkelin digitointikeskuksessa.

Kuten Dempsey aivan oikein toteaa, näitä erilaisista ja eritasoisista lähteistä koottuja metatietoja ei ole syytä asettaa vastakkain, vaan pikemminkin on syytä pohtia sitä, miten kuvailutietojen muodostama kokonaisuus saadaan pysymään hallinnassa ja miten niiden pohjalta pystytään rakentamaan mielekkäitä palveluita. Hyvä kysymys on myös se, millaisten aineistojen kuvailuun tarvitaan tulevaisuudessa ammattilaisten työpanosta ja mitkä kuvailutiedot on järkevämpää tuottaa jossain muualla tai jollain muulla menetelmällä.