Viikin AFO-ontologia tehostaa tiedonhakua

Tietoaineistojen kuvailua ja tiedonhaun tehokkuutta voidaan parantaa muokkaamalla asiasanastoista ontologioita, joissa asiasanat on muunnettu tietokoneen ymmärtämäksi hierarkkiseksi käsitemalliksi. Jos haetaan tietoa esim. suomenkarjan ruokinnasta hakusanoilla suomenkarja ja rehut, hakujärjestelmä ymmärtää, että itäsuomenkarja on suomenkarjaa ja nurmirehut ovat rehuja. Tällöin ontologiaan on siis määritelty suomenkarjan alarodut ja rehutyyppejä. Ontologioista voidaan poimia suoraan termejä aineistojen kuvailuun (esim. Artiva-lomake) ja tiedonhakuun (suunnitteilla Finnaan).

FinnONTO-hankkeessa (v. 2003-2012) muokattiin Yleisestä suomalaisesta asiasanastosta (YSA) Yleinen suomalainen ontologia (YSO). Samassa hankkeessa ontologisoitiin myös silloisen Viikin tiedekirjaston Agriforest-asiasanastosta AFO-ontologia v. 2007-2008. Nyt AFO sisältää noin 5700 käsitettä ja on käytettävissä Kansalliskirjaston ylläpitämässä Finto-palvelussa. Agriforest-sanaston termit perustuivat Viikin tiedekirjaston edeltäjien, Maatalouskirjaston ja Metsäkirjaston, vuosikymmenien aikana tehtyyn sanastotyöhön. Niinpä AFOn sisältö painottuu maa- ja metsätalouteen sekä elintarvike- ja ympäristöaloihin. Lisäksi mukana on näihin aihepiireihin liittyviä käsitteitä, esimerkiksi biologiaa ja eliöiden suomenkielisiä, englanninkielisiä ja tieteellisiä nimiä.

Agriforestissa oli runsaasti myös yleisiä termejä, jotka olivat osittain ristiriitaisia YSAn kanssa. Yleisiä käsitteitä ontologisoitiin AFOon vain poikkeustapauksissa ja niitä on jokaisessa päivityksessä edelleen vähennetty. Finto-palvelussa erikoisalojen ontologiat, kuten AFO, on ripustettu YSOon, josta yleiset käsitteet löytyvät.

AFOssa on käsitteiden englanninkielisiä käännöksiä, myös FAOn Agrovoc-sanastosta. Viikin kampuskirjasto on FAOn tallekirjasto ja Viikissä tallennetaan ja sisällönkuvaillaan Suomessa julkaistujen maatalous- ja metsätieteiden tieteellisten lehtien artikkeleita FAOn Agris-tietokantaan.

Viikin kampuskirjastossa sisällönkuvaillaan monografioita Helka-tietokantaan (Helsingin yliopiston kirjaston kirjastoluettelo) ja artikkeleita Arto-tietokantaan (kotimainen artikkeliviitetietokanta). Agriforest-asiasanastoon verrattuna AFO-ontologia on koettu Viikin kampuskirjastossa asiasanoituksen edistysaskeleeksi. Ontologian hierarkiarakenne helpottaa asiasanojen valintaa. Erityisen hyödylliseksi AFO on osoittautunut artikkelien tallennuksessa Artoon Artiva-lomakkeella, jossa asiasanat voidaan poimia suoraan ontologiasta. Lomakkeella voidaan poimia asiasanoja myös muista Finto-palvelun ontologioista ja asiasanastoista mm. YSAsta sekä Kassusta, joka sisältää kasvien suomenkielisiä ja tieteellisiä nimiä.

Ontologiapalvelujen ylläpito on vakiintumassa Kansalliskirjaston Finto-palveluun, joka tukee myös erikoisalojen ontologioiden tuotantoa. Ontolgiatyön sisällöllistä koordinointia varten on jo perustettu ryhmä pohtimaan mm. sitä, miten voidaan välttää eri ontologioita ylläpitävien tahojen päällekkäinen toiminta. Esimerkiksi AFO ja YSO sisältävät runsaasti samoja käsitteitä. YSOssa on runsaasti hyvin spesifistäkin aineistoa, joita tarvitaan mm. kotimaisten väitöskirjojen kuvailuun, mutta joka ehkä paremmin sopisi erikoisalojen ontologioihin. Jos ontologioiden käyttäjät haluavat, että erikoisalojen ontologiat sisältävät oman alansa käsitteiden kokonaisuuden, se vaatii väistämättä päällekkäistä työtä ontologioiden ylläpidossa. AFOon ei ole lisätty sen aihepiireihin liittyviä käsitteitä, jotka on lisätty YSOon AFOn perustamisen jälkeen. Yhtenä perusteena tähän on se, että Viikin kampuskirjastossa käytetään asiasanoituksessa ensisijaisesti YSAn termejä, kuten Suomen yliopistokirjastojen neuvoston sisällönkuvailun kehittämis- ja asiantuntijaverkosto suosittelee. Sisällön koordinoinnissa olisi tarpeen ottaa huomioon myös Tieteen termipankin tyyppiset hankkeet.

Teksti:

Päivi Lipsanen
tietoasiantuntija

Kuva:

Jaakkolan tila

Tiedon avaimet käteen Haagissa

International UDC Seminar 2011: Classification  and Ontology – Formal Approaches and Access to Knowledge – 19.-20.9.2011 Haag

Osallistuin UDK-konsortion järjestämään kansainväliseen seminaariin Alankomaiden kansalliskirjastossa.  Seminaarin tavoitteena oli mm. edistää yhteistyötä ja asiantuntijoiden tiedonvaihtoa bibliografisten järjestelmien, semanttisen verkon ja tekoälysovellusten asiantuntijoiden kesken.

Olin kiinnostunut erityisesti luokitusjärjestelmiä, ontologioita ja semanttista verkkoa koskeneista osuuksista. Olen mukana Suomen yliopistokirjastojen neuvoston sisällönkuvailun asiantuntijaverkostossa. Verkoston tehtävänä on seurata sisällönkuvailun tarjoamien mahdollisuuksien kehittymistä sekä niiden soveltamista kirjastoissa. Seminaari tarjosi miten tietoa mm. siitä miten tietoaineistojen löytyvyyttä edistetään muualla.

International UDC Seminar 2011

Seminaari oli jaettu seitsemään sessioon.  Kolme ensimmäistä käsitteli luokituksia, ontologioita ja niiden roolia verkossa. Neljännessä sessiossa aiheena oli ontologioiden ja luokituksien hyödyntäminen kemiallisen ja matemaattisen aineistojen sisällön analyysissä.  Viides sessio käsitteli ontologioiden avainelementtejä: kategorioita ja suhteita. Kuudennessa käsiteltiin analyyttis-synteettisten luokitusten käsitteiden ja rakenteiden mallintamista, ja viimeisessä sessiossa luokitusjärjestelmien muutoksia ja laajennuksia.

Kirjastomme näkökulmasta konkreettisin esimerkki miten semanttisen verkon palveluista on jo nyt hyötyä, löytyi Thomas Bakerin esitelmästä Concepts as Hubs in the Web of Data.

Hän kertoi, miten semanttisen verkon metadata on rakentunut. Uusia metadataresursseja voidaan dynaamisesti integroida jatkuvasti laajennettavissa oleviksi kuvauksiksi.  Käsitteiden erikieliset versiot mahdollistavat järjestelmän hyödyntämisen eri kielillä. Näin voidaan yhdistää saman julkaisun erikieliset versiot ja julkaisujen erikieliset kuvailut. Aineiston konelukuisuus mahdollistaa sen, voi syntyä uusia linkkejä hyvin erilaisiin aineistoihin. Yhdistetyn tiedon (Linked data) palveluiden avulla Agris -tietokannan viitteestä pääsee Agrovoc -käsitteen kautta DBpedia -käsitteeseen. DBpedia -käsitteestä pääsee VIVO Expert -palveluun, jossa on mm. tietoa asiantuntijoista, BBC:n uutisten ja BBC:n verkkosivuille tai Wikipediaan. Viikin kampuskirjasto on Suomen AGRIS Resource Center ja vastaa keskitetysti suomalaisen maatalousalojen julkaisujen, osa e-julkaisuja, viitetiedon toimittamisesta FAO:n AGRIS –tietojärjestelmään, Käytämme näidem aineistojen sisällönkuvailussa Agrovoc-termejä

Viikin tiedekirjasto eli nykyinen Viikin kampuskirjasto, on ollut mukana FinnONTO -hankkeessa. jossa on kehitetty mm. asiasanastoista ontologioita, esim.  AgriForest sanaston pohjalta AFO-ontologia ja Yleisestä suomalaisesta asiasanastosta (YSA) Yleinen suomalainen ontologia (YSO). Tätä kautta olen tutustunut ontologia -käsitteeseen ja siihen, miten me voimme kirjastomaailmassa sitä hyödyntää. Vaikka en ole ollut mukana ontologian rakentamisessa, näkökulmani ontologiaan ollut hyvin käytännön läheinen.  UDK -seminaarissa oli hyviä esityksiä, jossa kerrottiin erilaisista ontologioista ja logiikasta miten rakentuvat ja miten niitä voisi hyödyntää.

Kirjastojärjestelmissä ja viitetietokannoissa on runsaasti luokituksia, joita asiakkaat eivät juuri osaa hyödyntää.  Seminaarissa oli esimerkkejä, joissa UDK, Dewey tai Colon luokituksia tai niiden sovelluksia hyödynnetään yhdessä sanastojen, tesaurusten tai ontologioiden kanssa.

Teksti

Esko Siirala
tietoasiantuntija
Viikin kampuskirjasto

Teksti

Esko Siirala