Viikin AFO-ontologia tehostaa tiedonhakua

Tietoaineistojen kuvailua ja tiedonhaun tehokkuutta voidaan parantaa muokkaamalla asiasanastoista ontologioita, joissa asiasanat on muunnettu tietokoneen ymmärtämäksi hierarkkiseksi käsitemalliksi. Jos haetaan tietoa esim. suomenkarjan ruokinnasta hakusanoilla suomenkarja ja rehut, hakujärjestelmä ymmärtää, että itäsuomenkarja on suomenkarjaa ja nurmirehut ovat rehuja. Tällöin ontologiaan on siis määritelty suomenkarjan alarodut ja rehutyyppejä. Ontologioista voidaan poimia suoraan termejä aineistojen kuvailuun (esim. Artiva-lomake) ja tiedonhakuun (suunnitteilla Finnaan).

FinnONTO-hankkeessa (v. 2003-2012) muokattiin Yleisestä suomalaisesta asiasanastosta (YSA) Yleinen suomalainen ontologia (YSO). Samassa hankkeessa ontologisoitiin myös silloisen Viikin tiedekirjaston Agriforest-asiasanastosta AFO-ontologia v. 2007-2008. Nyt AFO sisältää noin 5700 käsitettä ja on käytettävissä Kansalliskirjaston ylläpitämässä Finto-palvelussa. Agriforest-sanaston termit perustuivat Viikin tiedekirjaston edeltäjien, Maatalouskirjaston ja Metsäkirjaston, vuosikymmenien aikana tehtyyn sanastotyöhön. Niinpä AFOn sisältö painottuu maa- ja metsätalouteen sekä elintarvike- ja ympäristöaloihin. Lisäksi mukana on näihin aihepiireihin liittyviä käsitteitä, esimerkiksi biologiaa ja eliöiden suomenkielisiä, englanninkielisiä ja tieteellisiä nimiä.

Agriforestissa oli runsaasti myös yleisiä termejä, jotka olivat osittain ristiriitaisia YSAn kanssa. Yleisiä käsitteitä ontologisoitiin AFOon vain poikkeustapauksissa ja niitä on jokaisessa päivityksessä edelleen vähennetty. Finto-palvelussa erikoisalojen ontologiat, kuten AFO, on ripustettu YSOon, josta yleiset käsitteet löytyvät.

AFOssa on käsitteiden englanninkielisiä käännöksiä, myös FAOn Agrovoc-sanastosta. Viikin kampuskirjasto on FAOn tallekirjasto ja Viikissä tallennetaan ja sisällönkuvaillaan Suomessa julkaistujen maatalous- ja metsätieteiden tieteellisten lehtien artikkeleita FAOn Agris-tietokantaan.

Viikin kampuskirjastossa sisällönkuvaillaan monografioita Helka-tietokantaan (Helsingin yliopiston kirjaston kirjastoluettelo) ja artikkeleita Arto-tietokantaan (kotimainen artikkeliviitetietokanta). Agriforest-asiasanastoon verrattuna AFO-ontologia on koettu Viikin kampuskirjastossa asiasanoituksen edistysaskeleeksi. Ontologian hierarkiarakenne helpottaa asiasanojen valintaa. Erityisen hyödylliseksi AFO on osoittautunut artikkelien tallennuksessa Artoon Artiva-lomakkeella, jossa asiasanat voidaan poimia suoraan ontologiasta. Lomakkeella voidaan poimia asiasanoja myös muista Finto-palvelun ontologioista ja asiasanastoista mm. YSAsta sekä Kassusta, joka sisältää kasvien suomenkielisiä ja tieteellisiä nimiä.

Ontologiapalvelujen ylläpito on vakiintumassa Kansalliskirjaston Finto-palveluun, joka tukee myös erikoisalojen ontologioiden tuotantoa. Ontolgiatyön sisällöllistä koordinointia varten on jo perustettu ryhmä pohtimaan mm. sitä, miten voidaan välttää eri ontologioita ylläpitävien tahojen päällekkäinen toiminta. Esimerkiksi AFO ja YSO sisältävät runsaasti samoja käsitteitä. YSOssa on runsaasti hyvin spesifistäkin aineistoa, joita tarvitaan mm. kotimaisten väitöskirjojen kuvailuun, mutta joka ehkä paremmin sopisi erikoisalojen ontologioihin. Jos ontologioiden käyttäjät haluavat, että erikoisalojen ontologiat sisältävät oman alansa käsitteiden kokonaisuuden, se vaatii väistämättä päällekkäistä työtä ontologioiden ylläpidossa. AFOon ei ole lisätty sen aihepiireihin liittyviä käsitteitä, jotka on lisätty YSOon AFOn perustamisen jälkeen. Yhtenä perusteena tähän on se, että Viikin kampuskirjastossa käytetään asiasanoituksessa ensisijaisesti YSAn termejä, kuten Suomen yliopistokirjastojen neuvoston sisällönkuvailun kehittämis- ja asiantuntijaverkosto suosittelee. Sisällön koordinoinnissa olisi tarpeen ottaa huomioon myös Tieteen termipankin tyyppiset hankkeet.

Teksti:

Päivi Lipsanen
tietoasiantuntija

Kuva:

Jaakkolan tila