Avoin saatavuus puhutti Madridissa

Viime vuosina terminologia-alan sisällä on tunnettu huolta siitä, kykeneekö terminologinen työskentely vastaamaan räjähdysmäisesti kasvavan termistöjen tarpeen asettamiin haasteisiin. Tiedon verkostoituessa ja tiedonkulun nopeutuessa sekä termit että uudet käsitteet leviävät niin nopeasti, ettei perinteisen terminologisen työn menetelmin voida pysyä mukana kehityksessä. Muuttuvan toimintaympäristön lisäksi huolta on aiheuttanut alan hajanaisuus ja siitä seuraava terminologisten resurssien huono yhteensopivuus.

Tämän vuoden kesäkuussa Madridissa järjestettiin seminaari  Creation, Harmonization and Application of Terminology Resources (CHAT) terminologisia resursseja kehittäville, yhdenmukaistaville ja käyttäville osapuolille, osana laajempaa terminologia- ja ontologia-alan yhteistä TKE-konferenssia.

Terminologisilla resursseilla tarkoitetaan yleensä termitietokantoja, terminhallintatyökaluja, termistöjen kuvailuun käytettäviä metakieliä ja sen sellaista. Terminhallintatyökalut ovat lisensoituja tietokoneohjelmia, joita valmistavat ja myyvät kieliteknologia-alan yritykset. Terminologiset tietokannat ovat laajoja termistöjä tai termistökokoelmia, jotka on tarkoitettu joko vapaaseen tai rajoitettuun käyttöön. Erityisesti vapaasti käytettäviä termitietokantojen kokoavat ja ylläpitävät julkiset toimijat: terminologia-alan järjestöt, yliopistot, kirjastot sekä valtioiden virastot ja tutkimuslaitokset. Saatavuudeltaan rajoitettuja termistöjä kokoavat myös eri alojen yritykset oman sisäisen käännös- ja lokalisointityönsä tueksi. Termistöjä kuvailevia metakieliä puolestaan kehittelevät sellaiset kansainväliset yhteistyöjärjestöt kuin standardointijärjestö ISO tai hiljattain lakkautettu lokalisointikonsortio LISA.

CHAT-seminaarin tarkoituksena oli koota yhteen eri resursseja kehittävät ja ylläpitävät osapuolet, mikä viittaa siihen, etteivät ne ilman CHATin kaltaisia tilaisuuksia useinkaan kohtaa. Kohtaamisen järjestäjänä CHAT onnistui hyvin, vaikka osanottajat painottuivatkin pääasiassa akateemiselle ja julkiselle sektorille.

Madridin esitelmissä esitettiin käsillä oleviin ongelmiin erilaisia ratkaisuja. Termityön nopeuttamiseksi esiteltiin keinoja termien etsinnän automatisoimiseksi. Perinteisessä termityössähän termit valikoidaan käsin alan kirjoituksista ja asiantuntijoilta. Seminaarissa näytettiin terminlouhintaohjelmia, jotka etsivät ne annetuista aineistoista automaattisesti laskemalla kullekin sanalle termimäisyyttä kuvaavan indeksin. Tietyn indeksirajan ylittäneet sanat otetaan käsin tarkasteltavaksi ja tästä joukosta valitaan sitten termit. Jos terminologi saa työnsä lähtökohdaksi valmiin listan termejä, osa hänen entisestä työstään on siis jo tehty ja prosessi nopeutuu.

Osassa puheenvuoroja nimettiin kuitenkin varsinaiseksi ongelmaksi se, ettei termistöjä joko löydä tai saa käyttää – ei niinkään se, ettei niitä olisi. Toisin sanoen resursseja kyllä on, mutta niitä ei syystä tai toisesta saada käyttöön. Siksi samaa työtä tehdään uudestaan eivätkä ponnistelut kohdistu sinne, missä terminologian aukot todellisuudessa ovat. Korkean profiilin vastaus ongelmaan on META-NET-verkosto, joka pyrkii tuomaan digitaaliset aineistot niitä tarvitsevien saataville tarjoamalla valmiit kuvailuskeemat ja avoimiin lisensseihin perustuvat käyttöoikeusmallit aineistoille. Osallistuminen META-NETin toimintaan on houkuttelevaa erityisesti silloin, kun tuotetaan julkisin varoin toteutettuja aineistoja, joilta ei odoteta liiketaloudellista voittoa. Skeptisemmin siihen suhtautuvat kieliteknologia-alan yritykset, jotka pelkäävät avoimien lisenssien vievän niiltä mahdollisuuden myydä tuotteitaan.

Keskustelussa terminologisten resurssien tulevaisuudesta osapuolia erottavat luontaisista intresseistä ja rooleista seuraavien näkemyserojen lisäksi myös kielipoliittisesta taustasta juontuvat erot. Kieliteknologisia palveluita tuottavat yritykset ovat pääsääntöisesti suurilta kielialueilta, joiden suuret puhujamäärät takaavat tuotteille riittävät markkinat. Julkisin varoin taas ylläpidetään kieliteknologisia resursseja (kuten termitietokantoja) erityisesti sellaisissa maissa, joiden kansallis- tai pääkielten puhujamäärät ovat niin pieniä, että yksityinen sektori tuskin kykenisi tuottamaan välttämättömiä kieliteknologisia palveluita. Pienen kielen näkökulmasta onkin helppo nähdä aineistojen vapaan saatavuuden edut. Kun aineistot on alun perin tuotettu yhteisin voimin, tuntuu niiden jakaminenkin vain luonnolliselta.


Termityön esivaiheita eli kirjeitä vuosikymmenten takaa

Yleinen kielitiede samoin kuin kielitieteen termistö ovat kehittyneet 1960-luvun alkuvaiheista Suomessa todella paljon. Palataan hetkeksi termityön haparoivaan alkuun, aikaan, jolloin suomalaisen kielentutkimuksen valtavirta oli sanastoineen päivineen vankasti ja ehjästi nuorgrammaattinen. Seuraavassa on kaksi lyhyttä katkelmaa 1960-luvulla saamistani kirjeistä kielentutkijoilta, jotka olivat opiskelleet tai edelleen opiskelivat Yhdysvalloissa. Kirjeet luovat ajan kuvaa monella muullakin tavalla.

24-vuotias Lauri Karttunen, teoreettinen semantikko (nykyisin Stanfordin yliopiston emeritusprofessori ja Rand Corporationin entinen tutkija), kirjoitti 7. marraskuuta 1965 Bloomingtonista, Indianasta mm. näin:

”Suomen kielen syntaksi on täkäläisestä näkökulmasta vielä niin kuvaamaton ja kartoittamaton kenttä. Paljon ei ole edistytty sitten Setälän päivien – tai Donatuksen, mitä termeihin ja menetelmiin tulee. – Oletko muuten jo saanut Chomskyn uuden kirjan Aspects of the Theory of Syntax  (M.I.T. Press, Cambridge 1965). Yleistajuisempaa tekstiä, kuin hän on aikaisemmin kirjoittanut, suositeltavaa lukemista kaikille ja erikoisesti niille, jotka rakastavat hyviä alaviitteitä”.

 

”Olen koettanut käännellä transformaatiokieliopin terminologiaa suomeksi, mutta se on osoittautunut vaikeaksi. On niin paljon termejä, jotka ovat peräisin matematiikasta. Niillä on varmasti suomessa tarkat vastineensa, jotka monessa tapauksessa ehkä voisi sellaisenaan lainata lingvistiikkaan, mutta en ole ollenkaan tolalla matematiikasta suomeksi. Voisitko, kiltti hyvä Auli, etsiä käsiisi jonkun alkeismatematiikan oppikirjan, joka sisältää ainakin johdatuksen joukkoteoriaan (se theory), suhteisiin (relations), funktioihin (functions), järjestettyihin joukkoihin ja järjestyksiin (ordered sets, orders) ja isomorfismeihin (isomorphisms) ja lähettää sen tänne. Maksan rahassa tai tavarassa.”

Huhtikuun 19. päivänä 1969 lähettiYhdysvalloissa väitellyt Turun yliopiston apulaisprofessori, nyt jo edesmennyt Eeva Kangasmaa-Minn seuraavan kirjeen:

”Hyvä maist. Hakulinen, Kuulin prof. Kalevi Wiikiltä, että teillä on tekeillä uusia kielitieteen käsitteitä koskeva suomenkielinen sanasto. Useat termit tuottavat tosiaan päänvaivaa, enkä haluaisi keksiä käännöksiä, jotka poikkeavat teidän sanastostanne[1]. Tällä hetkellä minulle olisi tärkeää saada suomenkieliset nimitykset seuraaville: base sentence, matrix sentence, insert sentence. Ensin mainitusta olen käyttänyt nimitystä kantalause, toisesta (Siron Lauseopin mukaan) peruslause, kolmannesta esim. Siro puhuu vain ”toisena lauseena”. Wiik arveli, että teillä on jo nimitykset näille käsitteille. Tarvitsisin niitä Siron 60-vuotisjuhlakirjaan tulevaa artikkelia varten, käsikirjoitus on jo lähetetty, mutta oikovedoksessa nimitykset voitaneen yhtenäistää. Pyydän anteeksi että näin vaivaan teitä, mutta koska esim. kansleri Ravila juuri äskettäin moitti ”uusia” kielitieteilijöitä (joihin tuskin kuulunkaan) sotkuisesta terminologiasta, rohkenen näin pyytää teiltä etukäteistietoja.

 

Kunnioittavasti Eeva Kangasmaa-Minn

[1] ”Sanastolla” viitataan tekeillä olleeseen ”Kielitieteen ja fonetiikan terminologiaan”, jota suunnittelimme Jussi Ojasen kanssa. Kirjanen julkaistiin ensimmäisen kerran vuonna 1970.

Termihaaste kiertämään

Viitisenkymmentä kielentutkijaa kokoontui Kotikielen Seuran teemapäivään Tieteiden taloon keskustelemaan Tieteen kansallisen termipankin kielitieteen pilotin käynnistämisestä. Termihankkeen jäsenet kertoivat pilottien tämänhetkisestä vaiheesta ja Kotuksen erikoistutkija Maria Vilkuna, pitkän linjan typologi, oppikirjantekijä ja Ison suomen kieliopin termistön (VISK termipankissa) koostaja, toi pureskeltavaksi erilaisia kielitieteen termien määrittelyyn liittyviä pähkinöitä. Esitykset ja niiden PowerPointit tulevat jälkikäteen linkkeinä termipankin sivulle.

Keskusteluissa nousi esiin tärkeitä kysymyksiä, joista voidaan jatkaa termipankin keskustelusivuilla ja tämän blogin kommenteissakin. Kielitieteen pääsivun keskustelua voidaan pitää paikkana, josta yleiskeskustelu on helppo löytää.

Ajankohtainen on kysymys kielitieteen aihealueen tarkemmasta luokittelusta. Termipankin wiki-tyyppisessä työskentelyssä luokittelu toteutuu toisella tavalla kuin mihin perinteisessä terminologien työskentelyssä on totuttu. Luokittelukin toteutuu käyttäjien yhteistyössä ja alhaalta ylöspäin käsitesivuja luotaessa. Antti Kanner näytti, kuinka yksinkertaista on lisätä käsitesivun alareunan palkkiin luokitus joko käytössä olevista luokista tai tarpeen vaatiessa nimeämällä uusi luokka. Luokituksesta tulee näin matala ja lavea pikemmin kuin hierarkkisen syvä. Silti koordinoijien ja avainhenkilöiden on syytä aktivoida myös suunnittelua luokkien jäsentymisestä juuri tässä termityön käynnistymisvaiheessa. Terminologi Igor Kudashev muistutti, että vaikka luokkien muuttaminen on wikialustalla helppoa, voi suurista muutoksista kuitenkin seurata hankaluuksia hakujen yms. osalta siitä huolimatta, että muutosten historia jääkin wikin muistiin ja näkyviin.

Fred Karlsson esitti, että alkuvaiheessa kannattaisi pitää huolta siitä, että ainakin Dixonin (2010) Basic Linguistic Theoryn käsitteet tulisivat mukaan ja suomeksi määritellyiksi. Dixonin ajatuksena on ollut koota ikään kuin kielentutkimusta yhdistävä pienin yhteinen nimittäjä. Muutenhan kielitieteelle ovat tyypillisiä moninaiset koulukunnat ja kunkin omalla tavallaan käyttämä termistö. Termien monimerkityksisyyden eli polysemian kysymykset nousevat käytännön työssä varmasti esiin. Osaratkaisu on se, että eri suuntaukset tai koulukunnat ovat omia luokkiaan. Keskusteltiin siitä, pitäisikö ne kuitenkin jäsentää kieliteorioiden alle. Samalla todettiin, että joidenkin termien kohdalle on ehkä kuitenkin syytä kirjoittaa parikin määritelmää etenkin silloin, kun laajemmin eri kieliin soveltuva, typologiassa ja yleisessä kielitieteessä vakiintunut tapa hahmottaa termi poikkeaa selvästi esimerkiksi suomen kielen tutkimuksessa eli fennistiikassa vakiintuneesta määritelmästä. Typologinen määritelmä on ensisijainen ja määritelmäsarakkeessa ylimpänä, mutta mielestäni ei ole kuitenkaan alan kehittymisen kannalta hyödyllistä luokittaa fennistiikan termejä erikseen. Tästä voidaan toki vielä keskustella, kun saadaan enemmän käytännön kokemusta määrittelyistä. Selite voi usein olla sopiva paikka sovellusalan vaihteluiden esittämiseen. Määrittelykysymyksistä kannattaa käydä keskustelua kyseisen termin käsitesivulta avautuvassa keskustelussa ennen kuin alkaa muuttaa määritelmiä, jos kyse on sovellusalan eroista tai muista tulkintaseikoista.

Tästä alkaa jo näkyä, että termityö voi olla myös tieteenalan ja eri alojen välistä tieteellisen ajattelun kehittämistä. Toivon, että termipankin tiimoilla käy kielitieteellisen keskustelun kuhina. Aineksia siihen nousi teemapäivän virkuista kommenteista.

Kutsumme kielitieteen pilottiin mukaan kaikkia kielentutkijoita. Kirjaudu termipankkiin omalla nimelläsi (etunimi ja sukunimi) ja lähetä termipankkiin sähköpostiviesti, että haluat kielitieteen asiantuntijaksi. Voit kertoa ammattisi tai koulutustaustasi viestissä; suuren osan kielitieteilijöitä toki tunnistamme jo nimestäkin. Kielitieteen pilottia organisoimaan on värvätty parisenkymmentä avainhenkilöä, jotka edustavat kielentutkimuksen eri suuntauksia. He ovat lupautuneet aktivoimaan oman erikoisalansa kenttää. Avainhenkilöiden joukko voi tästä vielä kasvaakin.

Ratkaisevaa termipankin edistymisen kannalta on se, että mahdollisimman moni ryhtyy termipankin aktiiviseksi käyttäjäksi ja muokkaajaksi. Kun mukana on suuri joukko tieteenalan asiantuntijoita, voidaan saavuttaa merkittäviä tuloksia jo sillä, että jokainen uhraa aina silloin tällöin sopivan hetken viilatakseen omassa työssään muutenkin sillä hetkellä ajankohtaisten termien tietoja – tai vaikka muokatakseen yhtä kohtaa kerrallaan. Keskusteltiin myös siitä, kuinka termipankkia voi hyödyntää opetuksessa ja saada kurssilaiset termityöhön mukaan. Termipankin perustaja Lea Laitinen esitti, että jatko-opinnoissa ryhdyttäisiin antamaan opintopisteitä termipankkiin tallennetusta termityöstä. Jokainen väitöskirjantekijähän määrittelee työssään keskeisimmät käsitteensä ja joutuu miettimään oman erikoisalansa ajantasaista terminologiaa laajemminkin.

Termitalkoiden käynnistämiseksi esitämme termipankkihankkeen puolesta termihaasteen:
• Kirjaudu termipankkiin omalla nimelläsi (etunimi ja sukunimi) ja pyydä sähköpostitse alasi asiantuntijan oikeudet.
• Muokkaa viiden termin käsitesivua tai tarkista sivulla olevat tiedot. Jos sinulle läheinen termi puuttuu, luo sille oma sivu. (Tarkista kuitenkin ensin hauilla, voisiko jollekin synonyymille olla jo sivu.)
• Lähetä sen jälkeen termihaaste viidelle kollegallesi. Kerro heille, mitä termejä olet muokannut, ja pyydä heitä tarkistamaan muokkauksesi . He voivat muokata edelleen, osallistua sivusta käytävään keskusteluun tai viedä viestiä eteenpäin muokkaamalla uusia termejä.
• Älä katkaise ketjua, tai termipankin talkooidea kaatuu.

 

Termipankin wiki-alusta koekäytössä

Tieteen kansallisen termipankin hankkeessa käynnistyy toinen vuosi. Tähän mennessä on saatu jo näkyviin termipankin wiki-alusta, johon hankkeen tutkijatohtori Kaarina Pitkänen-Heikkilä on syöttänyt koemielessä otoksen kasvitieteen rakenneoppiin kuuluvia termejä. Graafinen ilmekin alkaa olla loppusuoralla. Toistaiseksi alusta on siis vasta koekäytössä, mutta tämän vuoden aikana päästään pilottien kanssa tositoimiin. Sen kehittelystä vastaavat Niklas Laxström ja Antti Kanner. Varsinainen talkootyö saadaan käynnistettyä piloteissa kertyvien kokemusten ja niiden pohjalta laadittavien ohjeiden avulla. Käyttäjien kommentteja ja ehdotuksia otetaan mielihyvin vastaan  wiki-alustan keskustelupalstalla, tällä blogisivulla tai suoraan sähköpostitse (tieteentermipankki-info@helsinki.fi).

Kasvitieteen asiantuntijaryhmä on jo aloittanut työnsä, ja se ryhtyy pikkuhiljaa termityöhön täydentämään Kaarinan työstämää materiaalia.  Ryhmään kuuluvat tällä hetkellä professori Jouko Rikkinen, tohtori Johannes Enroth ja professori Kurt Fagerstedt Helsingin yliopiston Biotieteiden laitokselta, yli-intendentti Henry Väre ja intendentti Mikko Piirainen Luonnontieteellisestä keskusmuseosta, dosentti Terttu Lempiäinen Turun Kasvimuseosta ja Marja Vieno Turun yliopistosta. Vähitellen saamme myös asiantuntijoiden vahvistamia määritelmiä näkyviin.

Oikeustieteen pilottia varten emeritusprofessori Heikki E. S. Mattila on aktivoinut Suomalaisen Lakimiesyhdistyksen voimia. Termityön siemeneksi termipankki on saanut luvan käyttää Encyclopaedia Iuridica Fennican systemaattista hakusanastoa. Hankkeen puolesta oikeustieteen pilottia koordinoi Antti Kanner.

Kielitieteen pilottia koordinoivat termipankin viimevuotinen johtaja, emeritaprofessori Lea Laitinen ja helmikuussa Kaarinan sijaiseksi tuleva FT Marja Nenonen Joensuusta. Kielitieteen pilotin tiimoilta järjestetään Kotikielen Seuran teemapäivä perjantaina 20.4.2012 klo 14–18 Tieteiden talossa Helsingissä. Toivotamme kaikki termitalkoohenkiset lingvistit tuolloin mukaan keskustelemaan ja saamaan käytännön ohjeita työtavoista!

Kevään aikana kokoamme perusohjeiston, jonka avulla eri tieteenalojen edustajat voivat halutessaan tulla mukaan termitalkoisiin. Tieteen kansallisen termipankin keskeinen ajatushan on tarjota alusta, johon asiantuntijat voivat koota termejä, niiden määritelmiä ja käännösvastineita talkootyönä. Termipankki toimii yhteistyössä Tieteellisten seurain valtuuskunnan perustaman Tieteen termistötalkoot -hankkeen kanssa. 9.11.2012 TSV järjestää teemapäivän erityisesti yhteiskuntatieteilijöille.

Olemme iloisia siitä, että termipankki on saanut tiedeyhteisössä myönteisen ja innostuneen vastaanoton. Joulukuussa kokoonnuimme ensimmäiseen yhteistyö- ja avunantoseminaariin termityön ammattilaisten kanssa. Edustettuina olivat TSK, valtioneuvoston termipankki Valter, Vaasan yliopiston terminologit ja käännöstieteen terminologinen tutkimus; tuttua väkeä myös Anita Nuopposen ja Nina Pilkkeen toimittamasta terminologian oppikirjasta Ordning och reda: Terminologilära i teori och praktik (Norstedts). Saimme runsaasti hyödyllisiä kommentteja wiki-alustasta ja suunnittelimme jatkoyhteistyötä. Hankkeen ohjausryhmä on myös kokoontunut aktiivisesti kommentoimaan wiki-alustan suunnittelua.

Tieteen termipankin vetovastuu on vuoden alusta siirtynyt dosentti Tiina Onikki-Rantajääskölle.