”Ja nyt seuraan liittyy joensuulainen mobiilikäyttäjä…” Tieteen termipankin reaaliaikainen seuranta Google Analytics -ohjelman kautta

Kirjoitin viime vuoden huhtikuussa blogin termipankin käyttäjätilastoista ja suosituimmista sivuista tukeutuen Google Analyticsiin ja wikin omaan tilastointiin. Vuosi sitten Tieteen termipankissa oli kuukausikäyttäjiä lähes 7 900, säännöllisiä käyttäjiä heistä oli noin kaksi tuhatta. Arkipäivisin käyttäjiä oli silloin noin 350, viikoittain 1700–2100.

Vuodessa määrä on kaksinkertaistunut: viimeisen kuukauden aikana käyttäjiä on ollut runsas 17 500. Säännöllisiä käyttäjiä heistä oli lähes 4 400. Arkipäivisin käyttäjiä on runsas 800, viikoittain 4200–4800. Lauantaisin sivustoa käytetään vähiten, n. 300 kävijää. Sunnuntaisin kävijöitä on 400–500. Keskimääräisen käynnin kesto viimeisen kuukauden ajalta on ollut 2 minuuttia 13 sekuntia.

Vuosi sitten kerroin myös suosituimmista sivuista. En nyt lähde niitä tarkemmin syynäämään, mutta toteanpa vain, että jostain syystä kasvitieteen kangasturve (1491 latausta), mikrobiologian aflatoksiini (1209 latausta) ja kielitieteen eksistentiaalinen presuppositio (1117 latausta) ovat kiilanneet suosituimpien käsitesivujen kärkijoukkoon, ohittavat jopa useimmat sellaiset termit, joita olemme paljon itse muokanneet ja käyttäneet esimerkkeinä erilaisissa esittelytilaisuuksissa. Mikähän niitä nostaa?

Google Analyticsin tarjoama palvelu on kehittynyt viime aikoina siten, että sivuston käyttöä voi seurata reaaliaikaisesti. Käyttäjätilaston seuraaminen on ollut kiinnostavaa ja palkitsevaa – Tieteen termipankilla on paljon käyttäjiä! Ja kaikkien aihealueiden sivuilla on katsojia. Toivon tämän kirjoitukseni kannustavan yhä useampia tieteenaloja tulemaan mukaan Tieteen termipankkiin.

Ensimmäisen puolen tunnin mittaisen seurantani teen helsinkiläisten hiihtolomaviikon perjantaina alkaen klo 13.36. Aluksi Tieteen termipankissa on 8 aktiivista vierailijaa. Heistä 6 on Helsingistä, 1 Keravalta, 1 Tartosta. Kolmen minuutin päästä käyttäjiä on Helsingistä 4, Tampereelta 2, Oulusta ja 1 Keravalta. He ovat kiinnostuneita termeistä kesäpuu, parenteesi, kenotsooinen maailmankausi, maanpuolustusvelvollisuus, vapaudensuoja ja fyllösfääri. Kymmenen minuutin päästä tamperelaiset ovat poistuneet, Oulusta on tullut toinen käyttäjä ja nyt seuraan liittyy myös yksi turkulainen. Yksi helsinkiläisistä katsoo sivuaan mobiililaitteesta. Tarkasteltavat termit ovat piloerektio, nukleaasi, urosepsis, fyllösfääri ja kevätpuu. Itselläni on auki kasvitieteen käsitesivu kärsä, mutta sitä ei näy reaaliaikaisessa raportissa, koska en ole tällä hetkellä aktiivinen vierailija. Joku avaa sosiaalipsykologian käsitesivun rasismi. Kolme kävijöistä on tullut googlen kautta, kaksi suoraan. Ajankohtana 13.47 termipankissa on kolme vierailijaa: Helsingistä, Tampereelta, Oulusta. Yksi heistä katsoo mobiilista. Termit ovat kevätpuu, uintisiima ja rasismi. Minuutin päästä on vain kaksi vierailijaa, molemmat Helsingistä. 13.50 toinen poistuu ja mukaan tulee monohydraatista kiinnostunut haminalainen, joka katsoo sivua tietokoneeltaan. 13.56 olen seurannut tilannetta 20 minuuttia; nyt mukaan tulee kaksi helsinkiläistä. Viidestä vierailijasta kolme on tullut suoraan, kaksi googlen kautta. Neljä heistä katsoo sivuja tietokoneelta, yksi tabletista. 14.03 Tieteen termipankin Tuoreet muutokset -sivulta näkyy, että joku on päivittänyt lakimiesyhdistyksen tunnuksella oikeustieteen sivua edunvalvonta. 14.05 Google Analyticsin mukaan vierailijoita on vain 2 Helsingistä. Toinen on oikeustieteen lomakkeessa, toinen katsomassa Tuoreet muutokset -sivua. Jälkimmäinen heistä olen minä. 14.06 paikalla on neljä aktiivista vierailijaa, joista 3 on Helsingistä ja yksi Jyväskylän seutukunnan alueelta. Tarkastellut sivut ovat performatiivisuus, referatiivirakenne, oikeustieteen lomake ja Tuoreet muutokset -sivu. Yksi käyttäjistä on mobiilikäyttäjä. Puoli tuntia on kulunut. Käyn itse nopeasti Tieteen termipankin etusivulla ja sitten Tuoreet muutokset -sivulla. Käyntini päivittyy 10 sekunnissa Google Analyticsiin.

Seuraavana keskiviikkona kello 11.40 alkaen puolessa tunnissa kerrallaan paikalla on 4–10 katselijaa, Google Analyticsin ilmoittamat paikat ovat Helsinki, Vantaa, Paimio, Tampere, Kajaani, Lappeenranta, Espoo, Järvenpää, Pirkkala, Greifswals, Jyväskylän seutukunta, Turku, Joensuu ja Kerava.  Lähes koko ajan on auki sivuja kasvitieteestä, mikrobiologiasta, biologiasta, sienitieteestä, oikeustieteestä, kielitieteestä, silloin tällöin myös kirjallisuudesta, sähkötekniikasta, eläintieteestä, terminologiaopista. Yleensä Helsingistä on yhtaikaa useita käyttäjiä. Myös yliopistopaikkakunnilta voi olla kerralla useita, erityisesti Turusta, Tampereelta, Oulusta ja Joensuusta.

Samana päivänä vähän myöhemmin alkaen 15.10 käyttäjiä on enemmän, 7–12. He ovat Raumalta, Kotkasta, Kemistä, Kittilästä, Raisiosta, Turusta, Lappeenrannasta, Helsingistä, Jyväskylän seutukunnan alueelta, Lahdesta, Espoosta, Joensuusta, Vaasasta, Kouvolasta, Tampereelta, Porista, Oulusta, Sastamalasta. He katsovat mm. termejä obesiteetti, neurosekreetio, isotrooppinen, polyetyleeniglykoli, alloktoninen, hallintopakko, massavelka, verbiliitto, supistumaverbi, kliitti, entiteetti, arkaismi, segmentaatio ja nukleaasi. Useimmiten sivulle on päästy Googlen kautta. Joku on tullut myös jollain toisella sivustolla olevan suoran linkin kautta.

Torstaina 27.2. klo 10.15–10.45 paikalla on 9–12 vierailijaa koko ajan. He ovat Helsingistä, Vaasasta, Turusta, Espoosta, Oulusta, Kemijärveltä, Vantaalta. Viikon päästä torstaina 6.3. seuraan kävijöitä klo 14.30-15.00. Enimmillään termipankissa on 17 käyttäjää, vähimmillään 8. Joku katsoo sivuja Brysselissä, joku Norjan Bodøssa, joku Lohjalla. Auki on sivuja kasvitieteestä, kielitieteestä, mikrobiologiasta, käännöstieteestä, sienitieteestä ja sosiaalipsykologiasta.

Yölläkin on käyttäjiä. Silloin katsotaan termejä erityisesti biologian, mikrobiologian ja oikeustieteen aihealueelta. Eräänä torstaiyönä klo 00.14 paikalla on kolme katselijaa: Turusta, Espoosta, Helsingistä. He tutkailevat sivuja epimeeri, epäsymmetrinen kilpailu, eukaryoottisolu, sappirakkotulehdus. Puolen tunnin aikana 7 viimeisenä minuuttina Tieteen termipankin sivustolla ei ole yhtään käyttäjää.

Sunnuntain vastaisena yönä 9.3. klo 0.20 joku Barcelonasta lukee termipankin englanninkielistä etusivua. Muut käyttäjät ovat Kajaanista, Tampereelta, Madridista. Näitä yökyöpeleitä kiinnostavat oikeustieteen tavaramerkkioikeus ja vilpitön mieli sekä biologian povidoni. Puolen tunnin aikana on 8 minuutin jakso, jolloin paikalla ei ole ketään, mutta kun lopetan seurantani yhden maissa, on paikalla taas 3 uutta katsojaa.

Kuten tässä olen raportoinut, Tieteen termipankilla on paljon käyttäjiä. Eniten käyttäjiä on normaaliin työaikaan arkipäivisin, mutta myös öisin sivuja luetaan. Keitä lukijat ovat ja mitä aloja he edustavat? Tarjoaako Tieteen termipankki heidän kysymyksiinsä vastauksia? Millaisia käyttäjäkokemuksia heillä on wikistä? Kuinka hyvin termipankin sivuja voi selata kännykällä?  Näihin kysymyksiin voimme saada vastauksia piankin, kunhan saamme valmiiksi käyttäjäkyselyn, johon kuka tahansa voi vastata käsitesivujen kautta.

Wikimedia, Wikipedia ja MediaWiki

Internetissä on helppo törmätä sanaan wiki. Se tulee vastaan satunnaisellekin Internetin käyttäjälle jo miltei ensimmäisessä Google-haussa: ensimmäisellä hakutulossivulla melkein aiheesta kuin aiheesta löytyy ainakin yksi Wikipediaan johtava osuma. Mutta Wikipedian lisäksi on myös monia muita wiki-alkuisia tai -loppuisia sanoja, jotka osuvat silmään ainakin satunnaisesti. Tässä blogissa esitellään Tieteen termipankin kannalta niistä tärkeimpiä.

Maailman suurin tietosanakirja Wikipedia alkaa olla kaikille tuttu, mutta vähemmän tunnettu on sen ylläpidosta vastaava amerikkalainen säätiö Wikimedia Foundation. Wikimedia Foundation perustettiin vuonna 2003 nostamaan Wikipedian ylläpidon taloudellinen taakka siitä siihen asti huolehtineiden yksityishenkilöiden harteilta. Wikipedia oli perustettu paria vuotta aiemmin ja sillä oli jo tuolloin vireä 4000 säännöllisen muokkaajan yhteisö, joka siihen mennessä oli saanut aikaiseksi 234 000 sana-artikkelia. Sinällään jo vaikuttava suoritus, mutta ei mitään verrattuna siihen laajuuteen, mihin Wikipedia-yhteisö on sittemmin yltänyt. Samalla Wikipedian liepeille oli muodostunut useita joko teknisesti tai sisällöllisesti samanhenkisiä projekteja, jotka WikiMedia Foundation päätyi ottamaan huomiinsa.

Nykyään Wikimedia Foundation on voittoa tavoittelematon yleishyödyllinen säätiö, joka saa rahoituksensa lähinnä yksityisiltä lahjoittajilta. Vuoteen 2013 mennessä sen tulot olivat kasvaneet liki 50 miljoonaan dollariin vuodessa ja vakinaisten työntekijöiden määrä hieman alle kahteen sataan. Wikimedia Foundationin rahat eivät kuitenkaan kulu pelkästään Wikipedian palvelinkustannuksiin, eivätkä kaikki – tai edes suurin osa – sen työntekijöistä työskentele Wikipedian parissa. Wikipedian ohella Wikimedia Foundation pitää yllä myös erilaisia avoimeen lähdekoodiin ja vapaaseen saatavuuteen perustuvia ohjelmistokokonaisuuksia ja aineistoja.

Näistä ehkä tärkein on MediaWiki-niminen wiki-alusta, joka toimii myös Tieteen termipankin pohjana. Wikimedia-säätiön ansiosta MediaWiki on alustana vakaa, hyvin ylläpidetty ja säännöllisesti päivittyvä. Sen piirissä toimii aktiivinen kehittäjäverkosto, joka jatkuvasti laajentaa saatavilla olevien laajennosten ja lisätoimintojen määrää. Osa näistä laajennoksista on itsekin kasvanut kokonaisiksi laajennosekosysteemeiksi, jotka ovat mahdollistaneet uusia tapoja käyttää wikejä ja hämärtäneet rajaa wikien ja tavallisten Internet-sivustojen välillä. Wikimedia Foundationin hyvin hoidetun talouden ansiosta kenen tahansa ilmaiseksi käytettävissä on laadukas wiki-ohjelmisto.

Vaikka usein Wikipedia tuleekin edustaneeksi koko wiki-käsitettä, se on kuitenkin vain yksi wiki tuhansien joukossa, ja MediaWiki-alusta on vain yksi wiki-alusta kymmenien wiki-alustojen joukossa. Historiallisesti wikit (mikäli historiasta voidaan näin nuoren ilmiön kohdalla vielä puhua) ovat olleet Internet-selaimella luettavia sivuja, joita käyttäjät ovat päässeet suoraan selaimellaan muokkaamaan. Wiki-sana tulee havaijin kielen nopeaa tarkoittavasta sanasta, ja se on tullut yleisnimeksi ensimmäisen wikin, WikiWikiWebin, nimestä. Wikien keskeisin anti on ollut muuttaa yksisuuntainen Internet-viestintä kaksisuuntaiseksi, jolloin jokainen lukija on myös potentiaalinen kirjoittaja. Tämä on edelleen mahdollistanut uudenlaisen yhteisöllisen sisällöntuottamistavan, jonka voimasta esimerkiksi juuri Wikipedia on hyvä osoitus. Wikit toimivat aluksi vain yksittäisten ristiinlinkitettävien tekstisivujen varassa, mutta alkuperäsen wikiohjelmiston lisäosiksi tehdyt laajennokset kuten Semantic MediaWiki (SMW) ovat monipuolistaneet wikien perusrakenteita ja tehneet mahdolliseksi tarjota suuren osan modernien Internet-sivustojen toiminnallisuuksista myös wikeihin.

Semanttinen MediaWiki on MediaWikin laajennos. Sen lähtöajatus oli kyetä tekemään MediaWikin sivuista sellaisia, että ne sisältäisivät sillä tavoin rakenteistettua tietoa, että wiki itsessään tietäisi jotain omista tiedoistaan. Tämä mahdollistaisi tietojen järjestämisen ja selaamisen monin eri tavoin. Näin esimerkiksi yhden käyttäjän kirjoittaessa tietoja vaikkapa tiikereistä tai elefanteista ja ilmoittaessa joitain tietoja näiden uhanalaisuudesta, voi toinen käyttäjä artikkelissaan lajien uhanalaisuudesta hyödyntää näitä tietoja automaattisesti esimerkiksi erilaisten listojen tai muuttuvien tietojen muodossa. Kun ensimmäinen käyttäjä myöhemmin päivittää tietonsa tiikerien uhanalaisuudesta, päivittyvät tiedot samalla jälkimmäisenkin käyttäjän sivulle.Tällainen ei ollut mahdollista aiemmin, sillä perinteiset wiki-sivut muodostuivat vain tekstistä. Niitä voi kyllä selata erilaisten sanahakujen avulla, mutta moneen tarpeeseen pelkkä sanahaku on työkaluna riittämätön. Semanttinen MediaWiki on sittemmin tavoitteiltaan ja laajuudeltaan kasvanut ja sillekin on muodostunut aktiivinen kehittäjä- ja käyttäjäyhteisönsä, joka on järjestynyt Open Semantic Data Associationin (OSDA) nimellä toimivaksi yhdistykseksi.

MediaWikin laajennoksista tällä hetkellä juuri Semanttinen MediaWiki näyttääkin eniten laajentaneen wikien käyttöaloja sekä yritysmaailmassa että tieteellisen tutkimuksen parissa. Wikit ovat korvanneet monissa yrityksissä kokonaan aiemmin käytetyt intranet-ohjelmistot, ja yritysten sisäiseen käyttöön räätälöidyistä wikeistä on tullut suoranainen teollisuudenala. Tieteellisessä tutkimuksessa SMW:tä on sovellettu ainakin kattavana hermosolutietopankkina neurotieteissä (Blue Brain Project, EPFL Sveitsi [http://bluebrain.epfl.ch]), mittaustulosten keräämiseen ja järjestämiseen ilmastotutkimuksessa (Alankomaiden Kuninkaallinen Meteorologinen instituutti KNMI) ja maksapotilasdatan hallintaan (Cognition-based Surgery project [http://www.cognitionguidedsurgery.de]).

Tieteellisen tutkimuksen kannalta Semanttisen MediaWikin voima on sen tarjoamassa mahdollisuudessa jakaa tutkimustuloksia suurelle yleisölle ja samalla avata tutkimusten pohjana ollut aineisto muiden tutkijoiden käyttöön. Tämä kaikki on mahdollista juuri siitä syystä, että wikeissä lukemisen ja kirjoittamisen välinen raja on onnistuttu tekemään hyvin helpoksi ylittää. Samaan ajatukseen perustuu pitkälti Tieteen termipankinkin alustan toiminta: termipankin aineistoa selaavan asiantuntijan on hyvin helppo täydentää puutteellisiksi havaitsemansa tiedot ilman monimutkaista teknistä tai institutionaalista väliprosessia.

Klaus Mäkelä ja termityö

Joulukuussa edesmennyt yhteiskuntatieteilijä, alkoholitutkija  Klaus Mäkelä (1939-2013) oli monelle lingvistille tuttu pitkäaikaisesta, uskollisesta kiinnostuksestaan (suomen) kieltä kohtaan.  Hän seurasi tutkimusta mm. lukemalla aikakauslehti Virittäjää ja osallistumalla kieltä ja kielipolitiikkaa koskeviin seminaareihin ja muihin tapahtumiin.  Usein tuntui siltä, että tilaisuus ei voi alkaa ennen kuin Klausin kiinnostunut hahmo muovikasseineen oli ilmestynyt salin oikealle seinustalle tai ahtaan huoneen eturiviin.

Klaus Mäkelä oli ideoija, monipuolinen yhteiskunnallinen vaikuttaja, mikä tarkoittaa, että hän keksi koko ajan, mitä kannattaisi tehdä, jotta tuo tai tämä asia yhteiskunnassa tai vaikkapa  kielentutkimuksessa saataisiin paremmalle tolalle. Suomalaisen keskustelunanalyysin Mäkelä auttoi alkuun lahjoittamalla toistasataa tuntia käsittäneen, sosiologisessa tutkimuksessa käytetyn keskusteluaineiston Helsingin yliopiston suomen kielen laitokselle kuultuaan, että siellä on orastavaa kiinnostusta vuorovaikutuksen tutkimiseen.

Klaus pystyi lukemaan kaunokirjallisuutta kahdeksalla kielellä, ja kotitaustaltaan hän oli kaksikielinen. Yksi kodin opetuksista oli, että päivällispöydässä ei saa olla pitkästyttävä. Koskaan muutenkaan Klaus ei sellainen puheissaan ollut. Myös suomen kielen kirjallinen käyttö oli hänelle tärkeä: hän päätoimitti useita yhteiskuntatieteellisiä julkaisuja ja kirjoitti itse niin, että jokainen lause on mietitty, ehjä ja nautittava. Kollegat kertovat ettei hänen paperikorissaan ollut koskaan luonnoksia.

Klaus Mäkelä otti kantaa suomalaisten tiedelehtien kielivalintaan: hänen mukaansa suomalaisen tiedelehden julkaiseminen englanniksi on ”karkea virhe, johon ei pitäisi tuhlata verovaroja”. Reaalisempia mahdollisuuksia menestyä kansainvälisillä markkinoilla voisi Mäkelän mukaan pikemminkin olla pohjoismaiden yhteisesti toimittamilla julkaisuilla.

Luetimme Mäkelällä kielipoliittisen toimintaohjelmamme Suomen kielen tulevaisuus (2009) tutkimusta koskevan osuuden. Viimeisenä palveluksenaan suomalaiselle kielipolitiikalle Mäkelä esitti kommentissaan, että jos halutaan suomen kielen säilyvän tieteen kielenä, olisi pikimmin käynnistettävä tieteellisten termien systemaattinen kartoitus. Tämä ehdotus päätyi toimintaohjelman suosituksiin ja johti paria vuotta myöhemmin Tieteen termipankin perustamiseen.

Auli Hakulinen

Kirjallisuudentutkimuksen termityö käynnistyi syksyllä 2013

Aloitin Kaarina Pitkänen-Heikkilän äitiyslomasijaisena lokakuun 2013 alussa ja tehtävänäni oli organisoida kirjallisuudentutkimuksen termityötä. Koska kirjallisuudentutkimuksen aihealue oli vasta alkutekijöissään, oli tärkeää aloittaa työ asiantuntijaverkoston kokoamisella. Lähetin kutsun yli 50 asiantuntijalle, jotka edustivat kaikkia Suomen yliopistojen kirjallisuusoppiaineita. Kutsuun vastasi miltei parikymmentä henkeä, joista 15 pääsi mukaan verkoston ensimmäiseen tapaamiseen 13.11. Helsingissä. Alkutapaamisessa ehdittiin keskustella vain muutamasta pääkysymyksestä, mutta osanottajia yhdisti näkemys siitä, että alan termitietokannasta olisi paljon hyötyä opetuksen ja tutkimuksen kannalta. Keskusteltiin mm. siitä, millaisilla kriteereillä asiantuntijaoikeuksia myönnetään ja millaisiin luokkiin ja alaluokkiin kirjallisuudentutkimuksen termejä pitäisi sijoittaa. Tapaamisen lopuksi osallistujat kokeilivat termien lisäämistä Wikialustalle käytännössä. Alustavia suunnitelmia oli myös siitä, että kävisimme koordinaattori Antti Kannerin kanssa pitämässä termityön workshopin Turun yliopistossa.

Pari päivää myöhemmin, 19.11. olin kertomassa kirjallisuudentutkimuksen termityöstä, kun Tieteen termipankki esittäytyi Helsingin yliopiston Tiedekulmassa. Käytin yhtenä esimerkkinä minua jo pitkään kiinnostanutta realismi-termiä, joka tuttuudestaan ja näennäisestä yksinkertaisuudestaan huolimatta pitää sisällään monimutkaisia filosofisia, kerrontateknisiä ja historiallisia kysymyksiä. Suunnitelmani on kirjoittaa näistä realismin erilaisista kerrostumista myös tutkimusartikkeli julkaistavaksi jollakin kirjallisuudentutkimuksen foorumilla 2014.

Kirjallisuudentutkijoiden tapaamisessa nousi esille myös olemassa olevien kirjallisuudentutkimuksen sanakirjojen ja sanastojen hyödyntäminen termien keruussa. Kirjallisuudentutkimuksen suomenkielisiä termisanakirjoja ei ole monta, ja niistä viimeisimmän, Yrjö Hosiaisluoman Kirjallisuuden sanakirjan (WSOY 2003) painos oli loppunut jo vuosia sitten. Otin yhteyttä Hosiaisluomaan ja pyysin lupaa saada skannata kirja kokonaisuudessaan termipankin aineistoksi. Sanakirjassa on yli 1400 hakusanaa, joten siitä muodostuisi hyvä runko kirjallisuuden aihealueen termeille. Tekijä antoi myös lupansa termikuvausten muokkaamiseen ja päivittämiseen, joten lähitulevaisuudessa Hosiaisluoman tekemä työ tulee hyödyttämään uudella tapaa kaikkia kirjallisuuden tutkimuksesta ja opetuksesta kiinnostuneita. Sain marraskuussa tietää myös toisesta sanastosta, eli professori Aatos Ojalan tekemästä kirjallisuuden termisanastosta, jota oli käytetty jo pitkään Jyväskylän yliopiston kirjallisuuden laitoksen omilla sivuilla. Sanaston avoimeen verkkojulkaisuun tarvitaan kuitenkin tekijän – eli tässä tapauksessa Ojalan perikunnan – lupa. Perikunnan edustajien etsimisessä minua auttoi tutkijatohtori ja luovan kirjoittamisen opettaja Risto Niemi-Pynttäri Jyväskylän yliopistosta. Aatos Ojalan poika, valokuvaaja Markku Ojala muisteli puhelimessa sitä, miten sanasto oli ollut olemassa jo hänen lapsuudessaan pahvikortistona heillä kotona. Nyt se saa toivon mukaan uuden elämän termipankin sivuilla.

UUSI KIRJA SIENTEN BIOLOGIASTA VAATI MYÖS SANASTOTYÖTÄ

Ensimmäinen sienten biologiasta kertova suomenkielinen yleisteos ilmestyy syyskuussa. Teoksen ovat toimittaneet Jari Valkonen ja Sari Timonen, mutta tekijöinä on ollut lähes neljäkymmentä tutkijaa, jotka kansantajuisesti aukaisevat sienten toimintaa, solubiologiaa ja ekologiaa lukijoille. Kirjoittajat edustavat kaikkia Suomessa harjoitettavia sienten tutkimuslinjoja genetiikasta ja evoluutiosta solubiologiaan, biotekniikkaan ja ekologiaan. Kirja ei ole sienten tunnistusopas eikä siitä löydy ruokareseptejä. Sen sijaan siitä voi saada ymmärrystä pyykinpesuun, kasvien kasvatukseen ja kivihiiliesiintymien syntymiseen.

Kirjaa on kirjoitettu hartaudella kaksi ja puoli vuotta. Yhtenä suurena aikasyöppönä oli sanastotyöskentely. Siinä jouduttiin miettimään, mitkä käytössä olevista synonyymeistä soveltuisivat parhaiten käyttöön suomen kielessä, ja suomenkielisten termien puuttuessa keksittiin aivan uusia suomenkielisiä sanoja.

Yhtenä esimerkkinä mutkan kautta muodostuneiden uudissanojen keksimisestä voisi olla vaikkapa tynnyrihuokonen ja sen osat. Useimpia kantasienten rihmastoja luonnehtivat ns. väliseinät (lat. septum), joissa on sulkeutumiskykyinen huokonen. Tämäntyyppisestä väliseinästä on käytetty latinankielistä nimitystä dolipore septum, mutta itse huokoseen viittaavaa sanaa dolipore ei yleensä ole käytetty yksinään. Huokoselle lanseerattiin nyt nimi tynnyrihuokonen sen tynnyrimäisen kaitsinkalvojen suojaaman rakenteen vuoksi. Myös kaitsinkalvo on uusi sana, joka keksittiin korvaamaan termiä parentosomi.

Kaikki nämä uudet ja vanhat termit määritelmineen on jo viety Tieteen termipankkiin sienitieteen, mikrobiologian ja biologian aihealueille ja ovat sieltä kaikkien nähtävissä (ks. täältä).

Pohjoismainen terminologiakonferenssi NordTerm 2013 Tukholmassa 17.-19.6.

Kahden vuoden välein järjestettävä terminologialan pohjoismainen konferenssi Nord Term keräsi jälleen suuren joukon ammattiterminologeja, terminologian tutkijoita ja työssään muulla tavoin terminologian kanssa tekemisiin joutuneita tällä kertaa Tukholmaan. Varsinaista kahden päivän konferenssiohjelmaa edelsi tanskalaisen DanTermbankin järjestämä päivän mittainen työpaja terminologisen käsiteanalyysin soveltamisesta tietokantojen tietomallien ja tietorakenteiden suunnittelussa. Tietomalleilla tarkoitetaan tiedonhallinnassa käytettyjen tietueiden ominaisuuksia ja määriteltyjä suhteita toisiin tietueisiin tai tietuetyyppeihin. Esitelty lähestymistapa oli luonteva javarmasti hyödyllinen erityisesti tietorakenteiden standardoinnin näkökulmasta. Terminologian menetelmillä on näissä asioissa selvästi paljonkin annettavaa, mutta niiden soveltaminen edellyttää fokuksen pitämisen tarkasti siinä, mitä tietorakenteilta tarvitaan, vaikka se kenties joissain tapauksissa johtaisikin terminologisesta näkökulmasta epäintuitiivisiin ratkaisuihin.

Konferenssiesitelmät käsittelivät terminologiatyön eri puolia. Konferenssi oli temaattisesti jaettu osioihin, joihin esitelmät oli ryhmitelty sillä perusteella mitä termityön vaihetta niissä tarkkaan ottaen käsiteltiin. Kuitenkin suuressa osassa esitelmiä esiteltiin kokemuksia yksittäisistä termihankkeista,  jolloin temaattiset kategoriat eivät olleet esitelmien sisällössä kovinkaan keskeisessä osassa. Yksittäisestä termihankkeesta kun on vaikea kertoa fokusoiden vain yhteen termityön vaiheeseen. Esitelmät käsittelivät termityötä esimerkiksi Itävallan puolustusvoimissa, Scania AB:ssa ja Ruotsin opintotukihallinnossa. Konferenssiohjelma esitelmäkalvoineen on luettavissa Nord Termin sivuilla osoitteessa www.nordterm2013.se/program/session-schedule/all3.

Tieteen termipankin näkökulmasta kiinnostavimmat esitelmät olivat kuitenkin Jan Hoelin Ole Vågen esitelmät Norjan tieteellisestä termipankista, jota kehitetään Språkrådetin, Norjan kielilautakunnan toimesta samalla Semantic MediaWiki -alustalla kuin tieteen termipankkia. Norjan termiwikiin voi tutustua osoitteessa termwiki.sprakradet.no. Samaan aikaan Språkrådetin termwikin kanssa Norjassa on kehitteillä myös suurisuuntainen termiportaalihanke, jota koordinoidaan Norges Handelshøyskolesta käsin. Projekti on vasta aluillaan, mutta seuraamme sitä mielenkiinnolla.

Pasimologia, boniteetti ja kohorttivaikutus – Tieteen termipankin käyttäjätilastoja ja suosituimpia sivuja

Tieteen kansallisen termipankin wiki-alustalla vierailujen määrä on kasvanut tasaisesti. Esimerkiksi marraskuussa 2012 sivustolla oli runsas 4 200 yksilöityä vierailijaa, joista noin 1 300 oli säännöllisiä käyttäjiä. Maaliskuussa 2013 vierailijoita oli jo lähes 7 900 ja säännöllisten käyttäjien määrä oli noussut kahteentuhanteen. Viime viikkoina yksilöityjä käyttäjiä on ollut arkipäivisin noin 350, viikottain 1700–2100.

Tieteen termipankin wiki-alustan omiin tilastoihin on listattu suosituimpia sivuja. Odotuksenmukaisesti kaikkein suosituimpia ovat eri aihealueiden etusivut (1. sijalla Kasvitiede, 4 573 latausta; 2. Kielitiede, 4 568 latausta; 3. Oikeustiede, 2 261 latausta). Ohjesivuista tärkein on ”Käsitelomakkeen täyttäminen” – se on termipankin 17. suosituin sivu (ladattu 582 kertaa).  Koko termipankin etusivua ei ole listattu tähän; huhtikuun 18. päivänä yhden aikaan etusivua on ladattu 29 057 kertaa.

Varsinaisista termipankin sisältösivuista eli eri aihealueiden käsitesivuista suosituin on oikeustieteen common law, sijalla 9 (881 latausta), kasvitieteen emi on sijalla 11 (611 latausta) ja kielitieteen A-infinitiivi sijalla 18 (445 latausta). Nämä ovat sivuja, joita asiantuntijaryhmissä on tehty ensimmäisinä, joten latauksia on tullut runsaasti sivujen tekijöiltä; lisäksi sivut ovat toimineet alkuvaiheessa havainnollistavina esimerkkisivuina erilaisissa tiedotustilaisuuksissa.

Suosituimpien sivujen kärkipäässä on siis enimmäkseen juuri sellaisia sivuja, joita siellä odotuksenmukaisesti tulee ollakin. Aihealueiden etusivujen ja ohjesivujen lisäksi sadan suosituimman sivun listalla on enimmäkseen sellaisia pilottiprojekteihin kuuluvia käsitesivuja, joita me termipankissa työskentelevät olemme innoikkaimmin itse muokanneet. Yllätyksiäkin kuitenkin on. Esimerkiksi kielitieteen termi pasimologia on sijalla 20 (422 latausta), vaikka sivulla ei ole paljonkaan tietoa ja viimeiset muokkauksetkin ovat ylläpidon tekemiä päivityksiä syksyltä 2012. Onkohan joku Pasi-niminen löytänyt sivun ja käyttää sitä nyt humoristisena esimerkkinä eri yhteyksissä? Koordinoimani pilottiprojektin sivuista yllättävän suosittuja taas ovat biologian biomarkkeri (25. sija, 372 latausta) ja ekologinen lokero (46. sija, 296 latausta), vaikka näillä sivuilla en itse ole montakaan kertaa käynyt. Vastaavasti yllättävän suosittu on kielitieteen fonetiikan alaan kuuluva nomogrammi, joka on sijalla 28 (268 latausta), vaikka sitäkään ei ole kukaan aktiivisesti työstänyt. Olen myös ollut harhaluulossa, että epidemiologian aihealueella ei juuri mitään tapahdu (koska siellä ei ole tapahtunut muokkauksia), mutta kyllä termejä katsotaan (esim. kohorttivaikutus on sijalla 98, latauksia 203).

Suosituimmuusjärjestyksessä sijoilla 100–200 on edelleen esimerkiksi kasvitieteen termeistä juuri niitä, joihin olen itse kasvitieteen asiantuntijaryhmän kanssa tehnyt runsaasti muokkauksia. Kuitenkin mukaan mahtuu myös sellaisia kasvitieteen termejä, joita en itse muista edes nähneeni. Tällaisia ovat esimerkiksi dormanssi (124. sija, 182 latausta) ja boniteetti (137. sija, 175 latausta). Mikrobiologian aihealueella suosituin termi on munanjohdinmunasarjatulehdus (190. sija, 153 latausta). Ilmeisesti se on sairaus, jota jostain syystä erityisen paljon googlataan. Kahdensadan suosituimman sivun joukkoon mahtuu juuri ja juuri myös Tieteen termipankin tuoreimman aihealueen, Eläinlääketieteen, etusivu (197. sija, 151 latausta), joka on luotu muutama viikko sitten.

 

Miljoonan raja ylittyi pääsiäisenä

Tieteen termipankissa ylittyi miljoonan katselun raja pääsiäisen aikaan. Sitä voi pitää hyvänä saavutuksena vuoden ja yhden neljänneksen toimineella wikialustalla. Kävijämäärä kertoo ennen kaikkea siitä, että termipankin tietojen saavutettavuus hakukoneiden kautta on hyvä. Pankin sivustolle tullaan ensi sijassa katsomaan jotakin termiä ja käyttämään muitakin käsitesivun tietoja. Etusivu ei siis näytä olevan pääväylä termipankkiin, vaikka se onkin katselluin sivu.

Termitietojen lisääminen ja muokkaus on päässyt vasta kuluneen reilun vuoden aikana käyntiin, mutta Tieteen termipankki vakiinnuttaa jo asemaansa ja täydentyy vähitellen relevantin tiedon lähteenä. Aihealueina on kolmen pilottialan, kasvi-, kieli- ja oikeustieteen, lisäksi tällä hetkellä 11 suomenkielistä ja kaksi ruotsinkielisistä termeistä lähtevää tieteenalaa. Lisäksi asiantuntijaryhmä on aloittanut parilla alueella termityön, jonka tuloksia on tulossa näkyviin myöhemmin, ja kiinnostuksensa Tieteen termipankin termityötä kohtaan on osoittanut useampikin tieteenala.

Miljoona katselua on odotuksenmukaisessa suhteessa aihealueiden määrään ja niiden karttuvaan sisältöön nähden. Katselujen lisäksi myös käyntikerrat ja kävijämäärät ovat vuoden 2013 aikana selvästi kasvaneet. Tällä hetkellä Tieteen termipankin wikialusta vastaa esimerkiksi aktiivisesti luetun aikakauslehden tai paikallislehden verkkosivua ja on siten seuratumpi kuin pelkästään akateemiselle yleisölle suunnatut verkkosivut. Vertailukohtana voi mainita, että kielitieteen alaa edustavalla Kotikielen Seuran ja sen tieteellisen lehden Virittäjän sivustolla on pitkään ollut noin 70 000 käyntiä vuodessa.

Tieteen termipankin jokaiselta sivulta avautuu kävijöille myös mahdollisuus keskusteluun. Toivotamme tervetulleiksi omalla nimellään termeistä käytävään keskusteluun entistä enemmän rekisteröityneitä käyttäjiä, samoin kuin termityön asiantuntijajäseniksi eri tieteenalojen tutkijoita ja opettajia.

Miljoona miljoona miljoona ruusua kaikille käyttäjille!

Tiina Onikki-Rantajääskö, Antti Kanner ja Lea Laitinen

Tieteen termipankki tukee rinnakkaiskielisyyttä

Jaamme huolen, jota Aalto-yliopiston kauppakorkeakoulun tutkijat Elina Henttonen ja Sinikka Vanhala ilmaisivat Helsingin Sanomissa 18.3. yksinomaan englanninkielisiin maisteriohjelmiin ja maksullisiin kielitestauksiin siirtymisen koulutuspoliittisista seurauksista. Kysymys opetuksen kielestä on ajankohtainen muissakin yliopistoissa kuin Aallossa, mikä kävi ilmi Yliopistojen kielistrategioita käsitelleessä seminaarissa, joka järjestettiin Helsingin yliopistossa 7.3.

Pelkästään englanninkieliseen opetukseen siirtyminen on kapeakatseista yksikielisyyttä eikä aitoa kansainvälisyyttä. Pienen kansakunnan valtti on tasa-arvoisessa koulutuksessa, ja sen tae taas äidinkielen merkityksen ymmärtäminen sekä rinnakkaiskielisyys, joka vahvistaa niin äidinkielen kuin englanninkin taitoja — unohtamatta muitakaan kansainvälisen kanssakäymisen kieliä.

Kuinka tieteen uusimmista saavutuksista voidaan kertoa koulutuksen kaikille portaille alakoulusta alkaen, jos suomea ei käytetä tieteen kielenä? Kuinka voidaan tuottaa osaajia suomalaisen yhteiskunnan tarpeisiin, jos opiskelijat eivät opi suullista ja kirjallista suomen kielen taitoa? Miten käy demokratian, jos yhteiskunnallisen päätöksenteon taustaksi ei välitetä tutkimustietoa maan omilla kielillä? Mahdollisuus äidinkieliseen koulutukseen voitaisiin nähdä myös menestystekijänä.

Yksinomaan englanninkieliset maisteriohjelmat eivät tarjoa muualta tulleille valmiuksia integroitua suomalaisille työmarkkinoille. Monet kansainväliset opiskelijat haluaisivat jäädä Suomeen, mutta työllistymistä vaikeuttaa kansalliskielten riittämätön opetus. Toimivien rinnakkaiskielisten käytäntöjen kehittäminen on koulutuksen kielivalintojen haaste, johon nyt kannattaisi aktiivisesti tarttua.

Haluamme korjata yhden väärinkäsityksen. Henttonen ja Vanhala väittivät, että termipankkeja tarjottaisiin verkossa turhaan ratkaisuksi omakielisen opetuksen puutteeseen. Tieteen termipankin wikialustalla keskustellaan eri tieteenalojen käsitteistä, nimityksistä ja muista termikysymyksistä. Se sopii myös opetuksen avuksi, opinnäytteiden tekemiseen ja tutkijankoulutukseen. Termistö elää ja kehittyy kielenkäytössä. Tieteen termipankki on tarkoitettu tukemaan suomen kielen käyttöä tieteen kielenä ja tieteen rinnakkaiskielisyyttä.

Tiina Onikki-Rantajääskö ja Lea Laitinen

Sanastotyössä Tieteen termipankissa

Kasvien rakenneopin eli kasvimorfologian termit alkavat olla itselleni tuttuja. Ensimmäistä kertaa tarkastelin niitä kielitieteen proseminaarityössäni seitsemäntoista vuotta sitten. Pro gradussani keskityin adjektiiveihin. Väitöskirjani tein Elias Lönnrotin 1860-luvulla kehittelemästä kasvimorfologian sanastosta, niin adjektiiveista kuin substantiiveista.

Ei kasvitieteestä niin vain eroon pääse. Väitöskirjan jälkeen meni muutama vuosi tietokirjojen suomentamista käsittelevässä hankkeessa, mutta sitten kasvitiede jälleen kutsui. Tällä kertaa Tieteen termipankki -hankkeen suunnitteluvaiheessa: kasvitieteestä tulisi luontevasti yksi pilottitieteenala uudelle hankkeelle.

Varsinainen sanastotyö on monin tavoin erilaista kuin sanaston tai termistön tutkiminen; yhteistäkin kuitenkin on. Pienistä yksityiskohdista voi avautua laajempia näkymiä. Sanastotyön tekijä tutkii pieniä kokonaisuuksia: kerrallaan yhtä käsitettä ja sen lähellä olevia käsitteitä. Mitä käsitteen ominaispiirteisiin kuuluu, mikä erottaa sen vieruskäsitteistä? Millainen määritelmä auttaa ymmärtämään käsitteen sisällön? Millaisia termien pitäisi olla muodoltaan?

Lähikäsitteiden tarkastelua

Sanastotyön keskeinen menetelmä on käsiteanalyysi, joka on käsitteiden tarkastelua toisten käsitteiden joukossa ja niiden sijoittamista omalle paikalleen käsitejärjestelmässä. Hyvä määrittely on vaikeaa ja usein mahdotontakin ilman läheisten käsitteiden tarkastelua.

Ylä-, ala- ja vieruskäsitteiden esittäminen on hyödyllistä myös sille, joka haluaa ottaa selvää uudesta käsitteestä – tämän vuoksi myös termipankin käsitesivulla on mahdollisuus esittää lähikäsitteitä. Jollei esimerkiksi tiedä, että kasvimorfologiassa lehtilavan perusmuotoja ovat mm. pitkulainen, soikea, suikea, puikea, pitkänpyöreä ja pyöreä, voi olla vaikea ymmärtää, miksi sellaisia termejä kuin pyöreä, soikea tai pitkulainen pitää ylipäätään määritellä.

Määrittelyä

Määrittelyssä pyritään avaamaan käsitteen merkitystä tyypillisesti ns. sisältömääritelmän kautta siten, että osoitetaan käsitteelle yläkäsite ja ne olennaispiirteet, jotka erottavat käsitteen sen vieruskäsitteistä. Kasvien rakenneopin termeissä on kuitenkin joskus paikallaan käyttää ns. joukkomääritelmiä, jolloin luetellaan kaikki käsitteen alaan kuuluvat tarkoitteet. Esimerkiksi kukkalehden voi kertoa olevan ”kehä-, verho-, terä-, emi- tai hedelehti”. Lisäksi ns. koostumussuhteet ovat monesti hierarkiasuhteita tärkeämpiä, jolloin määrittely on helpompaa niiden avulla. Näin esimerkiksi lehtilapa kannattaa määritellä ”lehden osaksi” eikä vaikkapa tietyntyyppiseksi ”lavaksi”. Lehtilapa on siis lehden osakäsite.

Kasvimorfologiassa on runsaasti adjektiiveja. Perusohje määrittelyssä on, että substantiivit määritellään substantiivien avulla, verbit verbien avulla ja adjektiivit adjektiivien avulla. Käytännössä tieteen termeinä käytettyjen adjektiivien määrittely on usein mahdotonta toisen adjektiivin avulla, jolloin suositaan rakenteita ”sellainen x, joka yyyy” tai ”kuvaa x:ää, joka yyyy”.

Kasvitieteen perusteoksissa, esimerkiksi Retkeilykasviossa (1998), ei kuitenkaan ole aina määritelty näin, vaan suoraan sen tarkoitteen kautta, jota adjektiivi kuvailee. Tällaisen mallin mukaan esim. parilehdykkäinen on Tieteen termipankissa nyt ”kerrannaislehti, jonka lapa on jakautunut parillisiin lehdyköihin keskirangan eri puolilla”, nirhalaitainen on ”hammaslaitainen lehti, jonka terävien pykälien väliset lovet ovat pyöreitä” ja kellomainen taas ”teriö, joka muistuttaa muodoltaan kirkonkelloa”.

Kasvitieteen asiantuntijaryhmän keskustelun jälkeen päädyimme tällaiseen käytäntöön. Tieteenalan Lönnrotista alkava suomenkielinen perinne tukee tällaista, ja lisäksi kuvattu määrittely on käytännöllistä. Liiallinen metateksti voi tehdä määrittelystä kömpelöä. Kuulisin kuitenkin tästä ratkaisustamme mielelläni lukijoiden ja termipankin käyttäjien mielipiteitä.

Nimitykset ja terminmuodostus

Väitöskirjassani tutkin käsitteiden nimeämistä eli terminmuodostusta. Kantava ajatus oli, että käsitteiden nimityksiksi valitut tai sepitetyt sanat, termit, toimivat motivoituina merkkeinä. Ajatus osoittautui oikeaksi: Lönnrot pyrki termistössään erityisen ponnekkaasti merkityksen läpinäkyvyyteen. Hän uskoi, että siten käsitteet avautuvat Suomen Kasviston (1860) lukijoille ja kasviopin opiskelijoille.

Läpinäkyvyyttä on joskus pidetty myös termistöjen haasteena, koska silloin kaikki mahdolliset sivumerkitykset, joita sanalla on erikoisalan ulkopuolella, voivat alkaa häiritä ja jopa johtaa harhaan. Jos näin olisi, vierassanat tai täysin keksityt kirjainyhdistelmät olisivat termeinä kaikkein parhaita. On kuitenkin selvää, että merkitykseltään läpinäkyvät termit opitaan helpommin ja muistetaan paremmin. Lönnrot itse viittasi lainasanojen käyttöön Kasvikon oppisanoja -kirjoituksessaan (1858) seuraavasti:

Eipähän ole ollut pakko semmoisia muukalaisia sanoja, kun esimerkiksi androgynus, cellula, dicotyledo, concavus, cryptogamus, ovalis, phyllodium, pistilla, stipula y.m. sillä tavoin suomenkieleen sekoittaa, kun Ruotsalaiset niistä – epäilemättä kyllä suureksi hyödyksi ja kielensä kunniaksi – ovat saaneet sanansa androgynisk, cellul, dikotyledon, konkav, kryptogam, oval, phyllodium, pistill, stipel, jotka arvattavasti ynnä monen muun kumppalinsa kanssa ovat Ruotsin kansan hyvin helpot ymmärtää ja muistoissa pitää.

Lönnrot ei kuitenkaan ollut kaikkein jyrkin puristi, koska hän teki mielellään käännöslainoja: jopa kahdella kolmasosalla hänen termeistään on jonkinasteinen käännöslainatausta. Esimerkiksi hyvinkin kotoisilta vaikuttavat termit hammasluomainen, kukinto, munuaismainen, neuvoton ja sepivä ovat kaikki taustaltaan vieraan mallin mukaan muodostettuja käännöslainoja.

Nykyään kasvitieteen suomessa on runsaasti vierassanoja. Tieteen termipankin kasvimorfologian listauksista löytyvät mm. termit adventiivinen, diarkkinen, distylia, hypantio, mikrofylli ja sporogonio. Lisäksi mukana on käsitteitä, joilta puuttuu suomenkielinen nimitys kokonaan. Termipankkiin voi siis tuoda myös tällaisia ”nimettömiä” – näin tarjotaan käyttäjille nimitykset vierailla kielillä ja voidaan jättää suomenkielinen nimitys etsimään muotoaan vähitellen asiantuntijatyössä.

Tässä kohtaa lienee paikallaan myös sanoa, että Tieteen termipankissa ei sinänsä vierasteta lainasanoja. Monille aloille, esimerkiksi kielitieteeseen, on vakiintunut termeiksi runsaasti vierassanoja. Myös omakielisen termin rinnalla esiintyy usein synonyyminen vierassana. On tietysti ilahduttavaa, jos asiantuntijat keksivät uusille käsitteille aidosti suomalaisia nimityksiä. Mikäli tämä kuitenkin tuntuu vaikealta, ennen lainasanojen suomeen mukauttamista voi aina ensin yrittää kokeilla Lönnrotin keinoa ja kääntää vieraat termit osa osalta suomeksi.