Tutkijoiden oikeinkirjoitusohjelma integroitu Microsoft Wordiin

Helsingin yliopiston kieliteknologien kirjoittaman HFST-ohjelman avointa lähdekoodia on integroitu Microsoftin Word-tekstinkäsittelytyökaluun. HFST tulee sanoista Helsinki Finite-State Technology, joka tarkoittaa suomeksi äärellistilaista teknologiaa. Käytännössä ohjelma tekee tekstistä mm. morfologisia eli sanojen muodostukseen liittyviä analyysejä, joiden perusteella se voi arvioida tekstin oikeinkirjoitusta sanakirjan avulla.

– Valtakielien lisäksi HFST:tä hyödyntäviä sanakirjoja on nyt tarjolla grönlannista, fääristä ja kolmesta eri saamen kielestä. Lisäksi on kehitteillä sanakirjoja suomen sukukielille Koneen Säätiön tukemien hankkeiden kautta, kertoo FIN-CLARINin tutkimusjohtaja Krister Lindén.

Kuvassa ohjelma tarkistaa grönlanninkielistä tekstiä.

Kuvassa ohjelma tarkistaa grönlanninkielistä tekstiä.

Hanke lähti tuottamaan kielityökalua vähemmistökielille, joita Microsoft ei itse tue kyseisten markkinoiden pienuuden takia.

– Tavoitteemme on tärkeä, koska yhä isompi määrä tiedosta syntyy suoraan digimaailmaan. Ilman kunnollista kielityökalutukea vähemmistökielet jäävät vähemmälle käytölle, Lindén huomauttaa.

Hankkeessa on tehty pohjoismaista yhteistyötä. Itse HFST-ohjelma on kehitetty Helsingin yliopistolla. Norjalaiset lingvistit Tromssassa ovat testanneet koodia ja tuoneet siihen sanakirjoja ja tanskalaiset ohjelmoijat Odensessa ovat hoitaneet koodin liittämisen MS Wordiin.

HFST-ohjelmat ovat tarjolla myös OpenOfficeen ja muihin verkkoratkaisuihin.

Elias-robotti on kieliteknologian uusi apulaisprosessori

Kieliteknologian oppiaineen tuoreimpia vahvistuksia on humanoidirobotti Elias. Eliaksen työnkuvana on tukea kieliteknologian opetusta ja tutkimusta Helsingin yliopistossa.

Katso Eliaksen esittelyvideo YouTubessa:

screenshotVideon materiaali on kuvattu Eliaksen kesäseminaarin yhteydessä kesäkuussa 2015. Kahdeksan opiskelijan intensiivikurssi käsitteli robotin ja ihmisen välistä vuorovaikutusta. Opettajana oli dosentti Kristiina Jokinen.

– Luonnollisen vuorovaikutuksen automatisointi on kieliteknologian tutkijoiden Graalin malja. Koneiden kielellisten ja kognitiivisten kykyjen kehittäminen on suuri haaste. Ne tarjoavat happotestin, jossa kieliteknologian heikkoudet paljastuvat nopeasti! Opiskelijoille eli tulevaisuuden kieliteknologeille riittää tässä työsarkaa, sanoo tutkija Atro Voutilainen.

Kun yhä useampi opiskelija ja opettaja pääsee kursseilla tutustumaan robotin käyttämiseen, vain mielikuvitus on mahdollisuuksien rajana.

– Robotti on helposti lähestyttävä ohjelmointiympäristö, jota opiskelijat voivat lainata vaikka opinnäytetyötä varten, Voutilainen toteaa.

Robotin hankkimisen mahdollisti tutkijayhteisö BAULTin rahoitus.

Eliakseen pääsee tutustumaan henkilökohtaisesti Koe Kampus -tapahtumassa torstaina 29.10.2015, jossa Elias esittäytyy dosentti Graham Wilcockin avustuksella lukiolaisille ja muille nykykielten laitoksella opiskelusta kiinnostuneille. Tervetuloa!

***

Videossa mainitusta Wikitalk-hankkeesta löytyy lisätietoa seuraavasta artikkelista:

Jokinen, K. and Wilcock, G. (2014). Multimodal Open-domain Conversations with the Nao Robot. In: Mariani, J., Rosset, S., Garnier-Rizet, M. and Devillers, L. (eds.) Natural Interaction with Robots, Knowbots and Smartphones – Putting Spoken Dialog Systems into Practice. Springer Science+Business Media. pp. 213-224

Pääsy julkisiin palveluihin yli kielimuurien – automaattinen käännösalusta julkaistu

Euroopan kielten päivänä 26.9.2015 Euroopan komissio alkaa tukea kansalaisille ja yrityksille suunnattujen julkisten palvelujen toimintaa yli kielirajojen Eurooppaa yhdistävällä automaattisella käännösalustalla.

Käännösalusta (The Automated Translation platform of Connecting Europe Facility, CEF.AT) helpottaa monikielistä viestintää sekä asiakirjojen ja muun kielellisen sisällön vaihtoa Euroopassa sekä kansallisten julkishallintojen että hallintoelinten ja EU:n kansalaisten ja yritysten välillä. Käännösalusta vastaa moniin julkishallinnon tarpeisiin koskien kuluttajien oikeuksia, terveydenhuoltoa, julkisia hankintoja, sosiaaliturvaa, kulttuuria ja muita aloja.

Toistaiseksi useimmille eurooppalaisille kielille ei ole ollut saatavilla asianmukaista kieliteknologista tukea. Euroopan vaalima kielellinen monimuotoisuus voikin muuttua esteeksi tilanteissa, joissa se vaikeuttaa tietojen vaihtamista tai estää tasapuolisen pääsyn julkisiin palveluihin, liiketoiminta- tai työmahdollisuuksiin ja tukipalveluihin.

Lue koko juttu Kielipankin verkkosivuilla

375 humanistia: Mikko Tolonen

Digitaaliset ihmistieteet -tapahtuma Helsingin yliopistolla maaliskuussa 2015. Kuva Anni Jakobsson.

Digitaaliset ihmistieteet -tapahtuma Helsingin yliopistolla maaliskuussa 2015. Kuva Anni Jakobsson.

Mikko Tolonen on aate- ja filosofian historian tutkija, joka on viettänyt siivun elämästään pohtiessaan, miksi yksityiset paheet aiheuttavat myös yhteistä hyvää. Tolonen koki postdoc-vaiheessa herätyksen modernien tietojenkäsittelymenetelmien sovellusmahdollisuuksiin historiantutkimuksessa. Sittemmin hän on jäänyt koukkuun digitaalisiin ihmistieteisiin.

Tutustu Mikko Toloseen 375 humanistia -verkkosivuilla

Helsingin yliopiston 375-vuotisjuhlavuoden kunniaksi humanistinen tiedekunta nostaa esiin 375 humanistia. Sivustolla esiteltävät henkilöt avaavat näkymää humanistisen alan yhteiskunnalliseen ja kulttuuriseen merkitykseen sekä tarjoavat esimerkkejä humanistien laaja-alaisesta osaamisesta.

Sivuaine digihumanismista, alkuperäiskansoista tai Venäjän tutkimuksesta?

Ilmoittautuminen on käynnissä 17.8.–4.9.2015 täällä.

On haasteita, joihin vastaamiseksi yhden tieteenalan paraskaan osaaminen ei riitä. Työelämä tarvitsee yhä useammin asiantuntijoita, joilla on rautaisen ammattitaidon lisäksi laajempaa näkemystä ja ennakkoluuloton asenne.  Yhteiskunta kaipaa vaikuttajia, joiden työkalupakki ei periydy ainelaitoksen arkistoista, vaan perustuu parhaaseen tutkimustietoon ja tuoreimpiin poikkitieteellisiin oivalluksiin.

Uudet temaattiset sivuainekokonaisuudet maisterivaiheen opiskelijoille

Helsingin yliopiston humanistinen tiedekunta tarjoaa syksystä 2015 alkaen temaattisia sivuainekokonaisuuksia maisterivaiheen opiskelijoille tiedekunnasta riippumatta.  Erikoistu alkuperäiskansoihin, digitaaliseen humanismiin tai Venäjän kysymyksiin.  Rakenna itsellesi uniikki osaamisprofiili: suorita 25 op kokonaisuus tai valikoi sinulle sopivimmat kurssit.

Nykykielten laitoksen opetushenkilöstöä on mukana jokaisen kokonaisuuden toteutuksessa.

Digihumanismi ratkoo perinteisiä kysymyksiä uudenlaisin menetelmin

Digitaalinen humanismi viittaa erityisesti modernien tietojenkäsittelymenetelmien käyttöön humanistis-yhteiskunnallisessa tutkimuksessa. Kun tutkitaan ilmiöiden yhteyksiä ihmisten käyttäytymiseen, vuorovaikutukseen ja maailmankuvaan, tarvitaan sekä laajoja ja moniulotteisia aineistoja että humanistien tuoreita näkökulmia ja ymmärrystä. Digihumanismi-kokonaisuus avaa ihmistieteilijälle oven uusien teknologioiden mahdollisuuksiin ja tarjoaa tietojenkäsittelyn osaajalle näkemystä relevanteista sovellusaloista.

Monitieteinen Venäjän tutkimus tarjoaa kattavan peruspaketin Venäjästä

Venäjä-osaaminen on Suomen kannalta kriittinen menestystekijä ja työelämään hakeutuvan maisterin kannalta ehdoton kilpailuetu. Aleksanteri-instituutin ja nykykielten laitoksen kokoama monitieteinen Venäjän tutkimuksen sivuainekokonaisuus tarjoaa monipuoliset eväät Venäjän ja siihen liittyvien ilmiöiden tulkitsemiseen. Voit perehtyä valtioon ja turvallisuuteen, yhteiskuntaan ja hyvinvointiin, identiteettipolitiikkaan, luonnonvaroihin, ympäristöön ja talouteen, kirjallisuuteen ja kulttuuriin sekä Venäjään naapurina.

Alkuperäiskansatutkimus antaa uuden tavan ajatella ja jäsentää maailmaa

Alkuperäiskansatutkimuksen opintokokonaisuus perehdyttää sinut alkuperäiskansojen kieliin, oppimismenetelmiin ja näkemyksiin. Alkuperäiskansojen tieto perustuu sukupolvien aikana karttuneisiin havaintoihin ja kokemuksiin ympäristöstä. Tämän perinnetiedon ymmärtäminen auttaa meitä globaalien hyvinvointi- ja ympäristökysymyksien ratkaisemisessa ja tarjoaa uusia keinoja ymmärtää myös historiallisia jatkumoja ja valtasuhteita.