Näin arvioit, maksaako konekäännöksen käyttö vaivan

Kaikki Google Translatea joskus kokeilleet tietävät, että sen tekemistä käännöksistä tulee välillä hölynpölyä.

Konekääntimet voivat kuitenkin olla hyödyllisiä apuvälineitä kääntäjille. Kone ei tosin hoida koko hommaa napin painalluksella vaan ammattikääntäjän työpanosta tarvitaan yhä: kone tuottaa lähtötekstistä raakakäännöksen, jonka kääntäjä sitten editoi esimerkiksi kunnon suomeksi. Jälkieditoinnin työläyteen vaikuttavat mm. konekäännökseen tehtyjen muutosten lukumäärä, virheiden tyyppi ja virkkeen pituus.

Konekäännösten jälkieditointia väitöskirjassaan tutkinut Maarit Koponen huomasi, että erityisen työläitä editoitavia olivat esimerkiksi sanajärjestykseen ja idiomeihin liittyvät virheet sekä tapaukset, joissa konekäännin on tulkinnut sanaluokan väärin – esimerkiksi muuttanut substantiivin “people” (ihmiset) verbiksi (kansoittaa).

Tutkimuksessa kävi ilmi, että tietyntyyppisten kielellisten virheiden korjaaminen on mahdollista, vaikka lähtötekstiä ei olisi nähtävänä. Tällaisia ovat esimerkiksi tapaukset, joissa sanan taivutusmuoto on väärin, mutta oikea muoto on helposti pääteltävissä.

Sellaiset virheet, jotka haittaavat tekstin merkityksen välittymistä, voivat puolestaan tehdä korjaamisesta mahdotonta. Konekäännöksestä saattaa esimerkiksi puuttua sanoja eikä lukija pysty arvaamaan, mikä puuttuva tieto on. Tällaiset tapaukset voivat olla sudenkuoppia erityisesti tilanteessa, joissa lähtötekstiä ei pääse tarkistamaan: käännös voi vaikuttaa täysin sujuvalta mutta olla merkitykseltään väärä.

– Jälkieditoinnissa normaaliin toimintatapaan kuitenkin kuuluu, että lähtöteksti on käytettävissä, Koponen huomauttaa.

Kaavamaiset tekstit ovat koneelle helpoimpia

Jo lähtötekstistä voi jossain määrin päätellä, kannattaako siitä tehdä raakakäännös konekääntimen avulla.

– Jos lähtöteksti on kovin vaihtelevaa ja luovaa, siinä on pitkiä virkkeitä ja jollain tavalla kuvaannollista kieltä, konekäännöksestä tuskin on hyötyä, Koponen arvioi.

– Konekäännöksestä on tyypillisesti hyötyä silloin, kun käännettävä teksti on rakenteellisesti suhteellisen yksinkertaista ja jollain tavalla “kaavamaista” tai itseään toistavaa.

Lisäksi parhaan tuloksen saavuttaminen edellyttää, että konekäännin on tarkoitettu tietyn tyyppisen tekstin, esimerkiksi laitteen käyttöohjeen, kääntämiseen. Tällöin tilastollisen kääntimen opetusaineistona on käytetty samantyyppisiä tekstejä, joissa esiintyy juuri haluttua terminologiaa ja ilmauksia, tai kääntimeen on yhdistetty sanasto, jossa on oikeat käännökset.

– Vapaasti kaikkien käytettävissä olevat yleiskääntimet kuten Google Translate eivät ole varsinaisesti jälkieditointikäyttöön tarkoitettuja, Koponen selittää.

Väitöstutkimuksen tuloksia voidaan hyödyntää lähtötekstien arvioinnissa sekä konekääntimien ja editointiprosessien kehittämisessä.

Suomessa ollaan jäljessä

Konekäännösten käyttö on viime vuosina yleistynyt, joskin Suomessa se on vielä vähäistä. Suomesta tai suomeen tehtävien konekäännösten laatu on selkeästi heikompaa kuin sellaisissa kielipareissa (esim. englanti-espanja), joissa jälkieditointia on hyödynnetty jo pitkään.

– Heikko laatu johtuu osittain suomen kielen rakenteista, erityisesti runsaasta taivutusmuotojen määrästä. Vaikeuksia aiheuttaa myös tilastollisten kääntimien tarvitseman ns. opetusaineiston eli sopivien kaksikielisten tekstien vähäinen määrä, Koponen selittää.

Kääntimien kaupalliseen kehittämiseen on ollut vain vähän kiinnostusta, koska Suomi on varsin pieni markkina-alue. Kehitystyötä kuitenkin tehdään täälläkin.

Lisätietoa


Screenshot Google Translate -palvelusta

Screenshot Google Translate -palvelusta

Esimerkki konekääntimen vakavasta virheestä

Yksi esimerkki Koposen aineistossa oli seuraava pätkä, jota yksikään koehenkilöistä ei pystynyt korjaamaan:

Lähtöteksti: “…even when people are given unlimited cheap or free calls, the number and length of calls does not increase significantly.”

Konekäännös: “… jopa silloin kun ihmisille soitetaan, ei kasva merkittävästi.”

Kontekstin perusteella jotkut olivat osanneet päätellä, että puuttuva osa (mikä ei kasva?) liittyisi puheluiden pituuteen tms. Yksikään ei kuitenkaan edes yrittänyt korjata kohtaa “ihmisille soitetaan”, jonka olisi siis pitänyt olla “ihmisille annetaan rajoittamaton määrä halpoja tai ilmaisia puheluita”, koska konekäännös näyttää siltä, että se voisi olla oikein.

 

Kahden kielen sekakäyttö voi olla eduksi vähemmistökielelle

Kaksikieliset puhetyylit saavat usein liikanimiä kuten Spanglish (Spanish + English). Niitä pidetään helposti huonona kielenkäyttönä, jota olisi syytä välttää. Sekakieli ärsyttää, ja sen pelätään johtavan kielen rappioon. Tuoreen väitöksen mukaan kahden kielen sekoittaminen samassa puhetilanteessa on kuitenkin olennainen osa kaksikielisen ihmisen ilmaisukykyä.

– Monikielisellä puhujalla on yksikieliseen verrattuna käytössään moninkertainen ilmaisuvarasto, jota hyödyntämällä hänellä on laajemmat kielelliset resurssit, sanoo jatko-opiskelija Hanna Lantto.

Lantto tarkasteli Baskimaan Suur-Bilbaon alueen kaksikielistä puhetta, josta käytetään kansankielistä nimitystä euskañol. Se on yhdistelmä sanoista euskara (baskin kieli) ja español (espanja). Baskimaassa kaikki baskinkieliset ovat kaksikielisiä ja puhuvat myös espanjaa. Espanjankielisten sanojen ja ilmausten käyttö muuten baskinkielisessä puheessa ei siis ole este ymmärtämiselle.

Baskimaa sijaitsee Pohjois-Espanjassa.

Baskin kirjakieli liian muodollista

Baskimaassa alkoi voimakas kielenelvytys, kun Espanjan vähemmistökieliä syrjinyt kielipolitiikka muuttui maan siirtyessä Francon diktatuurista demokratiaan 1980-luvun taitteessa. Baskin kielellä on nykyään paljon puhujia, jotka puhuvat baskia toisena kielenään. Baskin kirjakieli euskara batua on levinnyt eri kouluasteisiin opetuskieleksi, ja sitä käytetään monenlaisissa julkisissa konteksteissa sekä mediassa.

Lanton väitöskirjatutkimus kuitenkin osoittaa, että uutta kirjakieltä pidetään muodollisena ja keinotekoisena. Siksi baskia pyritään usein muokkaamaan epämuodollisiin tilanteisiin sopivammaksi koodinvaihdolla eli sekoittamalla baskia ja espanjaa.

– Toisin kuin usein kuvitellaan, koodinvaihto on siis jopa edullista vähemmistökielen käytölle, koska yksikielistä baskia pidetään liian muodollisena epävirallisiin tilanteisiin, Lantto selittää.

Näin puhekielisestä baskista on käytännössä tullut kaksikielinen kielimuoto, joka sisältää aina jonkin verran koodinvaihtoa espanjaan.

– Esimerkiksi keskustelusanat, kiroilu ja slangi-ilmaukset sanotaan lähes aina espanjaksi muuten baskinkielisessä puheessa, Lantto kertoo.

Tausta vaikuttaa

Tutkimuksesta ilmenee, että koodinvaihdon määrässä ja laadussa on kuitenkin eroja puhujan taustasta riippuen. Äidinkieliset baskit käyttävät koodinvaihtoa monipuolisesti ja runsaasti. Koulussa kielen omaksuneet baskit taas käyttävät koodinvaihtoa vain vähän ja silloinkin se rajoittuu yleensä hyvin yleisiin espanjankielisiin ilmauksiin, kuten kirosanoihin.

Tutkimuksen mukaan koodinvaihdossa ilmeneville eroille on kaksi syytä. Ensinnäkin koulussa luokkahuoneen ilmapiiri ohjaa vahvasti yksikieliseen kielenkäyttöön. Toiseksi ei-äidinkielisten puhujien koodinvaihto tulkitaan usein kielitaidon puutteeksi.

– Tällaiset puristiset asenteet ja yksikielisyysnormit rajoittavat kaksikielisyyden täyttä hyödyntämistä, Lantto huomauttaa.

FM Hanna Lantto väittelee 10.6.2015 kello 12 Helsingin yliopiston humanistisessa tiedekunnassa aiheesta “Code-switching in Greater Bilbao – A bilingual variety of colloquial Basque”. Väitöstilaisuus järjestetään osoitteessa Päärakennus, luentosali 5, Fabianinkatu 33.

Kuvailutulkki kääntää visuaalisen verbaaliseksi

Tila on keskeinen elokuvakerronnan ulottuvuus, jonka tulkitseminen nojaa vahvasti näköhavaintoon. Kuvailutulkkauksen avulla myös näkövammaiset voivat nauttia visuaalisesta elokuvakerronnasta.

Maija Hirvonen tutki tuoreessa väitöskirjassaan elokuvan kuvailutulkkausta. Siinä tulkki muuttaa visuaalisesti havaittavaa tietoa sanalliseen muotoon. Hirvonen halusi selvittää, miten kieli ilmentää tilaa ja miten tilaa hahmotetaan elokuvan äänimaailman kautta. Tutkimus painotti kielen ja kuvan suhdetta.

Kuvakerrontaa kielen avulla

Tutkimuksen mukaan kuvailutulkkaus pystyy jäljittelemään elokuvakerronnan tapoja luoda tilavaikutelmia. Kuvailutulkkauksessa voivat heijastua mm. henkilöhahmon näkökulman rakentuminen, otoksen kuvakoko ja huomiopiste sekä staattisen ja dynaamisen tarinankulun vaihtelu. Tulkki ei yritä tarjota valmiita tulkintoja vaan hänen tehtävänsä on tarjota näkövammaiselle välineitä ja vihjeitä oman tulkinnan muodostamiseksi.

Elokuvissa hahmon näkökulma rakentuu usein otossarjana, jossa ensin näytetään hahmon katse, sen jälkeen katseen kohde ja lopuksi palataan takaisin kuvaamaan hahmon reaktio. Kuvailutulkkauksessa tällaisiin siirtymiin voi viitata esimerkiksi näin: Peter katsoo ympärilleen / Maassa on katkennut käsi / Järkyttynyt ilme kasvoillaan Peter juoksee pois.

Kuvailutulkkauksessa voidaan heijastaa elokuvan kuvakokoja luomalla vastaava viitekehys ja kuvailemalla esimerkiksi laajassa rajauksessa näkyvää ympäristöä (esim. puutarhassa) tai lähikuvassa näkyvää esinettä (pöydällä on vesilasi). Tulkki voi kiinnittää huomion elokuvassa näkyvän tilan eri osiin tai tapahtumiin.

Perikato-elokuvan saksalaisessa kuvailutulkkauksessa tämän otoksen kohdalla kerrottiin kuvassa näkyvästä ympäristöstä: "tuhoutuneessa puutarhassa vanhan valtakunnankanslian takana". Espanjankielisessä versiossa taas tilaa kuvailtiin eri lähtökohdasta ja painotettiin toimintaa: "bunkkerin ulkopuolella upseerit ottavat asennon Hitlerin tullessa ulos".

Perikato-elokuvan saksalaisessa kuvailutulkkauksessa tämän otoksen kohdalla kerrottiin kuvassa näkyvästä ympäristöstä: “tuhoutuneessa puutarhassa vanhan valtakunnankanslian takana”. Espanjankielisessä versiossa taas tilaa kuvailtiin eri lähtökohdasta ja painotettiin toimintaa: “bunkkerin ulkopuolella upseerit ottavat asennon Hitlerin tullessa ulos”.

Elokuvakerronnan visuaalisten elementtien muuttuvuus ja jatkuvuus heijastuvat kuvailutulkkauksessa. Kuvailua tarvitaan muun muassa silloin, kun viitataan uusiin asioihin ja teemoihin tai kun jo nähtyyn asiaan viitataan uudelleen mutta eri näkökulmasta: linja-auto kulkee tietä pitkin / linja-autossa on lapsia. Kuvailutulkki voi myös äänenkäytöllään ilmaista sen, että kohtaus jatkuu vielä: esimerkiksi saksassa nouseva intonaatio toteavan lausuman lopussa luo odotuksen siitä, että kuvailu jatkuu vielä samasta aiheesta.

Ensimmäisessä otoksessa ”minibussi ajaa tiellä”. Seuraavassa otoksessa ”Jamal ja Salim istuvat bussissa muiden lasten keskellä”. Tarkoituksena on ymmärtää, että nyt kurkistetaan juuri nähdyn bussin sisään. (Kuvat: Slummien miljonääri -elokuva.)

Ensimmäisessä otoksessa ”minibussi ajaa tiellä”. Seuraavassa otoksessa ”Jamal ja Salim istuvat bussissa muiden lasten keskellä”. Tarkoituksena on ymmärtää, että nyt kurkistetaan juuri nähdyn bussin sisään. (Kuvat: Slummien miljonääri -elokuva.)

Tutkimuksessa havaittiin eroavaisuuksia saman elokuvan erikielisissä kuvailutulkkauksissa. Taustalla ovat oletettavasti paitsi kielisysteemin erot myös erilaiset kerronnan ja kuvailutulkkauksen perinteet. Eroja aiheuttavat myös visuaalisen viestin monitulkintaisuus: esimerkiksi esineitä voi kuvailla painottaen joko esineen ulkonäköä, käyttöä tai sen narratiivista merkitystä tarinassa (vaikkapa tunnistetaan, että sama esine on nähty jo jossain aiemmassa kohtauksessa). Tällöin kaikki lähestymistavat vastaavat kuvaa, mutta näkökulmasta riippuu, millaisen mielikuvan kuulija saa tulkkauksen perusteella.

Slummien miljonäärin saksankielisessä kuvailutulkkauksessa ”Jamal kyykkii pienessä puuvajassa”, kun taas englanninkielisessä versiossa ”Jamal kyykkii reiän yllä slummiin kyhätyssä vessassa”. Molemmat kuvaavat samaa rakennelmaa: ulkovessaa. Edellinen painottaa sen fyysistä olomuotoa (pieni puuvaja) ja jälkimmäinen sen funktiota ja roolia tarinassa (vessa slummissa).

Slummien miljonäärin saksankielisessä kuvailutulkkauksessa ”Jamal kyykkii pienessä puuvajassa”, kun taas englanninkielisessä versiossa ”Jamal kyykkii reiän yllä slummiin kyhätyssä vessassa”. Molemmat kuvaavat samaa rakennelmaa: ulkovessaa. Edellinen painottaa sen fyysistä olomuotoa (pieni puuvaja) ja jälkimmäinen sen funktiota ja roolia tarinassa (vessa slummissa).

Tulkkaus laajentaa kokemusta

Hirvosen tutkimus havainnollistaa, miten rikas ilmaisuvaranto kuvailutulkattu elokuva on. Voisiko näkeväkin elokuvankatsoja saada enemmän irti kuvailutulkatusta elokuvasta? Auttaako tulkkaus kiinnittämään huomiota elokuvan tiloissa sellaisiin asioihin, joita katsoja ei muuten huomaisi?

– Varmasti. On jopa esitetty, että kuvailutulkkaus tukisi autismin kirjon ihmisiä, koska siinä tunnistetaan ja sanallistetaan ihmisten ilmeitä, tunnetiloja jne. Lisäksi kuvailutulkit kertovat taideteoksia kuvaillessaan saavansa palautetta näkeviltä siitä, että kuvailutulkkaus laajentaa myös heidän kokemustaan taiteesta, Hirvonen kertoo.

Teksti: Anni Aarinen ja Maija Hirvonen


Lisätietoa

Väitöstilaisuus

FM Maija Hirvonen väittelee 15.11.2014 kello 10 Helsingin yliopiston humanistisessa tiedekunnassa aiheesta “Multimodal Representation and Intermodal Similarity – Cues of Space in the Audio Description of Film”. Väitöstilaisuus järjestetään osoitteessa Porthania, Auditorio II, Yliopistonkatu 3.

Väitöskirjan tiivistelmä

Aineistossa neljä elokuvaa

Väitöstutkimuksen aineistona olivat seuraavat elokuvat ja niiden erikieliset kuvailutulkkaukset:

  • Der Untergang (suom. Perikato), Saksa/2004, sekä tämän espanjankielinen versio ja kuvailutulkkaus
  • Dancer in the Dark, Tanska/2000, englanniksi ja saksaksi
  • Tauno Tukevan sota, Suomi/2010, suomeksi
  • Slumdog Millionaire (suom. Slummien miljonääri), UK/2008, englanniksi, espanjaksi ja saksaksi

Intermodaalinen kääntäminen

Kuvailutulkkaus liittyy nk. intermodaalisen kääntämisen ja tulkkauksen tutkimukseen. Intermodaalisuus tarkoittaa sitä, että kääntäjä tai tulkki välittää ilmaisua eri kanavien ja ilmaisukeinojen välillä: esimerkiksi puhe ja äänet tehdään nähtäviksi kirjoituksen kautta kirjoitustulkkauksessa. Tarkoitus on tehdä viestinnästä ja kulttuurista saavutettavaa mm. aistirajoitteisten käyttäjien kuten kuulo- ja näkövammaisten kannalta.

Katso myös:

Noidista tehtiin viihdettä massoille 1600-luvun Englannissa

Hirtettyjä noitia eräässä noitapamfletissa

Kuvitusta eräästä noitapamfletista

1500 – 1600-lukujen noitapamfletit vastasivat nykypäivän sensaatiolehtiä. Kirjasten painajat ja kirjoittajat muokkasivat noitaoikeudenkäyntien pöytäkirjat viihdyttäviksi tarinoiksi, joiden avulla lukijat pyrittiin vakuuttamaan, että noituudesta tuomitut olivat tehneet rikoksen sekä ihmisiä että jumalaa vastaan.

Myös kuvituksella ja tekstin asemoinnilla houkuteltiin lukijoita ja helpotettiin lukemista. Kohulehdet sekä niiden nettisivut toimivat yhä näin, kertoo englantilaisesta filologiasta 18.11. väittelevä Carla Suhr.

Yksi Suhrin lempipamfleteista kertoo miehestä, joka noidan kirouksen takia päätyi Turkkiin. Miehen paluumatka Englantiin kesti kaksi vuotta, mutta tarina saa onnellisen lopun, sillä syylliseksi paljastuva noita ja hänen kaksi poikaansa on jo ehditty teloittaa hänen murhastaan.

1500- ja 1600-luvulla lukutaito yleistyi hiljalleen alemmissa yhteiskuntaluokissa, vaikka lukutaito jäikin useimmiten alkeelliselle tasolle.  Noitapamfletit suunnattiinkin tälle uudenlaiselle, pääosin kouluttamattomalle ja ennen kaikkea keskiaikaista ritarikirjallisuutta lukemaan tottuneelle suurelle yleisölle. Ritarikirjallisuuden kautta markkinat viihteelliselle kioskikirjallisuudelle olivat jo valmiiksi olemassa.

Lakitekstit onnistuttiin kauppaamaan lukijoille kirjasten tarjoamassa muodossa menestyksekkäästi. Pamflettien suosiota auttoi myös se, että muihin julkaisuihin verrattuna ne olivat halpoja. Menestystä varten sekä kirjoittajat että painajat joutuivat kuitenkin muuttamaan toimintatapojaan. Kirjoittajat muokkasivat vaikeasti tajuttavista oikeusteksteistä kertomuksia, ja painajat lisäsivät pamfletteihin ritarikirjallisuudesta tuttuja halvan näköisiä kuvia, jotta lukijat yhdistäisivät uudenlaiset tekstit populaariksi lukemistoksi. Samasta syystä noitapamfletit painettiin goottilaisilla kirjasimilla 1600-luvun alkupuoliskolle asti.

Noitia ei poltettu roviolla

Väitöskirjaansa varten Carla Suhr tutki kielitieteen ja historiantutkimuksen keinoin kaikki 36 säilynyttä noitapamflettia. Tutkimus osoittaa, kuinka lukutaito ja lukutavat sekä noitauskomukset muuttuivat 150 vuoden aikana, ja kuinka noitapamfletit kehittyivät omaksi tekstilajikseen. 1600-luvun lopulla myös tekstit olivat lyhentyneet ensimmäisistä parinkymmenen sivun kertomuksista ja niiden muoto ja kieli alkoivat muistuttaa syntymässä olevien ensimmäisten sanomalehtien uutisia.

Noituudesta syytettyjen oikeudenkäynnit eivät lukujen valossa olleet läpihuutojuttuja. Englannissa käytiin kaikkiaan 2500 noitaoikeudenkäyntiä, joista noin 500 tapauksessa syytetyn katsottiin syyllistyneen noituuteen. Viimeinen noituudesta tuomittu teloitettiin 1600-luvun lopulla, mutta viimeinen noitaoikeudenkäynti järjestettiin vasta vuonna 1712.

– Englannissa noituudesta tuomittuja ei muuten poltettu roviolla, vaan kuolemantuomio pantiin käytäntöön hirttämällä, alun perin historiaa opiskellut ja myöhemmin nykykielten laitoksella englannin kieleen keskittynyt Carla Suhr tarkentaa.