Kielitiede lääketieteen apuna

kielitiedeAutismin lääketieteellisen diagnoosin teolle voi tulevaisuudessa olla hyötyä kielitieteellisestä tutkimuksesta.

Nykykielen laitoksen tutkija Mari Wiklund kiinnostui autismista vuosia sitten. Hän tunsi harrastustensa kautta Asperger-diagnoosin saaneen henkilön ja halusi selvittää, mistä sairaudessa on kyse.

Lue koko juttu Humanistilehdestä

Vieraan kielen puhujat käyttävät ilmaisuja epämääräisemmin

Miksi joskus tuntuu siltä, ettei koskaan pysty puhumaan toista kieltä virheettömästi? Tuore väitöstutkimus osoittaa, että puhujan sanaston rakenteet ja sanojen käyttöprosessit ovat vieraalla kielellä hyvin samankaltaisia kuin äidinkielessä.

Väittelijä Svetlana Vetchinnikovan tutkimuskohteena olivat useammasta sanasta muodostuvat merkitysyksiköt eli kokonaisuuden muodostavat ilmaukset. Hän tutki mm. merkitysyksikön sisällä tapahtuvaa variaatiota eli sitä, miten ilmaisun sanamuoto vaihtelee puhujan mukaan.

Frekvenssi selittää ilmaisussa esiintyvän vaihtelun

Väitöstutkimus osoittaa, että ilmaisussa tapahtuvaa vaihtelua selittää frekvenssi eli se, kuinka usein kyseistä ilmaisua käytetään. Muutosta tapahtuu kahteen eri suuntaan: ilmaisu joko vakiintuu tai sen rakenne löyhenee, jolloin ilmaisun voi muotoilla monilla eri tavoilla.

Ilmaisun runsas käyttö saa sen usein vakiintumaan tiettyyn sanamuotoon. Näin on käynyt esimerkiksi sanonnoille: ne on muodostettava juuri tietyillä sanoilla, jotta kuulija tunnistaa, mitä puhuja tarkoittaa.

Kaikilla yleisilläkään ilmaisuilla ei ole vakiintunutta muotoa: puhuja voi esimerkiksi vaihdella ilmaisussa se tekee minut hulluksi viimeistä komponenttia it drives me crazy/mad/nuts ilman, että merkitys millään tavalla muuttuu.

Sekä äidinkieliset että vieraan kielen puhujat muuttavat ilmaisuiden sanamuotoa. Äidinkielen puhujilla on usein se etu, että koska he ovat altistuneet kielelleen enemmän kuin sitä vieraana kielenä puhuvat, he tuntevat vakiintuneet ilmaisut paremmin.

Jumiutumista ja likiarvoja

Vetchinnikova tarkasteli Helsingin yliopiston opiskelijoiden käyttämää englannin kielen sanastoa heidän omissa teksteissään ja sana-assosiaatiotesteissä. Englanti oli vieras kieli kaikille tutkimuksen osallistujille.

Tutkimuksessa kävi ilmi, että mitä yleisempi ilmaus on, sitä paremmin puhujat osaavat käyttää sitä tarkasti. Opittu ilmaus saattaa vakiintua henkilön puheeseen liikaakin, jos hän jumiutuu käyttämään samaa ilmausta jatkuvasti.

– Ilmauksen vakiintumisilmiö (fixing) on tuttu esimerkiksi esiintyjille, jotka ovat pitäneet saman puheen tai luennon monta kertaa: samat ilmaukset päädytään toistamaan melkein samoin sanoin jokaisella esityskerralla, Vetchinnikova selittää.

Ilmauksia, joita puhuja käyttää tai kuulee harvoin, ei tuoteta aivan sanatarkasti. Tällöin puhuja käyttää ilmaisua ns. likiarvona (approximation) eli korvaa jonkin ilmauksen osan esimerkiksi toisella lähes samaa tarkoittavalla sanalla.

– Kun henkilö vaikkapa etsii kirjastosta kirjaa, hänellä voi olla kirjan nimestä hieman epätarkka muistikuva: oliko se Looking at the Sun vai Gazing at the Sun, kun itse asiassa nimi onkin Staring at the Sun, Vetchinnikova havainnollistaa.

Kyse on siitä, että puhujat muistavat paremmin ilmauksen merkityksen kuin sen tarkan sanamuodon. Tämä muistin ominaisuus on sama sekä äidinkielisille että vieraan kielen puhujille. Juuri sen takia toisen kielen käyttäjät joskus ”erehtyvät” ja sanovat esimerkiksi so to say eikä so to speak tai to my head eikä to my mind. Kommunikoinnin kannalta tärkeää on, että viestin merkitys menee perille eli kuulija ymmärtää, mitä puhuja tarkoittaa.

– Vieraan kielen käyttö ei enimmäkseen ole virheellistä vaan ainoastaan hieman epämääräisempää, Vetchinnikova sanoo.

Väitös

Svetlana Vetchinnikova väittelee 29.8.2014. Hänen väitöskirjansa tiivistelmineen on ladattavissa E-thesis -palvelussa.

Teksti: Anni Aarinen & Svetlana Vetchinnikova

”I don’t love you anymore” – break up in writing

Suomenkielinen lyhennelmä artikkelista löytyy englanninkielisen version alta.

Letters announcing the end of a romantic relationship share some specific characteristics, finds Lecturer Sabine Kraenker from the Department of Modern Languages. She studied real break-up letters and love break-up in novels published in 2000–2010 for her doctoral dissertation.

The sample included emails, SMSs, letters and diary entries.

The sample included emails, SMSs, letters and diary entries.

The texts that Kraenker analyzed were in French and in the form of letters, emails, SMSs, and in the novels also diary entries. Her corpus included 15 authentic messages written by ordinary people, and 25 fictional texts. Many of the texts were collected from the Association pour l’autobiographie in France.

– It was quite difficult to get copies of real break-up emails because the topic is very private, Kraenker says.

Argumentation and conciliation

The texts were all written in the first person and directly addressed to someone. These letters were typically short and very focused on the subject of the break-up. It was clear that the purpose of the letters was to announce that a love relationship is over.

– Usually when writing a letter, you begin by introducing the purpose why you write. However, it was typical for the break-up letters that the beginning was vaguer and the writer did not state clearly at first what the letter is about, Kraenker describes.

The letters included some reasoning on why the relationship cannot continue. Arguments were used to hide the end of a feeling by giving logical reasons for a change in the leaver’s sentiments. The responsibility of the break-up was often delegated to the two persons involved in the love relationship.

– It was typical that the leaver stated that he or she just doesn’t love the other person anymore, and that’s it, Kraenker says.

The tone of the letters was conciliatory. They were not written in a violent way, and neither tried to accuse the other person nor to make them feel guilty. Interestingly, all of the writers in this sample wanted to continue as friends after the break-up.

Fiction only deals with being left

In fiction, the point of view was almost always that of the person being left. The fictional texts described the suffering that the person was going through after their partner left them. The position of the person who leaves the other seems to be missing from this type of French literature.

Kraenker believes that the classic novel Lettres portugaises published in 1669 has greatly shaped the way French writers, especially women, see break-ups.

– The book describes the suffering of a woman after her man has left her, and portrays the woman as a victim. I think that is partly why it is not easy for French women to be proud and happy of their decision to end a relationship, Kraenker contemplates.

More information

Kraenker’s defense of dissertation takes place on 30 May 2014.

The title of Kraenker’s dissertation thesis is Les écrits de la rupture amoureuse dans les textes de gens ordinaires et la littérature française de l’extrême contemporain (2000-2010). English abstract of the thesis is available.


“En rakasta sinua enää” – näin erotaan viestillä

Parisuhteen päättymisestä ilmoittavilla eroviesteillä on tyypillisiä ominaisuuksia, käy ilmi Helsingin yliopiston tuoreesta tutkimuksesta. Sabine Kraenker tutki väitöskirjassaan sekä tosielämän eroviestejä että rakkaussuhteen päättymiseen liittyviä tekstejä vuosina 2000–2010 julkaistuissa romaaneissa.

Kraenkerin analysoimat tekstit olivat ranskankielisiä kirjeitä, sähköposteja ja tekstiviestejä sekä romaaneissa myös päiväkirjamerkintöjä. Hänen aineistossaan oli 15 aitoa, tavallisen ihmisen kirjoittamaa eroviestiä ja 25 fiktiivistä tekstiä. Monet niistä saatiin Association pour l’autobiographie -yhdistykseltä Ranskasta.

– Oli varsin haastavaa saada kopioita oikeista eroviesteistä aiheen yksityisyyden takia, Kraenker kertoo.

Perustelua ja sovittelua

Kaikki analysoidut tekstit oli kirjoitettu minä-muodossa, ja ne puhuttelivat suoraan tiettyä henkilöä. Viestit olivat tyypillisesti lyhyitä ja keskittyivät hyvin tarkasti eroaiheeseen. Oli selvää, että viestien tarkoitus oli ilmoittaa rakkaussuhteen olevan ohi.

– Yleensä kirjeen alussa kerrotaan, miksi se on kirjoitettu. Eroviesteille oli kuitenkin tavallista, että viestin alku oli epämääräisempi ja kirjoittaja ei heti ilmaissut selkeästi, mitä aihetta viesti käsittelee, Kraenker kuvailee.

Viestit sisälsivät perusteluja sille, miksei rakkaussuhde voi enää jatkua. Argumentteja käytettiin peittelemään tunteiden loppumista: jättäjä esitti loogisia syitä sille, miksi hänen tunteensa ovat muuttuneet.

– Usein jättäjä kuitenkin ilmoitti, että hän ei vaan rakasta kumppaniaan enää, ja se siitä, Kraenker selittää.

Viestien sävy oli sovitteleva. Niillä ei pyritty satuttamaan eikä tarkoitus ollut syytellä toista osapuolta tai yrittää saada häntä tuntemaan syyllisyyttä. Erityistä oli se, että kaikissa Kraenkerin keräämissä viesteissä jättäjä halusi jatkaa eron jälkeen ystävinä.

Lisätietoa

Kraenker väittelee perjantaina 30.5.2014

Väitöskirjan tiivistelmä englanniksi. Väitöskirjan nimi on Les écrits de la rupture amoureuse dans les textes de gens ordinaires et la littérature française de l’extrême contemporain (2000-2010).

Fonetiikka valmistautuu ”big dataan”

Fonetiikka tutkii puhetta. Eräs puheentutkimuksen erityispiirre on aineiston keräämisen ja jaottelun työläys. Tällä hetkellä fonetiikka valmistautuu ison datan läpimurtoon.

Foneettinen tutkimus painottuu puheeseen prosessina, sen tuottamiseen ja havaitsemiseen ja siihen, miten puhe välittyy.

– Fonetiikka voi olla tutkijoille väline, mutta se on myös itsenäinen tutkimusala. On tärkeää tutkia esimerkiksi, miten ihminen omaksuu puhetta, mitä puhuminen on konkreettisena toimintana ja miten se vaikuttaa kielten muotoutumiseen ja moninaisuuteen, selittää tutkija Mietta Lennes nykykielten laitokselta.

Fonetiikalla on paljon yhtymäkohtia muihin tieteenaloihin. Esimerkiksi fonetiikka ja logopedia hyötyvät toisistaan. Puheteknologian alueella foneettista tietoa tarvitaan esimerkiksi laadukkaan puhesynteesin eli keinotekoisen puheen tai automaattisen puheentunnistuksen kehittämiseen. Koska melkein kaikkia maailman kieliä puhutaan, fonetiikalla riittää työsarkaa myös kielitieteissä, esimerkiksi kielten ääntämisen ja murteiden tutkimuksessa.

Lenneksen oma väitöskirja on parhaillaan esitarkastusvaiheessa. Hän on tutkinut sitä, miten suomen sanojen ja esimerkiksi vokaalien ääntäminen vaihtelee vapaassa keskustelupuheessa.

Lennes pyysi kahtakymmentä ystäväparia juttelemaan vapaasti keskenään noin 45 minuutin ajan. Hän äänitti puheen, minkä jälkeen alkoi varsinainen työ. Lennes ja kourallinen fonetiikan opiskelijoita litteroivat, rajasivat ja luokittelivat materiaalia taukojen rajaamiin puhunnoksiin, sanoihin, tavuihin ja äänteisiin.

– Kone ei ymmärrä puhetta, joten äänitetystä raakamateriaalista ei vielä ole hyötyä. Jos materiaalia halutaan tarkemmin tutkia, se pitää annotoida ainakin osaksi käsin, jotta tutkittavat yksiköt tai ilmiöt ja niiden väliset suhteet voidaan paikallistaa, Lennes kertoo.

Puhekorpuksen eli aineiston valmistaminen oli Lenneksen kohdalla vuosien työ. Puheentutkijoilla aineiston keräämiseen ja jäsentelyyn saattaa kulua valtaosa tutkimushankkeen kokonaisajasta. Koska työtä on paljon, on tärkeää, että aineisto säilytetään ja jaetaan myös muille tutkijoille. Tätä tavoitetta edistää Suomessa FIN-CLARIN -hanke, jossa Lennes työskentelee projektisuunnittelijana. Myös Lenneksen käyttämä aineisto on tulossa saataville tutkimustarkoituksiin Kielipankin kautta.

Köydenvetoa määrän ja laadun välillä

Pelkän käsityön varassa tutkijat eivät enää nykyisin ole. On myös kehitetty automaattisia menetelmiä, jotka esimerkiksi tunnistavat puhesignaalista äänteitä ja sanoja tai kohdistavat litteroitua tekstiä äänitiedostojen vastaaviin kohtiin. Automaattiset työkalut eivät kuitenkaan pysty samaan kuin tutkija. Näin päästäänkin ”big datan” eli valtavien aineistomäärien problematiikkaan:

– Automaation käyttöön liittyy köydenvetoa: yhtäältä halutaan paljon dataa, jotta voidaan kehittää automaattisia menetelmiä. Toisaalta data voi olla sotkuista, jos ihminen ei ole sitä käsitellyt ja iso datamäärä pitää kuitenkin lopulta korjata käsin. Vaihtoehdot ovatkin, että joko otetaan pieni aineisto ja käydään se tarkkaan läpi käsin tai käydään laaja aineisto läpi automaattisesti ja hyväksytään, että siinä on virheitä.

– Jos dataa on todella paljon, koneen tuottamat virheet eivät ole enää aineiston käytön kannalta kohtalokkaita, Lennes kertoo.

Lenneksen tutkimus näyttää, miten monella tavalla äännämme vokaalit vapaassa puheessa. Kun Lennes soittaa tallenteelta satunnaisen joukon koehenkilöiden puheessa esiintyvien sanojen vokaaliäänteitä, on helppo huomata, miten paljon vokaalin ääntäminen käytännössä vaihtelee. Esimerkiksi puhekielen ni-sanan i-vokaali kuulostaa koehenkilöiden puheessa välillä e-vokaalilta tai jonkinlaiselta välimuodolta kahden tai useamman vokaalin välillä.

Väitöskirjassaan Lennes pyrkii ymmärtämään äänteiden variaatiota luonnollisessa puheessa ja vuorovaikutuksessa. Miten kuuntelija ymmärtää puhujaa? Miksi emme juuri koskaan sano sanaa kahta kertaa samalla tavalla? Kuinka on mahdollista, että kuulija silti tunnistaa nämä erilaiset tuotokset samaksi sanaksi?

– Ihmiset ovat aika taitavia ennustamaan, mitä toinen ihminen sanoo ja toisaalta puhuja tietää, mitä kuulija odottaa. Mitä yleisempi sana, sitä vähemmän sanan vokaaleja tarvitsee puheessa erotella, ja mitä harvinaisempi sana, sitä selvemmin se yleensä äännetään, tiivistää Lennes.

BB-talo tieteen nimessä

Big data tarkoittaa isoja määriä aineistoa, jonka keräämisen nykyteknologia mahdollistaa.

Kiinnostava esimerkki ison datan käytöstä fonetiikassa löytyy Yhdysvalloista. MIT-yliopiston tutkijaryhmä Deb Royn johdolla asensi Big Brother -tv-ohjelman tyyliin Royn kodin täyteen mikrofoneja ja videokameroita ja tallensi perheen arkea kolmen vuoden aikana 90 000 tuntia eli noin 8–10 tuntia päivässä. Tarkoitus oli tutkia kerätyn tietomäärän avulla, miten Royn lapsi oppi puhumaan. Ted talk -videolla voi kuulla puolen vuoden ajalta kaikki harjoituskerrat, joiden aikana Royn lapsi oppii sanomaan englannin sanan vesi ”water”.

Fonetiikan professori Martti Vainio uskoo, että Suomessa voitaisiin tehdä samantyyppisiä ison aineiston tutkimuksia suomalaisten lasten puheen oppimisesta.

– Tietenkin asiaan liittyy eettisiä ongelmia, kuten yksityisyyden suoja, jotka pitäisi ratkaista.

Vainion mielestä isoja aineistoja voitaisiin käyttää hyväksi myös esimerkiksi vieraan kielen oppimisen tutkimisessa kouluissa.

– Iso data tulee olemaan foneettisten teorioiden koekenttä. Jos tutkimuksen kehityksessä ei ole mukana, jää sen jalkoihin. Siksi on parempi olla suuren aallon edellä, Vainio toteaa.

Fonetiikkaa alakoululaisille

Professori Vainion mukaan fonetiikkaa pitäisi opettaa jo alakoululaisille.

– Fonetiikkaa pitäisi käsitellä äidinkielentunnilla. Fysiikan tunnilla oppilaille opetetaan atomi, samalla tavalla oppilaiden tulisi käsitteellisesti erottaa edes kirjain äänteestä.

Anna-Kaisa Mustaparta Opetushallituksesta ei tyrmää Vainion ajatusta vaan kutsuu tutkijat mukaan opetussuunnitelman uudistustyöhön.

Opetushallituksessa uudistetaan parhaillaan perusopetusta, mutta fonetiikkaa ei opetussuunnitelmassa juuri käsitellä mainintaa lukuun ottamatta. Mustaparta kertoo, että fonetiikan osalta minimioppimistavoite on se, että oppilas osaa peruskoulun käytyään katsoa sanakirjasta foneettisten aakkosten avulla, miten jokin sana äännetään.

Mustaparran mukaan kielenopiskelun tapoihin halutaan lisää vapautta.

– Kannustamme erilaisiin opetustapoihin. Ei ole esimerkiksi mitään pakollisia teemoja, joita tulisi käsitellä.

Helsingin yliopistolla järjestettiin 6.5.2014 seminaari puheen visualisoinnista ja sen suhteesta kielten opetukseen.

Teksti: Heta Muurinen

19 May: Interfaces between Language, Literature and Culture

What: a one-day symposium called Interfaces between Language, Literature and Culture:  Research at Department of Modern Languages

When: on Monday 19 May 2014 from 9:15 am to 5 pm.

Where: in Metsätalo (Unioninkatu 40), 3rd floor, Room 6

Metsätalo, photo by Eeva Anundi

Metsätalo, photo by Eeva Anundi

Department of Modern Languages has a broad array of research interests including language, translation, literature, culture and digital humanities, often in combination. In order to make the research done at the department better known both at University of Helsinki and beyond, we are arranging a one-day symposium.

Since the symposium is open to all, please feel free to attend the entire symposium or any session you might find interesting. Most talks are in English.

In order for us to know how much coffee and tea to have at hand at the coffee break in the afternoon, please register for coffee/tea by Thursday 8 May by using this link: https://elomake.helsinki.fi/lomakkeet/50841/lomake.html

Program

Opening

9:15–9:20 Bo Pettersson (chair), Opening Words

9:20–9:25  Ulla Tuomarla, Greetings from the Department Head

Plenary

 9:25–10:20 Timo Honkela: “Digital Preservation and Computational Modeling of Language and Culture: Some Philosophical and Empirical Aspects”

Variations of English: Major Projects

10:20–10:40 Terttu Nevalainen, “What’s New in Varieng (Research Unit for Variation, Contacts and Change in English)”

10:40–11:00 Minna Palander-Collin, “Language Practices and Social Meanings in the History of English”

11:00–11:20 Minna Nevala, “Language of Evaluation: Constructing the Social Margins in England 1650–1900”

11:20–11:40 Sanna-Kaisa Tanskanen, ”Kielitaidon tasot: Edistyneiden kielenoppijoiden suullinen ja kirjallinen kielitaito”

11:40–11:50 Anna Mauranen, “ChangE Project: How does ELF change English?”

LUNCH BREAK

11:50–13:00 (lunch is not included in the event)

Language, Culture and Style

13:00–13:20 Eva Havu, “Presentation of the Research Community CoCoLaC (Contrasting and Comparing Languages and Cultures)”

13:20–13:35 Juhani Härmä, “Studying 19th-Century Finnish Letters Written in French”

Translation in Various Languages and Media

13:35–13:50 Svetlana Probirskaja ja Päivi Pasanen, ”Sodankäynnin tuntemattomat käännöskulttuurit”

13:50–14:05 Kristiina Taivalkoski-Shilov, ”Sexe=sukupuoli, sukupuolisuus ja/tai/vai seksi? Kaisa Siveniuksen Foucault-suomennoksen vastaanotosta”

14:05–14:20 Olli Philippe Lautenbacher, “Cohesive Structures (and Redundancy) in Subtitled Films”

COFFEE BREAK

14:20–14:45 (Please remember to register so we can prepare the right amount of coffee and tea.)

Literary Studies: Russians and Foxes, Native Americans and Shakespeare

14:45–15:00 Tomi Huttunen, “Research in Russian Literature and Culture”

15:00–15:15 Bo Pettersson, “What Does the Fox Say?”

15:15–15:30 Mark Shackleton, “Native North American Writing”

15:30–15:45 Nely Keinänen, “Shakespeare in Finland”

Computers, Language, Culture

15:45–16:05 Krister Lindén, “FIN-CLARIN (Common Language Resources and Technology Infrastructure): A Research Infrastructure for the Arts”

16:05–16:20 Graham Wilcock, “WikiTalk: Wikipedia-Based Open-Domain Conversations with Humanoid Robots”

16:20–16:35 Georg Gimpl, “Culture, History and Collective Memory: Virtual Museum Russbach – A Microstudy”

Discussion and closing of the symposium