Journeying with social media data

1.10.2018 | Minna Ruckenstein

We will present findings from two projects that work with large social media datasets in The Social and Political Life of Methods -conference at the University of Helsinki. Time: 23rd of October, 12.00-14.30. Place: Unioninkatu 40 (Metsätalo), lecture hall 6. The session is open for all.

Livestream can be accessed here

Methods in action – journeying with social media data

Citizen Mindscapes takes advantage of the discussion forum Suomi24 (“Finland24”) data, opened for research purposes in 2015. The data covers a time period of more than fifteen years and consists of tens of millions online messages in topics such as local affairs, health, food, religion, and celebrity gossip. Its sister project, Smarter Social Media Analytics, studied and developed methods to identify trends and phenomena using a database of one billion Finnish social media messages from various platforms. We bring together scholars with disciplinary backgrounds ranging from statistics and machine learning to sociology and media studies with the aim of demonstrating the consequences that methodological choices have for exploring large digital datasets and subsequent knowledge production. We will show how methods enable us to “see” what is in the social media data by revealing the particular nature and quality of social media discussion data. We emphasize how important it is not to lose sight of the ways in which and by whom the data has been produced. While we present our findings regarding particular datasets, we discuss the strengths and weaknesses of digital methods and demonstrate how by comparing methods and using them alongside each other, we can highlight the different epistemologies and economic and political aims that research on large datasets promotes.

Chair: Minna Ruckenstein

Auli Harju: Peer support and colliding views: Online survey of Suomi24 discussion forum users.

Jussi Pakkasvirta: How to analyze nationalist stereotypes from social media data – from quantitative to qualitative.

Laura Savolainen: The messiness of online forum data as its definitive feature: Trash talk and hyperbole in Suomi24’s discussions on binge eating disorder

Juha Alho: Missing data from the perspective of statistical science

Mika Pantzar: Crawling in big data: Unifying and dividing methodological aims in Citizen Mindscapes

Minna Ruckenstein: Mixed methods and unintended research findings

Mikko Jauho, Salla-Maaria Laaksonen & Juho Pääkkönen: The social life of visualizations in data-intensive social research

Discussants: Jennifer Pybus (Kings College London) and Julia Velkova (University of Helsinki)

Yksin yhdessä — tunnetoisto vertaistukipalstalla

6.3.2018 | Salla-M Laaksonen

Kuva: Julien Mauve

Teksti: Laura Savolainen

Tutkin tunnekeskustelun muotoja Suomi24:n BED -vertaistukipalstalla selvittääkseni, mitkä tunteen jakamiseen liittyvät dynamiikat ja käytännöt ovat luonteenomaisia nimenomaan internetin anonyymille vertaistuelle. BED eli Binge Eating Disorder on ahmintahäiriö, jossa yksilö kuluttaa suuria määriä ruokaa hallitsemattomasti ja lyhyessä ajassa. Se on yleisin syömishäiriö Suomessa (SYLI Ry).

BED-aineisto osoittaa, että vaikka anonyymilla vertaistukipalstalla kynnys paljastaa rankkoja ja arkaluontoisia tunnekokemuksia madaltuu, on emotionaalisen tuen saaminen epävarmaa ja jopa sattumanvaraista. Kommentoijat vaihtuvat nopealla tahdilla, syventyen vain ohi mennen toistensa tilanteisiin. Neuvonantoa yleisempää on vastavuoroinen jakaminen: vertaiskokemusten lukeminen toimii ikään kuin ärsykkeenä oman tunnekokemuksen tunnustamiselle. Tunteiden jakamiseen keskittyvän tutkimuksen mukaan tunteenpurkaus ilman myötätuntoista palautetta ei kuitenkaan tehokkaasti edesauta negatiivisen kokemuksen käsittelyä.

Sosiaalisen median tunneaaltojen on tyypillisesti ajateltu saavan alkunsa tunteen tarttuessa alitajuisesti käyttäjältä toiselle. Kuten huomio vastavuoroisesta jakamisesta osoittaa, tämä epidemiologinen metafora ei sovi kuvaamaan vertaistukikeskustelua: BED-foorumilla tunne ei tartu, vaan pikemminkin toistuu. Keskustelun monotonisuudella on täten kaksi ulottuvuutta: kommentoijien välille ei muodostu todellista dialogia, ja kommentoinnin tunneintensiteetti pysyy useimmiten kutakuinkin vakiona voimistumisen tai laantumisen sijaan.

Käyttäjät hakeutuvat vertaistukipalstalle negatiivisten tunteiden vallassa, ja poistuvat vähin äänin ne ilmaistuaan. Sosiaalinen järjestys ei nouse kestävistä siteistä käyttäjien välillä, vaan ennen kaikkea heidän tunnetilojensa tilapäisistä vastaavuuksista. Keskustelua leimaavan yksin yhdessä- tunnelman taustalta löytyy kuitenkin vahva vaade jaetusta kokemusmaailmasta. Johtopäätökseni on, että palstan vierailijat käyttävät kommunikaatioteknologian kannattelemaa sosiaalisuutta nimenomaan välineellisesti. Vertaistukikeskustelun tarkoitus on tarjota hetkellinen helpotus – ottaa samanaikaisesti vastaan negatiivinen tunne ja osoittaa käyttäjälle, ettei hän ole ainoa, joka kärsii.

Sherry Turkle on sanonut, että ihmiset odottavat yhä enemmän teknologioilta, yhä vähemmän toisiltaan. Tutkimani aineisto osoittaa tämän odotuksen paradoksaalisuuden suhteessa sosiaalisiin medioihin, joiden käyttöarvo määrittyy pitkälti niiden tuottaman ja välittämän vuorovaikutuksen laadun perusteella. Pelkkä kommunikointikapasiteetti itsessään ei riitä täyttämään sosiaalisia ja emotionaalisia tarpeitamme. Jos alustalle ei muodostu yhteisöllistä ja rakentavaa dialogia tukevaa käyttäjäkulttuuria, yksittäisten käyttäjien yritykset säädellä tunteitaan jäävät suuremmalla todennäköisyydellä irrallisiksi avunhuudoiksi.

Esittämiäni huomioita vertaistukikeskustelun välineellisyydestä ei voi yleistää koskemaan kaikkia vertaistukipalstoja: teknologisesti välittyneen vuorovaikutuksen erityispiirteisiin vaikuttavat tärkeiltä osin tutkittavan käyttöliittymän toiminnot ja sen mahdollistamat käyttötavat. Esimerkiksi rekisteröitymistä edellyttävällä vertaistukipalstalla tunnekeskustelu saattaisi saada yhteisöllisempiä muotoja. Erilaiset kommunikointitavat eivät siis ainoastaan välitä vuorovaikutusta vaan myös muovaavat – usein huomaamattamme – vuorovaikutuksellisia lähtökohtiamme ja odotuksiamme.

Lähteet:

Rimé, B. 2009. Emotion Elicits the Social Sharing of Emotion: Theory and Empirical Review. Emotion Review, 1(1), 60-85.
Syömishäiriöliitto (SYLI Ry). 2017. http://www.syomishairioliitto.fi/syomishairiot/syomishairiot8.html
Turkle, S. (2011). Alone together: Why we expect more from technology and less from each other. New York: Basic Books.

Vihapuhe yhtenäistyy

2.3.2018 | Heli T Tissari

Voimakkaat vihan ilmaukset ovat yksi Suomi24-aineiston piirteistä, joita Citizen Mindscapes -projektissakin pohditaan. Tähän liittyen on Puolassa hiljattain julkaistu kielitieteellisen aikakauslehden erikoisnumero (Lodz Papers in Pragmatics, 13: 2, 2017). Siinä käsitellään useita aiheita, joista yksi on vihapuheen samankaltaistuminen kahdessa eri Euroopan maassa, Englannissa ja Puolassa.

Sanojen hakeminen sähköisestä tekstistä on ollut jo kauan varsin yksinkertaista. Tehtävä monimutkaistuu, kun halutaan saada selville sanojen keskinäisiä suhteita. Mikäli netistä hakee vihaa tarkoittavia sanoja, saa vihapuheesta varsin vaillinaisen kuvan. Vihapuheen kirjoittaja ei välttämättä puhu suoraan vihasta. Sen sijaan hän voi käyttää esimerkiksi kirosanoja tai alatyylin sanoja. Tällaiset sanat voivat kertoa vihapuheesta jopa enemmän kuin varsinaiset vihasanat.

Liikkeelle voisi lähteä myös siitä, millaisista aiheista vihapuheen levittäjillä on tapana kirjoittaa ja millaisia sanoja niihin liittyy. Sellaisia suomen kielen sanoja saattaisivat olla vaikkapa mamu tai viherpiipertäjä.

Kielenkäyttö on kuitenkin paljon muutakin kuin pelkkiä sanoja. Kielitieteilijöitä kiinnostaa esimerkiksi, millä tavoin vihaista keskustelua netissä käydään. Yksi tapa tarkastella asiaa on pohtia, onko kyseessä aggressiivinen, vastustajan näkemysten kumoamiseen pyrkivä mielipiteiden vaihto, lumipallomaisesti kasautuva mielipiteiden vyöry vai vapaampi keskustelu, jossa yksittäiset puheenvuorot eivät välttämättä liity kovinkaan tiukasti toisiinsa.

Vihapuheeseen liittyvässä tutkimuksessa on havaittu aste-eroja tunneilmaisussa eri kielten puhujien välillä. Siinä missä puolalaiset nettikirjoittelijat eivät kavahda voimakkaidenkaan sanojen käyttämistä ja vastustajan persoonan halventamista, brittikirjoittelijat ovat kohteliaampia ja sävyisämpiä. Tutkimuksen perusteella vaikuttaa kuitenkin siltä, että puolalaisten ja brittien kielenkäyttö on viime aikoina lähentynyt. Molempien kohdalla voidaan puhua verkossa julkaistujen mielipiteiden radikalisoitumisesta. Viime aikoina on puhuttu paljon myös siitä, että kärjistetyn kriittiset ja negatiiviset kommentit keräävät enemmän nettihuomiota kuin asialliset ja positiiviset kommentit.

On kuitenkin hyvä muistaa, että vihapuhetta on toki tutkittu jo aikaisemminkin, esimerkiksi 1950-luvulla toisen maailmansodan jälkeen. Tuolloin tiettyyn ihmisryhmään kohdistuvan vihan ilmaisussa ja kasvussa tunnistettiin viisi vaihetta. Ensimmäisessä vaiheessa tietystä ihmisryhmästä alettiin puhua ja kirjoittaa kielteisiä asioita. Toisessa vaiheessa heihin otettiin fyysistä etäisyyttä, ja kolmannessa heitä alettiin syrjiä. Neljännessä vaiheessa heihin alettiin kohdistaa väkivaltaa, ja lopulta heitä alettiin tappaa.

Olisiko kielentutkijoiden mahdollista havaintojensa pohjalta estää se, että ihmiset siirtyvät kielteisestä kielenkäytöstä syrjintään ja väkivaltaan? Todennäköisesti tämä ei ole mahdollista yksin kielentutkijoiden voimin, mutta kielentutkijat voivat tarvittaessa soittaa hälytyskelloja tiedottamalla huolestuttavista tutkimustuloksista.

Kiinnostava on myös kysymys, miten ihmisten kielenkäyttö muuttuu siirryttäessä vaiheesta toiseen. Voisi odottaa, että vihan ilmaisut muuttuvat voimakkaammiksi vihan kasvaessa ja että aikaisempia tabuja murtuu. Väkivallan lisääntyessä voidaan kuitenkin myös ottaa käyttöön kaunistelevia ilmaisuja ja asioista voidaan olla vaiti. Kielellä saa halutessaan aikaan pahaa, mutta sitä tarvitaan myös pahan paljastamiseen ja estämiseen.

Teksti: Heli Tissari, Ulla Vanhatalo ja Mari Siiroinen

Tutkimuskirjallisuus:
Kopytowska, Monika & Fabienne Baider. 2017. From stereotypes and prejudice to verbal and physical violence: Hate speech in context. Lodz Papers in Pragmatics 13: 2, 133–152.
Lewandowska-Tomaszczyk, Barbara. 2017. Incivility and confrontation in online conflict discourses. Lodz Papers in Pragmatics 13: 2, 347–367.

Koko julkaisu:
Lodz Papers in Pragmatics 13: 2.

Arjen rauhankone

26.1.2018 | Minna Ruckenstein

Vihapuheeseen ja trolleihin keskittyvä keskustelu sosiaalisesta mediasta on vienyt huomion yhtä lailla tärkeästä ilmiöstä: ihmisten halusta paneutua toisten ongelmiin ja kannustaa toisia vaikeissa elämäntilanteissa. Kuten hankkeemme toteuttamaan Suomi24:n käyttäjäkyselyyn vastannut toteaa, palstoilta ”löytyy yllättävän paljon empaattisia ihmisiä”. Käyttäjien myönteisissä kokemuksissa toistuvat auttaminen ja avun saaminen. Kyselyyn vastanneet kiittävät kirjoittajia, jotka aikaa ja vaivaa säästämättä paneutuvat käytännön pulmiin ja toisten ongelmiin. Moni muistaa tietokoneisiin, esimerkiksi viruksiin tai käynnistysongelmiin saadun ratkaisun. Palstalta pyydettyyn neuvoon tuli vastaus puolessa tunnissa: ”Siitä tuli hyvä mieli”.

Ihmisiä askarruttavat terveydenhuoltoon ruoanlaittoon, remontteihin ja lemmikkieläimiin liittyvät kysymykset. Kysymyksiin löytyy usein jo googlaamalla vastaus. Miksei kakku nouse? Miten leikata koiran kynnet? Vastaukset näihin ja moniin muihin kysymyksiin löytyvät Suomi24-palstoilta.

Kun yhteiskuntatieteilijät suuntaavat katseen verkon negatiivisiin puoliin, vertaistuen merkitys ohitetaan. Citizen Mindcapes –hankkeen näkökulmasta tämä vääristymä ohjaa sitä, miten avointa Suomi24-aineistoa käytetään. Tiedämme aineiston avulla enemmän trollauksesta ja vihan ilmauksista, mutta vertaistuen yhteiskunnallinen arvo on edelleen heikko. Verkossa ilmaistu vertaistuki näyttäytyy puuhasteluna, joka tapahtuu ihmisten välisissä suhteissa, hyvää hyvyyttä. Sen suhdetta laajempiin yhteiskunnallisiin voimiin, kuten oikeudenmukaisuuteen tai yhteiskuntaa lujittaviin verkostoihin, ei nähdä. Kärjistäen: vihapuhe on yhteiskunnallista, mutta vertaistuki on jokaisen oma asia.

Suomi24 on paikka, josta ihmiset ovat hakeneet yli vuosikymmenen ajan elämälleen kaikupohjaa epätietoisuuden ja yksinäisyyden hetkinä. Yksinäisyyteen on vaikea eläytyä, jos siitä ei ole omakohtaista kokemusta. Kaikkihan haluavat joskus olla yksin. Yksinäisyys ei kuitenkaan ole valinta vaan sosiaalista osattomuutta, joka tuottaa syvää inhimillistä kärsimystä.

Elämän sosiaalinen tyhjyys ja autius näyttäytyvät Suomi24 foorumin käyttäjäkyselyssä kiitollisuutena. Vastaukset ovat lyhyitä ja niistä voi vain arvuutella kirjoittajan kokemuksia. Ne kertovat kuitenkin siitä, miten tärkeää on kohdata tukijoita ja samalla tavalla ajattelevia. ”En ole yksin”, kirjoittaa yksi kyselyyn vastanneista. ”Chatti on saattanut pelastaa vuosien varrella ihmishenkiä”, arvelee toinen.

Työttömyys ja taloudellinen huono-osaisuus on helpommin kestettävissä, kun siitä voi vaihtaa kokemuksia. Ihmiset neuvovat toisiaan Kela-asioinnissa, sairauksiin ja eläkkeisiin liittyvissä etuisuuksissa.

Käyttäjäkyselyn vastaajat kertovat, kuinka elämän murroskohdissa palstalta on löytynyt samassa tilanteessa olevia. Raskautta yrittävä on jakanut pettymyksen palstalla kuukautisten alkaessa. Ilo raskauden vihdoin alkaessa on jaettu naisten kesken ja ”odotusajan hermoilut ja ihmeellisyydet toisiamme tukien”. Toinen kirjoittaja kertoo hämmästyneensä avioeron jälkeen kuinka fiksua porukkaa keskustelupalstoilta löytyy: ”Sain laastarisuhteen täältä ja eheydyin ihmisenä.”

Timo Honkelan hieno teos Rauhankone visioi, kuinka tekoäly ja koneoppiminen valjastetaan yhteisymmärryksen ja rauhantyön edistämiseen. Verkon keskusteluissa jauhaa arkisempi rauhankone: ihmisten halu helpottaa toisten elämää ja edistää tulevaisuudenuskoa. Vertaistuen kytkeminen yhteiskunnalliseen hyvän tuottamiseen ei välttämättä vaadi suuria edistysaskelia. Honkelan kuvaamia positiivisia voimia voi käyttää myös olemassa olevien merkitysneuvottelujen ja rauhan eleiden tunnistamiseen. Teknologian kehittämisen ohella tulisi vahvistaa rakentavaa keskustelua ylläpitäviä ihmisvoimia — näille ihmisvoimille on jo nimikin. Heitä kutsutaan moderaattoreiksi tai yhteisömanagereiksi.

Vihan sanat

15.11.2017 | Heli T Tissari

(Photo by Autumn Goodman on Unsplash)

Monet ovat kiinnostuneita siitä, mitä viha on. Meidän kolmen naisen kielentutkijatiimimme halusi tutkia nykysuomea, joten päädyimme käyttämään Suomi 24 -korpusta, johon on kerätty Suomi 24 -keskustelut vuoden 2001 alusta syyskuulle 2016. Tästä mahdollisuudesta saamme kiittää ”Citizen Mindscapes” -projektia, jonka ansiosta nämäkin aineistot olivat käytettävissämme. Vaihtoehtoja sille, mitä aineistoa tutkia, oli paljon jo pelkästään Kielipankin Korp-sivulla, josta voi tällä hetkellä valita peräti 657 korpusta tai osakorpusta. Olisimme voineet tutkia vihasanoja esimerkiksi vuoden 1642 Bibliassa tai jossain muussa kahdestatoista Vanhan kirjasuomen korpuksen osassa.

Päätimme yrittää ymmärtää, mitä suomalaiset tarkoittavat käyttäessään sanoja viha, vihata ja vihainen. Pohdimme kyllä aluksi kovasti jo sitä, mitä sanoja meidän kielitieteilijöina kannattaisi tarkastella. Pelkästään viha*-alkuisia sanoja on suomen kielen sanakirjoissa iso liuta. Mukaan olisi voinut ottaa vaikkapa verbin vihastua tai substantiivin vihaaja. Lisäksi on paljon yhdyssanoja kuten isoviha tai vihamies. Päätimme lähteä liikkeelle kolmesta perussanasta, jotka edustivat kukin eri sanaluokkaa.

Ymmärsimme alusta asti, että meidän olisi mahdotonta analysoida kaikkia valitsemiemme sanojen esiintymiä Suomi 24 -korpuksessa. Pelkästään adjektiivin vihainen puhekielinen muoto vihanen esiintyy kyseisessä aineistossa 1495 kertaa. Päätimme aluksi analysoida noin kolmesataa satunnaista esimerkkiä kustakin sanasta. Lopuksi päädyimme analysoimaan tarkasti vain sata satunnaista esimerkkiä sanaa kohden, koska halusimme pohtia yksityiskohtaisesti, miten niitä käytettiin kussakin virkkeessä. Pohdimme muun muassa sitä, oliko substantiivia viha käytetty lauseessa subjektina. Sellaisissa tapauksissa viha itse ikään kuin tekee ja saa aikaan asioita sen sijaan, että niitä tekisi vihaa tunteva ihminen. Tutkimme myös, oliko kirjoittajilla tapana mainita vihan syitä ja seurauksia.

Kielentutkimuksen näkökulmasta vihaa olisi voinut tutkia monella muullakin tavalla. Eräs suosittu lähtökohta on viime vuosikymmeninä ollut tutkia, esiintyykö eri kielissä samanlaisia, niin kutsuttuja käsitemetaforia. Ymmärtävätkö eri kielten puhujat vihan esimerkiksi ihmisen sisällä kiehuvana nesteenä, joka voi kiehua yli, mistä seuraa räjähdys? Tämänkin tyyppisiä vihjeitä aineistossamme oli. Jos vihaa taas vaikkapa lietsotaan, kielenkäyttäjät ymmärtävät sen mahdollisesti tulena, jota voi kasvattaa ja levittää.

Vihasta käyttämämme kieli sisältää paljon vihjeitä siitä, miten ymmärrämme vihan. Vihan metaforat kertovat esimerkiksi siitä, miten viha leviää ja miten sitä voi hallita. Me asetimme tehtäväksemme määritellä vihasanoja yksinkertaisella noin 65 sanan alkusanakielellä. Totesimme tehtävän melko vaativaksi vaikkakin palkitsevaksi. Huomasimme, että kukin meistä tulkitsi aineistoa hieman eri tavalla. On kuitenkin todennäköistä, että ymmärtäisimme tunteidemme dynamiikkaa paremmin, jos puhuisimme niistä enemmän. Tunteista voi puhua vaikkapa alkusanakielen pohjalta kehitetyn, maallikoillekin sopivan 65 sanan menetelmän avulla.

Heli Tissari, Ulla Vanhatalo ja Mari Siiroinen

Vihan metaforista voi lukea esimerkiksi seuraavasta artikkelista:
Lakoff, George & Zoltán Kövecses. 1987. The cognitive model of anger inherent in American English. Cultural models in language and thought, toim. Dorothy Holland & Naomi Quinn. Cambridge: Cambridge University Press. 195–221.

Vihan aallot

20.9.2017 | Minna Ruckenstein

Media kertoo, kuinka viha laajenee verkon välityksellä ja kyseenalaistaa ihmisten hyvänä pitämän yhteiskunnan. Valeiden levittämisestä on tullut järjestäytynyttä.

Sosiaalisen median moderoijat näkivät jo vuosikymmen sitten vihapuheen ensioireet. Useita foorumeita moderoinut Saga Raippalinna kuvaa, kuinka keskustelut olivat ensin arkoja ja kokeilevia. Vihapuhetta vasta harjoiteltiin.

Sitten alkoivat massapostitukset. Toiminta kehittyi vähitellen päämäärähakuisemmaksi. Epävarmoja keskustelijoita liittyi mukaan, kun raivoa lietsovat viestit yleistyivät. Keskustelujen intensiteettiä kasvatettiin tietoisesti provosoivalla sisällöllä.

Moderoijat hillitsivät valejulkaisujen virtaa poistamalla sääntöjä rikkovaa ja lainvastaista aineistoa. Raippalinna kertoo joutuneensa todistamaan traumatisoivaa ja manipuloivaa sisältöä. Hän tarkisti tietoja, suodatti keskustelujen sisältöä ja yritti ohjata niiden painopistettä muualle. Hän ajatteli, että jos hän jättää sen tekemättä keskustelupalstoilla vellova viha jää elämään ja vahvistuu.

Raippalinna muistelee, kuinka raskasta työ oli. Kun ihmiset miettivät työpäivän päätteeksi mitä ostaisivat lähikaupasta, hänen mielessään pyörivät kidutusvideot ja ihmisarvoa alentavat uudissanat. Hän katseli häiritseviä videoita ja tekstejä vuoden verran ennen kuin perinteinen media kiinnitti niihin huomiota ja poliisi huolestui.

Moderointi ymmärretään usein viestien poistamisena ja palstojen siivoamisena, mutta kyseessä on huomattavasti laajempi toimenkuva. Moderointi on myös yhteisöjen ja keskustelujen hienovaraista ohjaamista. Sosiaalisen median ammattitaitoinen moderointi takaa keskustelukulttuurin laadun. Raippalinnan sanoin: ”Moderointi on parhaimmillaan, kun yhtäkään viestiä ei tarvitse poistaa.”

Citizen Mindscapes -hankkeessa lähestymme sosiaalisen median keskustelua vaimenevina tai vahvistuvina tunneaaltoina. Vihapuhetta on tuotettava lisää, jotta se pysyisi elinvoimaisena. Vihapuheen aallot vahvistuvat, kun ne onnistuvat värväämään mukaansa sivullisia, huolestuneita ja epävarmoja.

Kun teksti on kirjoitettu keskustelupalstalle, raivo on saanut jo elämän. Sitä pitäisi ymmärtää ja siihen pitäisi päästä käsiksi, kun se on vasta muotoutumassa. Tutkimuksellinen painopisteemme on tästä syystä tunnepuheen tuottamisen mekanismeissa.

Stephen King kuvaa hienossa teoksessaan Kirjoittamisesta: muistelmia leipätyöstä (2000) kuinka kirjoittaja kutsuu esiin väkivaltaa, josta hän kirjoittaa. Väkivaltaisista kirjoituksista seuraa väkivaltaa. Vastalääkettä väkivallalle on siirtää keskustelun painopistettä. Tämä onnistuu taitavalla moderointityöllä.

Ammattimoderoijat arvostavat sananvapautta. Vihaa täytyy voida ilmaista, koska liiallinen poliittinen korrektius tuottaa vastareaktion. Kirjoittajien on saatava olla ironisia ja käyttää kieltä, joka koettelee sopivuuden rajoja. Raja menee siinä, ettei keskustelun tule kutsua esiin lisää vihaa tai kehottaa väkivaltaisiin tekoihin. Tämän häilyvän rajan tunnistaminen ja ylläpitäminen niin konevoimin kuin ihmisvoimin on tutkimuksellinen haaste, jota kohti Citizen Mindscapes -tutkijat ovat ottaneet ensiaskelia. Koneluokittajat voivat toimia tarvittavina apuvoimina, mutta ihmismoderaattoreita tarvitaan edelleen vihan ja ironian hienosyiseen erotteluun sekä antoisan keskustelukulttuurin ylläpitämiseen.

Kansalaisjärjestöt ja tutkijat käyttivät koneoppimista vihapuheen tunnistamiseen kunnallisvaaleissa: https://rajapinta.co/2017/06/08/hate-speech-detectionwith-machine-learning-a-guest-post-from-futurice/

Suomi24-käyttäjäkyselyn tuloksia

21.8.2017 | Minna Ruckenstein

Citizen Mindscapes – hankkeessa toteutettiin verkkokysely Suomi24-foorumin käytöstä sekä siihen liittyvistä kokemuksista ja tuntemuksista. Kyselyn linkki oli esillä Suomi24-keskustelualueilla kahden viikon ajan joulukuussa 2016. Kyselyn avasi vajaa 4500 käyttäjää, joista kyselyyn vastasi hieman vajaa 1400 henkeä, mikä oli verkkokyselylle hyvä saavutus.

Vastaajia pyydettiin määrittelemään ovatko he satunnaisia vierailijoita, keskusteluiden lukijoita vai keskusteluihin osallistuvia kirjoittajia. Tämä oli kyselyn ainoa pakollinen kysymys. Satunnaisiksi vierailijoiksi itsensä luokitelleilta kysyttiin taustatietoja, muut eli keskustelufoorumin varsinaiset käyttäjät vastasivat laajempaan kyselyyn, jossa kysyttiin käyttäjien kokemuksia, esimerkiksi näkemyksiä foorumikeskustelun laadusta ja sen annista kirjoittajille ja lukijoille.

Kyselyn perusteella Suomi24-foorumin peruskäyttäjätyypiksi hahmottuu kaupungissa asuva keski-ikäinen mies, joka asuu yhdessä avio- tai avopuolisonsa kanssa. Lapsia ei ole tai he ovat jo muuttaneet kotoa. Yksin asuvia vastaajista oli reilu kolmannes.

Miehiä kyselyyn vastanneista oli 63%, naisia 36%. Vastaajista hieman alle puolet oli iältään neli-viisikymppisiä. 32% oli 60-vuotias tai vanhempi. Noin kolmannes vastanneista asuu suuressa, yli sadantuhannen asukkaan kaupungissa, neljännes asuu pienessä taajamassa tai maaseudulla. Joka kymmenes vastaaja oli kyselyyn vastatessaan työtön. Eläkkeellä oli kolmasosa vastaajista.

Käyttäjäkyselyn toteuttaminen avoimesti verkossa merkitsee, ettei kyselyn tulosten voida nähdä edustavan foorumin koko käyttäjäkuntaa. Vastaajat ovat valikoituneet oman motivaationsa perusteella: osa foorumin käyttäjistä halusi kertoa tutkijoille näkemyksiään keskustelufoorumista, suuri osa ohitti kyselyn kokonaan tai päätti olla vastaamatta siihen sen avattuaan.

Kyselyyn vastanneissa kirjoittajien osuus korostuu suhteessa muihin foorumin käyttäjiin. Vastaajista 39% oli satunnaisia kävijöitä, 17% prosenttia lukijoita ja 44% foorumille kirjoittavia. Kirjoittajilla on usein tiiviimpi suhde foorumiin ja sen keskusteluihin kuin pelkässä lukijaroolissa pysyttelevillä. Näin kirjoittajat olivat todennäköisesti motivoituneempia vastaamaan kyselyyn kuin muut Suomi24-käyttäjät. Kirjoittajien suuri osuus vastaajista antaa mahdollisuuden peilata käyttäjäkyselyn tuloksia käsillä olevaan Suomi24-aineistoon, sillä he ovat olleet mukana keskustelua tuottamassa. Tiedämme nyt enemmän paitsi siitä, keitä keskustelijat ovat, myös siitä, mitä he palstoilla käydystä keskustelusta ajattelevat.

Sukupuolen näkökulmasta kyselyaineisto herättää kiinnostavia kysymyksiä, joita on tarkoitus analysoida tarkemmin. Miesten osuus korostuu erityisesti kirjoittajissa. Kyselyyn vastanneista naisista vain reilu kolmannes kertoo osallistuvansa keskusteluihin. Kirjoittajiksi itsensä määrittelevät vastaajat kommentoivat foorumilla varsin usein, 36% heistä sanoo kirjoittavansa viikoittain, 17% päivittäin.

Kyselytutkimus paljastaa myös käyttäjien jännitteisen suhteen suomalaiseen yhteiskuntaan. Kyselyyn vastanneet ovat varsin tyytyväisiä omaan elämäänsä, ihmissuhteisiinsa ja yhteiskunnalliseen asemaansa. Sen sijaan 40% vastaajista koki olevansa erittäin tyytymätön suomalaisen yhteiskunnan nykytilaan.

Valtaosa vastaajista ei kokenut keskustelun nimettömyyttä tai nimimerkkikirjoittelua häiritseväksi. Kyselyn avovastauksissa, joissa kysyttiin muun muassa vastaajien myönteisiä ja kielteisiä kokemuksia foorumilla, nousi kuitenkin esiin, että vastaajien mielestä rekisteröitymättömyys mahdollisti keskustelupalstoilla häiriköinnin, ”trollauksen” ja vihapuheen. Keskusteluissa häiritsevään sisältöön oli törmännyt joskus puolet vastaajista ja usein kolmannes vastaajista.

Teksti: tutkija Auli Harju, Tampereen yliopisto

Käyttäjäkyselyn toteutti: tutkija Kari Saari, Juvenia – Nuorisoalan tutkimus- ja kehittämiskeskus, Kaakkois-Suomen ammattikorkeakoulu

Puhetta lääkkeistä

10.8.2017 | Minna Ruckenstein

Citizen Mindscapes hanke – allekirjoittanut ja Krista Lagus – aloittivat keväällä 2017 yhteistyön teknologiayritys Futuricen kanssa. Tarjosimme Futuricelle työstettäväksi ideaamme Suomi24- aineiston lääkkeisiin liittyvistä keskusteluista. Marjoriikka Ylisiuruan tekemä Suomi24-aihemallinnus oli osoittanut, että lääkkeet ovat sairauspuheen keskiössä. Lääkkeistä ja niiden annostuksesta, sivuvaikutuksista ja saatavuudesta puhutaan keskusteltaessa diagnosoinnista, oireista, paranemisesta tai päihdeongelmista.Terveystalon kehittämisylilääkäri Päivi Metsäniemi vakuuttui myös aineiston mahdollisuuksista, joten aihetta pyöriteltyämme teimme hakemuksen Futuricen Chilicorn Fund -ohjelmaan. Ohjelman hienous on siinä, että se kanavoi osaamista yhteiskunnallisesti hyödyllisiksi arvioituihin hankkeisiin.

Suomi24-aineiston tekee erityisen kiinnostavaksi, että ihmiset puhuvat lääkkeistä omasta näkökulmastaan, ilman potilas-lääkärisuhteen painolastia. Lääkkeiden voi ajatella olevan alue, jolla ihmiset tekevät ja neuvottelevat terveyttään. Lääkkeet herättävät myös voimakkaita tunteita. Tunteiden tutkimuksen näkökulmasta ihmisen ja lääkkeen suhteen analyysi avaa uudenlaisen näkökulman terveyskokemuksiin.

Lääkenäkökulman yhteiskunnallista merkittävyyttä korostaa tutkimustieto: vain puolet potilaista käyttää lääkkeitä annettujen ohjeiden mukaan. Vapaaehtoisilla potilailla tehdyt tutkimukset antavat siis liian ruusuisen kuvan lääkehoitojen vaikuttavuudesta tai ihmisten ja lääkkeiden kitkattomasta yhteistyöstä. Lääkekuureja jätetään kesken, annokset otetaan epäsäännöllisesti tai ne jäävät vaillinaisiksi. Lääkkeet voivat olla liian kalliita ostettavaksi. Lääkkeitä myös lainaillaan tai vanhoja lääkkeitä uusiokäytetään oireiden pahentuessa.

Toivoimme data-analyysin tuovan lisävalaistusta lääkkeiden käytön arkeen. Mistä lääkkeistä ihmiset keskustelevat Suomi24-palstoilla innokkaimmin ja miksi? Esimerkiksi seuraavat kysymykset ovat kiinnostavia: Mitkä lääkkeet ovat erityisen ristiriitoja herättäviä? Mihin lääkkeisiin ei luoteta? Millaisia tunteita ja sivuvaikutuksia eri lääkkeisiin liitetään?

Futuricen data-analyytikoiden tartuttua aineistoon tutkimuskysymykset täsmentyivät ja muovautuivat uusiksi tiiviissä yhteistyössä. Tunnekulma osoittautui data-analyysin kannalta erityisen haastavaksi, joten siitä luovuttiin toistaiseksi. Sen sijaan analyysityössä piirtyivät luotettavasti esiin lääkkeiden suhteet toisiin lääkkeisiin, lääkkeet ja niiden suhde oireisiin ja annoskoot. Erinomaista työtä tehneet Chang Rajani ja Atte Juvonen tulevat raportoimaan syksyn aikana ratkaistuja ja ratkaisemattomia analyysihaasteita.

Futuricen työn tuloksena on valmistumassa käyttöliittymä – Nettipuoskari – jonka avulla saa nopeita näkymiä siihen, mistä lääkkeistä, lääkeannoksista ja oireista ihmiset puhuvat Suomi24:n keskusteluissa. Seuraavassa vaiheessa lähdemme tutkimaan, millainen työkalu käyttöliittymä on lääkäreille, päihdetyöntekijöille tai tutkijoille ja miten sitä tulisi kehittää eteenpäin. Tähän työhön etsimme parhaillaan yhteistyökumppaneita.

Kuvittelemme, että lääkekeskustelujen purkaminen on arvokasta hoitotyötä tekeville sekä yhteiskunnallisille toimijoille, jotka pohtivat ihmisten lääkesuhdetta resursoinnin tai sääntelyn näkökulmasta. Sairastuneille tai sairastuneiden läheisille tieto voi olla myös kokemuksellisesti tärkeää. Keskustelu lääkkeiden käytöstä voi paljastaa toisenlaisen näkökulman läheisen arkeen tai auttaa vertaamaan omia lääkekokemuksia muiden vastaaviin.

Minna Ruckenstein

Internet, nationalismin kohtalo ja kansalliset stereotypiat

4.11.2016 | pakkasvi

Jussi Pakkasvirta

Internet-aineistoihin ja sosiaaliseen mediaan liittyy laaja yhteiskuntateoreettinen kysymys: elämmekö parhaillaan aikakautta, joka muistetaan myöhemmin uuden ajan alkuna?

Historioitsija Reinhart Koselleck on luonut käsitteen nimeltä ”Sattelzeit”, eli satula-aika. Sen mukaan on olemassa historiallisia kausia, jolloin käsitteet muuttuvat toisenlaisiksi. Yksi tyypillinen tällainen kausi on 1700-luvun loppu ja siitä syntynyt uusi modernin aikakausi, jolloin muodostui kansakunnan tapaisia uusia käsitteitä.

Nationalismin teoriaan Benedict Andersonin tuoma termi anonyymi yhteisöllisyys kuvastaa sitä, miten tiedotusvälineiden ja koulutusjärjestelmien kautta maailman ja ajan ymmärrys 1800-luvulta alkaen muuttui kansakunnissa ja kansallisvaltioissa. Niistä tuli uudenlaisia poliittisia yhteisöjä. Muutos tuotti samanaikaisuuden ja ajan uuden nopeuden – eräänlaisen monikkojen maailman.

Internetin aikana, viimeiset 20 vuotta, on tapahtunut tai tapahtumassa jotain vastaavaa – ja monikkojen maailma on tuhat-kertaistunut äärimmäisen nopeasti. Perinteisestä kollektiivisesta ja kommunikatiivisesta toiminnasta on tullut nyt myös uudenlaista konnektiivista toimintaa, joka mahdollistaa identiteettien nopeita muutoksia ja useita samanaikaisia identiteettejä. Vaihtoehtona nationalismille on lisäksi nähty paikallisuuden ja etenkin urbaanien verkostojen nousu.

Historiankirjoittajat kertovat ehkä myöhemmin, että 2000-luvun alku oli satula-aika, jolloin käsitteet muuttuivat: nationalismin 200-vuotisesta aikakaudesta tuli jotain muuta, ja ihmiskunta siirtyi huomaamattamme verkon ja uuden kommunikaation luomaan aikakauteen.

***

Toisaalta nationalismi tuntuu elävä ja kukoistavan hyvin myös internet-ajassa. Edellä esitetyn vasta-argumenttina voikin esittää, että esimerkiksi verkkokeskustelut ylläpitävät ja vahvistavat nationalismia uudella intensiteetillä. Ylikansallinen virtuaalinen verkko on mahdollistanut aiemmin erillään olleiden ryhmien välisen uudenlaisen viestinnän. Esimerkiksi muukalaisvihamielinen uusnationalismi voidaan ymmärtää ahtaasti dialogina, jossa luodaan stereotyyppisiä vihollis- ja omakuvia. Samalla perinteinen nationalismi on yhä vahvin poliittisen yhteisön resepti, joka on kameleonttimaisesti pystynyt sopeutumaan myös globalisaation vauhtiin.

Nationalismiin liittyy usein stereotypian käsite. Inhimillisessä vuorovaikutuksessa syntyvä poliittinen yhteisö sisältää aina jonkinlaisia ennakkokäsityksiä toisista. Stereotypiat ovat ennakkokäsityksiä, jotka rakentuvat erilaisista havainnoista tai ominaisuuksista. Niiden avulla tuotetaan yksinkertaistettu mielikuva esimerkiksi ihmistyypistä, yleisesti tunnetusta käyttäytymismallista tai luonnetyypistä. Tosimaailman ihmisiä samastetaan johonkin heitä (arvioijan mielestä) erityisen lähellä olevaan stereotypiaan, tai heidän ajatuksiaan tulkitaan stereotypian kautta. Stereotypiat kertovat kohteensa lisäksi myös meistä itsestämme. Niitä viljellään jatkuvasti esimerkiksi naapurikansoja koskevissa vitseissä ja mediassa.

Sosiaalisen median pitkän aikavälin kattavien, laajojen tekstiaineistojen automaattisella analyysilla voi lähestyä uudella tavalla kansallisten stereotypioiden käyttöä ja muutosta. Verkkokeskusteluiden kautta on mahdollista päästään kiinni niihin syvärakenteisiin ja pinttyneisiin käsityksiin, jotka vaikuttavat kansalaisten mielikuviin muista. Laajat kieliaineistot myös täydentävät perinteisten tutkimuskyselyjen ja haastatteluiden tuottamia tietoja, sillä ne sisältävät suuren otannan vapaata keskustelua, jota ei ole rajattu esimerkiksi tutkijan kysymyksillä, ja jossa voi nimimerkin taakse piiloutuen ilmaista voimakkaitakin mielipiteitä. Tällainen aineistolähtöinen lähestymistapa vaatii nykyaikaisia ja helposti suuriin aineistoihin soveltuvia tutkimusmenetelmiä: esimerkiksi Venäjä ja venäläiset mainitaan pelkästään Suomi24-keskustelupalstalla yli 600 000 kertaa.

Työstämmekin nyt Filip Ginterin (Turun yliopisto) ryhmän kanssa Citizen Mindscapes alahanketta, jossa käytämme Suomi24 sosiaalista ”big dataa” kartoittamaan suomalaisten käsityksiä muista maista. Suuren mittakaavan tietokoneanalyysilla voimme ymmärtää ja kuvailla uudella tavalla niitä stereotypioita ja mielipiteitä, joita suomalaisilla on ”maista ja kansoista”. Voimme myös luonnehtia, millä tavoilla näkemykset eri naapurimaista eroavat, tai toisaalta miten ne ovat samanlaisia.

Tai voimme tutkia, miten suomalaisten käsitykset oliivien, fetan ja turistisaarten Kreikasta muuttuvat talouskriisin (2008) ja pakolaiskriisin (2015) hetkillä – tai sitä, miksi suomaiset edelleen ajattelevat stereotyyppisesti, että latinalaisamerikkalaiset ovat laiskoja, iloisia ja aina myöhässä…

Lisälukemista:

J.Pakkasvirta (2016) ”Mitä kulttuurilla voi selittää”, Tieteessä tapahtuu 5/2016 http://ojs.tsv.fi/index.php/tt/article/view/59305

Verkkoon laitettu vapaasti luettavaksi myös J.Pakkasvirta & P.Saukkonen, toim. (2005), Nationalismit, WSOY: https://helda.helsinki.fi/handle/10138/166631

Kielipankki ja Suomi24 Tiedekulmassa 8.11.

3.11.2016 | Salla-M Laaksonen

Kuva: Kielipankki

Mitä voin lainata Kielipankista? -tapahtumassa Tiedekulmassa (Aleksanterinkatu 7, Helsinki) 8. marraskuuta klo 16.30-18.00 tutkijat kertovat, miten he hyödyntävät Kielipankkia. Esillä myös Suomi24-aineisto ja Marjoriikka Ylisiurua, joka työstää väitöskirjaansa aineistoa käyttäen.

Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Suomi24-aineisto tai kielitieteellisin termein korpus on osa Kielipankin tarjontaa.

Marjoriikka Ylisiurua: Keskusteluaiheiden mallinnus suurissa online-aineistoissa
Antti Kanner: Sanan vaivainen merkityksen muuttuminen historiallisessa sanomalehtikorpuksessa
Heidi Jauhiainen: Semanttiset kentät Akkadinkielisissä teksteissä
Hanna Westerlund: Havaintoja säädöskielen sanojen yhteisesiintymistä Kielipankin aineistossa

Kielipankin palveluista vastaa kansallinen FIN-CLARIN-konsortio, jonka muodostavat suomalaiset yliopistot ja tutkimusorganisaatio: yliopistot, Tieteen tietotekniikan keskus CSC ja Kotimaisten kielten keskus.

Suora verkkolähetys tilaisuudesta tämän linkin takana.

Tilaisuus on osa Helsingin yliopistolla 5.10.–2.12.2016 järjestettävää Digital Humanities -tiedeteemaa.