Vihan aallot

Media kertoo, kuinka viha laajenee verkon välityksellä ja kyseenalaistaa ihmisten hyvänä pitämän yhteiskunnan. Valeiden levittämisestä on tullut järjestäytynyttä.

Sosiaalisen median moderoijat näkivät jo vuosikymmen sitten vihapuheen ensioireet. Useita foorumeita moderoinut Saga Raippalinna kuvaa, kuinka keskustelut olivat ensin arkoja ja kokeilevia. Vihapuhetta vasta harjoiteltiin.

Sitten alkoivat massapostitukset. Toiminta kehittyi vähitellen päämäärähakuisemmaksi. Epävarmoja keskustelijoita liittyi mukaan, kun raivoa lietsovat viestit yleistyivät. Keskustelujen intensiteettiä kasvatettiin tietoisesti provosoivalla sisällöllä.

Moderoijat hillitsivät valejulkaisujen virtaa poistamalla sääntöjä rikkovaa ja lainvastaista aineistoa. Raippalinna kertoo joutuneensa todistamaan traumatisoivaa ja manipuloivaa sisältöä. Hän tarkisti tietoja, suodatti keskustelujen sisältöä ja yritti ohjata niiden painopistettä muualle. Hän ajatteli, että jos hän jättää sen tekemättä keskustelupalstoilla vellova viha jää elämään ja vahvistuu.

Raippalinna muistelee, kuinka raskasta työ oli. Kun ihmiset miettivät työpäivän päätteeksi mitä ostaisivat lähikaupasta, hänen mielessään pyörivät kidutusvideot ja ihmisarvoa alentavat uudissanat. Hän katseli häiritseviä videoita ja tekstejä vuoden verran ennen kuin perinteinen media kiinnitti niihin huomiota ja poliisi huolestui.

Moderointi ymmärretään usein viestien poistamisena ja palstojen siivoamisena, mutta kyseessä on huomattavasti laajempi toimenkuva. Moderointi on myös yhteisöjen ja keskustelujen hienovaraista ohjaamista. Sosiaalisen median ammattitaitoinen moderointi takaa keskustelukulttuurin laadun. Raippalinnan sanoin: ”Moderointi on parhaimmillaan, kun yhtäkään viestiä ei tarvitse poistaa.”

Citizen Mindscapes -hankkeessa lähestymme sosiaalisen median keskustelua vaimenevina tai vahvistuvina tunneaaltoina. Vihapuhetta on tuotettava lisää, jotta se pysyisi elinvoimaisena. Vihapuheen aallot vahvistuvat, kun ne onnistuvat värväämään mukaansa sivullisia, huolestuneita ja epävarmoja. 

Kun teksti on kirjoitettu keskustelupalstalle, raivo on saanut jo elämän. Sitä pitäisi ymmärtää ja siihen pitäisi päästä käsiksi, kun se on vasta muotoutumassa. Tutkimuksellinen painopisteemme on tästä syystä tunnepuheen tuottamisen mekanismeissa.

Stephen King kuvaa hienossa teoksessaan Kirjoittamisesta: muistelmia leipätyöstä (2000) kuinka kirjoittaja kutsuu esiin väkivaltaa, josta hän kirjoittaa. Väkivaltaisista kirjoituksista seuraa väkivaltaa. Vastalääkettä väkivallalle on siirtää keskustelun painopistettä. Tämä onnistuu taitavalla moderointityöllä.

Ammattimoderoijat arvostavat sananvapautta. Vihaa täytyy voida ilmaista, koska liiallinen poliittinen korrektius tuottaa vastareaktion. Kirjoittajien on saatava olla ironisia ja käyttää kieltä, joka koettelee sopivuuden rajoja. Raja menee siinä, ettei keskustelun tule kutsua esiin lisää vihaa tai kehottaa väkivaltaisiin tekoihin. Tämän häilyvän rajan tunnistaminen ja ylläpitäminen niin konevoimin kuin ihmisvoimin on tutkimuksellinen haaste, jota kohti Citizen Mindscapes -tutkijat ovat ottaneet ensiaskelia. Koneluokittajat voivat toimia tarvittavina apuvoimina, mutta ihmismoderaattoreita tarvitaan edelleen vihan ja ironian hienosyiseen erotteluun sekä antoisan keskustelukulttuurin ylläpitämiseen.

 

Kansalaisjärjestöt ja tutkijat käyttivät koneoppimista vihapuheen tunnistamiseen kunnallisvaaleissa: https://rajapinta.co/2017/06/08/hate-speech-detectionwith-machine-learning-a-guest-post-from-futurice/

 

Suomi24-käyttäjäkyselyn tuloksia

Citizen Mindscapes – hankkeessa toteutettiin verkkokysely Suomi24-foorumin käytöstä sekä siihen liittyvistä kokemuksista ja tuntemuksista. Kyselyn linkki oli esillä Suomi24-keskustelualueilla kahden viikon ajan joulukuussa 2016. Kyselyn avasi vajaa 4500 käyttäjää, joista kyselyyn vastasi hieman vajaa 1400 henkeä, mikä oli verkkokyselylle hyvä saavutus.

Vastaajia pyydettiin määrittelemään ovatko he satunnaisia vierailijoita, keskusteluiden lukijoita vai keskusteluihin osallistuvia kirjoittajia. Tämä oli kyselyn ainoa pakollinen kysymys. Satunnaisiksi vierailijoiksi itsensä luokitelleilta kysyttiin taustatietoja, muut eli keskustelufoorumin varsinaiset käyttäjät vastasivat laajempaan kyselyyn, jossa kysyttiin käyttäjien kokemuksia, esimerkiksi näkemyksiä foorumikeskustelun laadusta ja sen annista kirjoittajille ja lukijoille.

Kyselyn perusteella Suomi24-foorumin peruskäyttäjätyypiksi hahmottuu kaupungissa asuva keski-ikäinen mies, joka asuu yhdessä avio- tai avopuolisonsa kanssa. Lapsia ei ole tai he ovat jo muuttaneet kotoa. Yksin asuvia vastaajista oli reilu kolmannes.

Miehiä kyselyyn vastanneista oli 63%, naisia 36%. Vastaajista hieman alle puolet oli iältään neli-viisikymppisiä. 32% oli 60-vuotias tai vanhempi. Noin kolmannes vastanneista asuu suuressa, yli sadantuhannen asukkaan kaupungissa, neljännes asuu pienessä taajamassa tai maaseudulla. Joka kymmenes vastaaja oli kyselyyn vastatessaan työtön. Eläkkeellä oli kolmasosa vastaajista.

Käyttäjäkyselyn toteuttaminen avoimesti verkossa merkitsee, ettei kyselyn tulosten voida nähdä edustavan foorumin koko käyttäjäkuntaa. Vastaajat ovat valikoituneet oman motivaationsa perusteella: osa foorumin käyttäjistä halusi kertoa tutkijoille näkemyksiään keskustelufoorumista, suuri osa ohitti kyselyn kokonaan tai päätti olla vastaamatta siihen sen avattuaan.

Kyselyyn vastanneissa kirjoittajien osuus korostuu suhteessa muihin foorumin käyttäjiin. Vastaajista 39% oli satunnaisia kävijöitä, 17% prosenttia lukijoita ja 44% foorumille kirjoittavia. Kirjoittajilla on usein tiiviimpi suhde foorumiin ja sen keskusteluihin kuin pelkässä lukijaroolissa pysyttelevillä. Näin kirjoittajat olivat todennäköisesti motivoituneempia vastaamaan kyselyyn kuin muut Suomi24-käyttäjät. Kirjoittajien suuri osuus vastaajista antaa mahdollisuuden peilata käyttäjäkyselyn tuloksia käsillä olevaan Suomi24-aineistoon, sillä he ovat olleet mukana keskustelua tuottamassa. Tiedämme nyt enemmän paitsi siitä, keitä keskustelijat ovat, myös siitä, mitä he palstoilla käydystä keskustelusta ajattelevat.

Sukupuolen näkökulmasta kyselyaineisto herättää kiinnostavia kysymyksiä, joita on tarkoitus analysoida tarkemmin. Miesten osuus korostuu erityisesti kirjoittajissa. Kyselyyn vastanneista naisista vain reilu kolmannes kertoo osallistuvansa keskusteluihin. Kirjoittajiksi itsensä määrittelevät vastaajat kommentoivat foorumilla varsin usein, 36% heistä sanoo kirjoittavansa viikoittain, 17% päivittäin.

Kyselytutkimus paljastaa myös käyttäjien jännitteisen suhteen suomalaiseen yhteiskuntaan. Kyselyyn vastanneet ovat varsin tyytyväisiä omaan elämäänsä, ihmissuhteisiinsa ja yhteiskunnalliseen asemaansa. Sen sijaan 40% vastaajista koki olevansa erittäin tyytymätön suomalaisen yhteiskunnan nykytilaan.

Valtaosa vastaajista ei kokenut keskustelun nimettömyyttä tai nimimerkkikirjoittelua häiritseväksi. Kyselyn avovastauksissa, joissa kysyttiin muun muassa vastaajien myönteisiä ja kielteisiä kokemuksia foorumilla, nousi kuitenkin esiin, että vastaajien mielestä rekisteröitymättömyys mahdollisti keskustelupalstoilla häiriköinnin, ”trollauksen” ja vihapuheen. Keskusteluissa häiritsevään sisältöön oli törmännyt joskus puolet vastaajista ja usein kolmannes vastaajista.

Teksti: tutkija Auli Harju, Tampereen yliopisto

Käyttäjäkyselyn toteutti: tutkija Kari Saari, Juvenia – Nuorisoalan tutkimus- ja kehittämiskeskus, Kaakkois-Suomen ammattikorkeakoulu

 

Puhetta lääkkeistä

Citizen Mindscapes hanke – allekirjoittanut ja Krista Lagus – aloittivat keväällä 2017 yhteistyön teknologiayritys Futuricen kanssa. Tarjosimme Futuricelle työstettäväksi ideaamme Suomi24- aineiston lääkkeisiin liittyvistä keskusteluista. Marjoriikka Ylisiuruan  tekemä Suomi24-aihemallinnus oli osoittanut, että lääkkeet ovat sairauspuheen keskiössä. Lääkkeistä ja niiden annostuksesta, sivuvaikutuksista ja saatavuudesta puhutaan keskusteltaessa diagnosoinnista, oireista, paranemisesta tai päihdeongelmista.Terveystalon kehittämisylilääkäri Päivi Metsäniemi vakuuttui myös aineiston mahdollisuuksista, joten aihetta pyöriteltyämme teimme hakemuksen Futuricen Chilicorn Fund -ohjelmaan. Ohjelman hienous on siinä, että se kanavoi osaamista yhteiskunnallisesti hyödyllisiksi arvioituihin hankkeisiin.

Suomi24-aineiston tekee erityisen kiinnostavaksi, että ihmiset puhuvat lääkkeistä omasta näkökulmastaan, ilman potilas-lääkärisuhteen painolastia. Lääkkeiden voi ajatella olevan alue, jolla ihmiset tekevät ja neuvottelevat terveyttään. Lääkkeet herättävät myös voimakkaita tunteita. Tunteiden tutkimuksen näkökulmasta ihmisen ja lääkkeen suhteen analyysi avaa uudenlaisen näkökulman terveyskokemuksiin.

Lääkenäkökulman yhteiskunnallista merkittävyyttä korostaa tutkimustieto: vain puolet potilaista käyttää lääkkeitä annettujen ohjeiden mukaan. Vapaaehtoisilla potilailla tehdyt tutkimukset antavat siis liian ruusuisen kuvan lääkehoitojen vaikuttavuudesta tai ihmisten ja lääkkeiden kitkattomasta yhteistyöstä. Lääkekuureja jätetään kesken, annokset otetaan epäsäännöllisesti tai ne jäävät vaillinaisiksi. Lääkkeet voivat olla liian kalliita ostettavaksi. Lääkkeitä myös lainaillaan tai vanhoja lääkkeitä uusiokäytetään oireiden pahentuessa.

Toivoimme data-analyysin tuovan lisävalaistusta lääkkeiden käytön arkeen. Mistä lääkkeistä ihmiset keskustelevat Suomi24-palstoilla innokkaimmin ja miksi? Esimerkiksi seuraavat kysymykset ovat kiinnostavia: Mitkä lääkkeet ovat erityisen ristiriitoja herättäviä? Mihin lääkkeisiin ei luoteta? Millaisia tunteita ja sivuvaikutuksia eri lääkkeisiin liitetään?

Futuricen data-analyytikoiden tartuttua aineistoon tutkimuskysymykset täsmentyivät ja muovautuivat uusiksi tiiviissä yhteistyössä. Tunnekulma osoittautui data-analyysin kannalta erityisen haastavaksi, joten siitä luovuttiin toistaiseksi. Sen sijaan analyysityössä piirtyivät luotettavasti esiin lääkkeiden suhteet toisiin lääkkeisiin, lääkkeet ja niiden suhde oireisiin ja annoskoot. Erinomaista työtä tehneet Chang Rajani ja Atte Juvonen tulevat raportoimaan syksyn aikana ratkaistuja ja ratkaisemattomia analyysihaasteita.

Futuricen työn tuloksena on valmistumassa käyttöliittymä – Nettipuoskari – jonka avulla saa nopeita näkymiä siihen, mistä lääkkeistä, lääkeannoksista ja oireista ihmiset puhuvat Suomi24:n keskusteluissa. Seuraavassa vaiheessa lähdemme tutkimaan, millainen työkalu käyttöliittymä on lääkäreille, päihdetyöntekijöille tai tutkijoille ja miten sitä tulisi kehittää eteenpäin. Tähän työhön etsimme parhaillaan yhteistyökumppaneita.

Kuvittelemme, että lääkekeskustelujen purkaminen on arvokasta hoitotyötä tekeville sekä yhteiskunnallisille toimijoille, jotka pohtivat  ihmisten lääkesuhdetta resursoinnin tai sääntelyn näkökulmasta. Sairastuneille tai sairastuneiden läheisille tieto voi olla myös kokemuksellisesti tärkeää. Keskustelu lääkkeiden käytöstä voi paljastaa toisenlaisen näkökulman läheisen arkeen tai auttaa vertaamaan omia lääkekokemuksia muiden vastaaviin.

Minna Ruckenstein

Internet, nationalismin kohtalo ja kansalliset stereotypiat

Jussi Pakkasvirta

Internet-aineistoihin ja sosiaaliseen mediaan liittyy laaja yhteiskuntateoreettinen kysymys: elämmekö parhaillaan aikakautta, joka muistetaan myöhemmin uuden ajan alkuna?

Historioitsija Reinhart Koselleck on luonut käsitteen nimeltä ”Sattelzeit”, eli satula-aika. Sen mukaan on olemassa historiallisia kausia, jolloin käsitteet muuttuvat toisenlaisiksi. Yksi tyypillinen tällainen kausi on 1700-luvun loppu ja siitä syntynyt uusi modernin aikakausi, jolloin muodostui kansakunnan tapaisia uusia käsitteitä.

Nationalismin teoriaan Benedict Andersonin tuoma termi anonyymi yhteisöllisyys kuvastaa sitä, miten tiedotusvälineiden ja koulutusjärjestelmien kautta maailman ja ajan ymmärrys 1800-luvulta alkaen muuttui kansakunnissa ja kansallisvaltioissa. Niistä tuli uudenlaisia poliittisia yhteisöjä. Muutos tuotti samanaikaisuuden ja ajan uuden nopeuden – eräänlaisen monikkojen maailman.

Internetin aikana, viimeiset 20 vuotta, on tapahtunut tai tapahtumassa jotain vastaavaa – ja monikkojen maailma on tuhat-kertaistunut äärimmäisen nopeasti. Perinteisestä kollektiivisesta ja kommunikatiivisesta toiminnasta on tullut nyt myös uudenlaista konnektiivista toimintaa, joka mahdollistaa identiteettien nopeita muutoksia ja useita samanaikaisia identiteettejä. Vaihtoehtona nationalismille on lisäksi nähty paikallisuuden ja etenkin urbaanien verkostojen nousu.

Historiankirjoittajat kertovat ehkä myöhemmin, että 2000-luvun alku oli satula-aika, jolloin käsitteet muuttuivat: nationalismin 200-vuotisesta aikakaudesta tuli jotain muuta, ja ihmiskunta siirtyi huomaamattamme verkon ja uuden kommunikaation luomaan aikakauteen.

***

Toisaalta nationalismi tuntuu elävä ja kukoistavan hyvin myös internet-ajassa. Edellä esitetyn vasta-argumenttina voikin esittää, että esimerkiksi verkkokeskustelut ylläpitävät ja vahvistavat nationalismia uudella intensiteetillä.  Ylikansallinen virtuaalinen verkko on mahdollistanut aiemmin erillään olleiden ryhmien välisen uudenlaisen viestinnän. Esimerkiksi muukalaisvihamielinen uusnationalismi voidaan ymmärtää ahtaasti dialogina, jossa luodaan stereotyyppisiä vihollis- ja omakuvia. Samalla perinteinen nationalismi on yhä vahvin poliittisen yhteisön resepti, joka on kameleonttimaisesti pystynyt sopeutumaan myös globalisaation vauhtiin.

Nationalismiin liittyy usein stereotypian käsite. Inhimillisessä vuorovaikutuksessa syntyvä poliittinen yhteisö sisältää aina jonkinlaisia ennakkokäsityksiä toisista. Stereotypiat ovat ennakkokäsityksiä, jotka rakentuvat erilaisista havainnoista tai ominaisuuksista. Niiden avulla tuotetaan yksinkertaistettu mielikuva esimerkiksi ihmistyypistä, yleisesti tunnetusta käyttäytymismallista tai luonnetyypistä. Tosimaailman ihmisiä samastetaan johonkin heitä (arvioijan mielestä) erityisen lähellä olevaan stereotypiaan, tai heidän ajatuksiaan tulkitaan stereotypian kautta. Stereotypiat kertovat kohteensa lisäksi myös meistä itsestämme. Niitä viljellään jatkuvasti esimerkiksi naapurikansoja koskevissa vitseissä ja mediassa.

Sosiaalisen median pitkän aikavälin kattavien, laajojen tekstiaineistojen automaattisella analyysilla voi lähestyä uudella tavalla kansallisten stereotypioiden käyttöä ja muutosta. Verkkokeskusteluiden kautta on mahdollista päästään kiinni niihin syvärakenteisiin ja pinttyneisiin käsityksiin, jotka vaikuttavat kansalaisten mielikuviin muista. Laajat kieliaineistot myös täydentävät perinteisten tutkimuskyselyjen ja haastatteluiden tuottamia tietoja, sillä ne sisältävät suuren otannan vapaata keskustelua, jota ei ole rajattu esimerkiksi tutkijan kysymyksillä, ja jossa voi nimimerkin taakse piiloutuen ilmaista voimakkaitakin mielipiteitä. Tällainen aineistolähtöinen lähestymistapa vaatii nykyaikaisia ja helposti suuriin aineistoihin soveltuvia tutkimusmenetelmiä: esimerkiksi Venäjä ja venäläiset mainitaan pelkästään Suomi24-keskustelupalstalla yli 600 000 kertaa.

Työstämmekin nyt Filip Ginterin (Turun yliopisto) ryhmän kanssa Citizen Mindscapes alahanketta, jossa käytämme Suomi24 sosiaalista ”big dataa” kartoittamaan suomalaisten käsityksiä muista maista. Suuren mittakaavan tietokoneanalyysilla voimme ymmärtää ja kuvailla uudella tavalla niitä stereotypioita ja mielipiteitä, joita suomalaisilla on ”maista ja kansoista”. Voimme myös luonnehtia, millä tavoilla näkemykset eri naapurimaista eroavat, tai toisaalta miten ne ovat samanlaisia.

Tai voimme tutkia, miten suomalaisten käsitykset oliivien, fetan ja turistisaarten Kreikasta muuttuvat talouskriisin (2008) ja pakolaiskriisin (2015) hetkillä – tai sitä, miksi suomaiset edelleen ajattelevat stereotyyppisesti, että latinalaisamerikkalaiset ovat laiskoja, iloisia ja aina myöhässä…

Lisälukemista:

J.Pakkasvirta (2016) ”Mitä kulttuurilla voi selittää”, Tieteessä tapahtuu 5/2016 http://ojs.tsv.fi/index.php/tt/article/view/59305

Verkkoon laitettu vapaasti luettavaksi myös J.Pakkasvirta & P.Saukkonen, toim. (2005), Nationalismit, WSOY: https://helda.helsinki.fi/handle/10138/166631

Kielipankki ja Suomi24 Tiedekulmassa 8.11.

Kielipankki

Kuva: Kielipankki

Mitä voin lainata Kielipankista? -tapahtumassa Tiedekulmassa (Aleksanterinkatu 7, Helsinki) 8. marraskuuta klo 16.30-18.00 tutkijat kertovat, miten he hyödyntävät Kielipankkia. Esillä myös Suomi24-aineisto ja Marjoriikka Ylisiurua, joka työstää väitöskirjaansa aineistoa käyttäen.

Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Suomi24-aineisto tai kielitieteellisin termein korpus on osa Kielipankin tarjontaa.

  • Marjoriikka Ylisiurua: Keskusteluaiheiden mallinnus suurissa online-aineistoissa
  • Antti Kanner: Sanan vaivainen merkityksen muuttuminen historiallisessa sanomalehtikorpuksessa
  • Heidi Jauhiainen: Semanttiset kentät Akkadinkielisissä teksteissä
  • Hanna Westerlund: Havaintoja säädöskielen sanojen yhteisesiintymistä Kielipankin aineistossa

Kielipankin palveluista vastaa kansallinen FIN-CLARIN-konsortio, jonka muodostavat suomalaiset yliopistot ja tutkimusorganisaatio: yliopistot, Tieteen tietotekniikan keskus CSC ja Kotimaisten kielten keskus.

Suora verkkolähetys tilaisuudesta tämän linkin takana.

Tilaisuus on osa Helsingin yliopistolla 5.10.–2.12.2016 järjestettävää Digital Humanities -tiedeteemaa.

Suomi24 – julkinen tori ja yksityinen nurkkaus

Muistatko käyneesi turistina jossain tunnetussa mutta täpötäydessä nähtävyydessä? Kenties se oli Firenzen Duomo-kirkon edusta, Venetsian Pyhän Markuksen tori tai Lontoon Trafalgar Square. Tai kenties se oli Helsingin Senaatintori loppukesästä, kun torin ovat vallanneet kymmeniä vieraita kansallisuuksia edustavat kesälomalaiset opaskirjoineen ja selfietikkuineen.

Muistatko pettymyksen, kun laadukkaalta näyttävä torinlaidan kahvila-ravintola onkin ollut ylihinnoiteltu, keskinkertainen kuppila yllättävine ”kymmenen euron pöydänsiivousmaksu”-laskuineen? Tai muistatko miten reagoit, kun myyjän laatuvakuutteluista huolimatta matkamuistokojusta ostamasi teepaita reikiintyikin heti ensimmäisen pesun jälkeen?

Ja muistatko sen löytämisen ilon, kun torin turistilaumat vihaisena jättäessäsi oletkin vahingossa kääntynyt kadunkulmasta väärään suuntaan ja tavannut joukon italialaisia pikkupoikia pelaamassa jalkapalloa kirkon portailla, lontoolaisia esikoululaisia matkalla päiväkotiin vanhempiensa saattamana, turkkilaisia vanhoja herroja juomassa teetä tammipelinsä ääressä, tai bulgarialaisrouvia tukkimassa kioskin ovensuuta naurunrähäkän höystämällä juoruilullaan? Turistitorin vilinältä katveessa pysähdyit kenties hetken mielijohteesta uudestaan kahville, ja lounastaukolaisten jäljessä kärsivällisesti jonotettuasi sait elämäsi parhaan espresson. Sitä hörppiessä turistitorinkin kauneus muistui ehkä jälleen mieleen.

Varsin moni suosittu ja vilkas paikka vaikuttaa ulkopaikkakuntalaisesta hiukan epämääräiseltä ja likaiselta. On monenlaista ohikulkijaa ja hulinaa, ja taskuvarkaita pelkäävällä turistilla voi olla turvaton olo. Etenkään illalla ja yöllä torit eivät aina ole mitenkään rauhallisia paikkoja. Hiukan syrjemmältä voi kuitenkin löytyä hiljainen kaunis puistikko, tai sitten paikallinen korttelipubi kantapeikkoineen.

Tälläinen on myös Suomi24. Se on suomalaisten virtuaalinen kokoontumispaikka, jonka laitamilta löytyy niin aurinkoisia paikkoja kuin varjojakin. Vahingossa satunnaiseen suuntaan kääntymällä on kuitenkin mahdollista törmätä odottamattomiin ihmisjoukkoihin, kuten vaikkapa vilkkaaseen matematiikkakeskusteluun. Analysoimalla keskusteluja algoritmien avulla niistä löytyy suomalaisten ilonaiheita lemmikeistä rakkauden kautta uskon riemuun, mutta myös yksinäisyyttä ja pelkoja. Hulina on todellista Suomi24-kulttuuria, mutta sitä on myös vakavamielisempi maailman pohdinta.

Suomi24 ja kansalaisten mielenliikkeet Tiedekulmassa 1.11.

Mitä uutta suomalaisten mielentilasta? Tiedekulmassa tänään 1. marraskuuta esillä Suomi24-tutkimusta useasta eri näkökulmasta. Tilaisuus on osa Helsingin yliopistolla 5.10.–2.12.2016 järjestettävää Digital Humanities -tiedeteemaa.

Suomi24-aineiston avulla tutkitaan kansalaisten mielenliikkeitä, keskusteluja kannattelevia tunneaaltoja ja sanaston käyttöä. Aineiston voi ajatella sijaitsevan kielellisten ja numeeristen aineistojen ja menetelmällisten lähestymistapojen leikkauskohdassa: eri alojen tutkijoiden kokoontuminen saman aineiston ääreen murtaa tieteenalojen välisiä raja-aitoja.

Ohjelmassa:

  • Krista Lagus: Mistä aiheista ihmiset haluavat lukea ja mistä kirjoittaa?
  • Jussi Pakkasvirta: Miten nationalismia voi tutkia uusilla aineistoilla: kansalliset stereotypiat Suomi24-aineistossa
  • Mika Pantzar: Tunteiden rytmiliike
  • Minna Ruckenstein: Suoli24: keskustelua keskustelusta

Tervetuloa paikan päälle tai seuraamaan suoraa verkkolähetystä täällä.

Ilon ja pelon jäljillä

Sanna Muje Allerin viestinnästä esitti kolme kysymystä Suomi24-aineistosta Wau-sivuston kirjoitusta varten. Toistin moneen kertaan kuultua, mutta ehkä jotain uuttakin tuli mukaan. S24-hackathon-sanapilvi

Mikä Suomi24:n aineistossa on tutkijan näkökulmasta mielenkiintoista?

Tutkimusaineisto on kansainvälisestikin poikkeuksellisen laaja sosiaalisen median tutkimusaineisto. Siihen on tallentunut keskustelua yli vuosikymmenen ajan. Eri alojen tutkijat voivat lähestyä aineistoa hyvin erilaisin menetelmin ja kysymyksin. Aineisto on arvokas niin kielentutkijoille, data-analyytikoille, kulttuurihistorioitsijoille kuin sosiologeillekin.

Mitä Kuluttajatutkimuskeskuksen tutkijaryhmä tekee aineistolla?

Olemme rakentaneet aineiston ympärille Citizen Mindscapes tutkijakollektiivin, jossa kehitetään uudenlaisia tapoja tehdä tutkimusta laajoilla sosiaalisen median aineistoilla. Saimme juuri painosta aineistoraportin, jossa kuvaamme aineistoa ja mahdollisia tutkimuskysymyksiä. Aineiston avulla voi tutkia keskustelujen ajallisia rytmejä tai vaikka sitä, miten niitä luetaan.

Jatkamme myös menetelmäkokeiluja Krista Laguksen vetämässä kokonaisuudessa.  Yritämme päästä kiinni siihen, miten tunteet järjestävät Suomi24-keskustelujen kulkua. Mikä on keskusteluissa ilon aihe? Millaisiin asioihin liittyy pelkoa ja huolta? Näyttää siltä, että perhe ja uskonto ovat ilon aiheita. Terveyteen liittyvät huolet tuntuvat kytkeytyvän erityisesti masennukseen. Pelkoa tuottaa moni asia: Venäjä, synnytys tai helvetti.

Voiko Suomi24 aineiston avaaminen edistää suomalaista dataosaamista?

Ehdottomasti. Aineiston ympärille on jo rakentunut poikkeuksellisen innostavia yhteistyön muotoja. Eri alojen osaajat jakavat omaa osaamistaan ja näkemyksiään. Rakennamme parhaillaan sosiaalisen median analyysityökaluja. Uskomme, että niiden avulla Suomeen syntyy laaja-alaisempi datatutkimuksen osaamisperusta. Pelkkä teknologiaosaaminen ei riitä. Sen rinnalle tarvitaan ymmärrystä ihmisistä ja yhteiskunnasta.

Tutkimusnäkökulmasta olisi toivottavaa, että Allerin esimerkkiä seurattaisiin muissakin yrityksissä. Aineistoja avaamalla voi kasvattaa niiden käyttökelpoisuutta ja arvoa. Yritykselle hyöty voi tulla epäsuorasti, kun opitaan mitä kaikkea aineistoilla ja uusilla menetelmillä voidaan ja kannattaa tehdä. Kansalaista ja kuluttajaa pitää oppia myös suojaamaan. Ihmiset eivät halua, että heistä kerättyä aineistoa käytetään heitä vastaan.

Linkki sivustolle: http://wau.fi/

 

 

Sosiaalinen media – tutkimusaineiston hankala aarrearkku

Huolimatta siitä, että eettisiä ohjeistuksia sosiaalisen median eettiseen tutkimuskäyttöön alkaa olla saatavilla (esim. 1, 2), ovat käytännöt melko kirjavia niin Suomessa kuin maailmallakin. Monesti verkkoaineistojen kanssa luotetaan suoraviivaisesti niiden julkiseen saatavuuteen, eikä sen kummemmin pohdita tutkittavien asemaa. Eettisen ennakkoarvioinnin periaatteet (3) eivät nekään ota kantaa verkkotutkimukseen, vaan keskittyvät lähinnä tutkittavien fyysiseen ja psykologiseen koskemattomuuteen koetilanteessa. Yhteiskuntatieteissä eettisten ennakkoarviointien hakeminen on ylipäänsä varsin harvinaista.

Ihmistieteiden eettisen ohjeistuksen mukaan tutkittavan tulisi vähintäänkin tietää olevansa tutkimuksen kohde. Jo tämä on verkkotutkimuksen kohdalla haasteellista, sillä useinkaan kaikkien verkkokeskustelijoiden identiteetti tai yhteystiedot eivät ole selvitettävissä – näin myös Suomi24-aineiston kohdalla. Siksi varsin harvoin valmiita aineistoja verkosta keräävät tutkijat tekevät analyysiaan tutkimuksen kohteille erityisen tiettäväksi. Joitakin tapoja kuitenkin on — esimerkiksi itse sain aikanaan Turun yliopiston tutkijalta Sari Östmanilta blogiini kommenttina kysymyksen aineiston tutkimuskäytöstä (4).

Sosiaalisen median aineistojen — kuten muidenkin aineistojen — käytössä on aina punnittavana tieteen etu yksilön etua vasten. Kuten Markham ja Buchanan (1) muotoilevat (s. 4): “In different contexts the rights of subjects may outweigh the benefits of research.” Käytännössä sosiaalisen median aineistojen tutkimuskäyttö onkin aina hyvin konteksti- ja aihesidonnaista. Se, että tieto on helposti saatavilla, ei tarkoita, että sen käyttäminen on välttämättä laillista tai eettistä. Erityisen varovainen on oltava silloin, kun tutkittavat ovat esimerkiksi nuoria tai sairaita, tai käsiteltävä aihepiiri on arkaluontoinen.

Omissa tutkimuksissani olen käyttänyt aineistoina enimmäkseen verkkokeskusteluja, jotka liittyvät yrityksiin tai politiikkaan, ja jotka on kerätty avoimista verkkoryhmistä tai -palveluista. Tässä mielessä voimme jossakin määrin turvautua aineistojen julkisuuteen ja varsinkin politiikan kohdalla tutkittavien julkiseen rooliin ja kapeampaan yksityisyydensuojaan. Aineistoissa on kuitenkin myös paljon kansalaisten tuottamaa sisältöä. Esimerkiksi Digivaalit-projektissa (5) 1,5 miljoonan viestin aineistossamme valtaosa sisällöistä on muiden kuin poliittisten toimijoiden tuottamaa. Tutkimuskäyttöön vastikään avattu Suomi24-aineisto (6) puolestaan on käytännössä yksinomaan kansalaisten tuottamaa sisältöä.

Molemmissa hankkeissa aineistot on kerätty ohjelmoidusti suoraan palvelujen rajapintojen kautta. Käsittelemme aineistoja pääasiassa isoina tekstimuotoisina tietokantoina, joissa käyttäjästä on näkyvissä vain nimimerkki (esim. Suomi24, Twitter) tai Facebookin tapauksessa numerotunniste. Lisäksi laskennallisen yhteiskuntatieteen analyyseissa keskitymme usein enemmän tekstimassasta tuotettavaan numeeriseen dataan, aggregoituihin sanalistoihin tai vuorovaikutusyhteyksiin. Hakukoneiden vuoksi yksittäisenkään alkuperäisen tekstipätkän julkaiseminen tieteellisessä julkaisussa on harkittava tarkkoin: alkuperäisen viestin löytää helposti googlaamaalla.

Teknologian rooli ei ole muutenkaan vähäinen. Tutkijan ja tutkittavan lisäksi sosiaalisen median aineistonkeruuseen liittyy aina kolmas osapuoli: alusta, jolla sisältö on julkaistu. Periaatteessa esimerkiksi jokainen Facebookin käyttäjä on hyväksynyt julkisten päivitystensä tutkimuskäytön rajapinnan kautta jo silloin, kun käyttäjä on kirjautunut palveluun ensimmäistä kertaa ja hyväksynyt käyttösäännöt — jokunen ehkä jopa lukenutkin ne. Palveluiden yksityisyysasetukset kuitenkin muuttuvat jatkuvasti niin, että käyttäjien on vaikea pysyä perillä siitä, missä julkisuuden rajat menevät. Poliittisen toimijan kohdalla viestien julkisuus vaikuttaa suunnitellulta, mutta voimmeko yksittäisen kansalaisen kohdalla olla varmoja, että viesti on todella tarkoitettu julkiseksi?

Onneksi sosiaalisen median alustat myös jossakin määrin suojelevat käyttäjiään. Esimerkiksi Facebookin ohjelmointirajapinnan kautta saatavan tiedon määrä on muuttunut vuosi vuodelta vähäisemmäksi. Tällä hetkellä yksittäisten käyttäjien julkaisemia julkisia tilapäivityksiä ei saa rajapinnan kautta tallennettua. Samoin Aller on Suomi24-aineistoa luovuttaessaan rajannut tutkijiden käytössä olevasta aineistosta pois sellaisia tietoja, joiden avulla yksittäisen käyttäjän voisi esimerkiksi paikallistaa kartalle.

On hyvä muistaa, että sosiaalisen median aineistoja hyödyntävät myös muut kuin akateemiset tutkijat, usein kaupallisiin tarkoituksiin. Näistä hyödyntämistavoista tutkimus lienee kilteimmästä päästä. Se ei silti tarkoita, että tieteellisen tutkimuksen tulisi perääntyä eettisistä periaatteistaan. Verkko tarjoaa ainutlaatuisen mahdollisuuden ymmärtää ihmisten sosiaalista toimintaa laajalla skaalalla, ja tähän mahdollisuuteen kannattaa tarttua. Liian huolissaan ei kannata olla: tutkijat ovat aina käsitelleet arkaluontoisia aineistoja, ja meillä on siihen liittyvää ammattitaitoa. Nyt tuo taito täytyy mukauttaa digitaaliselle aikakaudelle ja muistaa pitää pää kylmänä myös verkon mahdollisuuksien edessä.

Teksti: Salla-Maaria Laaksonen, Viestinnän tutkimuskeskus CRC

Kirjoitus on muokattu rinnakkaisjulkaisu huhtikuussa 2016 julkaistusta kommenttipuheenvuorosta: Laaksonen, S-M. (2016). Sosiaalinen media – tutkimusaineiston hankala aarrearkku. Sosiaalilääketieteellinen aikakauslehti / Journal of Social Medicine 53(2), 145-146. [link] [koko teksti Rajapinta-blogissa] [kommentoitava teksti Terkamo-Moisio, Halkoaho ja Pietilä]

Viitteet:

  1. Markham, A., Buchanan, E., & AoIR Ethics Working Committee. 2012. Ethical decision-making and Internet research: Version 2.0. Recommendations from the AoIR Ethics Working Committee. Final Draft, Association of Internet Researchers.
  2. Turtiainen, R. & Östman, S. 2013. Verkkotutkimuksen eettiset haasteet: Armi ja anoreksia. Teoksessa: Laaksonen, S-M; Matikainen, J. & Tikka, M. (toim.). Otteita verkosta. Verkon ja sosiaalisen median tutkimusmenetelmät. Tampere: Vastapaino, s. 49–67.
  3. Tutkimuseettinen neuvottelukunta. 2009. Humanistisen, yhteiskuntatieteellisen ja käyttäytymistieteellisen tutkimuksen eettiset periaatteet ja ehdotus eettisen ennakkoarvioinnin järjestämiseksi.  Luettu 17.2.2016.
  4. Östman, S. 2007. Kommentti blogikirjoitukseen Koulukyytejä blogissa Little Things.  Luettu 18.2.2016.
  5. Helsinki Institute for Information Technology. 2015. Digivaalit 2015. Luettu 19.2.2016
  6. Citizen Mindscapes. nd. Luettu 19.2.2016.