Sosiaalinen media – tutkimusaineiston hankala aarrearkku

Huolimatta siitä, että eettisiä ohjeistuksia sosiaalisen median eettiseen tutkimuskäyttöön alkaa olla saatavilla (esim. 1, 2), ovat käytännöt melko kirjavia niin Suomessa kuin maailmallakin. Monesti verkkoaineistojen kanssa luotetaan suoraviivaisesti niiden julkiseen saatavuuteen, eikä sen kummemmin pohdita tutkittavien asemaa. Eettisen ennakkoarvioinnin periaatteet (3) eivät nekään ota kantaa verkkotutkimukseen, vaan keskittyvät lähinnä tutkittavien fyysiseen ja psykologiseen koskemattomuuteen koetilanteessa. Yhteiskuntatieteissä eettisten ennakkoarviointien hakeminen on ylipäänsä varsin harvinaista.

Ihmistieteiden eettisen ohjeistuksen mukaan tutkittavan tulisi vähintäänkin tietää olevansa tutkimuksen kohde. Jo tämä on verkkotutkimuksen kohdalla haasteellista, sillä useinkaan kaikkien verkkokeskustelijoiden identiteetti tai yhteystiedot eivät ole selvitettävissä – näin myös Suomi24-aineiston kohdalla. Siksi varsin harvoin valmiita aineistoja verkosta keräävät tutkijat tekevät analyysiaan tutkimuksen kohteille erityisen tiettäväksi. Joitakin tapoja kuitenkin on — esimerkiksi itse sain aikanaan Turun yliopiston tutkijalta Sari Östmanilta blogiini kommenttina kysymyksen aineiston tutkimuskäytöstä (4).

Sosiaalisen median aineistojen — kuten muidenkin aineistojen — käytössä on aina punnittavana tieteen etu yksilön etua vasten. Kuten Markham ja Buchanan (1) muotoilevat (s. 4): “In different contexts the rights of subjects may outweigh the benefits of research.” Käytännössä sosiaalisen median aineistojen tutkimuskäyttö onkin aina hyvin konteksti- ja aihesidonnaista. Se, että tieto on helposti saatavilla, ei tarkoita, että sen käyttäminen on välttämättä laillista tai eettistä. Erityisen varovainen on oltava silloin, kun tutkittavat ovat esimerkiksi nuoria tai sairaita, tai käsiteltävä aihepiiri on arkaluontoinen.

Omissa tutkimuksissani olen käyttänyt aineistoina enimmäkseen verkkokeskusteluja, jotka liittyvät yrityksiin tai politiikkaan, ja jotka on kerätty avoimista verkkoryhmistä tai -palveluista. Tässä mielessä voimme jossakin määrin turvautua aineistojen julkisuuteen ja varsinkin politiikan kohdalla tutkittavien julkiseen rooliin ja kapeampaan yksityisyydensuojaan. Aineistoissa on kuitenkin myös paljon kansalaisten tuottamaa sisältöä. Esimerkiksi Digivaalit-projektissa (5) 1,5 miljoonan viestin aineistossamme valtaosa sisällöistä on muiden kuin poliittisten toimijoiden tuottamaa. Tutkimuskäyttöön vastikään avattu Suomi24-aineisto (6) puolestaan on käytännössä yksinomaan kansalaisten tuottamaa sisältöä.

Molemmissa hankkeissa aineistot on kerätty ohjelmoidusti suoraan palvelujen rajapintojen kautta. Käsittelemme aineistoja pääasiassa isoina tekstimuotoisina tietokantoina, joissa käyttäjästä on näkyvissä vain nimimerkki (esim. Suomi24, Twitter) tai Facebookin tapauksessa numerotunniste. Lisäksi laskennallisen yhteiskuntatieteen analyyseissa keskitymme usein enemmän tekstimassasta tuotettavaan numeeriseen dataan, aggregoituihin sanalistoihin tai vuorovaikutusyhteyksiin. Hakukoneiden vuoksi yksittäisenkään alkuperäisen tekstipätkän julkaiseminen tieteellisessä julkaisussa on harkittava tarkkoin: alkuperäisen viestin löytää helposti googlaamaalla.

Teknologian rooli ei ole muutenkaan vähäinen. Tutkijan ja tutkittavan lisäksi sosiaalisen median aineistonkeruuseen liittyy aina kolmas osapuoli: alusta, jolla sisältö on julkaistu. Periaatteessa esimerkiksi jokainen Facebookin käyttäjä on hyväksynyt julkisten päivitystensä tutkimuskäytön rajapinnan kautta jo silloin, kun käyttäjä on kirjautunut palveluun ensimmäistä kertaa ja hyväksynyt käyttösäännöt — jokunen ehkä jopa lukenutkin ne. Palveluiden yksityisyysasetukset kuitenkin muuttuvat jatkuvasti niin, että käyttäjien on vaikea pysyä perillä siitä, missä julkisuuden rajat menevät. Poliittisen toimijan kohdalla viestien julkisuus vaikuttaa suunnitellulta, mutta voimmeko yksittäisen kansalaisen kohdalla olla varmoja, että viesti on todella tarkoitettu julkiseksi?

Onneksi sosiaalisen median alustat myös jossakin määrin suojelevat käyttäjiään. Esimerkiksi Facebookin ohjelmointirajapinnan kautta saatavan tiedon määrä on muuttunut vuosi vuodelta vähäisemmäksi. Tällä hetkellä yksittäisten käyttäjien julkaisemia julkisia tilapäivityksiä ei saa rajapinnan kautta tallennettua. Samoin Aller on Suomi24-aineistoa luovuttaessaan rajannut tutkijiden käytössä olevasta aineistosta pois sellaisia tietoja, joiden avulla yksittäisen käyttäjän voisi esimerkiksi paikallistaa kartalle.

On hyvä muistaa, että sosiaalisen median aineistoja hyödyntävät myös muut kuin akateemiset tutkijat, usein kaupallisiin tarkoituksiin. Näistä hyödyntämistavoista tutkimus lienee kilteimmästä päästä. Se ei silti tarkoita, että tieteellisen tutkimuksen tulisi perääntyä eettisistä periaatteistaan. Verkko tarjoaa ainutlaatuisen mahdollisuuden ymmärtää ihmisten sosiaalista toimintaa laajalla skaalalla, ja tähän mahdollisuuteen kannattaa tarttua. Liian huolissaan ei kannata olla: tutkijat ovat aina käsitelleet arkaluontoisia aineistoja, ja meillä on siihen liittyvää ammattitaitoa. Nyt tuo taito täytyy mukauttaa digitaaliselle aikakaudelle ja muistaa pitää pää kylmänä myös verkon mahdollisuuksien edessä.

Teksti: Salla-Maaria Laaksonen, Viestinnän tutkimuskeskus CRC

Kirjoitus on muokattu rinnakkaisjulkaisu huhtikuussa 2016 julkaistusta kommenttipuheenvuorosta: Laaksonen, S-M. (2016). Sosiaalinen media – tutkimusaineiston hankala aarrearkku. Sosiaalilääketieteellinen aikakauslehti / Journal of Social Medicine 53(2), 145-146. [link] [koko teksti Rajapinta-blogissa] [kommentoitava teksti Terkamo-Moisio, Halkoaho ja Pietilä]

Viitteet:

  1. Markham, A., Buchanan, E., & AoIR Ethics Working Committee. 2012. Ethical decision-making and Internet research: Version 2.0. Recommendations from the AoIR Ethics Working Committee. Final Draft, Association of Internet Researchers.
  2. Turtiainen, R. & Östman, S. 2013. Verkkotutkimuksen eettiset haasteet: Armi ja anoreksia. Teoksessa: Laaksonen, S-M; Matikainen, J. & Tikka, M. (toim.). Otteita verkosta. Verkon ja sosiaalisen median tutkimusmenetelmät. Tampere: Vastapaino, s. 49–67.
  3. Tutkimuseettinen neuvottelukunta. 2009. Humanistisen, yhteiskuntatieteellisen ja käyttäytymistieteellisen tutkimuksen eettiset periaatteet ja ehdotus eettisen ennakkoarvioinnin järjestämiseksi.  Luettu 17.2.2016.
  4. Östman, S. 2007. Kommentti blogikirjoitukseen Koulukyytejä blogissa Little Things.  Luettu 18.2.2016.
  5. Helsinki Institute for Information Technology. 2015. Digivaalit 2015. Luettu 19.2.2016
  6. Citizen Mindscapes. nd. Luettu 19.2.2016.