Sports activity research with Twitter data

Why study sports activities?

Being physically active affects us positively in many ways: it prevents many diseases and supports our mental wellbeing. While sedentary lifestyle is becoming more prominent, the effects of physical inactivity become more pronounced on both individual and societal levels. Rates of obesity are on surge, and the cost for society is seen in growing health service bills, longer sick leaves and lost productivity (Lundqvist et al., 2018; Vasankari et al., 2018).

Need for spatial data

Regardless of the importance of the topic, there is quite limited spatial information about physical activities. Most studies focus on people self-reporting their activities and the studies lack the spatial aspect (Sterdt et al., 2014). As there are no official statistics about people’s physical activities, user-generated data, like social media, can serve as a good proxy. The number of social media posts from national parks has been proved to follow the same trends as the official visitor statistics (Heikinheimo et al., 2017; Tenkanen et al., 2017). Similarly, I will try to approximate the sports activities in different parts of the Helsinki Metropolitan area by analysing social media data from Twitter.

Increasing popularity of social media data

The use of social media data in research has become increasingly popular in the course of the last decade. Many researchers have used social media data to extract information about the movement of tourists, impact of natural disasters or discussion about different diseases, to name a few topics (Middleton et al., 2018; Scholz & Jeznik, 2020; Viguria et al., 2020). Some big social media platforms, like Facebook and Instagram, have stopped sharing their data but Twitter has kept their data available for researchers and therefore I am using it in my MSc thesis. Twitter is a free microblogging platform where people can share short messages, links and media content for their followers. From a Twitter database gathered by Digital Geography Lab, I will gather all sport-related tweets and see how they are located in the Helsinki Area.

Geoparsing produces more spatial data

In social media platforms, you can geotag a post, which means attaching location information like coordinates to it. However, only around 1% of the tweets are geotagged, but many tweets mention place names in the text (Lee et al., 2013; MacEachren et al., 2011). I will use Natural Language Processing to analyse the text, extract the location names and convert them to coordinates. This process is called geoparsing and with it I can produce more geographical data to work with. After attaching location information to sports-related tweets where applicable, I will look for spatial patterns in the data. My final results will shed light on questions like:

  • Where are the hotspots and cold spots of sports-related tweets in the Metropolitan area?
  • Does the number of sports facilities in the neighbourhood affect the tweeting activity?
  • Or the socio-economic and educational indicators of the area?

And last but not least:

  • Is Twitter data a suitable indicator of sports activities?

Author:

Sonja Koivisto, University of Helsinki

References:

Heikinheimo, V., Minin, E. Di, Tenkanen, H., Hausmann, A., Erkkonen, J., & Toivonen, T. (2017). User-generated geographic information for visitor monitoring in a national park: A comparison of social media data and visitor survey. ISPRS International Journal of Geo-Information, 6(3). https://doi.org/10.3390/ijgi6030085

Lee, K., Ganti, R., Srivatsa, M., & Mohapatra, P. (2013). Spatio-temporal provenance: Identifying location information from unstructured text. 2013 IEEE International Conference on Pervasive Computing and Communications Workshops, PerCom Workshops 2013, March, 499–504. https://doi.org/10.1109/PerComW.2013.6529548

Lundqvist, A., Männistö, S., Jousilahti, P., Kaartinen, N., Mäki, P., & Borodulin, K. (2018). Terveys, toimintakyky ja hyvinvointi Suomessa – FinTerveys 2017 -tutkimus. Terveyden ja hyvinvoinnin laitos (THL), Raportti 4/2018. In K. S. and S. K. P. Koponen, K. Borodulin, A. Lundqvist (Ed.), Terveyden ja hyvinvoinnin laitos (pp. 38–41). Terveyden ja hyvinvoinnin laitos. http://www.julkari.fi/handle/10024/136223%0Ahttp://www.julkari.fi/bitstream/handle/10024/90832/Rap068_2012_netti.pdf?sequence=1

MacEachren, A. M., Jaiswal, A., Robinson, A. C., Pezanowski, S., Savelyev, A., Mitra, P., Zhang, X., & Blanford, J. (2011). SensePlace2: GeoTwitter analytics support for situational awareness. VAST 2011 – IEEE Conference on Visual Analytics Science and Technology 2011, Proceedings, October, 181–190. https://doi.org/10.1109/VAST.2011.6102456

Middleton, S. E., Kordopatis-Zilos, G., Papadopoulos, S., & Kompatsiaris, Y. (2018). Location extraction from social media: Geoparsing, location disambiguation, and geotagging. ACM Transactions on Information Systems, 36(4). https://doi.org/10.1145/3202662

Scholz, J., & Jeznik, J. (2020). Evaluating Geo-Tagged Twitter Data to Analyze Tourist Flows in Styria, Austria. ISPRS International Journal of Geo-Information, 9(11), 681. https://doi.org/10.3390/ijgi9110681

Sterdt, E., Liersch, S., & Walter, U. (2014). Correlates of physical activity of children and adolescents: A systematic review of reviews. Health Education Journal, 73(1), 72–89. https://doi.org/10.1177/0017896912469578

Tenkanen, H., Di Minin, E., Heikinheimo, V., Hausmann, A., Herbst, M., Kajala, L., & Toivonen, T. (2017). Instagram, Flickr, or Twitter: Assessing the usability of social media data for visitor monitoring in protected areas. Scientific Reports, 7(1), 1–11. https://doi.org/10.1038/s41598-017-18007-4

Vasankari, T., Kolu, P., Kari, J., Pehkonen, J., Havas, E., Tammelin, T., Jalava, J., Koski, H., Pihlainen, K., Kyröläinen, H., Santtila, M., Sievänen, H., Raitanen, J., & Kari, T. (2018). Costs of physical activity are increasing – the societal costs of physical inactivity and poor physical fitness. http://tietokayttoon.fi/documents/10616/6354562/31-2018-Liikkumattomuuden+lasku+kasvaa.pdf/3dde40cf-25c0-4b5d-bab4-6c0ec8325e35?version=1.0

Viguria, I., Alvarez-Mon, M. A., Llavero-Valero, M., del Barco, A. A., Ortuño, F., & Alvarez-Mon, M. (2020). Eating disorder awareness campaigns: Thematic and quantitative analysis using twitter. Journal of Medical Internet Research, 22(7), 1–11. https://doi.org/10.2196/17626

Ketkä liikkuvat talvisin vapaasti käytettävillä ulkoliikuntapaikoilla?

Kaikille avoimia ulkoliikuntapaikkoja on Suomessa tuhansia. Nämä vapaasti käytettävät ja monipuolisesti erilaisia käyttäjiä palvelevat liikkumisympäristöt ovat yhdenvertaisten liikkumismahdollisuuksien selkäranka. Rakennettujen liikkumisympäristöjen, kuten liikunta- ja toimintapuistojen, käyttäjämäärien, käyttäjätyyppien sekä käyttötapojen seuranta on kuntien liikuntapalveluille tuttu haaste. Tämä haaste ilmenee varsinkin alueilla, joilla ei ole vakituista henkilökuntaa paikalla.

YLLI-hankkeen tutkijat pyrkivät vastaamaan tähän haasteeseen jalkautumalla helmikuussa 2021 Jyväskylän Huhtasuon ja Helsingin Kontulan aleilla oleville liikuntapaikoille suorittamaan havainnointia alueiden käyttötavoista ja käyttäjämääristä. Halusimme laajentaa ymmärrystämme siitä, ketkä käyttävät lähiöiden liikkumisympäristöjä, miten niitä pääasiassa käytetään ja miten käyttötavat vaihtelevat eri kellonaikoina ja viikonpäivinä. Havainnoinnin tuottama tieto voi auttaa liikuntapaikkojen saavutettavuuden ja houkuttelevuuden kehittämisessä. Systemaattisesti toteutettuna havainnoinnin avulla voidaan tuottaa aikasarjatietoa myös erilaisten toimenpiteiden vaikuttavuudesta alueiden käyttöön.

SOPARC-havainnointimenetelmä YLLI-hankkeen tutkimuksessa

Jotta usean havainnoinnin tuottama tieto olisi mahdollisimman luotettavaa, on havainnoinnit toteutettava systemaattisesti. YLLI-hankkeen havainnoinneissa käytettiin System for Observing Play and Recreation (SOPARC)-protokollaa. SOPARC on puistojen käyttäjien fyysisen aktiivisuuden ja liikkumisen kontekstin havainnointiin suunniteltu menetelmä, joka perustuu havaintoalueilla olevien ihmisten laskemiseen ja heidän pääasiallisen toimintansa sekä havainnointialueen olosuhteiden havainnointiin tiettynä ajankohtana (McKenzie et. al. 2006). Esimerkki havainnointialueista on nähtävissä kuvassa 1.

YLLI-hankkeen tutkimuksessa havainnointimenetelmää muokattiin hankkeen tavoitteita tukevaksi ja suomen olosuhteisiin soveltuvaksi. Valitsimme ennakolta Huhtasuolta ja Kontulasta havainnointikohteet, jotka jaettiin pienempiin havainnointialueisiin. Jokaiselta havainnointialueelta kirjattiin tiettynä ajankohtana liikuntaympäristöön liittyviä olosuhteita sekä käyttäjien määrä, heidän sukupuolensa ja ikäryhmänsä.

Kuva 1. Kontulan liikuntapuiston havainnointikohde, havainnointialueet ja havainnointisijainnit. Taustakartta: Google Maps.

Havainnointialueet havainnoitiin yksi kerrallaan. Havaintokohteen kaikki alueet havainnoituaan tutkija siirtyi seuraavaan havaintokohteeseen ja kiersi näin kaikki kohteet ennalta sovitussa järjestyksessä. Havainnointi toistettiin jokaisella havaintoalueella neljä kertaa päivässä neljänä päivänä viikossa. Kyseisen havainnointikertojen määrän on todettu tuottavan vertailukelpoiset tulokset myös useammin toteutettujen havainnointikertojen kanssa (14 kertaa päivässä, 7 päivänä viikossa) (Cohen et al. 2011). Havainnoinnit toteutettiin helmikuussa 2021, ja ne uusitaan vielä kesällä 2021 vuodenaikojen vaikutusten vertailua varten.

Havainnointikohteita sekä Jyväskylästä että Helsingistä

Havainnoitavaksi valittiin Helsingistä Kontulan läheisyydestä Kelkkapuisto, Kurkimäen liikuntapuisto, Vesalan liikuntapuisto, Leikkipuisto Lampi ja Kontulan Liikuntapuisto (ks. kuva 1). Jyväskylän Huhtasuolta havainnoitiin Huhtasuon liikuntapuisto, Huhtasuon yhtenäiskoulun piha (iltaisin ja viikonloppuisin), Kangaslammen toimintapuisto, Huhtasuon senioripuisto ja Pupuhuhdan toimintapuisto.

Valitut ympäristöt tarjoavat monipuolisia liikkumismahdollisuuksia. Varustuksia ovat alueesta riippuen hiekka/nurmi/tekonurmikentät, koripallokentät, tenniskentät, leikkitelineet, ulkokuntosalilaitteet, miniareenat ja muut vastaavat liikkumisympäristöt. Seuraavassa on esitelty havainnointikohteet lyhyesti.

Talvella suurin osa havaintokohteista oli pääosin luistelu- ja jääkiekkokäytössä. Moni muu osa alueista, kuten mahdolliset nurmialueet ja koripallokentät olivat lumen peitossa ja siten lähes käyttämättä. Alla esitellyissä tuloksissa käyttäjät havainnoitiin pääosin jääalueilla, alueiden reiteillä tai alueilla olevissa lumikinoksissa (lapset). Koska suurin osa vaihtelevista liikkumismahdollisuuksista oli talvella vaikeasti tai mahdottomasti saavutettavissa, käsitellään tekstin tuloksissa havaintokohteita kokonaisuuksina, eikä yksittäisien havaintoalueiden tarkkuudella.

Jyväskylässä myös Huhtasuon senioripuisto ja Pupuhuhdan toimintapuisto valittiin havainnoitaviksi siitä huolimatta, että alueet ovat talvikunnossapidon ulkopuolella. Halusimme nähdä, onko alueilla käyttäjiä tästä huolimatta. Senioripuiston alue oli täysin lumen peitossa, eikä siellä havaittu ketään kierrosten aikana. Pupuhuhdan toimintapuistossa oli lumessa useita käytön jälkiä ja alueelle tulevaa kevyen liikenteen väylää oli esimerkiksi käytetty pulkkailuun. Havainnoituja ihmisiä Pupuhuhdan toimintapuistossa oli kuitenkin vain 3. Näin ollen Senioripuiston ja Pupuhuhdan toimintapuiston alueet on jätetty laskennallisista keskiarvoista. Huhtasuon yhtenäiskoulun pihaa ei havainnoitu arkipäivisin, joten sekin on jätetty pois keskiarvolaskuista.

Luistelu suosituin harrastemuoto

Havainnointiajankohtana sää oli kylmä. Jyväskylässä havainnointipäivien aikana oli keskimäärin -13 astetta pakkasta, kylmimmän mitatun lämpötilan ollessa -20,9 astetta. Helsingissä vastaavat lukemat olivat -10,4 ja -17,9 astetta pakkasta. Tämä todennäköisesti vaikutti laskevasti ihmisten ulkona liikkumiseen ja siten myös alla oleviin tuloksiin.

Kun lasketaan yhteen kaikkien havainnointikertojen (16) ihmismäärät, eniten käyttäjiä oli Kontulan liikuntapuistossa, jossa havainnoitiin yhteensä 501 henkilöä. Täydet 16 kertaa havainnoiduista ja ainakin joiltain osin talvikunnossapidetyistä alueista vähiten ihmisiä havainnoitiin Kangaslammen toimintapuistossa, jossa havainnoitiin yhteensä 46 henkilöä. Luistelumahdollisuuksia tarjoavissa liikuntapuistoissa (ka. 271) oli enemmän ihmisiä pääasiassa leikki- ja mäenlaskualueita tarjoaviin (ka. 168) havaintokohteisiin verrattuna. Luistelu, jääkiekko ja erilaiset leikit olivat suosituimmat pääasialliset aktiviteetit havaintokohteissa.

Yksittäisten havaintokertojen keskiarvoja tarkastellessa suosituin liikuntaympäristöjen käyttöaika oli iltapäivä 15:30-17:30 (ks. Taulukko 1).

HavainnointikohdeAamuKeskipäiväIltapäiväIlta
Huhtasuo, Jyväskylä
Huhtasuon liikuntapuisto1122523
Huhtasuon yhtenäiskoulu0052
Kangaslammen toimintapuisto0531,5
Kontula, Helsinki
Kelkkapuisto1165028
Kurkimäen liikuntapuisto1102114
Vesalan liikuntapuisto1110146
Leikkipuisto Lampi10531
Kontulan liikuntapuisto17246124
Taulukko 1. Keskimääräiset havainnoitujen henkilöiden määrät per havaintokerta eri ajankohdissa (arkipäivät + viikonloput) Jyväskylän tutkimuskohteissa.

Sukupuolten välisessä vertailussa miehet käyttivät naisia useammin jääalueita tarjoavia liikkumisympäristöjä. Leikkipuistotyyppisillä alueilla havainnoitiin enemmän naisia. Kontulan kelkkapuisto tarjoaa talvella lähinnä mäenlaskuun ja kävelyyn liittyviä liikkumismahdollisuuksia, ja tässä kohteessa naisten ja miesten määrä oli lähellä toisiaan viikon ajalta tarkastellessa (Kuva 2).

Kuva 2. Naisten ja miesten jakauma – Koko viikko / Havaintokohde.

Käyttäjien ikäluokkien välisessä vertailussa liikuntaympäristöjen suurimmaksi käyttäjäryhmäksi nousivat alle 18-vuotiaat käyttäjät lähes kaikilla alueilla (Kuva 3). Iäkkäiden (yli 60-vuotiaiden) määrä oli alhainen. Heitä havainnoitiin lähinnä kohteissa, joissa havainnointialueina oli myös reittityyppisiä alueita kuten hiihtolatuja tai kävelyteitä. On luonnollista, että iäkkäät eivät harrasta jääaktiviteetteja muiden ikäryhmien tavoin. Kun luisteluolosuhteet olivat selkein havaintokohteiden tarjoama liikuntamahdollisuus, jää iäkkäiden osuus vähäiseksi.

Kuva 3. Eri ikäluokkien jakauma – Koko viikko / Havaintokohde.

Talvi luo omat erityispiirteensä liikkumisympäristöille

Talvisissa olosuhteissa liikuntapuistot tarjoavat ihmisille luistelumahdollisuuksia, ja niitä käyttävät varsinkin nuoremmat ikäluokat ja miehet. Miehet pelaavat alueilla tyypillisesti jääkiekkoa ja naiset harrastavat vapaata luistelua. Havainnointien perusteella on tärkeää tarjota sään salliessa asukkaille luisteluolosuhteita, sillä kysyntää selvästi on olemassa.

Luisteluolosuhteiden ohella talvisin käytettävissä olevia liikuntamahdollisuuksia liikunta- ja toimintapuistoissa tarjoavat esimerkiksi ulkokuntosalit sekä leikkitelineet. Leikki- ja kiipeilytelineiden ohella myös lumikinokset osoittautuivat yhdeksi lasten liikkumisympäristöksi rakennetuilla liikuntapaikoilla. Lumihuoltoa suunnitellessa voi olla hyödyllistä sijoittaa esimerkiksi lumikinosten paikka mahdollisimman turvalliselle alueelle, eikä esimerkiksi autotien ja parkkipaikan välille. Lumikinokset voi sijoittaa myös varsinaisten suorituspaikkojen läheisyyteen, mikä mahdollistaa useamman lapsen harrastamisen samanaikaisesti eri ympäristöissä yhden vanhemman valvonnassa.

Lumi ja talviset olosuhteet vaikeuttavat useiden liikkumisympäristöjen käyttöä talvisin. Moni alue on täysin lumen peitossa ja siten käytännössä käyttömahdollisuuksien ulkopuolella. Esimerkiksi ulkokuntosalialueet ovat kuitenkin laitteiden toimintakyvyn puolesta käytettävissä myös talvisin. Usein alueiden käyttäjämäärä ei kuitenkaan itsessään riitä pitämään aluetta lumesta puhtaana. Suuret lumimassat heikentävät ulkokuntosalialueiden käytettävyyttä, ja voivat estää niiden käytön. Mahdollisuuksien mukaan ainakin kulkuväylät ulkokuntosalilaitteille on hyvä pitää avoinna myös talvisin. Varsinkin COVID19-poikkeustilan aikana ulkokuntosalilaitteet mahdollistavat turvallisen tavan toteuttaa lihaskuntoharjoittelua.

Koronaviruksen aiheuttama poikkeustila saattoi myös vaikuttaa esimerkiksi iäkkäiden vähäiseen havainnointiin. Myös hankkeessa kerätyn puhelinhaastattelun perusteella ihmiset välttävät ihmisiä yhteen kerääviä liikkumiskohteita pandemian aikana. Kontaktien välttämisen ohella suurimmalle osalle ikääntyvistä talvisten liikuntapuistojen tarjoamat luistelu-, mäenlasku- ja muut kiipeilyleikkimahdollisuudet eivät sovellu esimerkiksi kaatumis- ja loukkaantumisriskin myötä. Heille kävely- ja hiihtoreittien ylläpito sekä esimerkiksi ulkokuntoilulaitteet ovat myös talvella käytettävissä ja potentiaalisia olevia liikkumisympäristöjä.

Kirjoittajat:

Janne Pyykönen & Ilkka Virmasalo (Jyväskylän yliopisto)

Lähteet:

McKenzie, T., Cohen, D., Sehgal, A., Williamson, S. & Golinelli, D. 2006. System for Observing Play and Recreation in Communities (SOPARC): Reliability and Feasibility Measures. Journal of Physical Activity 3(1), 208-222.

Cohen, D., Setodji, C., Evenson, K., Ward, P., Lapham, S., Hillier, A. & McKenzie, T. 2011. How Much Observation Is Enough? Refining the Administration of SOPARC. Journal of Physical Activity 8(8), 1117-1123.

Sonja Koivisto started in November 2020 as a research assistant in YLLI-project

Photo: Sonja Koivisto

Sonja is a Master’s student in geoinformatics in the Department of Geosciences and Geography, University of Helsinki. She started in November 2020 as a research assistant in YLLI-project. In her studies and research, Sonja is interested in learning more about big data analytics and possibilities of social media data in research. She did her Bachelor’s degree in human geography, at the University of Helsinki as well. As a research assistant and Master’s thesis writer in YLLI-project, she is now working with Twitter data as an indicator of sports activities in the Helsinki Area. The main topics in her work revolve around content analysis for social media data, assessing and optimizing geoparsing methods as well as validating and complementing social media data with other data sources. Welcome to join our research team!

New postdoctoral researcher started in the project – welcome Pengyuan Liu

Pengyuan Liu started as a postdoctoral researcher in the YLLI-project (Equality in suburban physical activity environments / Yhdenvertainen liikunnallinen lähiö (YLLI)) in January 2021. He has a computer science background — He finished his BSc in Network Engineering at the Nanjing University of Post and Telecommunication in China 2011-2015, followed by his MSc in Cloud Computing at the University of Leicester in the UK 2015-2016. After his MSc, he did his PhD in Digital Geography with a specific focus on geographical artificial intelligence (GeoAI) and user-generated content (UGC) analysis at the University of Leicester. His research focuses on exploring how the content production of UGC can inform our understanding of place representations and indicate places’ socio-economic characteristics. His research interests cover the disciplines of geographic information science, GeoAI, urban analytics and quantitative human geography. In the YLLI-project, he will contribute to the social media data analysis.

Charlotte van de Lijn started as postdoctoral researcher in the project

Charlotte van der Lijn is a new Postdoctoral Researcher in the YLLI-project at the University of Helsinki, Department of Geosciences and Geography. She started in the beginning of December 2020.

She has completed her university courses in the UK – Her undergraduate degree was in BA Human Geography with a year abroad in Oulu at the University of Leicester 2012–2016, followed by her MSc in Applied Geographic Information Systems at the University of Sheffield 2016-2017. Her thesis was based on increasing accessibility for the visually impaired population in the Peak District National Park, Sheffield, UK using GIS analyses. Her PhD is in Urban Studies and Planning at the University of Sheffield 2017–2020. She researched online housing search in the UK with Rightmove data using novel GIS methods to identify the spatial extent of housing market areas. Her research interests are: applied spatial analysis and GIS, social-inequality, and collective/individual decision-making. In the YLLI-project she will contribute to the GIS data analysis and accessibility modelling.

Photo: archives of Charlotte van der Lijn