Koropleettikartta ja pohdintaa luokista

Aineiston valikointi ja tuonti QGIS:iin

(Kirjoitettu alunperin 28.1.2020)
Pääsin lopulta asiaan ja suoritin koropleettikartan laadintatehtävän lopulta yliopiston koneella haastavimman vaihtoehdon mukaan. Latasin kuntakarttapohjan (Kunnat 1:450000 2018) WFS-muodossa tilastokeskuksen palvelimelta (http://geo.stat.fi/geoserver/tilastointialueet/wfs). Tässä yhteydessä tulivat kätevästi tutuksi shp-tiedostomuotoisten vektoriaineistojen lisäksi muut aineistojen tuontimahdollisuudet. Esitettäväksi aineistoksi valitsin THL:n Sotkanet-palvelusta ns. HYTE-kerroin –aineiston vuodelta 2018 (tärkeää, että kuntakarttapohja ja kuntakohtaisesti esitetty aineisto on kerätty samalta vuodelta, koska kuntarajat muuttuvat). Ulkoa tuodut aineistot kannattaa tallentaa QGISissä ensin uudestaan omiksi tiedostoikseen ja avata sen jälkeen uudestaan käyttöön; tämä ainakin itselläni eliminoi erittäin ärsyttävän alkuvaiheen bugin, kun tuotujen aineistojen attribuuttitaulukkoja ei päässyt muokkaamaan (toggle edit ei ollut käytettävissä). Tuntienkaan pohdiskelun jälkeen syy tähän ei selvinnyt – ominaispiirre, joka QGISiä käytettäessä toistuu huomattavan usein, kun eri lähteissä ja formaateissa tuotetut aineistot eivät vaan millään meinaa sopia yhteen tai kommunikoida ohjelman kanssa kunnolla.

Takaisin aineistoon: HYTE-kerroin on Sipilän hallituksen suunnittelema eräänlainen kannustinpalkkio, joka lasketaan 29 prosessi-indikaattorin (kuvaavat kunnan terveydenedistämisen nykytilaa) ja 8 tulosindikaattorin (kuvaavat kunnan tekemistä muutoksista oletettavasti johtuvien viimeisen kahden vuoden aikaisia muutoksia terveydessä ja hyvinvoinnissa), joiden laskemisesta löytyy lisätietoa THL:n Internetsivuilta osoitteesta https://thl.fi/fi/web/hyvinvoinnin-ja-terveyden-edistamisen-johtaminen/hyvinvointijohtaminen/hyvinvointijohtaminen-kunnassa/hyte-kerroin-kannustin-kunnille. HYTE-kerrointa ei hallituspohjan muututtua tulla ottamaan käyttöön kuten alun perin oli vuoden 2021 alusta suunniteltu. On kuitenkin mielenkiintoista tarkastella, miten tämän kertoimen arvot jakautuvat alueellisesti – tämä HYKE-kertoimella maksettava kannustinpalkkio (vaikka onkin suhteellisen pieni) kumuloi ja kärjistää kunnille jaettavaa rahaa kuntalaisten terveydessä tapahtuvista muutoksista riippuen, mikä on potentiaalisesti kyseenalaista, sillä terveyseroissa voi olla alueellisia trendejä, jotka eivät riipu kunnista itsestään. Ensinnäkin, vaikka kunnat itse järjestävät perusterveydenhuoltoa, terveydenhuolto jakautuu kuntia suurempiin sairaanhoitopiireihin ja jos HYKE-kerroin olisi tullut suunnitellusti käyttöön, olisivat näistä toiminnoista vastanneet maakunnat.

Latasin koropleettikarttaa varten HYKE-kertoimen aineiston, johon on laskettu valmiiksi, kuinka monta euroa palkkiota maksettaisiin asukasta kohden. Aineisto on siis valmiiksi suhteutettua ja kelpaa koropleettikartalla esitettäväksi – esitettävät arvot eivät ole absoluuttisia ja riipu siksi esim. suoraan pinta-aloista tai muista vastaavasti arvoja kumuloivista aluerajaustekijöistä. Aineiston liitin karttapohjaan tallentamalla (ja siistimällä) sen ensin csv-tiedostoksi. Tämän tarkempi suorittaminen esitetään oikeastaan kurssikerran 3 harjoitusmateriaalissa, mutta käyn läpi pääkohdat: jotta ulkoa tuodun taulukon voi liittää karttapohjan attribuuttitaulukkoon, pitää yhden sarakkeen (kentän) arvojen olla samoja. Yhdistin aineistot join-toiminnolla ja käytin yhdistävänä sarakkeena kunnan nimeä. Ainoa poikkeama aineistossa tässä sarakkeessa oli Koski Tl –kunnan nimi, joka kartalla oli pelkkä Koski, joten poistin kirjaimet Tl. Koska (ä,ö,å) sisältävät kuntanimet näkyisivät oikein, muutin sekä karttapohjan että tuotavan taulukkoaineiston merkistökoodauksen UTF-8:sta muotoon ISO-8859-4. Lisäksi karttapohjaan sisältyivät HYTE-aineistosta puuttuvat Ahvenanmaan kunnat, joita en lähtenyt erikseen siivoamaan pois – annoin siis tietoisesti tulla näille riveille HYTE-kertoimen arvoiksi NULL-arvoja aineistojen yhdistämisen seurauksena ja hyväksyin sen, että lopullisessa kartassa Ahvenanmaan kunnat eivät näy, kun esitettävää HYTE-kertoimen dataakaan niistä ei ollut saatavilla.

 

Aineiston esittäminen kartalla

Seuraavaksi valitsin esitystavan. Halusin esittää kartalla maksettavan kannustinrahan ääripäät, joten valitsin sinisestä punaiseen liukuvan väriskaalan. Koska nyt emme ehkä ole kiinnostuneita (ainakaan itse en ole) vain kuntien keskinäisestä paremmuudesta vaan enemmänkin niiden suhtautumisesta parametrin (maksettava HYTE-palkkio) suuruuteen sinänsä, en käyttänyt luokkien määrittelyssä Jenks natural breaks –jakoa. Toisin sanoen halusin esittää kartalla jossain määrin sen, että aineisto eli kunnille määritellyt palkkiot ei ole normaalisti jakautunutta (tai lineaarista), vaan käyrä on oikealle vinoutunut eli suurin osa kunnista on keskiarvon yläpuolella; tämä selviää mm. tarkastelemalla histogrammia (kuva 1) luokkajakotyökalun asetuksista. Edellä mainituista syistä valitsin tasaväliset luokat. Saadakseni riittävän erotuskyvyn, päätin luokkien määräksi 10, mutta jätin esittämättä alimman luokan, koska se oli tyhjä (arvot eivät ala nollasta). Koska aineisto painottuu yläpäähän ja alueet tulevat olemaan siksi saman sävyisiä (sinisiä), halusin lisätä visuaalista kontrastia näissä luokissa, joihin suurin osa kunnista kuuluu. Loin siksi sinisen ja punaisen ääripään väliin kolmannen värin (lähes valkoisen vaaleansinisen) – ja koska jakauman huippu eli moodi (ei siis keskiarvo!) arvoltaan ~9,5€ on kohdassa ~75% absoluuttisen skaalan maksimista (12,6€), vein valkoisen värin esittämisalueen huipun tähän kohtaan. Lisäksi, koska esitettävät arvot eivät ala nollasta vaan ensimmäinen arvo (4,2 €) sijoittuu noin kohtaan 30% koko skaalasta, vein punaisen värityksen alkamiskohdan tähän kohtaan 30%. Näin värien tasolla saadaan visuaalisesti maksimaalinen erotuskyky (vrt. kuva 1 ja kuva 2). Lopuksi poistin kolme ensimmäistä tyhjää luokkaa, jolloin tuloksena on 7 tasavälistä luokkaa.

Legendassa visuaalisesti selkeintä olisi esittää luokkarajat tasalukuina, mutta koska osa luokkarajoista pyöristyy ylös- ja osa alaspäin, eivät luokat enää näyttäisi tasavälisiltä. Siispä pitäydyin pitämään legendassa alkuperäiset kahden desimaalin luvut näkyvissä.


Kuva1: Koropleettikartan luokkien väriskaalan optimointia histogrammin avulla

 

Lopputuloksen tarkastelua

Valmiista tuotoksesta (kuva 2) voidaan tehdä mielenkiintoisia havaintoja suurimpien HYTE-palkkion arvojen keskittymisestä suurten kaupunkien ympäristöön – lukuun ottamatta Turkua. Myöskään Jyväskylä, Kuopio ja Joensuu eivät ole aivan ylimmässä luokassa. Lappeenrannan seutu on mielenkiintoinen: HYTE-palkkioiden suurimpaan luokkaan kuuluvat nimenomaan kehyskunnat ilman aluekeskusta. Lisäksi hahmottuu, että pienimmät HYTE-palkkion arvot löytyvät kaupunkiseutujen väliin jääviltä harvaan asutuilta alueilta kuten Suomenselältä ja Savo-Karjalan vesistöisimmistä osista. Alempien luokkien sijoittumisessa hajonta on kuitenkin suurta. Havaintojen tulkinta ja mahdollisten syiden hahmottelu nopealla pohdinnalla on vaikeaa. Varmasti suuret kaupungit hyötyvät HYTE-indikaattoreilla mitaten korkeasta bruttokansantuotteesta, yliopistosairaaloista ja keskimääräistä nuoremmasta väestörakenteesta.
Pikaisesti tarkasteltuna erot huoltosuhteessa (melkein kaikilla yliopistokaupungeilla huoltosuhde n. 50%) eivät pääsääntöisesti näytä selittävän monien kaupunkien yllättävän alhaista sijoitusta – Lappeenrannan osalta tämä on mahdollista huoltosuhteen ollessa yli 60% (lähde: Kuntaliiton Internet-sivut, Tilastokeskuksen aineisto kuntien väestöstä ja ikärakenteesta, luettu 28.1.2020). On mahdollista, että joillakin kaupungeilla tulosindikaattoreiden ollessa jo tavoitetasolla kaupungilla ei ole tarvetta investoida niin suuresti prosessi-indikaattoreihin. Tämä on kuitenkin vain spekulaatiota ja asian selittäminen vaatisi niin syvällistä perehtymistä kaikkiin 37:ään määräytymisindikaattoriin ja niiden keskinäiseen laskennalliseen suhteeseen, ettei se tässä yhteydessä ole mahdollista.


Kuva 2: HYTE-kertoimen arvot euroina kunnan asukasta kohden.

 

Pohdintaa

Koropleettikartan kohdalla palaa mieleeän jälleen sama pohdinta kuin Tomi Kiviluomalla omassa Geoinformatiikan menetelmät (https://blogs.helsinki.fi/tomingeoblogi/2020/01/16/johdanto-kurssille-ja-qgisin-perusominaisuudet/) -kurssiblgogissaan: karttaesityksen analyyttinen ymmärrys vaatii ymmärrystä sen tiedonkeruumenetelmistä, eistystavasta ja näiden mahdollisista motiiveista. Väestöaineiston tapauksessa aineiston ryhmittely, luokkien muodostaminen, jopa esitykseen valittavat värit ja primääridataa kerättäessä myös alueellinen rajaaminen kuntarajoista alkaen vaikuttaa esitettävän tiedon muotoon. Ääriesimerkki valikoivasta väestön rajaamisesta hallinnollisiin alueisiin on esim. niinsanottu Gerrymandering-ilmiö Yhdysvaltojen vaalipiirejä oman puolueen edun motivoimana muodostettaessa. Vaikka tässä kurssityössä on kyse vain informaation esittämisestä, eikä hallinnosta, on hyvä muistaa, että paikkatietoa hyödyntävän hallinnollisen toiminnan perustana on olemassaoleva paikkatieto. Toteutuessaan HYTE-kertoimeen perustuva palkkiomallissa olisi käytetty paikkatietoaineistoa hallinnollis-poliittisten päätösten perustana.

Kyseisestä aineistosta yllä laatimani karttaesityksen lopputulokseen vaikuttavia valintoja, joihin kannatta kiinnittää huomiota, ovat mielestäni aineiston luokkajako ja esittämiseen käytettävät värit; jälkimmäinen vaikuttaa visuaaliseen tarkasteluun piilevästi yllättävän paljon – kartan tuottamaa ensivaikutelmaa ei pidä aliarvioida. Halusin karttaesityksessäni luokkien tasavälisellä valinnalla korostaa, että kunnat eivät ole HYTE-kertoimen arvojen suhteen normaalisti jakautuneita, mikä on luettavissa legendasta – tästä seuraavaa väriasteikon yläpään dominointia visuaalisella tasolla taas halusin täysin vastakkaisesti kompensoida siirtämällä väriskaalan keskikohdan aineistojakauman huipun kohdalle. Vaikka omasta mielestäni ratkaisu on perusteltu, on tällainen ristiriitainen toimenpide ehkä hieman epäortodoksinen ja voi johtaa ainakin mielikuvatasolla ristiriitaisiin tulkintoihin siitä riippuen, mitä katsoo: jos katsoo pelkkää karttaa, voi väriskaalasta tulla mielikuva normaalityyppisestä jakaumasta (tai Jenks-tyyppisestä luonnollisesta luokkajaosta) – legendaa katsoessa taas ilmenee, että aineisto ei noudata normaalijakaumaa. Myös kartan katsojalla on siis vastuunsa, mutta karttaesityksen laatijan on hyvä olla tietoinen lopputulokseen vaikuttavista valinnoistaan ja perustella ne.

 

Lähteet:

 1. Kiviluoma, T. 16.1.2020:
  Johdanto kurssille ja QGIS:in perusominaisuudet. Luettu 28.1.2020
  https://blogs.helsinki.fi/tomingeoblogi/2020/01/16/johdanto-kurssille-ja-qgisin-perusominaisuudet/
 2. THL:n Internetsivut: ” HYTE-kerroin – kannustin kunnille” Luettu 28.1.2020
  https://thl.fi/fi/web/hyvinvoinnin-ja-terveyden-edistamisen-johtaminen/hyvinvointijohtaminen/hyvinvointijohtaminen-kunnassa/hyte-kerroin-kannustin-kunnille
 3. Kuntaliiton Internet-sivut, Tilastokeskuksen aineisto kuntien väestöstä ja ikärakenteesta.
  Luettu 28.1.2020 https://www.kuntaliitto.fi/sites/default/files/media/file/Vaesto-31122018.xlsx

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *