How can less be more? More is more

Afrikan konfliktit ja resurssit

Tähänastisilla kurssikerroilla aineiston haku tietokannoista ja näistä löytyvien taulukkomuotoisten ja geometristen aineistojen yhteenliittäminen oli tullut yksinkertaisella tasolla kohtalaisen tutuksi, joten nyt on syytä lisätä kierroksia ja mennä hieman syvemmälle. Tämän kerran käyttökelpoisinta antia itselleni oli oppia hyödyntämään Join attributes by location -toiminnon potentiaalia. Siinä missä tähän asti olimme yhdistelleet lähinnä taulukkomuotoisia tietokantoja geometriseen aineistoon ja liimanneet samalle tasolle erilaisia valmiita piste- ja polygonimuotoisia aineistoja, päästiin tehtävissä lisäämään yhden aineistotason geometriatietoa suoraan laskemalla toisen tason attribuuttidataan.

Mutta sitä ennen sananen Afrikan konfliktien, maiden Internetin käyttöasteen ja arvokkaiden kaivannaisten (timantit, öljy) paikkatiedon yhdistävästä karttaesityksestä. Ennen yhdistelyä taulukkomuotoinen data on luonnollisesti siistittävä sellaiseen muotoon, että aineisto voidaan yhdistää vähintään yhden muuttujiltaan identtisen sarakkeen kautta. Afrikan internetin käyttödatassa olikin kohtalaisen paljon siivoamista: muutamien valtionnimien yhdenmukaistamistarpeen ohella etäisimpiä Intian valtameren saarivaltioita ei löytynyt kartta-aineistosta, joten poistin nämä surutta ongelmien välttämiseksi jatkossa. Laskutoimitus internetkäyttäjien osuudesta väestöstä tuotti erikoisia lukuja Komorien ja Djiboutin osalta, joten päättelin näiden kohdalla olevan kymmenkertainen suuruusluokkavirhe, jonka korjasin. Yhdistelyvaiheessa erityseisti piste- ja polygoniaineiston rajaaminen uniikkeihin tapauksiin count-toiminnolla vaikutti hyödylliseltä. Oli myös havainnollista, kuinka monen erilaisia aineistoja samaan karttaesitykseen voidaan yhdistää – ja esittää näitä yhtaikaa eri esitystapoja käyttämällä. Koko aineiston esittäminen (vaikka konflikteja olisikin yhdistelty) johti joka tapauksessa sekavaan lopputulokseen, vaikka värien ja esitystapojen huolellisella hiomisella painajaismaisimmat näkymät saikin siistittyä. Halusin esittää uniikkien konfliktien määrät kussakin valtiossa numeroina pallon sisällä kuten Tomi Kiviluoma (https://blogs.helsinki.fi/tomingeoblogi/2020/01/30/konfliktitulvia-vai-tulvakonflikteja/) ja olisin halunnut yhdistää tähän ympyräsymbolin koon riippuvuuden konfliktien määrästä.  Lukuarvojen esitysominaisuuden löytäminen kesti varsin kauan ja tajusin lopulta, että kyse on label-toiminnosta, eikä tähän voi yhdistää merkintöjen kokoasteikkoa; jälkimmäinen toiminto taas onnistuu esim. piirakkadiagrammin avulla kuten Juho Leskinen on tehnyt (https://blogs.helsinki.fi/juhongem1/2020/02/07/tietokantojen-yhdistelyn-ja-tulvaindeksin-salat/). Internetlähteiden mukaan lukuarvoaineisto pitäisi pystyä esittämään vastaavalla tavalla symboleiden kokoasteikkona Symbology-valikon avulla valitsemalla metodiksi size värin sijaan. Jostain syystä tämä ei ainakaan minulla QGIS 3.4.1:ssä toiminut.

Lopullisesta karttaesityksestä (kuva 1) ei erotu silmämääräistä vahvaa korrelaatiota konfliktien ja kaivannaisten välillä. Eteläisen Keski-Afrikan valtioissa (Kongon dem. tasavalta, Angola, Namibia) sekä Sierra Leonessa ja Liberiassa on jokaisessa paljon sekä timanttikaivoksia että konfliktivuosia, joten timanttiesiintymät ovat yksi mahdollinen konfliktien selitystekijä. Kumpaakin ilmiötä esiintyy tosin myös toisistaan riippumatta. Öljyesiintymät eivät hieman yllättäen näytä suoraan korreloivan konfliktien kanssa – joissakin öljyvaltioissa konflikteja esiintyy keskimääräistä enemmän, muutamissa ei lainkaan. Sen sijaan internetkäyttäjien määrä, joka mitannee karkeasti yhteiskunnallista kehitys- ja elintasoa, vaikuttaa ainakin itäisen Sahelin alueen valtioiden osalta korreloivan käänteisesti konfliktien esiintymisen kanssa.  Data ja varsinkin konfliktien määritelmä herättää kysymyksiä: millaisia nämä konfliktit ovat? Äkkiseltään vaikuttaisi, että tässä aineistossa on listattu ainoastaan valtioiden sisäiset konfliktit. Esimerkiksi kansainvälisesti aggressioistaan tunnettu öljyvaltio Libya ei tässä aineistossa sisällä yhtään konfliktia – mikä on hämmästyttävää ottaen huomioon, että maa on sotinut sekä Tsadin että Egyptin kanssa. Konfliktiaineisto on siis mielestäni puutteellista, jos siitä puuttuu kansainvälinen aineisto. En myöskään pidä täysin tarkoituksenmukaisena harjoitusohjeessa annettua ohjeistusta uniikkien konfliktien laskemisesta – miksei samana vuonna valtiossa voisi olla useampaa rinnakkaista konfliktia? Nythän aineistossa niputetaan saman vuoden tapahtumat yhdeksi.

Kuva 1: Kaivannaisresurssit, Internetin penetranssi ja konfliktivuodet Afrikan valtioissa (klikkaa auki).

Olemassaolevallakin aineistolla on toki mahdollista etsiä tilastollista korrelaatioita konfliktien ja kaivannaisten löytämisvuosien, tuotannon aloittamisen sekä tuottavuuden väliltä. On intuitiivisesti ajatellen luontevaa, että resurssien hallintaan liittyy konflikteja ja että resurssien haltuunotto voisi kytkeytyä yhteiskunnan kehitystasoon, mutta näin ei myöskään välttämättä ole. Tämän selvittämiseen soveltuu todennäköisesti parhaiten aineiston käsittely matriisina monimuuttujaregergessioanalyysin keinoin, mutta tällä aineistolla tilastollinen käsittely menee varsin nopeasti monimutkaiseksi. Jos halutaan rakentaa käsitys ajallisista kausaliteeteista eri tapahtumien välillä – jopa kokonaisia tapahtumaketjuja useampien kartalla näkyvien ilmiöiden välillä – on mukaan otettava bayesilaisia menetelmiä. Tässä kunkin tapahtumaketjun / polun luotettavuuden selvittäminen tapahtuu ns. posteriorij-todennäköisyyksiä approksimoimalla tai esim. Markov Chain Monte Carlo -menetelmällä simuloiden. Bayesilaisessa tilastotieteessä posteriorijakauma muodostetaan ehdollisena tunnettujen tapahtumien priori-todennäköisyyksien pohjalta. Keskeinen ja mahdollisesti ongelmallinen vaatimus tälle on, että jonidenkin konfliktien ja kaivannaisresurssien tunnuslukujen välinen suhde tunnetaan riittävällä luotettavuudella. Itse käyttäisin mallin kalibroimiseen jossain määrin tunnettua timanttieollisuuden osavaikutusta Sierra Leonen sisällisotaan.

Bayes- ja monimuuttujamenetelmien tarkempi esittely ja auki selittäminen vaatisi pitkän ja syvvällisen tekstin sekä itseltäni lisää paneutumista aiheeseen, etten käsittele asiaa tässä yhteydessä enempää. On mahdollista, että jotakin korrelaatioita voisi saada irti jonkinlaisella purkkavirityksellä: esimerkiksi muodostamalla konflikteista ja kaivannaisresursseista koordinaatistoon sidottuja n-ulotteisia ellipsejä, joissa ulottuvuudet muodostuisivat konfliktin tapauksessa sen kestosta, maantieteellisestä säteestä jne. ja kaivannaisresurssin tapauksessa esim. löytämisen ja tuotannon välisen aikajaksosta, tuotannon kestosta, tuottavuudesta jne. Näiden avulla voisi laskea, kuinka suuren tilavuuden osalta tällaiset pyörähdyskappaleet leikkaavat.

Suomen vesistöalueiden tulvaindeksit

Halusin (luonnollisesti) toteuttaa tehtävänannon tulvaindeksien laskemisesta haastavamman vaihtoehdon mukaan, jotta saisin menetelmätasolla mahdollisimman paljon uutta irti. Lisäksi työhjeen spekulointi valmiin järvipinta-alan oikeellisuudesta ja kehotus laskea virtaamavaihteluindeksi yleisen tulvaindeksin sijaan saivat ensimmäisen tehtävävaihtoehdon vaikuttamaan epämääräiseltä. Virtaamavaihteluiden indeksi ei suoraan kerro pelkästään tulvaherkkyydestä, vaan enemmänkin uoman / valuma-alueen alttiudesta kausivaihtelulle molempiin suuntiin, jolloin samaan lukuun sisältyy myös kuivemman kauden normaalia alempi vedenpinta.

Tehtävän hyödyllisin anti oli minusta pinta-alojen summaaminen kahden tason välillä suoraan geometriapisteitä käyttämällä Join attributes by location -toiminnolla. Tämä onnistui yllättävän helposti, kun oli ensin laskenut perusgeometria-attribuutit sekä järville että valuma-alueille. Jouduin muutaman kerran kokeilemaan, millä geometriapredikaatin valinnalla päädyn oikeaan tulokseen tasojen summaamisessa. Ensin asetusta overlap käyttäessäni päädyin samaan ongelmaan, jonka Tomi Kiviluoma blogissaan (https://blogs.helsinki.fi/tomingeoblogi/2020/01/30/konfliktitulvia-vai-tulvakonflikteja/) kuvailee: Laatokan pinta-ala vääristää järvipinta-alaa voimakkaasti ylöspäin muutamissa vesistöissä – esimerkiksi Hiitolanjoen järvipinta-ala nousee viisinkertaiseksi itse valuma-alueen kokoon nähden. Tämä johtuu siitä, että overlap-asetus laskee järvipinta-alaan mukaan myös valtionrajojen ulkopuolella sijaitsevat laskujärvet, jota valuma-alue sivuaa, vaikka ne eivät sisälly itse valuma-alueeseen. Laatokka on tästä dramaattisin esimerkki. Geometric predicate asetuksen tulee siis olla within (suomen kieliversiossa sisältyy), jotta vain kokonaan valuma-alueen sisällä olevat järvet lasketaan mukaan. Tästä eteenpäin aineistojen yhdistely ja käsittely oli erittäin jouhevaa, kun eri aineistojen välillä vesistöalueiden numerot vastasivat kategorisesti toisiaan.

Kuva 2: Suomen vesistöalueiden tulvaindeksejä ja järvisyysprosentteja

Tulkitsemalla tuottamaani vesistöalueiden tulvaindeksikarttaa (kuva 2) voidaan jo silmämääräisesti havaita korrelaatio korkean järvisyyden ja matalan tulvaindeksin välillä. Tämä on loogista, sillä korkeussuuntainen muutos volyyminlisäystilanteessa (kasvanut virtaama) on sitä pienempi, mitä suuremmalle pinta-alalle (järvet) se jakautuu. On luontevaa, että järviä on paljon suurilla valuma-alueilla ja tästä seuraten korkea keskivirtaama itsessään jo jossain määrin laskee tulvaindeksiä. Järvisyyden edellytys on kuitenkin keskimäärin vähäninen prominenssivaihtelu eli tasaisuus ja toisaalta se, että valuma-alueella on myös keksimääräisen mpy-lukeman alapuolella olevaa topografiaa – johon järvi siis on muodostunut. Edelleen on luontevaa, että tällaisia kerääntymäalueita on sisämaassa; rannikon joet laskevat pieneltä valuma-alueelta  suoraan mereen yksittäisen prominenssivaihtelun paikalliseta minimikäyrää pitkin, eikä väliin siis mahdu puskuroivia altaita.

Huomionarvoista on myös, että Lapissa, missä prominenssivaihtelua on enemmän, laajasta valuma-alueesta huolimatta (esim. Tornion-Muonionjoen vesistö, Kemijoen vesistö) järvisyys on suhteellisen pientä ja tulvaindeksi siten vastaavan kokoisia Etelä-Suomen sisämaan vesistöalueita korkeampi. Inarijärjven valtava pinta-ala näkyy välittömästi Paatsjoen vesistön matalana tulvaindeksinä. Lounais-Suomen korkean tulvaindeksin vesistöjen joet kuten Aurajoki ja Halikonjoki ovat sikäli mielenkiintoisia, että niiden uomat ovat melko syviä, hienosedimenttitasankoon uurtuneita, ja niitä ei välttämättä heti miellä tulvariskialueiksi. Kuitenkin juuri uomien jyrkkyys ja raviinimaiset, lyhyet ja jyrkät sivu-uomat altistavat lyhytaikaisille paikallisille tulville. Mahdolliset jääpadot kumuloivat paikallisen tulvan vaikutusta entisestään. Tämän tyyppisten jokien kohdalla myös virtaamavaihteluindeksin laskeminen voisi olla mielenkiintoista ja se todennäköisesti karakterisoisi nämä vesistöalueet omaksi alaryhmäkseen muiden korkean tulvaindeksin vesistöjen joukossa.

Kiviluoma, T. 30.1.2020:
Konfliktitulvia vai tulvakonflikteja, luettu 7.2.2020

Konfliktitulvia vai tulvakonflikteja

Leskinen, J. 7.2.2020:
Tietokantojen yhdistelyn ja tulvaindeksin salat, luettu 7.2.2020
Konfliktitulvia vai tulvakonflikteja, luettu 7.1.2020

Tietokantojen yhdistelyn ja tulvaindeksin salat

Projektioista, tietokannoista ja ohjeiden kirjaimellisesta noudattamisesta

Projektiomuunnoksia ja ominaisuuksien vertailua

QGIS:in pariin palaaminen vaati ensin toki hieman mieleenpalauttelua eri toimintojen osalta, mikä alkuun sujuikin kivuttomasti. Varsinainen harjoitusten tekeminen oli hieman haasteellista, kun edelleenkään GIS ei suostunut asentumaan läppärilleni ja kurssin ollessa ylibookattu en mahtunut ensimmäisessä viikon ryhmässä työskentelemään yhdellekään koneelle. Pääsin kahlaamaan läpi tehtäviä siis omassa rauhassa eli parhaassa seurassa. Aineiston hakemiseen suoraan WFS-tietokannoista olin tutustunut jo viime kurssikerralla ja tämä olikin erittäin helppotajuista kunhan vain palvelimen osoite oli tiedossa.   Iida Kokkisen blogitekstistä (https://blogs.helsinki.fi/iixkokki/2020/01/24/toinen-tapaaminen-arvon-qgisin-kanssa/) sain myös osaselityksen viime kertaiseen aprikointiini siitä, miksi ladattu WFS-aineisto ei ollut editoitavissa ilman sen tallentamista ja uudelleenavaamista omalla koneella. WFS-palvelimelta tiedosto avattaessa tarkastellaan suoraan palvelimella olevaa tiedostoa, eikä mitään ole tässä vaiheessa vielä ladattu erikseen paikalliselle koneelle, joten on ymmärrettävää, ettei palvelimen kirjoitussuojattua tiedostoa voi muokata.

Itse aineisto- ja karttapohjien tallentaminen oli helppoa. Tämän jälkeen myös pinta-alojen ja pituusjanojen mittailu aineistosta eri projektiota käyttävissä koordinaatistoissa oli yksinkertaista ja projektion saattoi vaihtaa lennosta oikean alakulman painikkeesta. Sen sijaan lieviä haasteita tuotti QGIS:in nykyversiossa (3.4.1 Madeira) toimintojen nimien muuttuminen  suhteessa työohjeeseen. Vertailin pituus- ja pinta-alavääristymiä keskenään seuraaviin projektioihin perustuvissa koordinaattijärjestelmissä: Popular Visualisation CRS / Mercator (deprecated), World Mercator, World Robinson, World Gall-(Peters) stereographic, Albers equal area conical Europe, ETRS89 / Lambers Azimuthal Equal Area Europe ja ETRS89 / TM35FIN. Oheisesta taulukosta (taulukko 1) ilmeten suurimmat vääristymät molemmissa mitattavissa parametreissä olivat Mercatorin ja Gall-Petersin projektioissa. Gall-Petersin lukuarvot ovat sikäli mielenkiintoisia, että vaikka kyseisessä projektiossa eri alueiden pinta-alat ovat keskenään vertailukelpoisia, ovat kaikki sen pinta-alat tässä esityksessä Suomen osalta yli 2,5 kertaisia projektioihin (LAEA, TM35FIN), jossa projektiopinnan tangenttin on lähempänä kuvautuvaa kohdetta eli Suomea. Mercatorin lisäksi Gall-Petersissä pituuskoordinaatin (x-akseli) vääristymä oli melkoinen, sillä tässä projektiossa pinta-alojen vakioimiseksi suhteessa todellisuuteen y-koordinaatti venyy lähelllä päiväntasaajaa ja x-koordinaatti vastaavasti lähellä napoja. Mercator on oikeakulmainen, joten siinä vääristyy kumpikin ulottuvuus yhtä paljon, Robinsonin projektiossa taas karvan verrran pinta-alaa  enemmän pituus, sillä projektio on tunnetusti navoiltaan litistynyt. Litistyneisyys onkin Robinsonin suurin haitta ja vanhanaikaisuudestaan huolimatta sen vääristymät eivät numeroiden valossa ole katastrofaalisen suuria. Tällä tarkkuudella LAEA ja TM35FIN näyttävät vastaavan toisiaan.

Taulukko 1: Eri koordinaattijärjestelmien projektioiden vääristymien vertailua.

Projektio Selite Pinta-ala (km²), Päälaen kalotti Pituusjana (km) Virmajärvi (Ilomantsi) –  Halsön (Korsnäs) Pinta-alan erotus (km²) Pituusjanan erotus (km) PA-vääristymä (% suurempi kuin LAEA) Pituusvääristymä, (% suurempi kuin LAEA) PA / pituus -vääristymien suhde
EPSG:3785 Popular Visualisation CRS / Mercator (deprecated) 54536,809 1162,109 47902,31 631,647 722,0184976 119,0748819 3,752226136
EPSG:54004 World Mercator 54492,296 1162,109 47857,797 631,647 721,3475652 119,0748819 3,749163565
EPSG:54030 World Robinson 9354,053 764,869 2719,554 234,407 40,9910982 44,18921619 0,977819992
EPSG:54016 World Gall-(Peters) stereographic 16999,551 821,72 10365,052 291,258 156,2296113 54,90647775 1,654092295
EPSG:102013 Albers equal area conical Europe 6635,165 530,489 0,666 0,027 0,010038437 0,005089903 1,000049483
EPSG:3902 ETRS89 / TM35FIN 6634,499 530,462 0 0 0 0 1
EPSG:3035 ETRS89 / Lambers Azimuthal Equal Area Europe 6634,499 530,462 0 0 0 0 1

Koordinaatistomuutoksia suorittaessani törmäsin QGIS:ille ilmeisen tyypilliseen ja hermoja raastavaan ilmiöön; haluttua toimenpidettä ei saa tehtyä ongelmitta, vaikka intuitiivisesti tekisi mielestään kaiken oikein – sen sijaan on vain yksi, intuitiolla tai loogisella päättelyllä löydettäväksi täysin mahdoton tapa toimia, jos mielia saada haluamansa toimenpiteen suoritettua. Kuten monen tunnin tuskailun ja erinäisten epämääräisten, noin 100dB:n äännähdysten jälkeen sain havaita, tässä tapauksessa koordinaatistomuunnoksen tekemisessä oli noudatettava työohjetta kirjaimellisesti – eli tallennettava aineisto omalle koneelle ja suoritettava muunnos nimenomaan tässä vaiheessa. Jos tein koordinaattimuunnoksen alakulman painikkeesta ennen tallentamista, oli seuraavassa vaiheessa tiedossa error-viesti ja projektio palautui oletuskoordinaatistoon.

Lopulta sain tämän kuitenkin ohjeita prikulleen noudattaen toimimaan ja loin kaksi isolpeettikarttaa. Ensimmäisessä vertailin Mercator-projektiota käyttävän koordinaatisotn pinta-alavääristymää prosentuaalisesti LAEA-projektion (kuva 1) ja toisessa vastaavasti Robinson-projektiota LAEA-projektioon (kuva 1). koordinaatistoon. Suurimpien luokkien vääristymät Pohjois-Suomessa vastaavat taulukon 1 lukuja; esim. Mercator-projektion pinta-alavääristymä Utsojen-Inarin alueella on yli 8,2-kertainen eli yli 720 % LAEA-projektiota suurempi. Halusin esittää aineiston luokat keskenään edes jollakin tavoin vertailukelpoisessa muodossa näiden kahden vertailukartan välillä eli käytännössä havainnollistaa sitä, miten Mercatorin projektiossa (suhteessa Robinsoniin) kunkin luokan pohjois-eteläsuunnassa  kattama maantieteellinen etäisyys pienenee luokittain pohjoista kohti edetessä – mikä tarkoittaa, että pinta-alavääristymä kasvaa eksponentiaalisesti napaa lähestyttäessä. Sopivaksi luokkien määräksi päätin 5, sillä esim. jo kuudella käytettävällä luokalla Pohjois-Suomen kuntien suuret, kauas sijaintikeskipisteestään ulottuvat alueet alkavat vääristää luokkarajoja, jolloin ilmiö ei enää kuvaa todellisuutta – vaikka luokkia lisätessä spatiaalinen resoluutio sinänsä kasvaisi. Käytännössä esim. Enontekiö kuvautuu alempaan luokkaan kuin Inari ja Utsoki, vaikka ne sijaitsevat lähes samojen leveysasteiden välillä – tällöin katsoja ei voi hahmottaa, missä luokkaraja todella kulkee. Värit valitsin räikeiksi ja siten, että niistä kävisi ilmi Mercator-projektion pinta-alavääristymän olevan alimmassakin luokassa noin kolminkertainen Robinsonin ylimmän luokan vääristymään verrattuna.


Kuva 1: Mercator-projektion pinta-alavääristymä (ala prosentteina isompi) verrattuna LAEA-projektioon koropleettikartalla Suomessa.


Kuva 2: Robinson-projektion pinta-alavääristymä (ala prosentteina isompi) verrattuna LAEA-projektioon koropleettikartalla Suomessa.

Projektion vaikutus pinta-alariippuvaiseen aineistoon

Lopuksi halusin tehdä vertailun projektiosta johtuvan pinta-alavääristymän vaikutuksesta Natura-alueiden prosentuaaliseen osuuteen kunnan pinta-alasta. Sattumalta keksimäni idea oli täysin sama kuin Tomi Kiviluomalla hänen blogissaan (https://blogs.helsinki.fi/tomingeoblogi/2020/01/24/tietokantoja-tykytysta-ja-toiveita-tulevasta/),  mutten kuitenkaan koskaan saanut SYKE:n WFS-palvelinta (https://geoserver.ymparisto.fi/geoserver/wfs) vastaamaan, enkä siten Natura-alueaineistoa ladattua vektorimuodossa. En ole keksinyt syytä tähän, mutta itse yritin tehdä tehtävää todennäköisesti muutamaa päivää myöhemmin kuin Tomi. Hänen esityksensä on toteutukseltaan varsin vaikuttava, vaikka projektion muutos ei kartalla huomattavaa eroa tarkasteltavaan suhteeseen tuotakaan. Tyydyin tarkastelemaan aineistoa vain WMS-palvelimelta (kuva 3), mutta tallennus vektorimuodossa ei WMS-datasta onnistu, vaikka selvästi tämäkin kuva sisältää paikkatietoaineistoa sen esitystavan reagoidessa koordinaatistomuunnoksiin. Olin myös etsinyt MML:n aineistosta jo valmiiksi käsiini merialueet kattavat kuntarajat, jotta saisin sisällytettyä myös Itämerellä sijaitsevat Natura-alueet aineistoon. Eräs ajatus olikin verrata tätä Natura-alueet / pinta-ala -listan muuttumista siitä riippuen, sisällytänkö merialueet mukaan.


Kuva 3: Natura-alueet Suomen kartalla

Toteutin siis tehtävän lopulta vertailemalla terveydenhuoltohenkilökunnan määrää neliökilometriä kohti Suomen sairaanhoitopiireissä Mercator-projektiolla esitettynä vs. todellisia pinta-aloja vastaavalla LAEA-projektiolla esitettynä. Koska sairaanhoitopiirit vastaavat lähes maakuntia, eikä sairanahoitopiirirajoista yllättäen ollut vektorikartta-aineistoa (etsin noin 3h), päätin käyttää sairaanhoitopiirien sijaan maakuntia. Tässä tarvitsi yhdistää aineistoja useammasta lähteestä: etsin Sotka-netistä (THL) sairaanhoitopiirien henkilökuntamäärän / 10k asukasta ja maakuntien asukasluvun (molemmat vuosita 2012). Karttapohjana käytin vanhinta saatavilla olevaa Tilastokeskuksen maakuntakarttaa 2013, mutta maakuntarajat eivät tämän jälkeen ole muuttuneet, joten se kelpaa tarkoitukseen hyvin. Yhdistin numeerisessa datassa muutamien maakuntarjaoista poikkeavien sairaanhoitopiirien kentät (henkilökuntaa / 10k asukasta) toisiinsa keskiarvoistamalla; Itä-Savon ja Etelä-Savon sairaanhoitopiiri kattavat yhdessä Etelä-Savon maakunnan, Länsi-Pohjan ja Lapin sairaanhoitopiirit kattavat Lapin maakunnan, Vaasan sairaanhoitopiiri kattaa yksin Pohjanmaan maakunnan.

Yritin yhdistää numeerisen attribuuttiaineiston join-toiminnolla karttaan, mutta jostain syystä se ei onnistunut QGIS:in sisällä, vaan aina jompaan kumpaan kahdesta liittämästäni taulukosta tuli NULL-kenttiä. Syytä tälle en pähkäilystä ja huolellisesta läpikäynnistä huolimatta keksinyt. Siispä yhdistin kaksi lähdemateriaalin taulukkoa suorittamalla laskutoimitukset Excelissä ja yhdistin tämän tulostaulukon (terveydenhuoltohenkilökunta / maakunta) maakuntakartta-aineistoon. Koska aineiston absoluuttiset luvut olivat hyvin pieniä, tasaväliluokittain esitettynä aineisto ei olisi näyttänyt koropleettikartalla järkevältä. Siispä käytin tässä tapauksessa Jenksin Natural breaks -luokittelua ja luokkien määrällä 8 saavutin optimaalisen resoluution. Kuvista 4 ja 5 ilmenee tämä ero koropleettikartoilla esitettynä.

Tarkastellaan ensin aineistoa LAEA-projektiosta muodostetulla kartalla (kuva 4). Yleisellä tasolla terveydenhuoltohenkilökunnan määrä neliökilometrillä noudattelee asukastiheyttä. Odotin, että henkilöstöltään massiivisen yliopistosairaalan sisältävät maakunnat olisivat dominoineet tässä tiheydessä, mutta näin ei käynyt – selitys lienee siinä, että yliopistoja on ennestään tiheästi asutuissa maakunnissa. Pohjois-Savo muodosti yliopistosairaalamaakunnista (KYS) ainoan positiivisen poikkeaman asukastiheydestä. Muita asukastiheyttään suuremmalla terveydenhuoltohenkilöstöllä varustettuja maakuntia olivat Päijät-Häme (henkilökuntatiheus suurempi kuin esim. sitä hieman tiheämmin asutulla Pirkanmaalla) sekä Pohjanmaa ja Ahvenanmaa. Kahdessa jälkimmäisessä trendiä voi nostaa ruotsinkielisen hoitohenkilökunnan keskittyminen näihin maakuntiin eli työvoiman helppo saatavussa ja toisaalta yleisenä trendinä vaikuttaisi, että pieni pinta-ala itsessään nostaa terveydenhuoltohenkilökunnan tiheyttä, vaikka asukastiheys olisi suhteellisen matala.

Eri projektioilla muodostettuja karttoja verrattaessa huomionarvoista on, että Mercatorilla alin luokka kattaa kaikki arvot, jotka ovat välillä 3-7 kertaa pienempiä kuin LAEA:n alimmassa luokassa, joka puolestaan edustaa vain yhtä lukua 0,05. Suurimpien luokkien arvot ovat absoluuttisesti noin 4 kertaa suurempia LAEA:ssa kuin Mercatorissa. Käytännössä Mercatorin ero napaa kohti kasvavassa pinta-alavääristymässä alkaa vaikuttaa vasta Lapin maakunnassa ja muualla vääristymä LAEA-projektioon on käytännössä 4-kertainen. Luokkien keskinäistä eroa tarkastellessa on huomionarvoista, että Mercatorissa Kainuun maakunta putoaa samaan luokkaan Lapin kanssa ja Etelä-Savo putooa myöskin pykälän. Tosin luokat eivät ole nyt tasaväliset ja tälle muutokselle luokkajako on itse asiassa todennäköisin selitys. Summa summarum: karttaesitystä muodostettaessa projektion ohella huomiota tulee kiinnittää erityisesti luokkajakoon!


Kuva 4: Terveydenhuoltohenkilöstö neliökilometriä kohden Suomen maakunnissa, laskettu LAEA-projektiolla


Kuva 5: Terveydenhuoltohenkilöstö neliökilometriä kohden Suomen maakunnissa, laskettu Mercator-projektiolla

 

Lähteet

  1. Kokkinen, I. 24.1.2020:
    Toinen tapaaminen arvon QGISin kanssa, luettu 31.1.2020
    https://blogs.helsinki.fi/iixkokki/2020/01/24/toinen-tapaaminen-arvon-qgisin-kanssa/
  2. Kiviluoma, T. 24.1.2020:
    Tietokantoja, tykytystä ja toiveita tulevasta, luettu 31.1.2020 https://blogs.helsinki.fi/tomingeoblogi/2020/01/24/tietokantoja-tykytysta-ja-toiveita-tulevasta/

Koropleettikartta ja pohdintaa luokista

Aineiston valikointi ja tuonti QGIS:iin

(Kirjoitettu alunperin 28.1.2020)
Pääsin lopulta asiaan ja suoritin koropleettikartan laadintatehtävän lopulta yliopiston koneella haastavimman vaihtoehdon mukaan. Latasin kuntakarttapohjan (Kunnat 1:450000 2018) WFS-muodossa tilastokeskuksen palvelimelta (http://geo.stat.fi/geoserver/tilastointialueet/wfs). Tässä yhteydessä tulivat kätevästi tutuksi shp-tiedostomuotoisten vektoriaineistojen lisäksi muut aineistojen tuontimahdollisuudet. Esitettäväksi aineistoksi valitsin THL:n Sotkanet-palvelusta ns. HYTE-kerroin –aineiston vuodelta 2018 (tärkeää, että kuntakarttapohja ja kuntakohtaisesti esitetty aineisto on kerätty samalta vuodelta, koska kuntarajat muuttuvat). Ulkoa tuodut aineistot kannattaa tallentaa QGISissä ensin uudestaan omiksi tiedostoikseen ja avata sen jälkeen uudestaan käyttöön; tämä ainakin itselläni eliminoi erittäin ärsyttävän alkuvaiheen bugin, kun tuotujen aineistojen attribuuttitaulukkoja ei päässyt muokkaamaan (toggle edit ei ollut käytettävissä). Tuntienkaan pohdiskelun jälkeen syy tähän ei selvinnyt – ominaispiirre, joka QGISiä käytettäessä toistuu huomattavan usein, kun eri lähteissä ja formaateissa tuotetut aineistot eivät vaan millään meinaa sopia yhteen tai kommunikoida ohjelman kanssa kunnolla.

Takaisin aineistoon: HYTE-kerroin on Sipilän hallituksen suunnittelema eräänlainen kannustinpalkkio, joka lasketaan 29 prosessi-indikaattorin (kuvaavat kunnan terveydenedistämisen nykytilaa) ja 8 tulosindikaattorin (kuvaavat kunnan tekemistä muutoksista oletettavasti johtuvien viimeisen kahden vuoden aikaisia muutoksia terveydessä ja hyvinvoinnissa), joiden laskemisesta löytyy lisätietoa THL:n Internetsivuilta osoitteesta https://thl.fi/fi/web/hyvinvoinnin-ja-terveyden-edistamisen-johtaminen/hyvinvointijohtaminen/hyvinvointijohtaminen-kunnassa/hyte-kerroin-kannustin-kunnille. HYTE-kerrointa ei hallituspohjan muututtua tulla ottamaan käyttöön kuten alun perin oli vuoden 2021 alusta suunniteltu. On kuitenkin mielenkiintoista tarkastella, miten tämän kertoimen arvot jakautuvat alueellisesti – tämä HYKE-kertoimella maksettava kannustinpalkkio (vaikka onkin suhteellisen pieni) kumuloi ja kärjistää kunnille jaettavaa rahaa kuntalaisten terveydessä tapahtuvista muutoksista riippuen, mikä on potentiaalisesti kyseenalaista, sillä terveyseroissa voi olla alueellisia trendejä, jotka eivät riipu kunnista itsestään. Ensinnäkin, vaikka kunnat itse järjestävät perusterveydenhuoltoa, terveydenhuolto jakautuu kuntia suurempiin sairaanhoitopiireihin ja jos HYKE-kerroin olisi tullut suunnitellusti käyttöön, olisivat näistä toiminnoista vastanneet maakunnat.

Latasin koropleettikarttaa varten HYKE-kertoimen aineiston, johon on laskettu valmiiksi, kuinka monta euroa palkkiota maksettaisiin asukasta kohden. Aineisto on siis valmiiksi suhteutettua ja kelpaa koropleettikartalla esitettäväksi – esitettävät arvot eivät ole absoluuttisia ja riipu siksi esim. suoraan pinta-aloista tai muista vastaavasti arvoja kumuloivista aluerajaustekijöistä. Aineiston liitin karttapohjaan tallentamalla (ja siistimällä) sen ensin csv-tiedostoksi. Tämän tarkempi suorittaminen esitetään oikeastaan kurssikerran 3 harjoitusmateriaalissa, mutta käyn läpi pääkohdat: jotta ulkoa tuodun taulukon voi liittää karttapohjan attribuuttitaulukkoon, pitää yhden sarakkeen (kentän) arvojen olla samoja. Yhdistin aineistot join-toiminnolla ja käytin yhdistävänä sarakkeena kunnan nimeä. Ainoa poikkeama aineistossa tässä sarakkeessa oli Koski Tl –kunnan nimi, joka kartalla oli pelkkä Koski, joten poistin kirjaimet Tl. Koska (ä,ö,å) sisältävät kuntanimet näkyisivät oikein, muutin sekä karttapohjan että tuotavan taulukkoaineiston merkistökoodauksen UTF-8:sta muotoon ISO-8859-4. Lisäksi karttapohjaan sisältyivät HYTE-aineistosta puuttuvat Ahvenanmaan kunnat, joita en lähtenyt erikseen siivoamaan pois – annoin siis tietoisesti tulla näille riveille HYTE-kertoimen arvoiksi NULL-arvoja aineistojen yhdistämisen seurauksena ja hyväksyin sen, että lopullisessa kartassa Ahvenanmaan kunnat eivät näy, kun esitettävää HYTE-kertoimen dataakaan niistä ei ollut saatavilla.

 

Aineiston esittäminen kartalla

Seuraavaksi valitsin esitystavan. Halusin esittää kartalla maksettavan kannustinrahan ääripäät, joten valitsin sinisestä punaiseen liukuvan väriskaalan. Koska nyt emme ehkä ole kiinnostuneita (ainakaan itse en ole) vain kuntien keskinäisestä paremmuudesta vaan enemmänkin niiden suhtautumisesta parametrin (maksettava HYTE-palkkio) suuruuteen sinänsä, en käyttänyt luokkien määrittelyssä Jenks natural breaks –jakoa. Toisin sanoen halusin esittää kartalla jossain määrin sen, että aineisto eli kunnille määritellyt palkkiot ei ole normaalisti jakautunutta (tai lineaarista), vaan käyrä on oikealle vinoutunut eli suurin osa kunnista on keskiarvon yläpuolella; tämä selviää mm. tarkastelemalla histogrammia (kuva 1) luokkajakotyökalun asetuksista. Edellä mainituista syistä valitsin tasaväliset luokat. Saadakseni riittävän erotuskyvyn, päätin luokkien määräksi 10, mutta jätin esittämättä alimman luokan, koska se oli tyhjä (arvot eivät ala nollasta). Koska aineisto painottuu yläpäähän ja alueet tulevat olemaan siksi saman sävyisiä (sinisiä), halusin lisätä visuaalista kontrastia näissä luokissa, joihin suurin osa kunnista kuuluu. Loin siksi sinisen ja punaisen ääripään väliin kolmannen värin (lähes valkoisen vaaleansinisen) – ja koska jakauman huippu eli moodi (ei siis keskiarvo!) arvoltaan ~9,5€ on kohdassa ~75% absoluuttisen skaalan maksimista (12,6€), vein valkoisen värin esittämisalueen huipun tähän kohtaan. Lisäksi, koska esitettävät arvot eivät ala nollasta vaan ensimmäinen arvo (4,2 €) sijoittuu noin kohtaan 30% koko skaalasta, vein punaisen värityksen alkamiskohdan tähän kohtaan 30%. Näin värien tasolla saadaan visuaalisesti maksimaalinen erotuskyky (vrt. kuva 1 ja kuva 2). Lopuksi poistin kolme ensimmäistä tyhjää luokkaa, jolloin tuloksena on 7 tasavälistä luokkaa.

Legendassa visuaalisesti selkeintä olisi esittää luokkarajat tasalukuina, mutta koska osa luokkarajoista pyöristyy ylös- ja osa alaspäin, eivät luokat enää näyttäisi tasavälisiltä. Siispä pitäydyin pitämään legendassa alkuperäiset kahden desimaalin luvut näkyvissä.


Kuva1: Koropleettikartan luokkien väriskaalan optimointia histogrammin avulla

 

Lopputuloksen tarkastelua

Valmiista tuotoksesta (kuva 2) voidaan tehdä mielenkiintoisia havaintoja suurimpien HYTE-palkkion arvojen keskittymisestä suurten kaupunkien ympäristöön – lukuun ottamatta Turkua. Myöskään Jyväskylä, Kuopio ja Joensuu eivät ole aivan ylimmässä luokassa. Lappeenrannan seutu on mielenkiintoinen: HYTE-palkkioiden suurimpaan luokkaan kuuluvat nimenomaan kehyskunnat ilman aluekeskusta. Lisäksi hahmottuu, että pienimmät HYTE-palkkion arvot löytyvät kaupunkiseutujen väliin jääviltä harvaan asutuilta alueilta kuten Suomenselältä ja Savo-Karjalan vesistöisimmistä osista. Alempien luokkien sijoittumisessa hajonta on kuitenkin suurta. Havaintojen tulkinta ja mahdollisten syiden hahmottelu nopealla pohdinnalla on vaikeaa. Varmasti suuret kaupungit hyötyvät HYTE-indikaattoreilla mitaten korkeasta bruttokansantuotteesta, yliopistosairaaloista ja keskimääräistä nuoremmasta väestörakenteesta.
Pikaisesti tarkasteltuna erot huoltosuhteessa (melkein kaikilla yliopistokaupungeilla huoltosuhde n. 50%) eivät pääsääntöisesti näytä selittävän monien kaupunkien yllättävän alhaista sijoitusta – Lappeenrannan osalta tämä on mahdollista huoltosuhteen ollessa yli 60% (lähde: Kuntaliiton Internet-sivut, Tilastokeskuksen aineisto kuntien väestöstä ja ikärakenteesta, luettu 28.1.2020). On mahdollista, että joillakin kaupungeilla tulosindikaattoreiden ollessa jo tavoitetasolla kaupungilla ei ole tarvetta investoida niin suuresti prosessi-indikaattoreihin. Tämä on kuitenkin vain spekulaatiota ja asian selittäminen vaatisi niin syvällistä perehtymistä kaikkiin 37:ään määräytymisindikaattoriin ja niiden keskinäiseen laskennalliseen suhteeseen, ettei se tässä yhteydessä ole mahdollista.


Kuva 2: HYTE-kertoimen arvot euroina kunnan asukasta kohden.

 

Pohdintaa

Koropleettikartan kohdalla palaa mieleeän jälleen sama pohdinta kuin Tomi Kiviluomalla omassa Geoinformatiikan menetelmät (https://blogs.helsinki.fi/tomingeoblogi/2020/01/16/johdanto-kurssille-ja-qgisin-perusominaisuudet/) -kurssiblgogissaan: karttaesityksen analyyttinen ymmärrys vaatii ymmärrystä sen tiedonkeruumenetelmistä, eistystavasta ja näiden mahdollisista motiiveista. Väestöaineiston tapauksessa aineiston ryhmittely, luokkien muodostaminen, jopa esitykseen valittavat värit ja primääridataa kerättäessä myös alueellinen rajaaminen kuntarajoista alkaen vaikuttaa esitettävän tiedon muotoon. Ääriesimerkki valikoivasta väestön rajaamisesta hallinnollisiin alueisiin on esim. niinsanottu Gerrymandering-ilmiö Yhdysvaltojen vaalipiirejä oman puolueen edun motivoimana muodostettaessa. Vaikka tässä kurssityössä on kyse vain informaation esittämisestä, eikä hallinnosta, on hyvä muistaa, että paikkatietoa hyödyntävän hallinnollisen toiminnan perustana on olemassaoleva paikkatieto. Toteutuessaan HYTE-kertoimeen perustuva palkkiomallissa olisi käytetty paikkatietoaineistoa hallinnollis-poliittisten päätösten perustana.

Kyseisestä aineistosta yllä laatimani karttaesityksen lopputulokseen vaikuttavia valintoja, joihin kannatta kiinnittää huomiota, ovat mielestäni aineiston luokkajako ja esittämiseen käytettävät värit; jälkimmäinen vaikuttaa visuaaliseen tarkasteluun piilevästi yllättävän paljon – kartan tuottamaa ensivaikutelmaa ei pidä aliarvioida. Halusin karttaesityksessäni luokkien tasavälisellä valinnalla korostaa, että kunnat eivät ole HYTE-kertoimen arvojen suhteen normaalisti jakautuneita, mikä on luettavissa legendasta – tästä seuraavaa väriasteikon yläpään dominointia visuaalisella tasolla taas halusin täysin vastakkaisesti kompensoida siirtämällä väriskaalan keskikohdan aineistojakauman huipun kohdalle. Vaikka omasta mielestäni ratkaisu on perusteltu, on tällainen ristiriitainen toimenpide ehkä hieman epäortodoksinen ja voi johtaa ainakin mielikuvatasolla ristiriitaisiin tulkintoihin siitä riippuen, mitä katsoo: jos katsoo pelkkää karttaa, voi väriskaalasta tulla mielikuva normaalityyppisestä jakaumasta (tai Jenks-tyyppisestä luonnollisesta luokkajaosta) – legendaa katsoessa taas ilmenee, että aineisto ei noudata normaalijakaumaa. Myös kartan katsojalla on siis vastuunsa, mutta karttaesityksen laatijan on hyvä olla tietoinen lopputulokseen vaikuttavista valinnoistaan ja perustella ne.

 

Lähteet:

  1. Kiviluoma, T. 16.1.2020:
    Johdanto kurssille ja QGIS:in perusominaisuudet. Luettu 28.1.2020
    https://blogs.helsinki.fi/tomingeoblogi/2020/01/16/johdanto-kurssille-ja-qgisin-perusominaisuudet/
  2. THL:n Internetsivut: ” HYTE-kerroin – kannustin kunnille” Luettu 28.1.2020
    https://thl.fi/fi/web/hyvinvoinnin-ja-terveyden-edistamisen-johtaminen/hyvinvointijohtaminen/hyvinvointijohtaminen-kunnassa/hyte-kerroin-kannustin-kunnille
  3. Kuntaliiton Internet-sivut, Tilastokeskuksen aineisto kuntien väestöstä ja ikärakenteesta.
    Luettu 28.1.2020 https://www.kuntaliitto.fi/sites/default/files/media/file/Vaesto-31122018.xlsx

Johdanto ja tutustumista QGIS-ohjelmistoon

Lämmittelyä

(Kirjoitettu alunperin 19.1.2020)
Tutustuminen QGIS:iin aloitettiin ohjelman perusominaisuuksista ja opeteltavaa tosiaan riittää – käyttöliittymä sinänsä on graafisuudessaan hyvin intuitiivinen, mutta haasteena aluksi on toimintojen suuri määrä ja haluttujen toimintojen löytäminen. Esimerkiksi jo pelkkä valmiin (vektori)aineiston lisääminen ja Data Source Managerin avaaminen näkyviin vaati, että Manage Layers Toolbar oli ensin asetettu näkyviin pudotusvalikon takaa. jotta. Tällaisten pienten, olennaisten niksien oppimisen jälkeen ohjelman käyttö ominaisuustosolla vaikuttaa hyvinkin joustavalta. Koko ohjelmiston – kuten nykyaikaisten paikkatietojärjestelmien yleensäkin – tarkoitus on juuri erilaisten informaatiokerrosten yhdistäminen ja attribuuttitiedon integraatio yhteen tai useampaan karttakerrokseen. Suurten informaatiomäärien integraation varjopuolena on valtaisa toimintojen määrä ja siten käyttämisen hankaloituminen – lähes kahdenkymmenen kehitysvuotensa (2002 alkaen) aikana QGISiin on lisätty toimintoja toisensa perään ja kehitystyössä tällä hetkellä lieneekin läsnä jatkuva sopivien kompromissien tekeminen käytettävyyden ja toimintojen sisällyttämistavan välillä. En ollut itse käyttänyt varsinaista GIS-ohjelmistoa aiemmin, mutta siitä huolimatta pääsin käyttöliittymään sisään varsin jouhevasti ja sain muunneltua haluamiani ominaisuuksia sandbox-hengessä ihan vain kokeilemalla. Esimerkkeinä käyttöliittymän joustavasta toiminnallisuudesta voisi mainita runsaasti. Jo kurssia laaditun tutoriaalin (A. Paarlahti, 2020) alussa opastetaan kätevä projektion vaihtaminen lennossa (kaikki materiaali projisoidaan automaattisesti työtilan karttaikuunaan) ja koordinaattijärjestelmän muuttaminen projektioineen.

Harjoitusmateriaalina olevan Itämeren typpipäästöaineiston kautta opetellaan graafisen esityksen ominaisuuksien muuttaminen, mutta en käsittele sitä tässä sen syvällisemmin, sillä nämä toiminnot ovat varsin intuitiivisia käyttää ja itse geoinformaation tasojen käsittelyn kannalta sekundaarisia. Kuitenkin karttanäkymästä tulosteiden tuottamisen kannalta on olennaista ymmärtää, muutamia toimintoja. Riippumatta siitä, onko QGISistä ulosvietävä karttaesityksen tuloste kuva, pdf tai paperituloste, se tehdään Print composerilla -työkalulla. Print composerin esikatseulikkuna näyttää reaaliajassa kartta- ja tietuetasot siinä järjestyksessä, kun ne työtilan layer browserissa ovat. Jos informaatiokerroksia on paljon, esikatseluikkunan näkymän muuttamisessa voi olla huomattavia viiveitä. Kartan perusominaisuudet, kuten mittakaavajana ja pohjoisnuoli, on huomattavan helppo lisätä Print composerilla, mikä on mieltä ylentävä ominaisuus. Pdf-tulostetta tehdessä on myös syytä panna merkille, että oletuksena QGIS tulostaa pdf:ään kaikki valitulla resoluutiolla esitettävissä olevat vektorikuviot: tämä johtaa helposti monen sadan megatavun kokoisiin tiedostoihin, joten tulostetta laadittaessa on syytä jättää näkyviin vai ne layerit, jotka haluaa tulosteessa esittää sekä välttää tarpeettoman tarkan resoluution käyttöä tulosteissa. Tulosteen tekeminen kuvatiedostona eliminoi tämän ongelman, vaikka tässäkin on mahdollista saada liian suuriresoluutioisia tiedostoja. Myös tarpeeton transparency-asetus kannattaa kuvista ottaa pois päältä, jos sille ei ole tarvetta.

Ensimmäisellä harjoituskerralla laadittiin siis kuvatuloste Itämeren typpipäästöistä koropleettikarttana prosentuaalisesti maittain (kuva 1). Silmiinpistävää siellä on Puolan huomattavan suuri osuus paitsi itsessään, myös verrattuna lähes samanmittaisen rantaviivan omaavan Saksan kanssa. Suomi ja Ruotsikin ovat suhteessa rantaviivaansa melko maltillisella tasolla, kun taas Venäjä päästää melko paljon typpeä pieneltä Suomenlahden pohjukan kaistaleeltaan. Tästä on hyvä siirtyä pohtimaan, mikä kartta on ja mitä se kertoo. Kuten Tiia Laisi Geoinformatiikan menetelmät -blogissaan (https://blogs.helsinki.fi/tlaisi/2020/01/15/kurssikerta-1-qgis-ohjelmistoon-tutustumista/”>https://blogs.helsinki.fi/tlaisi/2020/01/15/kurssikerta-1-qgis-ohjelmistoon-tutustumista/) asian hyvin ilmaisee: ”Kartta kuvastaa ilmiötä, mutta ei tietenkään anna sille selitystä”. Typpipäästökartan tulkinta vaatii esimerkiksi jokien ja niiden valuma-alueiden, kaupunkirakenteen (Venäjällä Pietarin suurkaupunki huomattava päästölähde), maatalouden volyymin ja spatiaalisen jakautumisen ja esim. kansallisella tasolla käytössä olevan puhdistusteknologian tuntemista.


Kuva 1: Itämeren rantavaltioiden typpipäästöjen osuuksien vertailua koropleettikartalla.

Varsinaisen harjoitustehtävän tekemisen olisin jättänyt kotiin, mutta minulla oli vaikeuksia saada QGIS toimiman omalle koneelle asennettuna. Valtava (noin 2Gb) tiedostopaketti sisälsi kyllä useita, eri toimintojen .exe-tiedostoja, mutta ilmeisesti toimiakseen olisi vaatinut jonkinlaisen paketinhallintaohjelman. On myös mahdollista, että Windows on estänyt jonkin kriittisen .exe-tiedoston asentamisen tai suorittamisen. Paneudun asiaan ja tuotan tehtäväksi annetusta Suomen koropleettikartasta erillisen blogimerkinnän. Tavallaan on ihan onnekastsakin, että tällaiset käytettävyyteen liittyvät ongelmat ilmenevät alkuvaiheessa.  Karttatehtävän kohdalla minua kiinnostaa sama kysymys, jota Tomi Kiviluomaa pohtii omassa Geoinformatiikan menetelmät (https://blogs.helsinki.fi/tomingeoblogi/2020/01/16/johdanto-kurssille-ja-qgisin-perusominaisuudet/) -kurssiblgogissaan: ymmärtääkseen syvällisesti karttaesitystä on ymmärrettävä monella tasolla, mitä menetelmiä aineiston keruuseen, sen luokitteluun ja esittämiseen on käytetty ja mitä motiiveja tähän mahdollisesti kytkeytyy.


Lähteet:

Laisi, T. 15.1.2020:
Kurssikerta 1. QGIS-ohjelmistoon tutustumista. Luettu 19.1.2020 https://blogs.helsinki.fi/tlaisi/2020/01/15/kurssikerta-1-qgis-ohjelmistoon-tutustumista/

Kiviluoma, T. 16.1.2020:
Johdanto kurssille ja QGIS:in perusominaisuudet
Luettu 19.1.2020 https://blogs.helsinki.fi/tomingeoblogi/2020/01/16/johdanto-kurssille-ja-qgisin-perusominaisuudet/