Projektioista, tietokannoista ja ohjeiden kirjaimellisesta noudattamisesta

Projektiomuunnoksia ja ominaisuuksien vertailua

QGIS:in pariin palaaminen vaati ensin toki hieman mieleenpalauttelua eri toimintojen osalta, mikä alkuun sujuikin kivuttomasti. Varsinainen harjoitusten tekeminen oli hieman haasteellista, kun edelleenkään GIS ei suostunut asentumaan läppärilleni ja kurssin ollessa ylibookattu en mahtunut ensimmäisessä viikon ryhmässä työskentelemään yhdellekään koneelle. Pääsin kahlaamaan läpi tehtäviä siis omassa rauhassa eli parhaassa seurassa. Aineiston hakemiseen suoraan WFS-tietokannoista olin tutustunut jo viime kurssikerralla ja tämä olikin erittäin helppotajuista kunhan vain palvelimen osoite oli tiedossa.   Iida Kokkisen blogitekstistä (https://blogs.helsinki.fi/iixkokki/2020/01/24/toinen-tapaaminen-arvon-qgisin-kanssa/) sain myös osaselityksen viime kertaiseen aprikointiini siitä, miksi ladattu WFS-aineisto ei ollut editoitavissa ilman sen tallentamista ja uudelleenavaamista omalla koneella. WFS-palvelimelta tiedosto avattaessa tarkastellaan suoraan palvelimella olevaa tiedostoa, eikä mitään ole tässä vaiheessa vielä ladattu erikseen paikalliselle koneelle, joten on ymmärrettävää, ettei palvelimen kirjoitussuojattua tiedostoa voi muokata.

Itse aineisto- ja karttapohjien tallentaminen oli helppoa. Tämän jälkeen myös pinta-alojen ja pituusjanojen mittailu aineistosta eri projektiota käyttävissä koordinaatistoissa oli yksinkertaista ja projektion saattoi vaihtaa lennosta oikean alakulman painikkeesta. Sen sijaan lieviä haasteita tuotti QGIS:in nykyversiossa (3.4.1 Madeira) toimintojen nimien muuttuminen  suhteessa työohjeeseen. Vertailin pituus- ja pinta-alavääristymiä keskenään seuraaviin projektioihin perustuvissa koordinaattijärjestelmissä: Popular Visualisation CRS / Mercator (deprecated), World Mercator, World Robinson, World Gall-(Peters) stereographic, Albers equal area conical Europe, ETRS89 / Lambers Azimuthal Equal Area Europe ja ETRS89 / TM35FIN. Oheisesta taulukosta (taulukko 1) ilmeten suurimmat vääristymät molemmissa mitattavissa parametreissä olivat Mercatorin ja Gall-Petersin projektioissa. Gall-Petersin lukuarvot ovat sikäli mielenkiintoisia, että vaikka kyseisessä projektiossa eri alueiden pinta-alat ovat keskenään vertailukelpoisia, ovat kaikki sen pinta-alat tässä esityksessä Suomen osalta yli 2,5 kertaisia projektioihin (LAEA, TM35FIN), jossa projektiopinnan tangenttin on lähempänä kuvautuvaa kohdetta eli Suomea. Mercatorin lisäksi Gall-Petersissä pituuskoordinaatin (x-akseli) vääristymä oli melkoinen, sillä tässä projektiossa pinta-alojen vakioimiseksi suhteessa todellisuuteen y-koordinaatti venyy lähelllä päiväntasaajaa ja x-koordinaatti vastaavasti lähellä napoja. Mercator on oikeakulmainen, joten siinä vääristyy kumpikin ulottuvuus yhtä paljon, Robinsonin projektiossa taas karvan verrran pinta-alaa  enemmän pituus, sillä projektio on tunnetusti navoiltaan litistynyt. Litistyneisyys onkin Robinsonin suurin haitta ja vanhanaikaisuudestaan huolimatta sen vääristymät eivät numeroiden valossa ole katastrofaalisen suuria. Tällä tarkkuudella LAEA ja TM35FIN näyttävät vastaavan toisiaan.

Taulukko 1: Eri koordinaattijärjestelmien projektioiden vääristymien vertailua.

Projektio Selite Pinta-ala (km²), Päälaen kalotti Pituusjana (km) Virmajärvi (Ilomantsi) –  Halsön (Korsnäs) Pinta-alan erotus (km²) Pituusjanan erotus (km) PA-vääristymä (% suurempi kuin LAEA) Pituusvääristymä, (% suurempi kuin LAEA) PA / pituus -vääristymien suhde
EPSG:3785 Popular Visualisation CRS / Mercator (deprecated) 54536,809 1162,109 47902,31 631,647 722,0184976 119,0748819 3,752226136
EPSG:54004 World Mercator 54492,296 1162,109 47857,797 631,647 721,3475652 119,0748819 3,749163565
EPSG:54030 World Robinson 9354,053 764,869 2719,554 234,407 40,9910982 44,18921619 0,977819992
EPSG:54016 World Gall-(Peters) stereographic 16999,551 821,72 10365,052 291,258 156,2296113 54,90647775 1,654092295
EPSG:102013 Albers equal area conical Europe 6635,165 530,489 0,666 0,027 0,010038437 0,005089903 1,000049483
EPSG:3902 ETRS89 / TM35FIN 6634,499 530,462 0 0 0 0 1
EPSG:3035 ETRS89 / Lambers Azimuthal Equal Area Europe 6634,499 530,462 0 0 0 0 1

Koordinaatistomuutoksia suorittaessani törmäsin QGIS:ille ilmeisen tyypilliseen ja hermoja raastavaan ilmiöön; haluttua toimenpidettä ei saa tehtyä ongelmitta, vaikka intuitiivisesti tekisi mielestään kaiken oikein – sen sijaan on vain yksi, intuitiolla tai loogisella päättelyllä löydettäväksi täysin mahdoton tapa toimia, jos mielia saada haluamansa toimenpiteen suoritettua. Kuten monen tunnin tuskailun ja erinäisten epämääräisten, noin 100dB:n äännähdysten jälkeen sain havaita, tässä tapauksessa koordinaatistomuunnoksen tekemisessä oli noudatettava työohjetta kirjaimellisesti – eli tallennettava aineisto omalle koneelle ja suoritettava muunnos nimenomaan tässä vaiheessa. Jos tein koordinaattimuunnoksen alakulman painikkeesta ennen tallentamista, oli seuraavassa vaiheessa tiedossa error-viesti ja projektio palautui oletuskoordinaatistoon.

Lopulta sain tämän kuitenkin ohjeita prikulleen noudattaen toimimaan ja loin kaksi isolpeettikarttaa. Ensimmäisessä vertailin Mercator-projektiota käyttävän koordinaatisotn pinta-alavääristymää prosentuaalisesti LAEA-projektion (kuva 1) ja toisessa vastaavasti Robinson-projektiota LAEA-projektioon (kuva 1). koordinaatistoon. Suurimpien luokkien vääristymät Pohjois-Suomessa vastaavat taulukon 1 lukuja; esim. Mercator-projektion pinta-alavääristymä Utsojen-Inarin alueella on yli 8,2-kertainen eli yli 720 % LAEA-projektiota suurempi. Halusin esittää aineiston luokat keskenään edes jollakin tavoin vertailukelpoisessa muodossa näiden kahden vertailukartan välillä eli käytännössä havainnollistaa sitä, miten Mercatorin projektiossa (suhteessa Robinsoniin) kunkin luokan pohjois-eteläsuunnassa  kattama maantieteellinen etäisyys pienenee luokittain pohjoista kohti edetessä – mikä tarkoittaa, että pinta-alavääristymä kasvaa eksponentiaalisesti napaa lähestyttäessä. Sopivaksi luokkien määräksi päätin 5, sillä esim. jo kuudella käytettävällä luokalla Pohjois-Suomen kuntien suuret, kauas sijaintikeskipisteestään ulottuvat alueet alkavat vääristää luokkarajoja, jolloin ilmiö ei enää kuvaa todellisuutta – vaikka luokkia lisätessä spatiaalinen resoluutio sinänsä kasvaisi. Käytännössä esim. Enontekiö kuvautuu alempaan luokkaan kuin Inari ja Utsoki, vaikka ne sijaitsevat lähes samojen leveysasteiden välillä – tällöin katsoja ei voi hahmottaa, missä luokkaraja todella kulkee. Värit valitsin räikeiksi ja siten, että niistä kävisi ilmi Mercator-projektion pinta-alavääristymän olevan alimmassakin luokassa noin kolminkertainen Robinsonin ylimmän luokan vääristymään verrattuna.


Kuva 1: Mercator-projektion pinta-alavääristymä (ala prosentteina isompi) verrattuna LAEA-projektioon koropleettikartalla Suomessa.


Kuva 2: Robinson-projektion pinta-alavääristymä (ala prosentteina isompi) verrattuna LAEA-projektioon koropleettikartalla Suomessa.

Projektion vaikutus pinta-alariippuvaiseen aineistoon

Lopuksi halusin tehdä vertailun projektiosta johtuvan pinta-alavääristymän vaikutuksesta Natura-alueiden prosentuaaliseen osuuteen kunnan pinta-alasta. Sattumalta keksimäni idea oli täysin sama kuin Tomi Kiviluomalla hänen blogissaan (https://blogs.helsinki.fi/tomingeoblogi/2020/01/24/tietokantoja-tykytysta-ja-toiveita-tulevasta/),  mutten kuitenkaan koskaan saanut SYKE:n WFS-palvelinta (https://geoserver.ymparisto.fi/geoserver/wfs) vastaamaan, enkä siten Natura-alueaineistoa ladattua vektorimuodossa. En ole keksinyt syytä tähän, mutta itse yritin tehdä tehtävää todennäköisesti muutamaa päivää myöhemmin kuin Tomi. Hänen esityksensä on toteutukseltaan varsin vaikuttava, vaikka projektion muutos ei kartalla huomattavaa eroa tarkasteltavaan suhteeseen tuotakaan. Tyydyin tarkastelemaan aineistoa vain WMS-palvelimelta (kuva 3), mutta tallennus vektorimuodossa ei WMS-datasta onnistu, vaikka selvästi tämäkin kuva sisältää paikkatietoaineistoa sen esitystavan reagoidessa koordinaatistomuunnoksiin. Olin myös etsinyt MML:n aineistosta jo valmiiksi käsiini merialueet kattavat kuntarajat, jotta saisin sisällytettyä myös Itämerellä sijaitsevat Natura-alueet aineistoon. Eräs ajatus olikin verrata tätä Natura-alueet / pinta-ala -listan muuttumista siitä riippuen, sisällytänkö merialueet mukaan.


Kuva 3: Natura-alueet Suomen kartalla

Toteutin siis tehtävän lopulta vertailemalla terveydenhuoltohenkilökunnan määrää neliökilometriä kohti Suomen sairaanhoitopiireissä Mercator-projektiolla esitettynä vs. todellisia pinta-aloja vastaavalla LAEA-projektiolla esitettynä. Koska sairaanhoitopiirit vastaavat lähes maakuntia, eikä sairanahoitopiirirajoista yllättäen ollut vektorikartta-aineistoa (etsin noin 3h), päätin käyttää sairaanhoitopiirien sijaan maakuntia. Tässä tarvitsi yhdistää aineistoja useammasta lähteestä: etsin Sotka-netistä (THL) sairaanhoitopiirien henkilökuntamäärän / 10k asukasta ja maakuntien asukasluvun (molemmat vuosita 2012). Karttapohjana käytin vanhinta saatavilla olevaa Tilastokeskuksen maakuntakarttaa 2013, mutta maakuntarajat eivät tämän jälkeen ole muuttuneet, joten se kelpaa tarkoitukseen hyvin. Yhdistin numeerisessa datassa muutamien maakuntarjaoista poikkeavien sairaanhoitopiirien kentät (henkilökuntaa / 10k asukasta) toisiinsa keskiarvoistamalla; Itä-Savon ja Etelä-Savon sairaanhoitopiiri kattavat yhdessä Etelä-Savon maakunnan, Länsi-Pohjan ja Lapin sairaanhoitopiirit kattavat Lapin maakunnan, Vaasan sairaanhoitopiiri kattaa yksin Pohjanmaan maakunnan.

Yritin yhdistää numeerisen attribuuttiaineiston join-toiminnolla karttaan, mutta jostain syystä se ei onnistunut QGIS:in sisällä, vaan aina jompaan kumpaan kahdesta liittämästäni taulukosta tuli NULL-kenttiä. Syytä tälle en pähkäilystä ja huolellisesta läpikäynnistä huolimatta keksinyt. Siispä yhdistin kaksi lähdemateriaalin taulukkoa suorittamalla laskutoimitukset Excelissä ja yhdistin tämän tulostaulukon (terveydenhuoltohenkilökunta / maakunta) maakuntakartta-aineistoon. Koska aineiston absoluuttiset luvut olivat hyvin pieniä, tasaväliluokittain esitettynä aineisto ei olisi näyttänyt koropleettikartalla järkevältä. Siispä käytin tässä tapauksessa Jenksin Natural breaks -luokittelua ja luokkien määrällä 8 saavutin optimaalisen resoluution. Kuvista 4 ja 5 ilmenee tämä ero koropleettikartoilla esitettynä.

Tarkastellaan ensin aineistoa LAEA-projektiosta muodostetulla kartalla (kuva 4). Yleisellä tasolla terveydenhuoltohenkilökunnan määrä neliökilometrillä noudattelee asukastiheyttä. Odotin, että henkilöstöltään massiivisen yliopistosairaalan sisältävät maakunnat olisivat dominoineet tässä tiheydessä, mutta näin ei käynyt – selitys lienee siinä, että yliopistoja on ennestään tiheästi asutuissa maakunnissa. Pohjois-Savo muodosti yliopistosairaalamaakunnista (KYS) ainoan positiivisen poikkeaman asukastiheydestä. Muita asukastiheyttään suuremmalla terveydenhuoltohenkilöstöllä varustettuja maakuntia olivat Päijät-Häme (henkilökuntatiheus suurempi kuin esim. sitä hieman tiheämmin asutulla Pirkanmaalla) sekä Pohjanmaa ja Ahvenanmaa. Kahdessa jälkimmäisessä trendiä voi nostaa ruotsinkielisen hoitohenkilökunnan keskittyminen näihin maakuntiin eli työvoiman helppo saatavussa ja toisaalta yleisenä trendinä vaikuttaisi, että pieni pinta-ala itsessään nostaa terveydenhuoltohenkilökunnan tiheyttä, vaikka asukastiheys olisi suhteellisen matala.

Eri projektioilla muodostettuja karttoja verrattaessa huomionarvoista on, että Mercatorilla alin luokka kattaa kaikki arvot, jotka ovat välillä 3-7 kertaa pienempiä kuin LAEA:n alimmassa luokassa, joka puolestaan edustaa vain yhtä lukua 0,05. Suurimpien luokkien arvot ovat absoluuttisesti noin 4 kertaa suurempia LAEA:ssa kuin Mercatorissa. Käytännössä Mercatorin ero napaa kohti kasvavassa pinta-alavääristymässä alkaa vaikuttaa vasta Lapin maakunnassa ja muualla vääristymä LAEA-projektioon on käytännössä 4-kertainen. Luokkien keskinäistä eroa tarkastellessa on huomionarvoista, että Mercatorissa Kainuun maakunta putoaa samaan luokkaan Lapin kanssa ja Etelä-Savo putooa myöskin pykälän. Tosin luokat eivät ole nyt tasaväliset ja tälle muutokselle luokkajako on itse asiassa todennäköisin selitys. Summa summarum: karttaesitystä muodostettaessa projektion ohella huomiota tulee kiinnittää erityisesti luokkajakoon!


Kuva 4: Terveydenhuoltohenkilöstö neliökilometriä kohden Suomen maakunnissa, laskettu LAEA-projektiolla


Kuva 5: Terveydenhuoltohenkilöstö neliökilometriä kohden Suomen maakunnissa, laskettu Mercator-projektiolla

 

Lähteet

  1. Kokkinen, I. 24.1.2020:
    Toinen tapaaminen arvon QGISin kanssa, luettu 31.1.2020
    https://blogs.helsinki.fi/iixkokki/2020/01/24/toinen-tapaaminen-arvon-qgisin-kanssa/
  2. Kiviluoma, T. 24.1.2020:
    Tietokantoja, tykytystä ja toiveita tulevasta, luettu 31.1.2020 https://blogs.helsinki.fi/tomingeoblogi/2020/01/24/tietokantoja-tykytysta-ja-toiveita-tulevasta/

Yksi vastaus artikkeliin “Projektioista, tietokannoista ja ohjeiden kirjaimellisesta noudattamisesta”

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *