Fake news

Toisesta kurssikerrasta onkin näköjään ehtinyt vierähtää jo reipas tovi. Muistikuvieni mukaan olin pihalla kuin lumiukko, kun näitä asioita käytiin läpi itse kurssikerralla, joten sinällään tällä ajan yllättävän nopealla kulumisella ei oman oppimiseni kannalta ole niinkään väliä. Nähkääs, ei voi unohtaa taitoja, joita ei koskaan oikein oppinutkaan. Da. Toisaalta edellisen postaukseni lopussa taisin mainita tuntevani itseni suorastaan IT-neroksi, joten ihan optimistisin mielin siirryn tästä tekemään harjoituksia. Jostain syystä preesensissä tällä kertaa, vaikka kirjoitus on toki tehty retrospektiivisesti tehtyjä töitä tarkastellen. Aikamuodot sekoittuvat. Ajatus harhailee.

 

Jo riittävät jonninjoutavat lätinät. Töihin.

 

Avaan lämmittelytyön. Testailen työkaluja vähäsen aikaa. Saan valittua joukon Suomen kuntia, jotka kuuluvat samaan maakuntaan, kuten toiveena on. Hyvin pyyhkii, toistaiseksi. Sitten alan vertailla Pohjois-Suomeen piirtämäni alueen pinta-alaa ja Vaasasta Ilomantsiin kulkevaa mittausviivaa eri karttaprojektioilla. Jumitun jostain syystä jo tähän kohtaan melko pitkäksi aikaa, kun jään ensinnäkin pohtimaan, mitä projektioita valitsisin käytettäviksi ja toiseksi sen takia, että taulukon kanssa tuhraamiseen menee luvattoman kauan. En ole varma, mitä lukuja taulukkoon oikeastaan pitäisi laittaa. Tutkailen muiden blogitekstejä ja esimerkiksi Jaakko Kuurne oli päätynyt hivenen erilaiseen taulukkoratkaisuun kuin mitä minun tekisi mieleni tässä yhteydessä tehdä. Ja koska tunnen edellä mainitun kaverin melko hyvin ja tiedän hänen olevan välillä jopa raivostuttavan kyvykäs oikeastaan aivan kaikessa mihin ryhtyy, epäröin pitkään tehdä taulukkoa eri tavalla kuin hän, sillä todennäköisesti hänen tapansa on kuitenkin ainut oikea. (EDIT 20.4.: Näköjään Kuurne on muokannut taulukkoaan sen jälkeen kuin kirjoitin tämän tekstin – vieläpä samaan suuntaan kuin mitä oma taulukkoni on.) Hämmentäviä epävarmuuden hetkiä yön pikkutunteina. Toisaalta, kyllä taulukkoja maailmaan mahtuu. Taulukossa 1 omani:

 

Taulukko 1. Eri projektioiden vääristymien vertailua.

Projektion ID Projektion nimi Satunnainen pinta-ala Pohjois-Suomessa km² Vaasan ja Ilomantsin välinen mittausviiva, km Pinta-alan absoluuttinen muutos verrattuna ETRS89 / TM35FIN -projektioon, km² Mittausviivan absoluuttinen muutos verrattuna ETRS89 / TM35FIN -projektioon, km Pinta-alan muutos suhteessa ETRS89 / TM35FIN -projektioon, % Mittausviivan muutos suhteessa ETRS89 / TM35FIN -projektioon, %
EPSG:3785 Popular Visualisation CRS / Mercator (deprecated) 644910,445 1122,497 559278,004 612,546 653,115 suurempi 120,119 suurempi
EPSG:54030 World Robinson 118124,773 739,429 32492,332 229,478 37,944 suurempi 45,000 suurempi
EPSG:54027 World Equidistant Conic 86629,767 510,74 997,326 0,789 1,165 suurempi 0,155 suurempi
EPSG:102013 Europe Albers Equal Area Conic 85640,968 509,977 8,527 0,026 0,010 suurempi 0,005 suurempi
IAU2000:61818 Pan North Pole Stereographic 43,726 5,221 85588,715 504,73 99,949 pienempi 98,976 pienempi
EPSG:3902 ETRS89 / TM35FIN 85632,441 509,951 0 0 0 0

 

Maapalloa ei tunnetusti voi kuvata millään projektiolla täysin oikein ja taulukosta 1 näkeekin selkeästi projektiovalinnan valtavan vaikutuksen pinta-aloihin ja etäisyyksiin (ja kulmiin, joita ei tosin tässä yhteydessä käsitellä). Taulukossa vertaillaan erilaisia projektioita Suomea melko todenmukaisesti kuvaavaan ETRS89-TM35-projektioon. Mercatorin perinteinen oikeakulmainen lieriöprojektio vääristää sekä pituus- että leveyssuuntaisia mittasuhteita sitä enemmän, mitä kauemmas päiväntasaajalta edetään ja Suomi on sen verran pohjoisessa, että vaikutukset näkee selvästi: mittaamallani alueella Mercatorin pinta-ala on yli 650% suurempi kuin TM35-projektiossa, jossa siis Mercatorin projektio on käännetty poikittain ja keskimeridiaani (tämän projektion ”päiväntasaaja”) kulkee Suomen halki, jolloin projektio on Suomen osalta suhteellisen realistinen. Ihan hyvä tavallaan, että Mercator on saanut haastajia. Robinsonin projektio on kompromissi, joka vääristää niin pintoja, kulmia kuin etäisyyksiäkin, mutta mahdollisimman vähän. Mittaamillani kohteilla vääristymä on suurempi leveyssuuntaisen janan kuin pinta-alan osalta (päinvastoin kuin Mercatorin projektiossa), mikä johtuu siitä, että projektio litistyy napoja kohti mentäessä. Equidistant Conic on tasavälinen kartioprojektio, jossa on kaksi standardileveyspiiriä, joiden kohdalla kartio sivuaa maapallon pintaa. Toinen näistä sattuu vieläpä olemaan osapuilleen Helsingin korkeudella, joten olettaa sopii projektion lukujen olevan melko lähellä TM35-koordinaattijärjestelmän arvoja. Näin myös on, kuten taulukosta selviää. Albersin oikeapintainen projektio kuvaa pinta-alat oikein, joten pinta-ala on jo käytännössä sama kuin Suomen omassa koordinaatistossa. Kirsikkana kakun päälle valitsen taulukkoon mukaan vielä kunnon huumoriprojektion, Pan North Pole Stereographicin, joka kuvaa maapallon pinnan tasolle pohjoisnapaa lukuun ottamatta. Muita pisteitä ”vastaa se piste, jossa tämän projektiopisteen ja annetun pisteen kautta kulkeva suora leikkaa tason”, tietää Wikipedia kertoa. Artikkeli myös jatkaa kertomalla projektiota kuvaavan funktion olevan määrittelyjoukossaan sileä, bijektio sekä konforminen. En suinkaan väitä, että ymmärtäisin, mistä tässä kaikessa oikein on kyse (tai Wikipedian olevan luotettava lähde yhtään missään), mutta tulos on kiinnostava: Pinta-ala on 99,949% pienempi kuin TM35:n. Sitä ei siis lähes ole. Samoin käy luonnollisesti mittausviivan kanssa. Olen mykistynyt. Propagandan määrä on vakio. Siirryn eteenpäin pikavauhtia.

 

Uppoan yhä syvemmälle pituuksien ja pinta-alojen vääristymiin ja tarkoitus onkin seuraavaksi havainnollistaa koropleettikartan muodossa, kuinka suurta heittoa huono projektiovalinta voi dataan tuottaa. Lataan aineistoksi Suomen kunnat vuoden 2020 jaolla ja aion käyttää projektiona ainakin Euroopan komission suosittelemaa Lambertin oikeapintaista tasoprojektiota. Ai miksikö sitä suositellaan? Noh. Analyyseissa, joissa pinta-ala on merkittävässä asemassa, kannattaa toki käyttää projektiota, joka kuvaa pinta-alat oikein. Suosittelu käy järkeen, joten hymähdän hyväksyvästi Euroopan komissiolle: hyvää työtä, Euroopan komissio. Oma suoritukseni alkaa sen sijaan tökkiä. Säädän arviolta tunnin verran projektiomuunnoksen kanssa ennen kuin ymmärrän, kuinka se todella pitää tehdä. On ilmeisen vaikea sisäistää, että ohjelmiston sisäinen koordinaatistojärjestelmä on eri asia kuin siinä varsinaisesti näkyvä koordinaatisto. Lisäksi puhtaasti tekniset näppäryydet ohjelman toimintojen kanssa osoittautuvat yllättävän haasteellisiksi, mutta en anna tämän kuitenkaan lannistaa. Tulin voittamaan jne. Laskiessani alueiden pinta-aloja ominaisuustietotaulukkoon ohjeissa kuvatulla kaavalla, tulen kuitenkin umpikujaan ja hetken ajan luulen hävinneeni lisäajalla. Luvut eivät nimittäin ole laisinkaan sitä mitä pitäisi. Pitkään säädettyäni ymmärrän kuitenkin, että laskukaava ei toimi sen vuoksi, että jostain syystä minulla on neliömetrin sijasta neliökilometri oletusmittayksikkönä, jolloin lukuihin tulee noin miljoonan heitto. Mitäpä pienistä. Hämmentävää on vain se, että havaittuani tämän ja asetuksia tutkiessani oletukseksi on määritelty nimenomaisesti neliömetri, mutta silti jostain syystä aineistot latautuvat neliökilometreinä. Suljen koko QGIS:n ja avaan sen uudestaan, jolloin lyyti alkaa niin sanotusti jälleen kirjoittaa. Todennäköisesti olen vain aikaisempien harjoitusten tiimellyksessä epähuomiossa säätänyt oletusmittayksikön uusiksi enkä sitä enää osannut muuttaa. Eteenpäin, siis. Lasken pikaisesti pinta-alat kolmessa eri projektiossa: Lambertissa (joka siis kuvaa alat oikein), Mercatorissa (joka Taulukko 1:kin perusteella kuvaa alat päin honkia) ja päälle vielä Robinsonin kompromissiprojektiossa (joka kuvaa kaiken päin prinkkalaa muttei kokonaisuudessaan miltään osin niin paljon kuin muut), minkä jälkeen alan vertailemaan tuloksia. Kuvassa 1 näkyy Mercatorin ja Lambertin vertailu, jonka tulos on suorastaan kammottava: pinta-alavääristymä kasvaa nopeasti pohjoista kohti ja on pahimmillaan yli 720%. Kuvassa 2 taas kuvataan Robinsonin projektio verrattuna Lambertin vastaavaan. Tulos on jo kertaluokkaa parempi, mutta melko väkevää vääristymää tässäkin kartassa esiintyy.

 

Kuva 1. Pinta-alan kasvu Mercatorin projektiossa verrattuna Lambertin projektioon.

 

Kuva 2. Pinta-alan kasvu Robinsonin projektiossa verrattuna Lambertin projektioon.

 

Sen verran karttojen teknisestä toteutuksesta, että Mercatorin hirviöprojektiossa on tarkoituksella aggressiivisen punaiseen etenevä värimaailma kuvaamassa vääristymän suurta kasvua tarkastelualueella. ”Jos todellisuus värittyy niin kyllä karttakin” onkin nykyään mottoni. Robinsonin lempeämpi vääristymä saa samalla logiikalla toki hieman vähemmän kirkuvan sävytyksen. Käytössä on myös normaalia enemmän luokkia (10 kpl) sen vuoksi, että vaikka kyseessä kuinka on koropleettikartta, kuvataan tässä yhteydessä sellaisia arvoja, jotka nousevat tasaisesti kohti pohjoista, jolloin on jopa toivottavaa, että kartasta käy värisävyjen muodossa ilmi tasainen muutos. Eri luokkien määrä on kuitenkin sellainen, että tarkat rajatkin voi halukas kartoista tihrustaa. Legendan eri luokkia kuvaavat arvot on myös käännetty toisin päin kuin oletuksena on, jotta ne etenisivät samaan suuntaan kuin kartan värit, mikä oli mielestäni oikein onnistunut päätös. Kaiken kaikkiaan olen jopa tyytyväinen karttojen ulkoasuun.

 

Työ ei kuitenkaan ole vielä ohi. Aivan lopuksi, suorastaan encoremaisesti, hyödynnän eri koordinaattijärjestelmiin tallennettuja pinta-alatietoja ja yhdistän niihin valmiiksi kerättyä tilastotietoa kunnista. Päätän yrittää suhteuttaa Natura 2000 -alueiden pinta-aloja kunkin kunnan kokonaispinta-alaan Lambertin ja Mercatorin projektioissa. Metsähallitus toki kertoo meille, että Natura-alueiden yhteenlaskettu pinta-ala Suomessa on noin 50 000 km² eli noin 15 % maan kokonaispinta-alasta, mutta kuntakohtaisten osuuksien selvittäminen ja vertailu kuulostaa kuitenkin oikein hyvältä harjoitukselta tietokantojen kanssa painimiseen. Loistavan idean tähän varastan suoraan Tomi Kiviluomalta; yritän siis olla yhtä hyvä kuin hän. Lisään Suomen vuoden 2015 kunta-aineistoon aiemmin laskemani pinta-alat tietokantaliitoksella. Tässä vaiheessa jotain menee vikaan: Kaikki koordinaatit ovat aivan väärin ja yritän korjata tilannetta availemalla uusia projekteja sekä karttatasoja sinne tänne tiheään tahtiin. Ikkunoita sinkoilee silmissä. Lopulta, ehkä pienen taisteluväsymyksen aiheuttaman herpaantumishetken jälkeen, kokoan jälleen itseni ja saan kuin saankin aikaan lähes samanlaisen projektiovertailun kuin Kiviluoma. En kuitenkaan aivan, sillä häneltä puuttuu pinta-alaa koskeva aineisto kuuden kunnan osalta, minulta seitsemän. Johtuisiko eri vuoden kunta-aineistosta? En ole varma. Lisäksi, kun yritän saada karttoihini aikaan samaa efektiä kuin hän (luokittelematon aineisto harmaalla), en osaakaan sitä tehdä vaan onnistun luomaan vain kartan, jossa harmaalla on sekä luokittelematon että arvon 0,00 saava aineisto. Muuten kuvista käy ilmi sama kuin Kiviluomallakin: Mercatorin pohjalta tehty kartta (kuva 3) kertoo Natura-alueita olevan parhaimmillaan 14,2 % kunnan pinta-alasta, kun todellisuus on lähempänä Lambertin projektiota (kuva 4), jossa Natura-alueiden osuus on enimmillään 98,9 % eli käytännössä koko kunta. Tämä johtuu täsmälleen samoista asioista kuin aiemminkin: Mercator vääristää pinta-aloja niin paljon isommiksi napoja lähestyttäessä, että joidenkin määriteltyjen muuttujien (kuten Natura-alueiden pinta-alojen) suhteelliset osuudet pienenevät merkittävästi. Ongelma valitsemassani esitystavassa on – kuten Kiviluomakin blogissaan omista kartoistaan toteaa – se, että karttojen samanlaiset värimaailmat saattavat antaa visuaalisen illuusion siitä, että arvot niiden välillä olisivat jotenkin samankaltaisia, vaikka näin ei suinkaan ole.

 

Kuva 3. Natura-alueiden osuus kunnan kokonaispinta-alasta Mercatorin projektion mukaan.

 

Kuva 4. Natura-alueiden osuus kunnan kokonaispinta-alasta Lambertin projektion mukaan.

 

Sellaista, sellaista. Yhteenvetona tästä kurssikerrasta voisi sanoa aivan kaiken olevan mitä suurimmissa määrin valetta. Silkkaa fake newsia. Tarkkana saa olla.

 

Päätän raporttini tähän tältä erää.

 

Pelkkii sydämii.

 

Lähteet:

 

Kuurne J. Projektioista, tietokannoista ja ohjeiden kirjaimellisesta noudattamisesta.

Blogikirjoitus kurssikerralta 2. Luettu 5.2.2020 ja 20.4.2020.

https://blogs.helsinki.fi/jaakongisblogi/2020/02/03/projektioista-tietokannoista-ja-ohjeiden-kirjaimellisesta-noudattamisesta/

 

Wikipedia, Vapaa tietosanakirja.

Stereografinen projektio. Luettu 5.2.2020.

https://fi.wikipedia.org/wiki/Stereografinen_projektio

 

Metsähallitus.

Natura 2000 -alueet. Luettu 21.4.2020.

https://www.metsa.fi/natura2000alueet

 

Kiviluoma T. Tietokantoja, tykytystä ja toiveita tulevasta.

Blogikirjoitus kurssikerralta 2. Luettu 5.2.2020.

https://blogs.helsinki.fi/tomingeoblogi/2020/01/24/tietokantoja-tykytysta-ja-toiveita-tulevasta/

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *