Viimeinen näytös: Yhdysvaltojen koulutustaso ja äänestyskäyttäytyminen

Viimeinen kurssikerta oli siinä mielessä vapaamuotoinen, että mitään yksiselitteistä tehtävää ei ollut eikä valmista aineistoa enää annettu opiskelijoiden käyttöön. Oli siis aika soveltaa kaikkea kurssilla opittua, kerätä itse tarvittavat tietokannat, muokata niitä ja lopulta luoda haluamansa karttaesitys mistä tahansa aiheesta, joka inspiroi. Vapaus ei ole helppoa. Kun aihe voi olla mitä vain ja aineistoja on tarjolla yhden internetin verran, tulee olo, että kaikesta löytyy aivan liian paljon dataa eikä mistään juuri sitä, mitä hakee. Valtavien tietomäärien suodattaminen minkään järkevän karttaesityksen muotoon voikin olla melkoinen haaste. Haaste on kuitenkin luonteeltaan sellainen, että se on pakko opetella voittamaan, jos aikoo koskaan esim. työllistyä mihinkään, joka liippaa läheltä maantiedettä.

 

Kädenojennuksena opiskelijoiden suuntaan oli kurssikerran materiaaleihin kuitenkin linkattu sivustoja, joista aloittaa. Aloitin siis niistä. Muutamia vaihtoehtoja punnittuani päätin ryhtyä työstämään Yhdysvaltojen karttaa, jossa vertailtaisiin osavaltioittain äänestyskäyttäytymistä ja yleistä koulutusastetta. Samaista aluetta käsitteli eri kantilta myös Katariina Kuusikero (https://blogs.helsinki.fi/katakuus/2020/03/03/luento-7-omatoimi/) pohtiessaan kiinnostavasti yksityiskoulujen ja julkisten koulujen jakautumista osavaltioissa sekä niiden yhteyttä sosiaalisiin ongelmiin. Hänenkin kartoistaan voi havaita, että Yhdysvallat on melkoisen polarisoitunut yhteiskunta ja minua kiinnosti selvittää, missä määrin sellainen sosioekonominen muuttuja kuin koulutustaso korreloi poliittisten mielipiteiden kanssa – tai onko tällaista yhteyttä ylipäätään havaittavissa. Taustakartan sain aikaan valmiiksi linkatulta Naturalearthdata-sivustolta (http://www.naturalearthdata.com/downloads/10m-cultural-vectors/) ladatusta koko maailman aineistosta, josta suodatin näkyviin pelkästään Yhdysvaltojen alueen. Äänestystulosten ja koulutustason löytäminen osavaltiotasolla ei enää ollutkaan aivan näin helppoa, mutta jonkin aikaa googlailtuani löysin tarvittavia tietokantoja, joita piti toki muokata ennen kuin ne olivat itselleni käyttökelpoisessa muodossa. Vaalit, joita tässä yhteydessä tarkastelen, ovat vuoden 2018 kongressivaalit, joista löysin tarpeellisen aineiston USA:n Federal Election Commissionin sivuilta (https://www.fec.gov/introduction-campaign-finance/election-and-voting-information/federal-elections-2018/); koulutusasteen vuoden 2016 tiedoilla taas nappasin täältä (https://www.chronicle.com/interactives/almanac-2018). Jotta tietokantakytkös taustakarttaan saatiin onnistumaan, piti molempia aineistoja jonkin verran muokata Excelissä. Tämä piti sisällään postikoodien lisäämistä (jotta yhteinen kenttä löytyy kaikista aineistoista), solujen muotoilua ja tyhjien rivien sekä sellaisten alueiden tietojen poistoa, joita ei taustakartassa ole (käytännössä territoriot, jotka eivät ole osavaltioita mutta joilla on edustaja Yhdysvaltain edustajainhuoneessa). Tämä oli puhtaasti mekaanista suorittamista, johon meni kuitenkin yllättävän paljon aikaa. Kartan visuaalista ilmettä hain myös melko pitkään enkä silti ole aivan tyytyväinen lopputulokseen. Tomi Kiviluoma oli tehnyt samankaltaisen vertailun kuin allekirjoittanutkin (https://blogs.helsinki.fi/tomingeoblogi/2020/03/02/lopputaistelu-koulutusaste-ja-trumpin-nousu-yhdysvalloissa/) ja hänen laillaan huomasin esityksen yksinkertaistuvan huomattavasti ottamalla mukaan ainoastaan USA:n mannerosat. Alaska ja Havaiji eivät muuta kokonaiskuvaa millään lailla, joten ne voidaan selvyyden ja luettavuuden vuoksi jättää kokonaan pois. Osavaltioiden nimien lyhenteet lisäsin myös kuvaan, ”sillä harva osaa paikantaa osavaltioita puhtaasti kartalta”, kuten Kiviluoma aivan oikein toteaa. Mietin vaihtoehtoisia ratkaisuja kahden muuttujan – koulutustason ja äänestyskäyttäytymisen – kuvaamiseen mutten keksinyt parempaa kuin Kiviluomankin käyttämät osavaltiokohtaiset värit + ympyrädiagrammit. Käänsin asetelman kuitenkin toisinpäin kuin hän: minun kartassani osavaltio värittyy sen puolueen värillä, joka on äänestetyin ja diagrammi taas kuvaa aikuisväestön koulutustasoa. Vielä piti selvittää, mitä lasken mukaan koulutukseen ja millä tavoin lasken osuudet äänimääristä. Päädyin lopulta kuvaamaan värillä todellisen ääniosuuden kaikista äänistä (siis myös niistä, jotka eivät menneet kummallekaan suurelle puolueelle) ja koulutukseen laskin kaikki akateemiset tutkinnot lukuun ottamatta Associate degree -tutkintoa, joka Fulbrightin sivuilta (https://www.fulbright.fi/fi/tutkimus-ja-opiskelu-usassa/perustutkinto) napatun tiedon mukaan on kaksivuotinen ohjelma, joka valmentaa eräisiin ammatteihin ja on vain osa Bachelor-tutkintoa. Vastaavaa ei esimerkiksi Suomessa edes ole ja koska kyseessä ei varsinaisesti ole kokonainen akateeminen tutkinto, jätin tämän pois laskuista. Vähintään kandidaatti pitää olla päästäkseen kartalleni! Lopputulos kuvassa 1.

 

Kuva 1. Vuoden 2018 vaalien äänestystulokset ja koulutusaste osavaltioittain Yhdysvalloissa.

 

Tulos on osapuilleen sen kaltainen kuin odotinkin. Yhdysvaltain itä- ja länsirannikot profiloituvat demokraattien äänestäjinä ja keskimääräistä hivenen koulutetumpina, keskellä olevat osavaltiot taas ovat republikaanien valtakuntaa ja jonkin verran kouluttamattomampaa väestöä. Ero koulutustasossa ei ole kuitenkaan tavattoman suuri ja poikkeuksia löytyy: Nevada esimerkiksi äänesti enimmäkseen demokraatteja, vaikka vain 23,4 prosentilla väestöstä on jokin korkeakoulututkinto ja Utah puolestaan äänesti yli 60 prosenttisesti republikaaneja, vaikka yliopistokoulutettuja on 32,7% väestöstä. Hienoisen koulutuksellisen yliotteen voi kuitenkin havaita demokraatteja äänestävissä osavaltioissa. Koulutustaso on kuitenkin vain yksi osa maan laajempaa poliittista ja sosiaalista diversiteettiä eikä yksin tietenkään selitä vielä mitään. Rannikoiden liberaalien suurkaupunkien ja etenkin Etelävaltioiden alueen kulttuuriset erot ovat jossain paljon syvemmällä kuin pelkässä koulutuksessa eivätkä erot vaikuta Trumpin aikakaudella ainakaan vähentyneen. Historian koura on pitkä ja vahvasorminen. Se pitää otteessaan kuin QGIS – paljon pidempään kuin ennalta arvaisi.

 

Kiitokset Artulle ja kaikille kurssin läpi rähmineille erinomaisen opettavaisista viikoista!

 

Mo.

 

Lähteet:

 

Kuusikero K. Seitsemäs luento – time to shine.

Blogikirjoitus kurssikerralta 7. Luettu 10.3.2020

https://blogs.helsinki.fi/katakuus/2020/03/03/luento-7-omatoimi/

 

Natural Earth Data.

Osavaltioiden rajat. Luettu 28.2.2020

http://www.naturalearthdata.com/downloads/10m-cultural-vectors/

 

Federal Election Commission.

USA:n vuoden 2018 vaalien tulokset. Luettu 28.2.2020

https://www.fec.gov/introduction-campaign-finance/election-and-voting-information/federal-elections-2018/

 

Chronicle.

USA:n koulutusaste osavaltioittain. Luettu 28.2.2020

https://www.chronicle.com/interactives/almanac-2018

 

Kiviluoma T. Lopputaistelu: Koulutusaste ja Trumpin nousu Yhdysvalloissa.

Blogikirjoitus kurssikerralta 7. Luettu 10.3.2020

https://blogs.helsinki.fi/tomingeoblogi/2020/03/02/lopputaistelu-koulutusaste-ja-trumpin-nousu-yhdysvalloissa/

 

Fulbright. Tutkimus ja opiskelu USA:ssa

Perustutkinnon määritelmä. Luettu 10.3.2020

https://www.fulbright.fi/fi/tutkimus-ja-opiskelu-usassa/perustutkinto

Ei elämästä selviä hengissä

Terve ja heipä hei.

 

Kuudes kurssikerta soljui eteenpäin kuin kevätlaitumelle kirmaava lehmä, intoa täynnä. Sellaista ei voi mikään pysäyttää, paitsi ehkä teurastajan pulttipistooli, jollaista ei nyt kuitenkaan onneksi näkynyt mailla halmeilla. Itse kurssikerran aluksi kiertelimme pienryhmissä Kumpulan lähialueita arvioiden erilaisten kohteiden viihtyisyyttä, turvallisuutta ja sen sellaisia ominaisuuksia kännykkään ladatulla Epicollect5-sovelluksella. Tämän jälkeen kaikkien ryhmien tuottama data kerättiin yhteen ja ladattiin QGIS:iin. Sen lisäksi, että tuotimme nyt ensi kertaa itse koko aineiston, käytimme myös aineiston analysoinnissa uudenlaista menetelmää, interpolointia, joka huomioi mitattujen pisteiden arvon, tiheyden ja lukumäärän. Tällä tavalla saadaan aikaan esitys, joka luo todellisten kohteiden lisäksi myös niiden välisille alueille arvion mitattavan ominaisuuden arvosta. Itse interpoloimani muuttuja oli koettu turvallisuuden tunne eri paikoissa, ja pienellä säädöllä sain aikaan kuvassa 1 näkyvän kartan.

 

Kuva 1. Kumpulan lähiseutu koetun turvallisuuden tunteen mukaan. Mitä punaisempi värisävy, sitä turvattomampi alue.

 

Aineisto on sen verran pieni (49 kohdetta), että yksittäiset arviot vaikuttavat aivan liikaa alueen koettuun turvallisuuteen, jotta tästä saisi tieteellisessä mielessä kunnollista kvantitatiivista dataa aikaiseksi. Mutta se nyt tuskin oli ideakaan, vaan se, että ymmärrämme, kuinka aineistoja ylipäätään voi luoda. Tekemämme arvion perusteella risteys on vaarallinen paikka kuten myös Chemicumin piha. Ensin mainittu käy intuitiivisesti järkeen, mutta yliopiston kampuksen koetun vaarallisuuden syyt vaativat jo mielikuvituksellisempia selityksiä. En lähde niihin nyt.

 

Toisessa tehtävässä latasin pohjaksi maailmankartan ja päälle tietoa kolmesta hasardista: maanjäristyksistä, tulivuorten purkautumisista ja meteoriittien putoamisista. Ideana oli astua opettajan saappaisiin ja tuottaa valtavan aineiston pohjalta materiaalia, jota voisi käyttää tuntiopetuksessa. Aineistojen muokkaaminen oikeaan muotoon Excelissä oli yllättävän vaivatonta eikä (vastoin kaikkia odotuksia) suurempia ongelmia tässä työvaiheessa ilmennyt. Kerrassaan mahtavaa! Excel kun on ollut arkkiviholliseni koko elämäni. Tällä kertaa voitin ohjelman kuitenkin 6-1. Yhden säälipisteen Excel sai siitä, että en osannut muokata vuosilukuja haluamaani muotoon yhdessä aineistossa, mutta lopputuloksen kannalta sillä ei ollut oikeastaan mitään väliä. Käytin melko kauan aikaa aineiston läpikäymiseen, koska sitä oli niin paljon (käytännössä koko maailmanhistorian kaikki tiedossa olevat järistykset, purkaukset ja meteoriitit), ja lopulta päädyin tuottamaan kartan vuoden 1900 jälkeen purkautuneista tulivuorista ja vähintään kuuden magnitudin maanjäristyksistä, sillä näin mukaan ei tullut joitain ammoin sammuneita tulivuoria tai mitättömän pieniä järistyksiä (tällaisellakin suodatuksella järistyksiä on kuitenkin yli 6000). Joidenkin muiden kurssilaisten lailla kokeilin myös visualisoida karttaani interpoloinnin keinoin, mutta en ollut lainkaan vakuuttunut tuloksesta. Kuvan 2 perinteinen pistekartta kuvastaa siis lähihistorian toteutuneita purkauksia ja järistyksiä, jotka karttaa vilkaisemalla tapahtuvat suurelta osin samoilla alueilla. Miksi näin? ”Koska litosfäärilaattojen rajat kulkevat siellä”, kerron dramaattisesti luokalleni, jota ei ole olemassa. Laatat aiheuttavat liikkuessaan primääristi maanjäristyksiä ja sekundaarisesti tulivuorten purkauksia, sillä laattojen törmäykset tai etääntymiset toisistaan tuottavat suuren osan tulivuorista. Tämän vuoksi litosfäärilaattojen rajat olisi kiva saada kartalle. Mutta mistä sellaiset saisi? Totta puhuen vaivaa ei täytynyt nähdä juuri yhtään, sillä muut olivat tehneet työn valmiiksi: Vilma Koljonen oli nimittäin jo etsinyt laattojen rajat (https://blogs.helsinki.fi/vilmakol/2020/02/19/raikasta-ulkoilmaa/) maailmankarttansa päälle, mistä Tomi Kiviluoma taas oli saanut inspiraation etsiä itsekin tarvittavat aineistot (https://blogs.helsinki.fi/tomingeoblogi/2020/02/20/hasardia-menoa/), jotka oli löytänytkin ja onnekseni linkannut omaan blogiinsa. Allekirjoittaneelle jäi maailman helpoin työ painaa linkkiä ja napsia valmiit laattarajat omiin töihinikin. Nöyrimmät kiitokseni molemmille edellä mainituista! Niin. Ne rajat menevät melko yksiin niin toteutuneiden maanjäristysten kuin tulivuorenpurkaustenkin kanssa, joten periaatteessa hasardikartallani voisi kuvata ja opettaa ihan vain litosfäärilaattojen rajoja. Pelkästään niistä löytyy kartta esimerkiksi Worldatlaksesta (https://www.worldatlas.com/articles/major-tectonic-plates-on-earth.html).

 

Kuva 2. Vuoden 1900 jälkeen tapahtuneet tulivuorenpurkaukset ja isohkot maanjäristykset maailmassa.

 

Seuraavaksi halusin opettaa olemattomille oppilailleni (opetusmateriaaliahan tässä piti tuottaa), että vaikka maanjäristyksiä ja tulivuorenpurkauksia pystyy välttelemään pysymällä kaukana litosfäärilaattojen rajoilta, voi meteoriitti silti pudota päähän aivan missä tahansa – sitä kun ei kiinnosta oikeastaan mikään mitä maapallolla tapahtuu. Kuvasta 3 voidaankin todeta, että meteoriitteja on iskeytynyt historian saatossa aivan kaikkialle, missä vain on ollut joku havainnoimassa sitä joko putoamisen aikaan tai suuren törmäyksen kyseessä ollessa kraatterin tai muiden todisteiden löytyessä. Meriin, sademetsiin tai aavikoille putoavia kappaleita on huomattavan vaikea huomata, mikä selittää kartalla olevat tyhjemmät kohdat. Noh, ehkä huoli meteoriitin päähän putoamisesta ei kuitenkaan ole aivan akuutti: tiettävästi tunnetun historian aikana yksi ihminen on kuollut meteoriitin iskiessä maahan (https://yle.fi/uutiset/3-8660343).

 

Kuva 3. Tiedossa olevat meteoriittien maahanputoamispaikat maailmassa.

 

Ja lopuksi rauhoittelen imaginaaristä luokkaani sillä, että kuvassa 4 näkyvät oikein voimakkaat maanjäristykset (magnitudi vähintään 8) ovat verrattain harvinaisia. Niitä on tapahtunut vuosina 1900-2012 kaikkiaan 39.

 

Kuva 4. Vuosien 1900-2012 maanjäristykset, joiden magnitudi on vähintään 8.

 

Kerran kolmessa vuodessa siis… Tätä lisähuomiota en kuitenkaan kerro oppilailleni, muussa tapauksessa pedagoginen hampurilaistaktiikkani menisi pieleen. Jätän luokkani naureskelemaan hyväntuulisesti yltiöpäisessä itseluottamuksen tilassa ja täysin tietämättöminä luonnonhasardien vaarallisuudesta.

 

Itse poistun ovesta peläten astuvani suoraan episentrumiin.

 

Lähteet:

 

Koljonen V. Raikasta ulkoilmaa!

Blogikirjoitus kurssikerralta 6. Luettu 5.3.2020

https://blogs.helsinki.fi/vilmakol/2020/02/19/raikasta-ulkoilmaa/

 

Kiviluoma T. Hasardia menoa.

Blogikirjoitus kurssikerralta 6. Luettu 5.3.

https://blogs.helsinki.fi/tomingeoblogi/2020/02/20/hasardia-menoa/

 

https://github.com/fraxen/tectonicplates Luettu 5.3.2020

 

https://www.worldatlas.com/articles/major-tectonic-plates-on-earth.html Luettu 5.3.2020

 

https://yle.fi/uutiset/3-8660343 Luettu 5.3.2020

Työkalupakki hukassa

Päivää. Tai yötä.

 

Oli miten oli, palaan iloksenne tai ainakin omaksi ilokseni taas pieneltä luovalta tauolta takaisin blogin kirjoittamisen sykähdyttävään maailmaan! Viidennellä kurssikerralla oppimistavoitteeksi oli asetettu karttakohteiden bufferointi sekä erilaisten laskutoimitusten tekeminen kohteiden avulla. Alkuharjoitukseksi laskin ohjeiden mukaisesti Pornaisten alueen teiden pituuksia ja peltojen pinta-aloja, minkä jälkeen puskuroin alueella sijaitsevista teistä, terveyskeskuksesta ja koulusta erikokoisia alueita, jotta saisin selville näiden kohteiden vaikutusalueen ja saavutettavuuden. Kuvassa 1 karttanäkymä alueesta:

 

Kuva 1. Pornaisten alueen bufferointeja.

 

Varsinaiset itsenäistehtävät aloitin Malmin lentokenttäalueen analysoinnilla. Tehtävänä oli laskea kentän melualueella asuvien ihmisten määrä 1 km:n ja 2 km:n säteellä, mikä onnistui helposti samalla logiikalla kuin alkuharjoituksessakin. Viralliset lentomelualueet määrittävät Helsingin kaavoitusta (https://www.malmiairport.fi/helsinki-malmin-aanitasomallinnus-paivitetty-kaavoituksessa-kaytetyt-melukayrat-eivat-vastaa-todellisuutta/), joten asia on sikäli merkittävä ja myös ajankohtainen, sillä – kuten tunnettua – Malmin lentokentän alueelle kaavaillaan asuinaluetta n. 25 000:lle ihmiselle (https://www.uuttahelsinkia.fi/fi/malminlentokentanalue). Tällaisia uudistussuunnitelmia tietysti myös vastustetaan yritystoiminnan, historian, ilmailun tai kaupunkikuvan muuttumattomuuden ystävien toimesta (https://www.kuntalaisaloite.fi/fi/aloite/6466), jotka puolestaan ovat tukkanuottasilla lähes mm. koko kaupunginvaltuuston kanssa. ”Aiemmin Suomen suurimpana ollut aloite ilmailukäytön jatkamisesta (Malmilla) käsiteltiin valtuustossa halveksien ja naureskellen, emmekä halua kansanliikkeelle uutta nolausta”, kertoo esimerkiksi Malmin lentoaseman ystävät ry:n puheenjohtaja Timo Hyvönen (https://www.iltalehti.fi/kotimaa/a/30c87b7d-ef08-456f-a42b-44bea7f05df0). Meluhaitat ovat olleet yksi (ei kuitenkaan ehkä vahvin) perustelu kentän purkamiseksi, joten halusinkin laskea, kuinka moni lähialueen taloista on rakennettu lentokentän käyttöönottovuoden (1936) jälkeen, jotta voin määritellä… hmm… Mitäköhän tämän tiedon avulla voikaan määritellä? Jaa-a. Vaikkapa sen, kuinka moni ihminen on jäävi vastustamaan kenttää melunäkökulmasta? Mennään sillä. Kyllä. Paremman puutteessa. Taulukosta 1 voimme lukea, että 1 km:n säteellä kentästä on yhteensä 745 rakennusta, joista vaivaiset 51 on rakennettu ennen lentokentän käyttöönottoa. Näissä 51:ssä talossa asuvat 184 ihmistä voivat valittaa naapuriinsa rakennetusta kentästä. Loput 97,87% alueen asukkaista asuvat rakennuksissa, jotka on rakennettu kentän käyttöönoton jälkeen. Kuvassa 2 nämä talot merkitty punaisella. Ei valitusoikeutta heillä meluun! Asia käsitelty.

 

Taulukko 1. Malmin lentokentän melualueen asutustietoja.

Asukkaita 1 km:n bufferilla 8650
Rakennuksia 1 km:n bufferilla 745
Asukkaita 2 km:n bufferilla 56947
Rakennuksia 2 km:n bufferilla 4686
Ennen vuotta 1936 rakennettuja taloja 1 km:n bufferilla 51 (6,85% kaikista taloista)
Asukkaita ennen vuotta 1936 rakennetuissa taloissa 1 km:n bufferilla 184 (2,13% kaikista asukkaista)
Kuva 2. Malmin lentokentän melualue.

 

Seuraavaksi otin käsittelyyn hiukan isomman lentokenttäkompleksin, Helsinki-Vantaan. Nytkin laskin melualueita, mutta hivenen mutkikkaammin kuin Malmin tapauksessa. Taas piirsin kiitoradat Add line feature -työkalulla, tallensin ne tietokannaksi, valitsin rakennuksia ja niissä asuvia ihmisiä Select by location -työkalulla, tallensin niitä tietokannoiksi, tarkistelin joka välissä Statistics-paneelista kohteiden määriä ja kirjasin niitä ylös (aivan kuten Malmin tapauksessakin). Lisäksi laskin arvion Tikkurilan 60:n dB:n lentomelualueesta, joka toteutuu, jos koneet joutuvat laskeutumaan ko. suunnasta esimerkiksi poikkeuksellisen tuulen tai lentokentän rakennustöiden vuoksi. Taulukosta 2 voidaan todeta, että aluesuunnittelu tuottaa tulosta: kovimmalla meluvyöhykkeellä 2 km:n alueella lentokentästä asuu vain 27 ihmistä. Jos taas Tikkurilan yli lentäminen olisi päivittäistä, kovasta melusta kärsisi jatkuvasti 12 489 ihmistä.

 

Taulukko 2. Helsinki-Vantaan lentoaseman melualueen asutustietoja.

Rakennukset enintään 2 km:n etäisyydellä kiitoradoista 2228
Asukkaat enintään 2 km:n etäisyydellä kiitoradoista 10427
2 km:n vyöhykkeellä asuvat vähintään 65:n dB:n lentomelualueen asukkaat 27
2 km:n vyöhykkeellä asuvat vähintään 55:n dB:n lentomelualueen asukkaat 610
Kaikki vähintään 55:n dB:n lentomelualueen asukkaat 11913
Tikkurilan 60:n dB:n lentomelualueen asukkaat (arvio) 12489

 

Sitten taas bufferoin ja tein yksinkertaisia laskutoimituksia metro- ja juna-asemien saavutettavuudesta pääkaupunkiseudulla. Ei siitä sen enempää, taulukko 3 puhukoon puolestaan.

 

Taulukko 3. Pääkaupunkiseudun juna- ja metroasemien saavutettavuus.

Alueen asukkaat yhteensä 490173
Enintään 500 m:n päässä asemista asuvat ihmiset 106691 (21,77% kaikista asukkaista)
Työikäiset enintään 500 m:n päässä lähimmästä asemasta 73108 (68,52% kaikista enintään 500 m:n päässä asemista asuvista)

 

Tähän asti kaikki meni pienen gis-taukoni huomioiden jopa yli odotusten. Hankaluuksia oli kuitenkin luvassa, kun aloin painia taajamien kanssa. Aloitin laskemalla Vaki_vantaa_font_point -tietokannan perusteella taajamien asukaslukuja. Taajamissa asuvien ihmisten prosentuaalisen määrän sain helposti kokoon perinteisellä Select by location -työkalulla, mutta taajamien ulkopuolella asuvien kouluikäisten prosenttiosuutta laskiessa tulos oli aina se, että kaikki asuvat taajamissa. Jumitin tässä kohtaa arviolta tunnin ja kävin tarkastamassa muiden blogeista, mitä tuloksia he olivat saaneet aikaan. Kellään taajamien ulkopuolisten kouluikäisten määrä ei ollut nolla. Alex Nylanderilla olivat asukkaiden kokonaismäärätkin jo aivan eri luokkaa kuin minulla (https://blogs.helsinki.fi/alny/2020/02/18/kurssikerta-5-buffereita-ja-vaestoanalyyseja/), mutta epäilen tämän johtuvan eri väestötietokannan käytöstä (Alex käytti koko pääkaupunkiseudun aineistoa, minä pelkän Vantaan). Yritin monta kertaa uudestaan eri tavoin, mutta tulosta ei tullut. Lopulta tein koko kouluikäisten tietokannan uudestaan ikävuosilla 7-14 (alun perin 7-16), jotta voisin verrata saamaani tulosta suoraan Joonatan Reunasen (https://blogs.helsinki.fi/reunajoo/2020/02/17/mennaa-eteenpain/) saamiin tuloksiin. Tein laskutoimitukset uudestaan ja nyt kaikki toimikin, kuten taulukosta 4 voi päätellä. Ihmeellinen on elämä. Jotain oli jossain vaiheessa aiemmin mennyt vikaan mutten osaa sanoa mitä.

 

Taulukko 4. Vantaan alueen asutustietoja.

Taajamissa asuvat ihmiset yhteensä 478371 (97,59% kaikista asukkaista)
7-14-vuotiaat yhteensä 43786
7-14-vuotiaat taajamissa asuvat 42621
7-14-vuotiaat taajamien ulkopuolella 1165 (2,66% kaikista saman ikäisistä)

 

Ilo oli kuitenkin lyhyempi kuin koskaan. Heti seuraavana tehtävänä ollut ulkomaalaisten osuuksien laskeminen taajamissa vei minut pitkäksi ajaksi epätoivon partaalle ennen kuin ymmärsin pyytää apua. Onneksi edellä mainittu Alex Nylander muistutti minua ystävällisesti, suorastaan pelastavan enkelin lailla, Join attributes by location (summary) – ja Count points in polygon -toimintojen oikeaoppisesta käytöstä, minkä avulla sain kuin sainkin tehtävän (ja tätä seuranneen putkiremonttitehtävän) lopulta tehtyä. Kyseiset työkalut ovat olleet ennenkin jostain syystä ongelmallisia minulle ja nytkin tarvitsin apua oikeiden tasojen valitsemiseen. Kyllä se siitä vielä. Ulkomaalaisten osuuksia laskiessani käytin jostain syystä Pks_vaki_font_point -aineistoa, mikä selittänee taulukossa 5 olevien lukujen eroja esimerkiksi Tomi Kiviluoman saamiin lukuihin (https://blogs.helsinki.fi/tomingeoblogi/2020/02/12/valintojen-maailma-bufferointia-ja-tietokantojen-syvaluotaavaa-suodatusta/) – hänellä kun on asukastietoa sisältävää informaatiota 343:sta taajamasta, minulla 557:stä. Tulokset esitetty myös karttatulkintana kuvassa 3.

 

Taulukko 5. Ulkomaalaisten osuus pääkaupunkiseudun taajamissa.

Pääkaupunkiseudun taajamat, joissa asukastietoja 557
Taajamat, joissa ulkomaan kansalaisten osuus yli 10% 65 (11,7% taajamista)
Taajamat, joissa ulkomaan kansalaisten osuus yli 20 % 22 (3,9% taajamista)
Taajamat, joissa ulkomaan kansalaisten osuus yli 30% 14 (2,1% taajamista)
Kuva 3. Ulkomaan kansalaisten osuus pääkaupunkiseudun taajamissa.

 

Lopuksi tein vielä itsenäistehtävän liittyen tuleviin putkiremontteihin Helsingissä. Tarkoitus oli siis selvittää, missä päin Helsinkiä on tulevina vuosina odotettavissa suhteessa eniten kerrostalojen putkiremontteja. Tätä varten selvitin potentiaalisessa remontti-iässä (rakennettu vuosina 1965-1970) olevat rakennukset ja niiden sijoittumisen Helsingin pienalueille. Muutamalla laskutoimituksella sain aikaan taulukossa 6 näkyvät tiedot ja kuvassa 4 näkyvän koropleettikartan.

 

Taulukko 6. Helsingin rakennustietoja.

Vuosina 1965-1970 rakennetut talot Helsingissä 2094
Vuosina 1965-1970 rakennetut kerrostalot Helsingissä 776
Asukkaiden määrä putkiremontti-iässä olevissa helsinkiläisissä kerrostaloissa 42994
Asuntojen määrä putkiremontti-iässä olevissa helsinkiläisissä kerrostaloissa 25838
Kuva 4. Putkiremontti-iässä olevien kerrostalojen osuus kaikista kerrostaloista Helsingissä.

 

Ilman apua en näistä tehtävistä selvinnyt. Eri tietokantojen yhdistäminen tuottaa välillä turhan paljon vaikeuksia. QGIS tarjoaa työkalut moneen asiaan, mutta toisinaan tarvitsen jonkun vinkkaamaan oikeille poluille tai muuten saatan viettää tunteja etsiessäni yksin ratkaisua yksinkertaiseen ongelmaan.

 

Jonain päivänä olen vielä gis-guru. Se päivä ei ollut tänään.

 

Nährään!

 

Lähteet:

 

https://www.malmiairport.fi/helsinki-malmin-aanitasomallinnus-paivitetty-kaavoituksessa-kaytetyt-melukayrat-eivat-vastaa-todellisuutta/ Luettu 3.3.2020

 

https://www.uuttahelsinkia.fi/fi/malminlentokentanalue Luettu 3.3.2020

 

https://www.kuntalaisaloite.fi/fi/aloite/6466 Luettu 3.3.2020

 

https://www.iltalehti.fi/kotimaa/a/30c87b7d-ef08-456f-a42b-44bea7f05df0 Luettu 3.3.2020

 

Nylander A. Kurssikerta 5: Buffereita ja väestöanalyysejä.

Blogikirjoitus kurssikerralta 5. Luettu 3.3.2020

https://blogs.helsinki.fi/alny/2020/02/18/kurssikerta-5-buffereita-ja-vaestoanalyyseja/

 

Reunanen J. Mennää eteenpäin.

Blogikirjoitus kurssikerralta 5. Luettu 3.3.2020

https://blogs.helsinki.fi/reunajoo/2020/02/17/mennaa-eteenpain/

 

Kiviluoma T. Valintojen maailma: bufferointia ja tietokantojen syväluotaavaa suodatusta.

Blogikirjoitus kurssikerralta 5. Luettu 3.3.2020

https://blogs.helsinki.fi/tomingeoblogi/2020/02/12/valintojen-maailma-bufferointia-ja-tietokantojen-syvaluotaavaa-suodatusta/

Raaaastaria

Aika matkaa valkoisella ratsullaan vääjäämättömästi ohitsemme. Ratsu on pitelemätön, huhupuheiden mukaan hallitseva Euroopan laukkamestari ja painonsa arvoinen kullassa. Etenemisensä on määrätietoista ja askeleensa nopea. Koppotikopotikop. Kunnon koni. Hummaa seuratessa tunnit kuluvat, mutta mitään ei tapahdu ja illansuussa aamu jo on. Taas tässä kävi näin. Ryhdyt illalla hommiin ja aamulla et todellakaan ole valmis. Aina sama juttu mutta ei se mitään! En silti aio luopua tavastani tehdä kurssikerran asiat uudestaan kotona. Siperia opettaa.

 

Idea oli tällä kertaa mm. tehdä ruutukarttoja, operoida rasteriaineistoilla ja tuottaa uutta tietoa tietokantaan maantieteellisiä kohteita hyödyntämällä. Viimeksi mainittu tuotti käsittämättömiä hankaluuksia ottaen huomioon, että kurssikerralla asiat tuntuivat erittäinkin järkeenkäyviltä. Toista se on kotona ja tuntui, että kerta kaikkiaan mikään ei nyt sujunut. Tunnelma on silti kepeä, jopa riehakas. Ensimmäisessä tehtävässä teimme QGIS:ssä ruututeemakartan pääkaupunkiseudun alueelle. Ruudukon luominen ja sen karsiminen turhista ruuduista onnistui varsin helposti, mutta ongelmat alkoivat siinä vaiheessa, kun piti saada jotain järkevää dataa valitsemiini 1km x 1km -ruutuihin. En oikeastaan tiedä, mikä meni pieleen. Säädin loputtomalta tuntuvan ajan Join attributes by location – ja Join attributes by location (summary) -toimintojen kanssa enkä oikein sisäistänyt toimintojen mekaniikkaa. Vaihtelin tasoja ja laskettavia muuttujia ja lopulta puoliksi tuurilla sain aikaan jotain, joka tuntuu edes etäisesti mielekkäältä. Täytyypä seuraavalla kurssikerralla kysäistä näiden toimintojen luonteesta vielä tarkemmin ylivelhojumalalta, kuten tittelinsä tunnetusti kuuluu (ainakin jos on uskominen Matti Katajistoa (https://blogs.helsinki.fi/mattikat/2020/02/05/varsinaista-velhoilua/) ja miksei toisaalta olisi). Karttani on joka tapauksessa kuvassa 1:

Kuva 1. Ruotsinkielisen väestön suhteellinen jakautuminen pääkaupunkiseudulla.

Kartalla esitetään ruotsinkielisten osuus koko väestöstä neliökilometreittäin. Saman oli tehnyt mm. Heta Rantakallio (https://blogs.helsinki.fi/hetranta/2020/02/12/4-ensikosketus-rasteriaineistoihin/), joka tosin päätyi aikalailla erilaisiin prosenttilukemiin kuin allekirjoittanut. Oli miten oli, suurimmalta osin pääkaupunkiseudulla on prosentuaalisesti melko vähän ruotsinkielisiä, mutta esimerkiksi Kauniainen ja entinen Sipoon alue Helsingissä erottuvat suuremmalla ruotsinkielisten osuudella. Tähän on historialliset syyt. Ennestään ympäristöään suurempi määrä tiettyä kieltä puhuvia tietyllä alueella kerää ympärilleen yhä enemmän samaa kieltä puhuvia ja näin jotkin alueet aikojen saatossa profiloituvat kielellisesti. Kieli on osa alueiden identiteettiä ja paikan identiteetti sekä siihen liittyvät mielikuvat ovat yksi (melko tärkeäkin) syy asua tai muuttaa tietylle alueelle. Ruotsinkielisten palvelujen tarjonta on luonnollisesti myös parempaa siellä, missä on enemmän ruotsinkielisiä, mikä edelleen on houkutteleva tekijä muuttamiselle ja näin ilmiö ruokkii itse itseään. Kielellinen eriytyminen on pitkäaikainen historiallinen tapahtumasarja. Pari sanaa teknisestä toteutuksesta: Kartan lukemisen helpottamiseksi lisäsin kuvaan isoimmat tiet, jotta ruudukolle olisi muutakin maantieteellistä osviittaa kuin kuntarajat. Pienempien teiden lisääminen vain sotki karttaa, joten jätin ne kuvasta pois. Vihreä väri valikoitui väestöosuuksien kuvaamiseen lähinnä siksi, että se erottuu mahdollisimman hyvin punaisesta.

 

Ruututeemakartta on oiva väline vertailla alueita toisiinsa, koska ruudut ovat keskenään yhtä suuria. Tämä auttaa suhteuttamaan alueita toisiinsa, jolloin lopputuloksena voidaan tarkastella maantieteellisiä ilmiöitä ilman että data on kuitenkaan liian tarkkaa. Esimerkiksi ruotsinkielisten kansalaisten absoluuttisen tarkka sijoittuminen kartalle kertoisi edellä olleessa kuvassa 1 näkyvästä maantieteellisestä todellisuudesta niin tarkasti, että itse ilmiötä olisi paljon vaikeampi kartalta tulkita. Ruututeemakartan avulla sen sijaan samankokoisia alueita voi suoraan vertailla keskenään. Ruututeemakartalla voidaan mielekkäästi kuvata myös absoluuttisia arvoja juuri siitä samaisesta syystä, että ruudut ovat samankokoisia. Absoluuttisetkin arvot ovat tällöin ikään kuin suhdelukuja verrattuna ruudun kokoon, joten alueiden vertailu on tasapuolista.

 

Toisessa tehtävässä käsittelyssä oli Pornaisten alueen rasteriaineistoja. Homma sujui kuin rasvattu ja sain jopa Paitulista ladatun Maanmittauslaitoksen korkeuskäyräaineiston lisättyä QGIS:iin. Kuvassa 2 näkyvät päällekkäin peruskarttalehden ja QGIS:in korkeusmallin korkeuskäyrät. Ne eroavat toisistaan jonkin verran: Peruskarttalehdessä korkeuseroja on yleistetty luettavuuden parantamiseksi kun taas QGIS on paikoitellen turhankin tarkka ja piirtää käytännössä merkityksettömistä pinnanmuodoista hallitsematonta kuviota, mikä karttaesityksenä on pelkästään sekava. Lisähankaluuksia seuraa, jos jokin pieniä pinnanmuotoja sisältävä alue sattuu sijaitsemaan juuri eri korkeustasojen rajamailla (käyrät ovat viiden metrin välein), jolloin minimaalisetkin erot saattavat kartalla aiheuttaa painajaismaisen sahalaitakuvion.

Kuva 2. QGIS-ohjelmiston (punaiset) ja Maanmittauslaitoksen peruskarttalehden (mustat) korkeuskäyrien erot.

Kuvassa 3 näkyy vielä osa Pornaisista sen jälkeen, kun olin leikkinyt rinnevarjostuksen ominaisuuksilla ja korkeuskäyrien väreillä peruskarttalehden päällä. Tarkoitus oli saada aikaan kartta, josta havaitsisi pinnanmuodot tavallista paremmin mutta kuitenkin niin, että kokonaisuus säilyy tasapainoisena ja verrattain helposti luettavana. Alla näette tuloksen.

Kuva 3. Yhdistelmä peruskarttalehdestä, rinnevarjostuksesta ja korkeuskäyristä Pornaisten alueella.

Aivan lopuksi treenasin piirtämistä QGISissä. Helppo homma, menee omalla painollaan.

 

Kuollutta hevosta on kuitenkaan turha piiskata.

 

Se pitää päästää levolle.

 

Lähteet:

 

Katajisto M. Varsinaista velhoilua.

Blogikirjoitus kurssikerralta 4. Luettu 18.2.2020

https://blogs.helsinki.fi/mattikat/2020/02/05/varsinaista-velhoilua/

 

Rantakallio H. 4. Ensikosketus rasteriaineistoihin.

Blogikirjoitus kurssikerralta 4. Luettu 18.2.2020

https://blogs.helsinki.fi/hetranta/2020/02/12/4-ensikosketus-rasteriaineistoihin/

Tietokantojen yhdistelyn ja tulvaindeksin salat

Kolmannella kurssikerralla opettelimme yksinkertaistamaan tietokantoja, liittämään niihin tietoa muista ohjelmista ja tuottamaan uutta tietoa vanhan tiedon avulla. Tätä kaikkea ryhdyttiin harjoittelemaan Afrikan valtiot sisältävällä tietokannalla, joka oli alkuun turhan yksityiskohtainen: jokainen saari tai muuten erillinen alue oli kirjattu aineistoon erikseen, mikä johti siihen, että yksi ainut valtio saattoi käsittää yli sata riviä tietokannassa. Ja jos tarkoituksena on tehdä valtiokohtaista vertailua, mainittu ominaisuus vaikeuttaa työtä huomattavasti. Alueita pystyi yhdistämään joko yksi kerrallaan tai saraketietojen pohjalta niin, että QGIS poisti kaikki valtioiden nimien kaksoiskappaleet tietokannasta, jolloin jäljelle jäi tietokanta, jossa yhtä valtiota edustaa yksi rivi – juuri kuten pitikin. Aineiston yksinkertaistaminen oli yksinkertaista. Hyvä. Seuraavaksi lisäsimme ohjelmistoon dataa excel-muotoisesta tiedostosta, jossa oli tietoa mm. Afrikan valtioiden väkiluvusta ja internetin käyttöasteesta. Saadakseen nämä tiedot QGIS:iin on tietoa muokattava niin, että datan liittäminen onnistuu. Käytännössä tämä tarkoittaa kieliasun tarkistamista kahden tietokannan välillä, jotta yhteinen rajapinta löytyy – tässä tapauksessa oli järkevää ottaa valtion nimi yhdistäväksi tekijäksi. Muutamia eroavaisuuksia löytyikin ja excel-tiedoston valtioiden nimet muutettiin vastaamaan QGIS:n valtion nimiä. Lisäksi oli katsottava, että data on muuten uskottavaa ja järkevää. Muutamia näppäilyvirheitä aineistosta löytyikin väkiluvun suhteen ja ne korjattiin, minkä jälkeen tallensimme aineiston csv-muodossa, jota QGIS ymmärtää. Aineistoa liittäessä saa olla tarkkana, että kaikki nappulat ja namiskuukkelit on säädetty oikein (esimerkiksi se, tulkitseeko ohjelma pilkun desimaaliksi vai sarake-erottimeksi). En ole tietääkseni koskaan yhdistänyt yhtäkään tietokantaa yhtään mihinkään ohjelmaan, mutta homma toimi kuin rasvattu, sillä asia näytettiin kädestä pitäen. Lopuksi lisäsimme karttalehdelle vielä dataa timanttikaivoksista, konflikteista ja öljyesiintymistä niiden sijainnin perusteella. Teknisesti (ja tarkkojen ohjeiden kanssa) tämä kaikki oli oikeastaan melko vaivattoman tuntuista. Tähänastisista kurssikerroista tämä tuntui jostain syystä helposti ymmärrettävimmältä.

Afrikan kartassani (kuva 1) on kuvattu eri vihreän sävyillä internetin käyttäjien osuus koko väestöstä valtioittain, eri kokoisilla punaisilla palloilla konfliktivuosien määrä vuosina 1947-2008 sekä turkooseina pisteinä timanttikaivosten ja keltaisella värillä öljyesiintymien sijoittuminen. Internetin käyttöaste kuvaa maan yleistä kehitysastetta tietyiltä osin ja kartasta voikin nähdä tietynlaisen korrelaation konfliktien määrässä ja matalassa internetin käyttöasteessa. Timanttikaivokset eivät näytä vaikuttavan millään lailla konflikteihin tai kehitysasteeseen – niitä esiintyy aivan sattumanvaraisesti niin rauhallisilla kuin epävakaillakin alueilla, kehitysasteesta riippumatta. Öljyesiintymiä esiintyy pääasiassa kehittyneemmissä osissa Afrikkaa, mistä voisi päätellä esim. että öljyn tuoma varallisuus jakautuu timanttikaivoksia tasaisemmin valtion asukkaille. Voisi ja voisi. Tästä kaikesta voi todellakin vetää jos jonkinlaisia johtopäätöksiä, mutta niiden kanssa on syytä olla varovainen: kartasta ei voi aivan suoraan lukea minkään siinä kuvattujen asioiden keskinäistä korrelaatiota ja parempaan analysointiin tarvittaisiin vielä ajallisesti tarkempaa tietoa oikeastaan kaikesta, minkä lisäksi huomioon täytyy toki ottaa erilaiset poliittiset ja historialliset seikat, jotka vaikuttavat valtioiden kehitysasteeseen. Kaiken kaikkiaan aineisto on melkoinen sekasotku.

Kuva 1. Eräiden ilmiöiden alueellinen esiintyminen Afrikassa.

Itsenäistyönä (minulle nämä kaikki ovat itsenäistöitä, koska teen kaikki kurssilla tehdyt asiat uudestaan kotonani, jotta oppisin jotain) oli tehdä tulvaindeksikartta, jossa vertaillaan Suomen vesistöalueiden valuma-alueominaisuuksia ja tulvaherkkyyttä. Idea oli siis kuvata koropleettikarttana tulvaherkkyyttä ja diagrammina järvisyyttä. Molemmat asiat löytyvät kartastani (kuva 2) enkä nähnyt syytä pitää varsinaisia vesialueita näkyvillä tässä yhteydessä, joten poistin aineistosta jokien ja järvien visualisoinnin. Näin kartasta tuli mielestäni helppolukuisempi. En kylläkään törmännyt kenenkään muun blogissa tällaiseen ratkaisuun, joten en tiedä oliko tämä sittenkään hyvä idea, mutta tässä se nyt on näytillä. Punaisella kuvasin tulvariskiä ja sinisellä järvisyyttä eli jatkoin minimalistisella linjalla. Väreistä onkin riittänyt hyvää debattia muiden kurssilaisten kesken, kuten esim. Laura Hynysen tekstistä käy ilmi (https://blogs.helsinki.fi/lauravel/2020/01/29/lisaa-elementteja-analyysiin/). Itse yritin tehdä kartasta vain mahdollisimman yksinkertaisen ja värit sitä ainakin ovat.

Kuva 2. Virtaamavaihtelujen indeksi Suomessa.

Siellä, missä on vähäinen järvisyys, on myös suurin tulvariski, sillä jos vesi ei voi virrata järveen, se virtaa ympäröiville alueille kuten mm. Venla Moisio (https://blogs.helsinki.fi/moivenla/2020/01/29/viikko-3-tietokantojen-yhdistamista-ja-laskutoimitusten-tekemista/) on blogissaan ottanut esiin. Vilma Koljonen on puolestaan huomioinut, että tulvaindeksi on korkealla rannikkoalueilla Etelä- ja Länsi-Suomessa, sillä niissä on ensinnäkin (luonnollisesti) paljon jokia ja toiseksi (etenkin Pohjanmaalla) vähän korkeuseroja, mikä lisää tulvimisen riskiä (https://blogs.helsinki.fi/vilmakol/2020/01/29/tietokannoista-kayttokelpoisia/). Niin. Eipä minulla oikeastaan ole mitään järkevää lisättävää heidän kommentteihinsa. Oikeassa ovat!

 

Loppuun on vielä sanottava, että pidän (täysin hölmön intuitiivisesti) varsinaista tulvaindeksiä (keskiylivirtaama / keskivirtaama) kuvaavampana tapana kuvata tulvaa kuin virtaamavaihtelujen indeksiä (keskiylivirtaama / keskialivirtaama), joka kartassani on nähtävillä. Tulva kun määritelmällisesti on keskimääräistä mittavampaa veden virtausta. Harjoitusohjeiden perusteella tulvaindeksi voidaan kuitenkin jostain syystä laskea molemmilla tavoilla, ja tämä kismittää nyt jostain syystä mieltäni pahasti. Selviän kuitenkin tästä kismityksestä. Pakko selvitä. Ehkä toisenkin tavan hienous minulle myöhemmin selviää!

 

Seuraavia gis-haasteita odotellessa,

 

Hyvää yötä.

 

Lähteet:

 

Hynynen L. Lisää elementtejä analyysiin.

Blogikirjoitus kurssikerralta 3. Luettu 7.2.2020

Lisää elementtejä analyysiin

 

Moisio V. Viikko 3 – Tietokantojen yhdistämistä ja laskutoimitusten tekemistä.

Blogikirjoitus kurssikerralta 3. Luettu 7.2.2020

https://blogs.helsinki.fi/moivenla/2020/01/29/viikko-3-tietokantojen-yhdistamista-ja-laskutoimitusten-tekemista/

 

Koljonen V. Tietokannoista käyttökelpoisia.

Blogikirjoitus kurssikerralta 3. Luettu 7.2.2020

Tietokannoista käyttökelpoisia

Fake news

Toinen blogitekstini tulee jonkin verran myöhässä ja toisesta kurssikerrasta onkin ehtinyt vierähtää jo reipas tovi. Myöhästyminen ei ole kovinkaan ylevää, myönnän sen.

 

Muistikuvieni mukaan olin pihalla kuin lumiukko, kun näitä asioita käytiin läpi itse kurssikerralla, joten sinällään tällä myöhästymisellä ei oman oppimiseni kannalta ole niinkään väliä. Nähkääs, ei voi unohtaa taitoja, joita ei koskaan oikein oppinutkaan. Da. Toisaalta edellisen postaukseni lopussa taisin mainita tuntevani itseni suorastaan IT-neroksi, joten ihan optimistisin mielin siirryn tästä tekemään harjoituksia.

 

Jo riittää jonninjoutavat lätinät. Töihin.

 

Avaan lämmittelytyön. Testailen työkaluja vähäsen aikaa. Saan valittua joukon Suomen kuntia, jotka kuuluvat samaan maakuntaan, kuten toiveena on. Hyvin pyyhkii, toistaiseksi. Sitten alan vertailla Pohjois-Suomeen piirtämäni alueen pinta-alaa ja Vaasasta Ilomantsiin kulkevaa mittausviivaa eri karttaprojektioilla. Jumitun jostain syystä jo tähän kohtaan melko pitkäksi aikaa, kun jään ensinnäkin pohtimaan, mitä projektioita valitsisin käytettäväksi ja toiseksi sen takia, että taulukon kanssa tuhraamiseen menee luvattoman kauan. En ole varma, mitä lukuja taulukkoon oikeastaan pitäisi laittaa. Tutkailen muiden blogitekstejä ja esimerkiksi Jaakko Kuurne oli päätynyt hivenen erilaiseen taulukkoratkaisuun (https://blogs.helsinki.fi/jaakongisblogi/2020/02/03/projektioista-tietokannoista-ja-ohjeiden-kirjaimellisesta-noudattamisesta/) kuin mitä minun tekisi mieleni tässä yhteydessä tehdä. Ja koska tunnen edellä mainitun kaverin melko hyvin ja tiedän hänen olevan välillä jopa raivostuttavan kyvykäs oikeastaan aivan kaikessa mihin ryhtyy, epäröin pitkään tehdä taulukkoa eri tavalla kuin hän, sillä todennäköisesti hänen tapansa on kuitenkin ainut oikea. Hämmentäviä epävarmuuden hetkiä yön pikkutunteina. Toisaalta, kyllä taulukkoja maailmaan mahtuu. Taulukossa 1 omani:

 

Taulukko 1. Eri projektioiden vääristymien vertailua.

Projektion ID Projektion nimi Satunnainen pinta-ala Pohjois-Suomessa km² Vaasan ja Ilomantsin välinen mittausviiva, km Pinta-alan absoluuttinen muutos verrattuna ETRS89 / TM35FIN -projektioon, km² Pituusjanan absoluuttinen muutos verrattuna ETRS89 / TM35FIN -projektioon, km Pinta-alan muutos suhteessa ETRS89 / TM35FIN -projektioon, % Pituusjanan muutos suhteessa ETRS89 / TM35FIN -projektioon, %
EPSG:3785 Popular Visualisation CRS / Mercator (deprecated) 644910,445 1122,497 559278,004 612,546 653,115 suurempi 120,119 suurempi
EPSG:54030 World Robinson 118124,773 739,429 32492,332 229,478 37,944 suurempi 45,000 suurempi
EPSG:54027 World Equidistant Conic 86629,767 510,74 997,326 0,789 1,165 suurempi 0,155 suurempi
EPSG:102013 Europe Albers Equal Area Conic 85640,968 509,977 8,527 0,026 0,010 suurempi 0,005 suurempi
IAU2000:61818 Pan North Pole Stereographic 43,726 5,221 85588,715 504,73 99,949 pienempi 98,976 pienempi
EPSG:3902 ETRS89 / TM35FIN 85632,441 509,951 0 0 0 0

 

Maapalloa ei tunnetusti voi kuvata millään projektiolla täysin oikein ja taulukosta 1 näkeekin selkeästi projektiovalinnan valtavan vaikutuksen pinta-aloihin ja etäisyyksiin (ja kulmiin, joita ei tosin tässä yhteydessä käsitellä). Taulukossa vertaillaan erilaisia projektioita Suomea melko toden mukaisesti kuvaavaan ETRS89-TM35 -projektioon. Mercatorin perinteinen oikeakulmainen lieriöprojektio vääristää sekä pituus- että leveyssuuntaisia mittasuhteita sitä enemmän, mitä kauemmas päiväntasaajalta edetään ja Suomi on sen verran pohjoisessa, että vaikutukset näkee selvästi: mittaamallani alueella Mercatorin pinta-ala on yli 650% suurempi kuin TM35-projektiossa, jossa siis Mercatorin projektio on käännetty poikittain ja keskimeridiaani (tämän projektion ”päiväntasaaja”) kulkee Suomen halki, jolloin projektio on Suomen osalta suhteellisen realistinen. Ihan hyvä tavallaan, että Mercator on saanut haastajia. Robinsonin projektio on kompromissi, joka vääristää niin pintoja, kulmia kuin etäisyyksiäkin, mutta mahdollisimman vähän. Mittaamillani kohteilla vääristymä on suurempi leveyssuuntaisen janan kuin pinta-alan osalta (päinvastoin kuin Mercatorin projektiossa), mikä johtuu siitä, että projektio litistyy napoja kohti mentäessä. Equidistant Conic on tasavälinen kartioprojektio, jossa on kaksi standardileveyspiiriä, joiden kohdalla kartio sivuaa maapallon pintaa. Toinen näistä sattuu vieläpä olemaan osapuilleen Helsingin korkeudella, joten olettaa sopii projektion lukujen olevan melko lähellä TM35-koordinaattijärjestelmän arvoja. Näin myös on, kuten taulukosta selviää. Albersin oikeapintainen projektio kuvaa pinta-alat oikein, joten pinta-ala on jo käytännössä sama kuin Suomen omassa koordinaatistossa. Kirsikkana kakun päälle valitsen taulukkoon mukaan vielä kunnon huumoriprojektion, Pan North Pole Stereographicin, joka kuvaa maapallon pinnan tasolle pohjoisnapaa lukuun ottamatta. Muita pisteitä ”vastaa se piste, jossa tämän projektiopisteen ja annetun pisteen kautta kulkeva suora leikkaa tason.”, tietää Wikipedia (https://fi.wikipedia.org/wiki/Stereografinen_projektio) kertoa. Artikkeli myös jatkaa kertomalla projektiota kuvaavan funktion olevan määrittelyjoukossaan sileä, bijektio sekä konforminen. En suinkaan väitä, että ymmärtäisin, mistä tässä kaikessa oikein on kyse (tai Wikipedian olevan luotettava lähde yhtään missään), mutta tulos on kiinnostava: Pinta-ala on 99,949% pienempi kuin TM35:n. Sitä ei siis lähes ole. Samoin käy luonnollisesti pituusjanan kanssa. Olen mykistynyt. Propagandan määrä on vakio. Siirryn eteenpäin pikavauhtia.

 

Uppoan yhä syvemmälle pituuksien ja pinta-alojen vääristymiin ja tarkoitus on seuraavaksi havainnollistaa koropleettikartan muodossa, kuinka suurta heittoa huono projektiovalinta voi dataan tuottaa. Lataan aineistoksi Suomen kunnat vuoden 2020 jaolla ja aion käyttää projektiona ainakin Euroopan komission suosittelemaa Lambertin oikeapintaista tasoprojektiota. Ai miksikö sitä suositellaan? Noh. Analyyseissa, joissa pinta-ala on merkittävässä asemassa, kannattaa toki käyttää projektiota, joka kuvaa pinta-alat oikein. Suosittelu käy järkeen, joten hymähdän hyväksyvästi Euroopan komissiolle: hyvää työtä, Euroopan komissio. Oma suoritukseni alkaa sen sijaan tökkiä. Säädän arviolta tunnin verran projektiomuunnoksen kanssa ennen kuin ymmärrän kuinka se todella pitää tehdä. On ilmeisen vaikea sisäistää, että ohjelmiston sisäinen koordinaatistojärjestelmä on eri asia kuin siinä näkyvä koordinaatisto. Lisäksi puhtaasti tekniset näppäryydet ohjelman toimintojen kanssa osoittautuvat yllättävän haasteellisiksi, mutta en anna tämän kuitenkaan lannistaa. Tulin voittamaan jne. Laskiessani alueiden pinta-aloja ominaisuustietotaulukkoon ohjeissa kuvatulla kaavalla, tulen kuitenkin umpikujaan ja hetken ajan luulen hävinneeni lisäajalla. Luvut eivät nimittäin ole laisinkaan sitä mitä pitäisi. Pitkään säädettyäni ymmärrän kuitenkin, että laskukaava ei toimi sen vuoksi, että jostain syystä minulla on neliömetrin sijasta neliökilometri oletusmittayksikkönä, jolloin lukuihin tulee noin miljoonan heitto. Mitäpä pienistä. Hämmentävää on vain se, että havaittuani tämän ja asetuksia tutkiessani oletukseksi on määritelty nimenomaisesti neliömetri, mutta silti jostain syystä aineistot latautuvat neliökilometreinä. Suljen koko QGis:n ja avaan sen uudestaan, jolloin lyyti alkaa niin sanotusti jälleen kirjoittaa. Todennäköisesti olen vain aikaisempien harjoitusten tiimellyksessä epähuomiossa säätänyt oletusmittayksikön uusiksi enkä sitä enää osannut muuttaa. Eteenpäin, siis. Lasken pikaisesti pinta-alat kolmessa eri projektiossa: Lambertissa (joka siis kuvaa alueet oikein) ja Mercatorissa (joka Taulukko 1:kin perusteella kuvaa alueet päin honkia) ja päälle vielä Robinsonin kompromissiprojektiossa (joka kuvaa kaiken päin prinkkalaa muttei kokonaisuudessaan miltään osin niin paljon kuin muut), minkä jälkeen alan vertailemaan tuloksia: Kuvassa 1 näkyy Mercatorin ja Lambertin vertailu ja tulos on kammottava. Pinta-alavääristymä kasvaa nopeasti pohjoista kohti ja on pahimmillaan yli 720%. Kuvassa 2 taas kuvataan Robinsonin projektio verrattuna Lambertin vastaavaan. Tulos on jo kertaluokkaa parempi, mutta melko väkevää vääristymää tässäkin kartassa esiintyy.

Kuva 1. Pinta-alan kasvu Mercatorin projektiossa verrattuna Lambertin projektioon.
Kuva 2. Pinta-alan kasvu Robinsonin projektiossa verrattuna Lambertin projektioon.

 

Sen verran karttojen teknisestä toteutuksesta, että Mercatorin hirviöprojektiossa on tarkoituksella aggressiivisen punaiseen etenevä värimaailma kuvaamassa vääristymän suurta kasvua tarkastelualueella. ”Jos todellisuus värittyy niin kyllä karttakin” onkin nykyään mottoni. Robinsonin lempeämpi vääristymä saa samalla logiikalla toki hieman vähemmän kirkuvan sävytyksen. Käytössä on myös normaalia enemmän luokkia (10 kpl) sen vuoksi, että vaikka kyseessä kuinka on koropleettikartta, kuvataan tässä yhteydessä arvoja, jotka nousevat tasaisesti kohti pohjoista, jolloin on jopa toivottavaa, että kartasta käy värisävyjen muodossa ilmi tasainen muutos. Eri luokkien määrä on kuitenkin sellainen, että tarkat rajatkin voi halukas kartoista tihrustaa. Legendan eri luokkia kuvaavat arvot on myös käännetty toisin päin kuin oletuksena on, jotta ne etenisivät samaan suuntaan kuin kartan värit, mikä oli mielestäni oikein onnistunut päätös. Kaiken kaikkiaan olen jopa tyytyväinen karttojen ulkoasuun lukuun ottamatta niiden liian pientä kokoa tässä blogikontekstissa.

 

Työ ei kuitenkaan ole vielä ohi. Aivan lopuksi, suorastaan encorenomaisesti, hyödynnän eri koordinaattijärjestelmiin tallennettuja pinta-alatietoja ja yhdistän niihin valmiiksi kerättyä tilastotietoa kunnista. Päätän yrittää suhteuttaa Natura-alueiden pinta-aloja kunkin kunnan kokonaispinta-alaan Lambertin ja Mercatorin projektioissa. Tämän loistavan idean varastan suoraan Tomi Kiviluomalta (https://blogs.helsinki.fi/tomingeoblogi/2020/01/24/tietokantoja-tykytysta-ja-toiveita-tulevasta/), sillä tekemänsä vertailu vaikuttaa oikein hyvältä harjoitukselta tietokantojen kanssa painimiseen. Yritän olla yhtä hyvä kuin hän. Lisään Suomen vuoden 2015 kunta-aineistoon aiemmin laskemani pinta-alat tietokantaliitoksella. Tässä vaiheessa jotain menee vikaan ja kaikki koordinaatit ovat aivan väärin ja yritän korjata tilannetta availemalla uusia projekteja ja karttatasoja sinne tänne tiheään tahtiin. Ikkunoita sinkoilee silmissä. Lopulta, ehkä pienen taisteluväsymyksen aiheuttaman herpaantumishetken jälkeen, kokoan jälleen itseni ja saan kuin saankin aikaan lähes samanlaisen projektiovertailun kuin Kiviluoma. En kuitenkaan aivan, sillä häneltä puuttuu pinta-alaa koskeva aineisto kuuden kunnan osalta, minulta seitsemän. En ymmärrä, mistä tämä johtuu. Lisäksi, kun yritän saada karttoihini aikaan samaa efektiä kuin hän (luokittelematon aineisto harmaalla), en osaakaan sitä tehdä vaan onnistun luomaan vain kartan, jossa harmaalla on sekä luokittelematon että arvon 0,00 saava aineisto. Muuten kuvista käy ilmi sama kuin Kiviluomallakin: Mercatorin pohjalta tehty kartta (kuva 3) kertoo Natura-alueita olevan parhaimmillaan 14,2 % kunnan pinta-alasta, kun todellisuus on lähempänä Lambertin projektiota (kuva 4), jossa Natura-alueiden osuus on enimmillään 98,9 % eli käytännössä koko kunta. Tämä johtuu täsmälleen samoista asioista kuin aiemminkin: Mercator vääristää pinta-aloja niin paljon isommiksi napoja lähestyttäessä, että joidenkin määriteltyjen muuttujien (kuten Natura-alueiden pinta-alojen) suhteelliset osuudet pienenevät merkittävästi. Ongelmana tässä vertailussa on – kuten Kiviluoma blogissaan toteaa – se, että karttojen samanlaiset värimaailmat saattavat antaa visuaalisen illuusion siitä, että arvot niiden välillä olisivat jotenkin samankaltaisia, vaikka näin ei suinkaan ole.

Kuva 3. Natura-alueiden osuus kunnan kokonaispinta-alasta Mercatorin projektion mukaan.
Kuva 4. Natura-alueiden osuus kunnan kokonaispinta-alasta Lambertin projektion mukaan.

 

Sellaista, sellaista. Yhteenvetona tästä kurssikerrasta voisi sanoa aivan kaiken olevan siis mitä suurimmissa määrin valetta. Silkkaa fake newsia. Tarkkana saa olla.

 

Päätän raporttini tähän tältä erää.

 

Pelkkii sydämii.

 

Lähteet:

 

Kuurne J. Projektioista, tietokannoista ja ohjeiden kirjaimellisesta noudattamisesta.

Blogikirjoitus kurssikerralta 2. Luettu 5.2.2020

https://blogs.helsinki.fi/jaakongisblogi/2020/02/03/projektioista-tietokannoista-ja-ohjeiden-kirjaimellisesta-noudattamisesta/

 

Kiviluoma T. Tietokantoja, tykytystä ja toiveita tulevasta.

Blogikirjoitus kurssikerralta 2. Luettu 5.2.2020

https://blogs.helsinki.fi/tomingeoblogi/2020/01/24/tietokantoja-tykytysta-ja-toiveita-tulevasta/

 

Wikipedia, Vapaa tietosanakirja.

Stereografinen projektio. Luettu 5.2.2020

https://fi.wikipedia.org/wiki/Stereografinen_projektio

QGis-ohjelmistoon tutustumista

Ensimmäisellä Geoinformatiikan menetelmät -kurssikerralla tarkoitus oli päästä alkuun QGis-nimisen paikkatieto-ohjelmiston käytössä. Allekirjoittaneelle tämä oli ensikosketus ko. ohjelmistoon ja koska olen hyvinkin onnistuneesti vältellyt tietoteknisen osaamisen syvällistä kehittämistä suurimman osan elämästäni, alkoi hiki virrata ohimoillani ohjelman avatessani: mitenköhän tämä taas tuleekaan sujumaan?

Otin paniikkiini kulauksen vettä ja muistin, että oppimaanhan minä yliopistolle oikeastaan tulinkin eikä asioita olekaan tarkoitus osata ennen kuin ne on opeteltu. Nämä häpeällisen kliseiset sanat mielessäni napsautin hiiren painiketta ja QGis hurahti pahaenteisesti käyntiin. Aloin seuraamaan opastusta, jossa käytiin kohta kohdalta läpi ensimmäisen harjoitustyön eri työvaiheita. Aineistoja ladattiin, tasoja muokattiin ja alta aikayksikön huomasin saaneeni aikaan kartan valtioiden typpipäästöjen suhteellisista osuuksista Itämereen päästetyn typen määrästä. Tämähän onkin helppoa! Ainakin kun opetus on etevää ja tyhmiä saa kysyä.

Niin, se kartta. Kuvassa 1 se on.

Kuva 1. Eri valtioiden suhteellinen osuus typpipäästöistä Itämereen.

Latasin myöhemmin QGis:n omalle koneelleni ja itse asiassa tein kartan vielä kotona uudestaan, jotta oppisin paremmin ohjelmiston salat – kertaus kun on tunnetusti opintojen äiti. Yläpuolella näkyvä kartta on siis kotona tekemäni uusintaversio, joka ei kylläkään eroa juuri mitenkään jo kurssikerralla tehdystä. Kurssikerran työn päälle tein vielä helpoimman vaikeustason harjoitustyön, koropleettikartan vuoden 2015 Suomen kuntien tietokannan pohjalta. Kuvasin työikäisen väestön määrää kussakin kunnassa, joten kartalla voi vertailla Suomen eri kuntien ikärakennetta keskenään. Valitsin tasavälisen luokittelun, koska mielestäni se tarjosi tässä tapauksessa rehellisimmän kuvan todellisuudesta. Mitä tummemman vihreä värisävy on, sitä paremmassa jamassa kunta on huoltosuhteensa kanssa. Samaa aihepiiriä ovat käsitelleet muutkin omissa blogeissaan, kuten esimerkiksi Matti Katajisto ja Paula Allinen kuvatessaan yli 65-vuotiaiden osuutta kunnan väestöstä. Heidän esitystapansa on tavallaan käänteinen alla olevaan omaani (kuva 2) verrattuna.

Kuva 2. 15-64-vuotiaiden osuus väestöstä kunnittain, % vuonna 2014.

Tältä kurssikerralta jäi päällimmäiseksi mieleen havainto siitä, että QGis on erinomaisen helppokäyttöinen ja looginen ohjelmisto, kunhan sitä vain vähän aikaa näpyttelee menemään. ”QGIS:in avulla tutkimuksessa voi keskittyä enemmän itse tutkimuskysymyksen pohtimiseen ja vähemmän erilaisten visuaalisten esittämistapojen miettimiseen. Ohjelman toimintoihin kuuluu merkittävä määrä erilaisia automaattisia toimintoja, kuten legendan valmistaminen kartan kylkeen. Viime kurssilta tutussa CorelDraw -ohjelmassa jokainen vaihe kartan tekemisessä täytyi tehdä itse käsin. Seikasta voidaan huomata ero oikean paikkatieto-ohjelman ja piirto-ohjelman välillä.”, kuten kanssakurssilaiseni, samainen Matti Katajisto asian hienosti sanoiksi pukee (Katajisto M. QGIS perusteet, luettu 29.1.2020). Allekirjoitan kommenttinsa.

Kyllähän tämä sujuukin. Tunnen itseni suorastaan IT-neroksi.

Lähteet:

Katajisto M. QGIS perusteet.
Blogikirjoitus kurssikerralta 1. Luettu 29.1.2020
https://blogs.helsinki.fi/mattikat/

Allinen P. First things first, QGis.
Blogikirjoitus kurssikerralta 1. Luettu 29.1.2020
https://blogs.helsinki.fi/pallinen/