Kurssikerta 7: Viimeisenä harjoituksena oma kartta

Kurssi on tulossa päätökseen ja viimeisenä tehtävänä olisikin etsiä itse dataa ja saada siitä jokin kelpo karttaesitys aikaiseksi. Lähdin datan metsästykseen viimeistä kurssikertaa edeltävänä iltana. Muutaman tunnin jälkeen kone oli tukossa kaikenlaisista kansioista ja tiedostoista, mutta en siltikään ollut löytänyt  oikein mitään käyttökelpoista. Joko tiedostomuodoissa ja latauksessa koneelle/QGIS:siin oli vaikeuksia tai taulukot olivat muuten niin sekavia, ettei niitä oikein pystynyt hyödyntämään. Oikeanlaisen aiheen keksiminenkin tuotti vähän hankaluuksia. Erilaisia pohjakarttoja löytyy hyvin, mutta järkevän datan löytäminen osoittautui suurimmaksi ongelmaksi tehtävässä.

Satuin kuitenkin seuraavana aamuna ennen kurssikerran alkua löytämään dataa ihmiskaupparikoksista Yhdysvalloissa, jonka onnistuin jopa lataamaan QGIS:siin onnistuneesti. En ole täysin vakuuttunut esimerkiksi osavaltioiden rikosten määrien vertailukelpoisuudesta toisiinsa. Tietoa oli sekavasti 2010-luvulta eri vuosilta. Rikoksia ei ollut kirjattu osavaltioittain vaan tiedot olivat aina pienemmästä piirikunnasta tai muusta sellaisesta, joten jouduin yhdistelemään ne osavaltioittain. Kaikista osavaltioista ei ollut ollenkaan tietoa, esimerkiksi Kaliforniasta, jossa on varmasti tapahtunut kyseisiä rikoksia. Kartta on varmaan kuitenkin suuntaa-antava. Liitän kartan tähän postaukseen, koska puuhastelin sen kanssa koko neljän tunnin ajan, vaikka ei vastaakaan tehtävänantoon yhdellä muuttujallaan. Oli kuitenkin hyvää harjoitusta ja testailin vähän lisäillä ja muokata labeleita ja numeroarvoja.

Kuva 1. Yhdysvalloissa raportoidut ihmiskaupparikokset osavaltioittain. Lähde: Bureau of Justice Statistics.

Nyt melkein kuukauden jälkeen vähän pelotti taas lähteä etsimään dataa, mutta se lähti sujumaan tällä kertaa vähän paremmin ja sain ladattua väestötietoa Yhdysvalloista. Ajattelin myös, että vaaleista voisi löytyä jotain dataa, minkä saisi kartalle. Minusta oli helpompi löytää dataa kun oli valinnut jonkun tietyn aiheen ja pystyi tekemään tarkempia hakuja. Löysin presidentinvaalien äänistä taulukoita, mutta ensimmäinen lataamani oli todella iso tiedosto ja sekoitti QGIS:sin täysin. Kokeiluiden jälkeen löysin myös pienemmän tiedoston ja lähdin muokkaamaan sitä eteenpäin.

Vaikeus oli yhdistellä rivejä siten, että kaiken tärkeän tiedon sai mukaan. Yhdysvaltojen datassa oli yleistä, että osavaltioille oli useampia rivejä. Data hangoitteli eri vaiheissa paljon vastaan ja monesti yhdisteltäessä näytti nullia uusille arvoille ja valitti ettei pystytty tallentamaan muutoksia. Jumituin myös aika pitkäksi aikaa kohtaan, jossa joka osavaltiolle oli kaksi riviä, toisessa Bidenin äänestystiedot ja toisessa Trumpin. Yritin saada tiedon yhteen sarakkeeseen, kumpaa on äänestetty enemmän missäkin osavaltiossa ja jouduin vähän soveltamaan kun en keksinyt kovin hyvää tapaa siihen. Mutta eri vaiheiden jälkeen sain sen jotenkin sellaiseen muotoon, että pystyin yhdistämään taulukon Yhdysvaltojen karttaan. Laskin  myös äänestysprosentin toiseksi muuttujaksi. Lopullinen kartta on kuvassa 2.

Kuva 2. Yhdysvaltojen osavaltioiden jakautuminen vuoden 2020 presidentinvaaleissa sekä osavaltioiden äänestysprosentit. Lähteet: US Census Bureau ja Harvard Dataverse, MIT Election Data and Science Lab.

Olen ihan tyytyväinen siihen, miltä kartta nyt näyttää. Muutamat jutut jäi vähän vaivaamaan, esimerkiksi itärannikon pienet osavaltiot, joista kaikista ei äänestysprosentti näy. Toiseksi kartaksi olisi tietysti voinut tehdä zoomauksen itärannikkoon. Esimerkiksi Pinja oli tehnyt näin kartassaan tupakoinnin määrästä ja mediaanituloista. En saanut myöskään legendaan symbolia äänestysprosentille. Jouduin lisäämään äänestysprosentin Alaskan päälle käsin, koska se ei aluksi tullut näkyviin, mutta huomasin vasta tallennuksen jälkeen, että siellähän se on, nyt niitä on kaksi päällekkäin. Sain kuitenkin Alaskan ja Havaijin oikeaan mittakaavaan verrattuna muuhun maahan ja aseteltua ne ihan kivasti.

Valitsemani aiheet eivät ehkä ole sellaisia, jota kovin pitkälle pystyy analysoimaan. Vaalien äänestysprosentit koko Yhdysvalloissa liikkuvat noin 40 ja 60 prosentin välissä. Se on aika vähän verrattuna esimerkiksi Suomeen, jossa vuonna 2018 presidentinvaaleissa äänestysprosentti oli 69,9 (Tilastokeskus). Vaikea kuitenkin verrata niin erilaisia maita. Äänestysprosentin ja suositumman ehdokkaan välillä ei ole kovin vahvaa yhteyttä. Kartalla näkyvistä heikoin äänestysprosentti näyttäisi löytyvän Texasista, joka meni Trumpille ja korkein Mainesta, joka äänesti enemmän Bidenia. Rannikoilla, kuten Kaliforniassa ja itärannikolla äänestetään enemmän demokraattista Bidenia. Netistä löytyy paljon karttoja viime vuoden vaaleista, johon voi omaa tuotosta vähän verrata, esimerkiksi New York Timesin sivuilla. Ainakin näyttäisi olevan osavaltioiden voittajaehdokkaat oikein. Projektio on eri kuin käyttämäni ja Alaskan ja Havaijin liittäminen kartalle on tehty vähän eri tavalla. 

Roosa oli tehnyt kartan koskien Yhdysvaltoja ja myös kohdannut ongelmia aineistojen etsimisessä ja valitsemisessa sekä niiden muokkaamisessa. Roosa oli valinnut mielenkiintoiset muuttujat, mediaanitulot ja huonemäärän joiden mahdollista yhteyttä oli saanut pohdittua laajasti. Näyttää myös hyvältä, kun osavaltioiden nimet on kartalla, minkä olisin itsekin voinut tehdä vaalikarttaan.

Tämä kurssi on ollut kokonaisuudessaan todella kiinnostava ja tehtävien parissa kulunut varsin paljon aikaa. Joskus ehkä vähän liikaakin, kun ryhtyi liian tarkaksi ja sääti karttojen kanssa iltamyöhään. Blogi on ollut kiva tapa suorittaa kurssia, vaikka blogitekstien tekeminen on ollut yllättävän hankalaakin. On kiva kun on pääsyt lukemaan muiden tekstejä ja näkee miten he ovat jonkun tehtävän tehneet ja kuinka kurssi sujuu muilla. Olen ihan ylpeä varsinkin siitä, että sain taiottua esiin jonkinlaisen kartan viimeisenä harjoituksena.

Kiitos ja moikka!

 

Lähteet:

    • Bureau of Justice Statistics, haettu 5.3.2021. https://www.bjs.gov/index.cfm?ty=tp&tid=40
    • Harmonen, R. (2021) Seitsemäs kurssikerta –  loppusuoralla, luettu 31.3.2021. https://blogs.helsinki.fi/harmoroo/2021/03/02/seitsemas-kurssikerta-loppusuoralla/
    • Hägg, P. (2021) Kurssikerta 7, luettu 31.3.2021.  https://blogs.helsinki.fi/pinhagg/2021/03/29/kurssikerta-7/
    • Natural Earth, haettu 5.3.2021. https://www.naturalearthdata.com/downloads/50m-physical-vectors/
    • New York Times,  Presidential Election Results: Biden Wins, luettu 31.3.2021. https://www.nytimes.com/interactive/2020/11/03/us/elections/results-president.html
    • Tilastokeskus (2018) Sauli Niinistön kannatus tasaista eri alueilla presidentinvaalissa 2018,luettu 31.3.2021 https://www.stat.fi/til/pvaa/2018/pvaa_2018_2018-02-02_tie_001_fi.html
    •  US Census Bureau, haettu 31.2.2021. https://www.census.gov/en.html

 

Kurssikerta 6: Hasardi!

Viikon kuusi blogitehtävänä oli tehdä erilaisia karttoja hasardeista. Kartoista oli tarkoitus varsinkin tehdä sellaisia, että ne olisivat sopivia opetuksessa käytettäviksi. Eli varmastikin niiden tulisi olla selkeitä ja informatiivisia. Karttoja katsomalla olisi hyvä myös mahdollisesti löytää syy-seuraussuhteita ja yhteyksiä ilmiöiden välillä.

Ensimmäisessä kartassa (kuva 1) näkyy tulivuoret ja viimeaikaiset maanjäristykset (noin yhdeksän kuukauden ajalta). Punaiset kolmiot on looginen tapa kuvastaa tulivuoria ja maanjäristykset taas näkyvät harmaina pisteinä taustalla. Koska niitä on niin paljon, osassa karttaa ne sulautuvat harmaaksi sumuksi. Kartan avulla voi päätellä, että maanjäristyksillä ja tulivuorilla on yhteys ja varsinkin Tyynenmeren tulirenkaan voimakas vulkaaninen toiminta erottuu. Tulivuorista ja maanjäristyksistä syntyy ikään kuin viivoja kartalle, jotka kuvaavat litosfäärilaattojen reunakohtia.

Kuva 1.

 

Lisäsin seuraavaan karttaan mannerlaattojen rajat, jotta niiden ja maanjäristysten yhteyden voisi nähdä selkeästi. Vaihdon myös alla olevan maailmankartan ja laitoin kaikki alueet vain yhdellä värillä. Punaiset maanjäristykset erottuvat taustastaan hyvin. Päätin myös laittaa maanjäristykset eri väreillä voimakkuuden mukaan. Eri sävyt ei kovin vahvasti kyllä erotu toisistaan, poikkeuksena Yhdysvaltojen päällä olevat pienet maanjäristykset valkoisella. En tiedä, kirjataanko maanjäristyksiä yhtä tarkasti joka puolella maailmaa, joka voisi tietysti vaikuttaa pienien maanjäristysten runsauteen tietyillä alueilla.  Emilia oli tehnyt maanjäristyksistä hyvän kartan, jossa maanjäristykset näkyivät eri värien lisäksi eri kokoisina palluroina riippuen voimakkuudesta.

Kuva 2.

Meteoriittien laskeutumispaikoista tein oman karttansa (kuva 3), koska se ei oikein vahvasti liity muihin ilmiöihin. Tiheimmin meteoriitteja näyttäisi olevan Yhdysvalloissa ja Euroopassa, mutta sitä varmasti selittää se, että tiheästi ja kauan asutuilta alueilta meteoriittien laskupaikat löydetään helpommin ja ne on tutkittu tarkemmin.

Kuva 3.

Halusin vielä tehdä kartan, jossa on mannerlaatat ja tulivuoret (kuva 4). Suurin osa tulivuorista sijoittuu mannerlaattojen reunoille, mutta kuumia pisteitä löytyy keskeltä laattoja. Kartalla näkyy myös suurimpia 2000-luvun maanjäristyksiä, mutta ne eivät erotu kovin hyvin. Ehkä toinen värivalinta olisi ollut parempi.

Kuva 4.

Opetusta ajatellen tulivuorten ja maanjäristysten suhteen on parasta esittää mannerlaattojen rajat kartalla, koska laattojen liike aiheuttaa suurimman osan niistä. Toisaalta on myös hyvä näyttää ensin kuvan 1 tapainen kartta, jotta oppilas voi ensin itse huomata yhtäläisyydet ja päästä itse lopputulokseen.

Taustakarttana käytin maailmankarttaa, jossa näkyy hieman korkeuseroja ja minkälainen ympäristö eri puolilla maailmaa on. Se tuo hieman lisää informaatiota karttaan. Kokeilin yksiväristä kuvassa 2 ja sekin toimii, mutta ei ole ehkä niin kivan näköinen. Toisaalta se korostaa ilmiötä ja tuo vähän enemmän kontrastia värien välille. Etsin netistä erilaisia karttoja, jotka kuvaa samoja ilmiöitä ja esimerkiksi tämä maanjäristyskartta on hieno esimerkki. Se on aika kaoottisen näköinen, mutta hetken sitä tutkittua alkaa hahmottumaan. On myös paljon nettisivuja, jotka seuraavat esimerkiksi tulivuorien tilannetta tällä hetkellä ja luokittelevat niitä aktiivisuuden mukaan. Löysin tällaisen sivuston koskien Islannin tulivuoria.

 

Lähteet:

    • Halmes, E. (2021) Harjoitus 6: Raikasta talvisäätä ja interpolointia, luettu 29.3.2021. (https://blogs.helsinki.fi/emhalmes/2021/03/04/harjoitus-6-raikasta-talvisaata-ja-interpolointia/)
    • https://en.vedur.is/earthquakes-and-volcanism/volcanic-eruptions/
    • https://www.flickr.com/photos/idvsolutions/7439877658/sizes/l/

Kurssikerta 5: Bufferit ja oman osaamisen testaamista

Lentokentät, asemat ja taajamat

 Viidennellä kurssikerralla opitut asiat pistettiin testiin itsenäisten tehtävien avulla.

Uusi asia oli buffereiden eli puskurien teko ja sitä harjoiteltiin Malmin ja Helsinki-Vantaan lentokenttiin liittyvillä tehtävillä. Tehtävä alkoi uuden layerin luomisella ja sinne kohteiden, lentokentän kiitoratojen, lisäämisellä. Malmin lentokentän piirtäminen onnistui hyvin, mutta Helsinki-Vantaata piirtäessäni aiheutti vähän ihmetystä sen katoaminen kartalta. Ongelma onneksi selvisi, koska olin layeria luodessani unohtanut asettaa oikean koordinaattijärjestelmän, joten lentokenttä piirtyi ihan väärään paikkaan.

Bufferien teko onnistui hyvin ja kohteiden valitseminen niiden sisältäkin oli helppoa select by location-toiminnon avulla. Jos taas tarvitsee valita kohteet jonkun tietyn ominaisuuden perusteella, select by expression on kätevä. Käytin sitä esimerkiksi valitessani talot, jotka oli otettu käyttöön ennen vuotta 1936. Vastaukset tehtäviin löytyi statistics-paneelista, jossa näkyi kohteitten määrä ja halutun muuttujan summa. Siinä oli myös se hyvä ominaisuus, että pystyi joko tarkastelemaan arvoja koko aineistosta tai vain valituista kohteista.

Kuvassa 1 näkyy 1km puskurin sisään jäävät talot ja korostettuna ne, jotka ovat otettu käyttöön ennen Malmin lentokentän käyttöönottoa. Olin lukenut tehtävänannon väärin, koska olisi pitänyt selvittää lentokentän jälkeen käyttöönotettuja taloja, mutta tuloksista kuitenkin näkyy lentokentän ikä suhteessa ympäröiviin taloihin. Visualisointi ei ehkä ole paras mahdollinen, mutta halusin sen olevan selkeä. Taustakartan kanssa tulokset eivät olisi hahmottuneet kovin hyvin, koska se oli niin täynnä kaikkea, joten jätin sen pois.

Kuva 1. Ennen Malmin lentokentän käyttöönottoa (1936) rakennetut talot.

Helsinki-Vantaan lentokentän tehtävissä bufferien käyttö jatkui, mutta käytettiin myös toista uutta ominaisuutta, clippiä. Sen avulla pystyttiin valitsemaan kohteita, joita määrittää kaksi eri layeria, esimerkiksi bufferi ja meluastealue. Miettiessäni miten piirtäisin Helsinki-Vantaan lisämelualueen, oikosulku iski, koska en tajunnut miten piirtämäni viivan pituus olisi pitänyt tietää. Veetin blogia lukemalla sain muistutuksen toisella kurssikerralla käytetystä mittaustyökalusta. Mittasin 7km pituisen viivan ja piirsin sitten samanlaisen lisämelualueeksi ja bufferoin sen. Melualueen piti olla 1 km levyinen, joten tein 500m bufferin suuntaansa.

Asemiin ja taajamiin liittyvissä tehtävissä mukaan tuli myös joined layerin teko. Se on loppujen lopuksi aika yksinkertainen työkalu, mutta jostain syystä se ei oikein muistu helposti mieleen ja unohdan sen olemassaolon. Sitä siis käytetään silloin kun halutaan yhdistää tietoa kahdesta layerista. Esimerkiksi ulkomaalaisten suhteellisia määriä eri alueilla laskiessa piti ensin saada tietää ulkomaalaisten määrä alueittain. Sitten suhteelliset osuudet koko alueen väestöstä sai laskettua field calculatorilla. Ennen yhdistelyä ja laskutoimitusten tekoa piti kuitenkin poistaa niitä sotkevat 999999-arvot yksitellen.

 

 

Saunat ja uima-altaat

Uima-altaita selvitellessä selvisin aika pitkälti select by expression työkalulla ja statistics paneelilla.

Isompi projekti oli tehdä kartta uima-altaiden määristä asuinalueittain. Yrittäessäni rajata uima-altaita alueilla QGIS ilmoitti errorista ja varoitti invalid geometrystä. Ohjeet ongelman ratkaisemiseksi löytyi onneksi Ilarin blogista ja niin päästiin tästäkin eteenpäin.

Tein joined layerin jotta sain tietää uima-altaiden määrät alueittain ja otin mukaan vaan alueet joissa on uima-altaat, koska vain niiden arvot tarvitsee ja kannattaa visualisoida kartalle. Kuvassa 2 on tekemäni kartta uima-altaiden määristä eri asuinalueilla pääkaupunkiseudulla. Pylväät eivät erotu kovin hyvin, mutta en halunnut tehdä niistä liian isoja, jolloin ne olisivat peittäneet alueiden rajoja. Pylväiden ja arvojen saanti kartalle on jotenkin erityisen hankalaa enkä oikein saa niitä mieluisikseni. Niiden paikan määrittäminen on vaikeaa ja ne ovatkin vähän missä sattuu. Alueiden vaihtelevat koot vaikeuttavat pylväiden kokojen säätämistä ja numeroarvon lisäämistä, koska molemmat eivät aina mahdu alueen sisään. Yritin saada mahdollisimman monen niistä näkyville kartalle.

Kuva 2. Uima-altaiden määrä pääkaupunkiseudulla alueittain.

 

Tässä vielä kaikki tehtävien tulokset:

taulukkokk5gim

QGIS-kokemuksia

Keskeisiä työkaluja QGISissä:

    • Valitsemistyökaulut varsinkin select by location ja select by expression. Niiden käyttö on tässä vaiheessa jo sujuvaa, vaikka esimerkiksi select by expressionilla voi varmasti tehdä lukuisia erilaisia asioita joista en vielä tiedäkään.
    • Field calculator jotta voi laskea uutta tietoa. Sen käyttö onnistuu myös, vaikka välillä omat aivot ja matikka vähän hidastaa kun ei osaa laittaa oikeita laskutoimituksia.
    • Joined layereiden teko ja clip-työkalu. Jos tarvitaan yhdistellä tietoa eri layereilta ja tehdä analyysia niiden välillä. En vielä ole kovin varma näiden käytöstä ja todella herkkä unohtamaan ne, mutta ovat suhteellisen yksinkertaisia. Kurssikerralla mainittiin myös intersection-työkalu, joka on clipin tapainen, mutta en ole varma missä tilanteissa sitä kannattaisi käyttää. En itse ainakaan käyttänyt sitä missään tämän kerran tehtävistä.
    • Puskurit ovat hyödyllisiä, mutta en osaa keksiä niille mitään syvempää käyttötarkoitusta kuin tarkastella mitä niiden sisälle tai ulkopuolelle jää. Käyttö on aika helppoa ja niidenkin hyödyntämiseen on varmasti lisää vaihtoehtoja.

Tämän kurssikerran tehtävissä osoittautui hyödylliseksi statistics-paneeli, jonka avulla pystyi katselemaan muuttujien määriä ja summia. Ei tarvinnut aina luoda uusia layereita, koska tietoa ei tarvinnut pysyvästi tallettaa. Teen kuitenkin usein uusia layereita valituista kohteista, jotten kadota tietoja ja se voi joskus aiheuttaa sen, että layereita on vähän liikaa. Yritin tässä harjoituksessa varsinkin pysyä ajan tasalla layereistani ja poistin niitä jotka olivat turhia sekä nimesin heti jos tein uuden.

Työkalut ovat tulleet tutuiksi, mutta analyysit ovat vielä aika yksinkertaisia. Kun ei tunne kunnolla ohjelmaa, on välillä vaikea alkaa kokeilemaan eri keinoja, mutta olen yrittänyt testailla ominaisuuksia opitun rajoissa. Tällä kurssikerralla sai myös hyvän muistutuksen, että hyvä lähtökohta on ensin aina tutkia attribuuttitietoja ja katsoa onko siellä jotain outoa ennen kuin lähtee tekemään analyysia. Myös koordinaattijärjestelmän varmistaminen on kannattavaa, koska se voi sekoittaa koko projektin, jos se on väärä.

Lähteet:

    • Leino, I. (2021) Viides kurssikerta, luettu 8.3.2021. https://blogs.helsinki.fi/ilarilei/2021/02/19/viides-kurssikerta/
    • Sihvola, V. (2021) Episode V: The QGIS Strikes Back, luettu 8.3.2021. https://blogs.helsinki.fi/veetisih/?p=112