Kurssikerta 7: Viimeisenä harjoituksena oma kartta

Kurssi on tulossa päätökseen ja viimeisenä tehtävänä olisikin etsiä itse dataa ja saada siitä jokin kelpo karttaesitys aikaiseksi. Lähdin datan metsästykseen viimeistä kurssikertaa edeltävänä iltana. Muutaman tunnin jälkeen kone oli tukossa kaikenlaisista kansioista ja tiedostoista, mutta en siltikään ollut löytänyt  oikein mitään käyttökelpoista. Joko tiedostomuodoissa ja latauksessa koneelle/QGIS:siin oli vaikeuksia tai taulukot olivat muuten niin sekavia, ettei niitä oikein pystynyt hyödyntämään. Oikeanlaisen aiheen keksiminenkin tuotti vähän hankaluuksia. Erilaisia pohjakarttoja löytyy hyvin, mutta järkevän datan löytäminen osoittautui suurimmaksi ongelmaksi tehtävässä.

Satuin kuitenkin seuraavana aamuna ennen kurssikerran alkua löytämään dataa ihmiskaupparikoksista Yhdysvalloissa, jonka onnistuin jopa lataamaan QGIS:siin onnistuneesti. En ole täysin vakuuttunut esimerkiksi osavaltioiden rikosten määrien vertailukelpoisuudesta toisiinsa. Tietoa oli sekavasti 2010-luvulta eri vuosilta. Rikoksia ei ollut kirjattu osavaltioittain vaan tiedot olivat aina pienemmästä piirikunnasta tai muusta sellaisesta, joten jouduin yhdistelemään ne osavaltioittain. Kaikista osavaltioista ei ollut ollenkaan tietoa, esimerkiksi Kaliforniasta, jossa on varmasti tapahtunut kyseisiä rikoksia. Kartta on varmaan kuitenkin suuntaa-antava. Liitän kartan tähän postaukseen, koska puuhastelin sen kanssa koko neljän tunnin ajan, vaikka ei vastaakaan tehtävänantoon yhdellä muuttujallaan. Oli kuitenkin hyvää harjoitusta ja testailin vähän lisäillä ja muokata labeleita ja numeroarvoja.

Kuva 1. Yhdysvalloissa raportoidut ihmiskaupparikokset osavaltioittain. Lähde: Bureau of Justice Statistics.

Nyt melkein kuukauden jälkeen vähän pelotti taas lähteä etsimään dataa, mutta se lähti sujumaan tällä kertaa vähän paremmin ja sain ladattua väestötietoa Yhdysvalloista. Ajattelin myös, että vaaleista voisi löytyä jotain dataa, minkä saisi kartalle. Minusta oli helpompi löytää dataa kun oli valinnut jonkun tietyn aiheen ja pystyi tekemään tarkempia hakuja. Löysin presidentinvaalien äänistä taulukoita, mutta ensimmäinen lataamani oli todella iso tiedosto ja sekoitti QGIS:sin täysin. Kokeiluiden jälkeen löysin myös pienemmän tiedoston ja lähdin muokkaamaan sitä eteenpäin.

Vaikeus oli yhdistellä rivejä siten, että kaiken tärkeän tiedon sai mukaan. Yhdysvaltojen datassa oli yleistä, että osavaltioille oli useampia rivejä. Data hangoitteli eri vaiheissa paljon vastaan ja monesti yhdisteltäessä näytti nullia uusille arvoille ja valitti ettei pystytty tallentamaan muutoksia. Jumituin myös aika pitkäksi aikaa kohtaan, jossa joka osavaltiolle oli kaksi riviä, toisessa Bidenin äänestystiedot ja toisessa Trumpin. Yritin saada tiedon yhteen sarakkeeseen, kumpaa on äänestetty enemmän missäkin osavaltiossa ja jouduin vähän soveltamaan kun en keksinyt kovin hyvää tapaa siihen. Mutta eri vaiheiden jälkeen sain sen jotenkin sellaiseen muotoon, että pystyin yhdistämään taulukon Yhdysvaltojen karttaan. Laskin  myös äänestysprosentin toiseksi muuttujaksi. Lopullinen kartta on kuvassa 2.

Kuva 2. Yhdysvaltojen osavaltioiden jakautuminen vuoden 2020 presidentinvaaleissa sekä osavaltioiden äänestysprosentit. Lähteet: US Census Bureau ja Harvard Dataverse, MIT Election Data and Science Lab.

Olen ihan tyytyväinen siihen, miltä kartta nyt näyttää. Muutamat jutut jäi vähän vaivaamaan, esimerkiksi itärannikon pienet osavaltiot, joista kaikista ei äänestysprosentti näy. Toiseksi kartaksi olisi tietysti voinut tehdä zoomauksen itärannikkoon. Esimerkiksi Pinja oli tehnyt näin kartassaan tupakoinnin määrästä ja mediaanituloista. En saanut myöskään legendaan symbolia äänestysprosentille. Jouduin lisäämään äänestysprosentin Alaskan päälle käsin, koska se ei aluksi tullut näkyviin, mutta huomasin vasta tallennuksen jälkeen, että siellähän se on, nyt niitä on kaksi päällekkäin. Sain kuitenkin Alaskan ja Havaijin oikeaan mittakaavaan verrattuna muuhun maahan ja aseteltua ne ihan kivasti.

Valitsemani aiheet eivät ehkä ole sellaisia, jota kovin pitkälle pystyy analysoimaan. Vaalien äänestysprosentit koko Yhdysvalloissa liikkuvat noin 40 ja 60 prosentin välissä. Se on aika vähän verrattuna esimerkiksi Suomeen, jossa vuonna 2018 presidentinvaaleissa äänestysprosentti oli 69,9 (Tilastokeskus). Vaikea kuitenkin verrata niin erilaisia maita. Äänestysprosentin ja suositumman ehdokkaan välillä ei ole kovin vahvaa yhteyttä. Kartalla näkyvistä heikoin äänestysprosentti näyttäisi löytyvän Texasista, joka meni Trumpille ja korkein Mainesta, joka äänesti enemmän Bidenia. Rannikoilla, kuten Kaliforniassa ja itärannikolla äänestetään enemmän demokraattista Bidenia. Netistä löytyy paljon karttoja viime vuoden vaaleista, johon voi omaa tuotosta vähän verrata, esimerkiksi New York Timesin sivuilla. Ainakin näyttäisi olevan osavaltioiden voittajaehdokkaat oikein. Projektio on eri kuin käyttämäni ja Alaskan ja Havaijin liittäminen kartalle on tehty vähän eri tavalla. 

Roosa oli tehnyt kartan koskien Yhdysvaltoja ja myös kohdannut ongelmia aineistojen etsimisessä ja valitsemisessa sekä niiden muokkaamisessa. Roosa oli valinnut mielenkiintoiset muuttujat, mediaanitulot ja huonemäärän joiden mahdollista yhteyttä oli saanut pohdittua laajasti. Näyttää myös hyvältä, kun osavaltioiden nimet on kartalla, minkä olisin itsekin voinut tehdä vaalikarttaan.

Tämä kurssi on ollut kokonaisuudessaan todella kiinnostava ja tehtävien parissa kulunut varsin paljon aikaa. Joskus ehkä vähän liikaakin, kun ryhtyi liian tarkaksi ja sääti karttojen kanssa iltamyöhään. Blogi on ollut kiva tapa suorittaa kurssia, vaikka blogitekstien tekeminen on ollut yllättävän hankalaakin. On kiva kun on pääsyt lukemaan muiden tekstejä ja näkee miten he ovat jonkun tehtävän tehneet ja kuinka kurssi sujuu muilla. Olen ihan ylpeä varsinkin siitä, että sain taiottua esiin jonkinlaisen kartan viimeisenä harjoituksena.

Kiitos ja moikka!

 

Lähteet:

    • Bureau of Justice Statistics, haettu 5.3.2021. https://www.bjs.gov/index.cfm?ty=tp&tid=40
    • Harmonen, R. (2021) Seitsemäs kurssikerta –  loppusuoralla, luettu 31.3.2021. https://blogs.helsinki.fi/harmoroo/2021/03/02/seitsemas-kurssikerta-loppusuoralla/
    • Hägg, P. (2021) Kurssikerta 7, luettu 31.3.2021.  https://blogs.helsinki.fi/pinhagg/2021/03/29/kurssikerta-7/
    • Natural Earth, haettu 5.3.2021. https://www.naturalearthdata.com/downloads/50m-physical-vectors/
    • New York Times,  Presidential Election Results: Biden Wins, luettu 31.3.2021. https://www.nytimes.com/interactive/2020/11/03/us/elections/results-president.html
    • Tilastokeskus (2018) Sauli Niinistön kannatus tasaista eri alueilla presidentinvaalissa 2018,luettu 31.3.2021 https://www.stat.fi/til/pvaa/2018/pvaa_2018_2018-02-02_tie_001_fi.html
    •  US Census Bureau, haettu 31.2.2021. https://www.census.gov/en.html

 

Leave a Reply

Your email address will not be published. Required fields are marked *