Seitsemäs kurssikerta

Euroopan alueen tunnuslukuja

Ensin tein kartan Euroopan valtioiden BKT:sta. Sain kuvan 1, jonka mukaan BKT on suuri monissa Keski-Euroopan valtioissa. Saksa nousee selvästi esiin.

Kuva 1. Euroopan alueen BKT  (miljoonaa US dollaria) ”Jenks natural breaks” -luokittelulla. Datan lähde.

Mietin kauan, miten luokittelen aineistoa, sillä esimerkiksi Saksa tuntui kokoajan hyppäävän esille, ja monissa luokitteluissa esimerkiksi Norja jäi pois. Päätin käyttää Natural breaks (Jenks), joka etsii luokat, joissa sisäinen varianssi olisi mahdollisen pieni ja luokkien välinen suuri eli se yrittää erotella luokat toisistaan selkeämmin (Wikipedia).

Tämän avulla sainkin karttaan näkymään muitakin valtioita kuin Iso-Britannian, Ruotsin, Saksan, Ranskan, Italian ja Espanjan. Nämä hallitsivat kuvaa aika lailla esimerkiksi ”Pretty Breaks” tai tasavälisessä luokittelussa (kuva 2).

 

 

Kuva 2. Euroopan alueen BKT (miljoonaa US dollaria) tasavälisellä luokittelulla. Datan lähde.

Tein vielä kuvan miljardeina USD:na (kuva 3). Tällöin tieto on ehkä hieman luettavammassa muodossa, ja saa paremmin selvää eri numeroiden arvoista.

Olin myös kiinnostunut piirtämään työttömyysprosenteista kartan. Viimeaikaisten uutisten perusteella oli helppo uskoa suurempiakin yli 20% tietoja esimerkiksi Espanjasta ja Kreikasta (kuva 4).

Kuva 4. Euroopan alueen työttömyysprosentti ”Jenks natural breaks” -luokittelulla. Datan lähde.

Jostain syystä työttömyys -datassani ei ollut lainkaan monia Itä-Euroopan maita, enkä löytänyt nopeasti csv-tiedostoa, jossa ne olisivat olleet. En saanut tietoja helposti kaivettua netistäkään, joten jätin leikin sikseen tapeltuani datan kanssa jo aikamoisen ajan. Esimerkiksi Valko-Venäjän työttömyysprosentti oli jonkun tilaston mukaan 0,5%, mikä ei vaikuttanut uskottavalta.

Tein kartan myös väestöntiheydestä (kuva 5). Laskin itse tiheyden asukasluvun ja pinta-alan mukaan.

Kuva 5. Euroopan alueen väestöntiheys ”Jenks natural breaks” -luokittelulla. Datan lähde 1 ja Datan lähde 2.

 

Datan muokkauksen ongelmat

Suurin osa ajasta tuntui menevän datan muokkaamiseen. Aika hyvin löytyi netistä suoraan cvs-tiedostoja eri asioista. Mutta taulukkoja usein piti muokata omaan tarkoitukseen sopiviksi. Esimerkiksi poimia vain yhden tiedon per haluttu maa. Lisäksi välillä tiedot olivat tekstimuotoa, joten piti muokata ne lukuarvoiksi.

Ensin pakersin aika paljon liitosten kanssa tehdessäni Euroopan maiden BKT-karttaa. Piti taas muokata csv-taulukkoa, koska se oli taas laittanut saman sarakkeen tietoja viereisiin sarakkeisiin tulkitessaan maiden nimiä. Lisäksi piti muistaa korvata pilkut pois. Lopulta sainkin pitkään pakerrettuani nämä asiat toimimaan.

 

Muiden blogeista

Huomasin, että Sinillä ja Kim-Henrikillä oli hieman erilainen blogisivusto. He olivat tarkastelleet karttalehden alueen maankäyttöä. On mielenkiintoista, miten erilaisia juttuja QGIS:llä saa aikaan, kunhan osaa kaivaa datan jostain. Tosin nykyisessä avoimen datan ilmapiirissä se on entistä helpompaa. Tosin datan muokkauksessa haluttuun muotoon saa itselleen harmaan hiuksen jos toisenkin.

 

Lähteet

GDP / BKT -tiedoston hain csv-muodossa: https://datacatalog.worldbank.org/dataset/gdp-ranking Haettu 23.2.2018

Maiden kartat ja väestön tietoja sain (kurssiblogin linkki): http://www.naturalearthdata.com/ Haettu 23.2.2018

Työttömyystilastot: https://data.oecd.org/unemp/unemployment-rate.htm Haettu 23.2.2018

Pinta-alat: https://en.wikipedia.org/wiki/List_of_European_countries_by_area Haettu 26.2.2018

Kreikan työttömyys -uutinen: https://www.talouselama.fi/uutiset/kreikan-tyottomyys-laski-jalleen-yha-euroopan-korkein/c1e1195a-c941-3765-a594-ae8d2a233479  Luettu 26.2.2018

Espanjan työttömyys -uutinen: https://yle.fi/uutiset/3-9424834 Luettu 26.2.2018

Sinin blogi https://blogs.helsinki.fi/7k110738/  Luettu 5.3.2018

Kim-Henrikin blogi https://blogs.helsinki.fi/helanne/ Luettu 5.3.2018

3 vastausta artikkeliin “Seitsemäs kurssikerta”

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *