Terveyttä ja sairautta EU:ssa (Kurssikerta 7)

Karttasarjassani analysoidaan Eurooppalaisten terveyttä ja sen suhdetta lääkäreiden määrään. Tarkoituksena saada lisävihiä siitä, mikä väestön terveyteen voi vaikuttaa.

Tiedot ovat Eurostatin tilastoista, joista valitsin tarkasteltavaksi vuoden 2014, sillä aineistoja oli siltä vuodelta saatavissa useammista maista. Karttapohjan hain Natural Earth Data -sivustolta.

Lääkärit

Tein ensin kartan väestösuhteutetusta potilastyötä tekevien lääkäreiden määrästä vuonna 2014 (engl. practicing physicians).

OECD:n määritelmän mukaan tämä luku sisältää lääkärit, jotka tekevät potilastyötä. Esimerkiksi hallinnollisissa tai tutkimustehtävissä olevat lääkärit ja ulkomailla työskentelevät eivät lukeudu aineistoon. Tilastoaineiston puuttuessa joidenkin maiden tilastoihin on kuitenkin laskettu mukaan kaikki työelämässä mukana olevat lääkärit (esim. Alankomaat). (1)

Euroopassa vuonna 2014 tilanne oli tämä:

Eniten lääkäreitä (505 per 100 000 as) on aineiston mukaan Itävallassa, vähiten Puolassa (231). Huom. Irlannin ja Suomen luvut ovat tilastoaineiston mukaan arvioita.

Terveet elinvuodet

Terveiden elinvuosien odote (engl. healthy life years, HLY / disability-free life expectancy) kuvaa sitä aikaa, jonka ihminen viettää terveenä ja toimintakykyisenä. Eliniän odotteessa on ollut jo useamman vuosikymmenen ajan Euroopassa nouseva trendi, mutta tämä ei välttämättä samassa suhteessa nosta toimintakykyisenä elettyjen vuosien määrää. Pitkä sairaana ja toimintakyvyttömänä elettyjen vuosien määrä on kansanterveydellisestikin kannattamatonta. Yhteiskuntapoliittisesti on tärkeä tietää, miten toimintakykyistä väestö tulee olemaan, mikä toimintakykyyn vaikuttaa ja millaista avuntarvetta tähän liittyy. (2 ja 3)

En tässä verrannut terveitä elinvuosia koko elinikään (sellainen löytyy lähde nro 3:n, OECD julkaisun, sivulta 57), vaan tein yksinkertaisesti kartat terveiden elinvuosien odotteesta. Myöhemmin vertasin näitä tietoja maissa toimivien lääkäreiden määrään.

Vuonna 2014 Euroopassa terveiden elinvuosien odote syntymähetkellä oli keskimäärin 61,8 vuotta naisille ja 61,4 vuotta miehille. (2) Tässä kartat terveiden elinvuosien odotteesta maittain vuonna 2014:

Miehet

Naiset

Ruotsi ja Malta nousivat sekä miesten että naisten osalta korkeimmalle terveiden elinvuosien odotteessa. Miehet viettävät vähiten toimintakykyisiä vuosia Latviassa ja Virossa, naiset taas Slovakiassa, Portugalissa ja Latviassa. Tulokset vastaavat OECD:n tekemää, samaan aineistoon pohjautuvaa listausta (2, s. 56).

Lääkäreiden ja terveiden elinvuosien suhde

Vertailin vielä näitä aineistoja keskenään. Tein vertailut kahteen suuntaan: terveet elinvuodet suhteutettuna lääkäreiden määrään ja lääkäreiden määrän suhteutettuna terveiden elinvuosien odotteeseen.

Kyse ei ole syy-seuraussuhteesta, vaan näiden muuttujien välisen yhteyden tarkastelusta. Terveiden elinvuosien odotteeseen vaikuttavat monet erilaiset tekijät. Halusin kuitenkin tarkastella, onko lääkäreiden määrällä havaittavissa jonkinlaista systemaattista yhteyttä terveisiin elinvuosiin. Ajatuksenani oli käyttää aineistoa avuksi pohdinnassa, kuinka hyvin lääkäreiden määrää lisäämällä voidaan vaikuttaa väestön terveyteen.

Mielenkiintoista kyllä, sekä naisten että miesten aineisto antaa samansuuntaisen indeksiluvun kummassakin vertailussa, vaikka naisten ja miesten terveiden elinvuosien odotteet ovat keskenään poikkeavia. Lisäksi kumpaankin suuntaan tehdyt vertailut antoivat keskenään johdonmukaisia tuloksia.

Ei voida mielestäni sanoa, että lääkäreiden määrällä olisi selkeä yhteys terveiden elinvuosien odotteeseen, ainakaan näiden tilastoaineistojen perusteella. Tämä oli tietenkin ihan odotettavaa, mutta paikalliset vaihtelut suhteissa ovat kiinnostavia ja yllättäviäkin:

Miehet

Puolassa terveitä elinvuosia saavutetaan suhteellisesti vähimmällä lääkäripanostuksella. Aineistona vain miehet.

Naiset

Puolassa terveitä elinvuosia saavutetaan suhteellisesti vähimmällä lääkäripanostuksella myös naisten osalta, Irlanti ja Iso-Britannia pääsevät samaan indeksilukemaan.

Miehet

Itävallassa terveitä elinvuosia saavutetaan lääkäreiden määrään verrattuna Euroopan heikoimmin, Puolassa ja Irlannissa taas vähimmällä ”lääkäripanoksella”. Aineisto koskee miehiä.

Naiset

Itävallassa terveitä elinvuosia saavutetaan myös naisten osalta lääkäreiden määrään verrattuna Euroopan heikoimmin, Puolassa taas tehokkaimmin.

Mitä näistä vertailuista voi päätellä?

Datan epävarmuudet

Lääkäreiden määrään liittyvistä tilastointipuutteista mainitsin yllä. Maiden tiedot eivät ole keskenään aivan vertailukelpoisia.

Myös terveiden elinvuosien lukumäärät eivät ole mitenkään yksiselitteisiä. OECD:n mukaan terveiden elinvuosien ennustetta kuvaava aineisto perustuu ihmisten itse ilmoittamaan tietoon. Se ei siis ole maiden välillä välttämättä vertailukelpoista, vaan siihen vaikuttavat mm. ihmisen kultturinen ja sosiaalinen tausta ja se, miten näistä johtuen omaa terveyttä hahmotetaan ja arvioidaan. (2)

EU:ssa jäsenmaiden terveet elinvuodet lasketaan GALI-kysymyksen perusteella. GALI on yksi  Eurooppalaisiin väestötutkimuksiin kehitetyistä, toimintarajoitteiden mittaamiseen käytetyistä, kysymyksistä. GALI-kysymys nojautuu WHO:n toimintakykyluokituksen (ICF) viitekehykseen: sen on tarkoitus mitata osallistumisen rajoitteita (participation restrictions). Gali-kysymystiedot kerätään Euroopan tulo- ja elinolotutkimuksella (EU-SILC). (4, 2)

Englanniksi GALI-kysymys kuuluu seuraavasti:

for at least the past six months, to what extent have you been limited because of a health problem in activities people usually do? Would you say you have been: severely limited? limited but not severely? not limited at all?” (5)

Maiden välinen vertailukelpoisuus on THL:n mukaan kyseenalainen mm. kysymyksen heikon standardoinnin sekä tutkimusten toteutustavoissa olevien erojen vuoksi. (4) GALI-kysymystä on kuitenkin haastava korvata. Se on tieteellisin menetelmin kehitetty mittari, josta on tehty paljon tutkimusta. Se on myös keveä käyttää, ja siinä mielessäkin käyttökelpoinen toistuvaan tilastointiin. (6) Krittiikiä eritellään hyvin Eurostatin raportissa, ja GALI-kysymystä on pyritty kehittämään. (6).

Näiden epävarmuuksien lisäksi eri maiden aineistoja koskevissa Eurostatin tilastoissa oli myös aukkoja: kaikista maista ei ollut kaikilta vuosilta dataa.

Tällaiset puutteet ovat mielestäni tavallisia hyvin monissa tilastoissa ja aineistoissa. Aineistot olivat mielestäni hyvälaatuisia, mutta on tärkeä tiedostaa, miten ne on kerätty ja mitä kysymyksiä niihin liittyy. Näistä kysymyksistä olisi voinut hakea paljon enemmänkin tietoa, aineistoa tuntuu olevan hyvin paljon, asiaa on mietitty.

Omat johtopäätökset

Lääkärimäärien ja terveiden elinvuosien odotteen vertailua täytyy käyttää harkiten. Onnistuin kyllä teknisesti vertailussa, ja saamani kartat ovat keskenään johdonmukaisia. Jouduin pohtimaan, mitä saamani luvut tarkoittavat ja miten kuvata niitä karttaselitteessä uskottavasti. Artun ehdotuksesta laadin luvuista indeksit, jotka kuvaavat kartoissa mainittuja korrelaatioita. Indeksit kertovat vain analysoitujen maiden keskenäisistä suhteista, nämä eivät ole yleisiä muualla käytössä olevia indeksityyppejä.

Minusta tällaisia lukuja voi käyttää jatkoanalysoinnin apuna pohdittaessa eurooppalaisten hyvinvoinnin lisäselvittämistarpeita, mutta yksin niistä ei voi tehdä pitkälle meneviä johtopäätöksiä.

Terveyteen ja toimintakykyisyyteen vaikuttavat niin monet muutkin seikat, joita pitäisi huomioida. Väestön hyvinvointi on tärkeä tavoite, ja karttoja voisi käyttää apuna lisäselvitysten kohdentamiseen siitä, voidaanko terveyteen vaikuttaa ensisijaisesti lääkäreiden määrää lisäämällä vai muita seikkoja huomioimalla. Tämä on tietenkin hyvin monimutkainen aihe.

Indeksikartoista nousee mm. seuraavia kysymyksiä, jotka ovat minusta mielenkiintoisia:

  • Mitä Itävallassa tapahtuu, kun lääkäreiden määrä on aineiston korkein, mutta sillä on saavutettu suhteessa vähiten terveyshyötyä? Mikä Itävallassa vaikuttaa väestön terveyteen (tai sen kokemiseen)? Millaisia maan terveydenhuoltopalvelut ovat, poikkeavatko ne jossain suhteessa muista maista? Onko maassa joitakin erityisiä ympäristö- ja elämäntapatekijöitä, joihin lääkärit eivät pysty vaikuttamaan, mutta jotka heikentävät väestön terveyttä ja toimintakykyä?
  • Norjassa ja Ruotsissa näiden indeksien mukaan terveiden elinvuosien odote korreloi hyvin lääkäreiden määrään: kummatkin ovat korkeita. Mitä näissä maissa tehdään oikein?
  • Puola ja Irlanti nousivat esiin maina, joissa terveen eliniän odotteen suhde lääkäreihin oli ”edullisin”: vähimmällä lääkärimäärällä saatiin suhteessa eniten terveitä elinvuosia (terveiden elinvuosien kartassa Puola on keskivaiheilla, Irlanti kärkipäässä. Lääkäreiden määrät taas ovat aika alhaisia, Irlanti 281 ja Puola 231). Tämä on yllättävää ja kiinnostavaa. Miten maiden terveydenhuolto toimii? Onko maassa merkittäviä elintapa- ja ympäristötekijöitä, jotka ovat terveyttä edistäviä? Vai kokevatko maiden asukkaat kulttuurisista/sosiaalisista syistä terveytensä ja toimintakykynsä positiivisemmin suhteessa muihin maihin, tuleeko vaikutus GALI-kysymyksen subjektiivisen vastauksen kautta? Itseasiassa sekin olisi kiinnostava ja hyödyllinen tieto.
  • Vuoden 2014 lääkäreiden määrää koskevasta aineistoista puuttuivat Kreikan ja Portugalin tiedot, jotka olisivat olleet mielenkiintoisia. Kreikassa on jopa Itävaltaa enemmän lääkäreitä (Itävalta v. 2014: 505 per 100 000 as., Kreikka v. 2016: 658 per 100 000 as). Portugalissa vuonna 2016: 480 per 100 000 as. (7)
    Nämä olisivat myös mielenkiintoisia selvitettäviä. Kreikassa nimittäin terveiden elinvuosien odote on korkea, Portugalissa matala – mistä erot johtuvat?

    (note to self: Keltaisen väriskaalat ovat epäselviä lääkäreiden määrää kuvaavassa kartassa, muitakin väriskaaloja voisi selkeyttää)

Lopuksi

Olin yllättynyt siitä, että tämä harjoitus sujui ongelmitta ja jopa nopeasti – kurssi on ollut aika epätoivoista ryömimistä välillä itselläni, ja paljon on aukkoja. En tiedä missä ne lukemattomat omituiset ongelmat olivat tällä kertaa. Jäi sopivaan saumaan hyvä maku onnistumisesta, ja kiinnostus perehtyä niin Qgis-ohjelmaan kuin ylipäänsä paikkatieto-ohjelmiin tarkemmin, kaikesta haastavuudesta huolimatta. Loistava työkalu, jos tämän saa haltuun.

Kiitos Artulle laadukkaasta ja mukavasta opetuksesta!

Lähteet:

1. OECD (2019), Doctors (indicator). doi: 10.1787/4355e1ec-en (Luettu 1.3.2019)

2. OECD (2016), ”Life expectancy and healthy life expectancy at birth”, in Health at a Glance: Europe 2016: State of Health in the EU Cycle, OECD Publishing, Paris, https://doi.org/10.1787/health_glance_eur-2016-6-en. (Luettu 1.3.2019)

3. Penttilä, Irmeli, 2006. Kuinka ikääntyvä väestö voi – vertailutietoja EU-maista. Tilastokeskus. https://www.stat.fi/tup/tietotrendit/tt_05_06_ikaantyva_vaesto.html (1.3.2019)

4. Nurmi-Koikkalainen ym. (2017) Tietoa ja tietotarpeita vammaisuudesta. Analyysia THL:n tietotuotannosta. Työpaperi. THL. https://www.julkari.fi/bitstream/handle/10024/135650/URN_ISBN_978-952-302-946-0.pdf?sequence=1 (1.3.2019)

5. Bogaert ym. (2018). The use of the global activity limitation Indicator and healthy life years by member states and the European Commission. Archives of public Health. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6022353/ (1.3.2019)

6. Eurostat. Item 4.3 Global Activity Limitation Indicator (GALI) as a core variable. Meeting of the European direc-tors of social statistics 15-17 September 2015, Luxembourg. https://circabc.europa.eu/sd/a/8eec189a-3389-47d3-999e-c12afc4a0f7d/DSS-2015-Sep-04.3%20GALI%20as%20a%20core%20variable.pdf (Luettu 1.3.2019)

7. Eurostat, 2018: Healthcare personnel statistics – physicians. Table 1: Physicians, 2016. https://ec.europa.eu/eurostat/statistics-explained/index.php/Healthcare_personnel_statistics_-_physicians (Luettu 1.3.2019)

Luonnon (ja QGIS:n) armoilla (Kurssikerta 6)

Tämä olikin mukava kurssikerta. Harjoitukset sujuivat ongelmitta, hädin tuskin onnistuin hillitsemän haluni häiritä opetusta tuulettelemalla vastoinkäymisten puuttumista. Myös Epicollect-sovelluksen käyttö oli mielenkiintoista, ja ulkoilu aurinkoisessa pakkassäässä virkistävää vaihtelua istumiseen.

Tein kolme karttaa hasardeista. En käyttänyt näissä interpolointia, sillä koen pistemäisen esitystavan kyseisissä ilmiöissä mielekkäämmäksi esitystavaksi. Toki interpoloinnilla saa lisättyä kartan visuaalista tehoa ihan vaikuttavasti, kuten Elina Huhtinen päätyi harjoituksissaan tekemään – vaikutelma näissä kartoissa todella on, että maa voi liikkua alta milloin tahansa (1). Tämän voisi toki varmasti toteuttaa muillakin ”visuaalisilla tehokeinoilla” kuin interpoloimalla. Karttatoteutusten vertailu on mielenkiintoista ja opettavaa.

Reikäinen taivas

Ensimäinen karttani käsittelee meteoriittilöydöksiä. Käytin värejä ja kokoja meteoriittilöydösten kokoluokan esittämiseen.

Meteoriittilöydöksiä maailmalta painoluokittain.

Aineistosta ei itselleni selvinnyt, minkä vuosien tilastoja tässä oli, tämä tieto olisi toki hyvä olla näkyvissä.

Kartassa on minusta olennaista hahmottaa, että kyse ei ole pudonneista meteoriiteista sinänsä, vaan tilastoiduista meteoriittihavainnoista. Voisi ajatella meteoriitteja putoavan maapallolle suhteellisen tasaisesti. Kuitenkin meteoriittihavaintoja on tehty runsaasti esimerkiksi Euroopassa, Pohjois-Amerikassa ja vaikkapa Omanissa. Sen sijaan merialueilta tai vaikkapa päiväntasaajan Afrikasta ei havaintoja ole. Esimerkiksi Oman vaikuttaa astrofyysikkojen keskuudessa olevan erinomainen havainnointipaikka, sillä ”siellä on runsaasti tasaista, vaaleansävyistä, hiekatonta ja kasvillisuudetonta pintaa”. (2)

Tarkistin myös varmuuden vuoksi y- ja x-koordinaattien osumisen oikeaan hakemalla kartalta muutamia pisteitä ja vertailemalla niitä attribuuttitaulukon paikkamainintaan – loogista oli.

Mannerlaattojen kitkaa

Toinen karttani esittää yli 6 richterin suuruisia maanjäristyksiä Etelä-Amerikassa vuosina 1950-2000. Hyödynsin tiedon välittämisessä värejä ja kokoja, kuten meteoriittihavaintojakin yllä esittäessä. Mannerlaattojen rajat piirtyvät hyvin esiin niin tässä Etelä-Amerikkaa kuvaavassa kartassa kuin koko maailmankin esiintymiä kuvaavassa kartassa (ei karttaa).

Voimakkuudeltaan 6 Ricterin asteikolla ylittäneet maanjäristykset Etelä-Amerikassa vuosina 1950-2000.

Viimeiseen karttaani valitsin erityisen voimakkaat (yli 8 ricterin asteikolla) maanjäristykset 1950-2000. Nämäkin luonnollisesti löytyvät mannerlaattojen reuna-alueilta.

Seismologian instituutin mukaan yli 8 Ricterin maanjäristyksiä tapahtuu maailmalla vuosittain keskimäärin enintään 1, yli 7 Ricterin järistyksiä 18 ja yli 6 Ricterin järistyksiä n. 120. (3)

Olisi ollut kiva lisätä karttaan paikannimet, mutta näitä ei ollut tietokannassa, toki ne olisi tällä osumamäärällä voinut hakea erikseen muualtakin. Tällaiseen tietoon olisi voinut liittää myös lukeman Ricterin asteikolta. Joukossahan olisi kuuluisia järistyksiä, kuten:

  • Kamtchatkan niemimaa 11.4.1952 (9,0)
  • Valdivia, Chile 22.5.1960 (9,5)
  • Prince William Sound, Alaska, Yhdysvallat 27.3.1964 (9,2).

Tuhothan eivät toki ole verrannollisia järistyksen suuruuteen. Esimerkiksi Alaskan järistys aiheutti vain vähän tuhoja tapahtuessaan harvaan asutulla alueella. Valdivian järistys tappoi tuhansia ihmisiä ja sen aiheuttamat tsunamit aiheuttivat tuhoja Uudessa-Seelannissa ja Alaskassa asti. (4)

Tässä vaiheessa huomasin, että osa näistä kuitenkin puuttuu aineistosta, ainakin Valdivia 1960 ja Kamtchatka 1952. Aineistoni on haettu kurssiohjeen mukaiselta sivulta http://quake.geo.berkeley.edu/anss/catalog-search.html.

Näistä laadittu kartta näyttää tältä, arvoitukseksi itselleni kuitenkin jäi, miksi merkittäviä järistyksiä puuttuu joukosta:

Voimakkuudeltaan 8 ricteriä ylittäneet maanjäristykset vuosina 1950-2000.


Lähteet:

  1. Hoffman, B., Knos, E., Al-Kathriri, A. 2004. Harvesting meteorites in the Omani desert: Implications for astrobiology. European Space Agency, (Special Publication) ESA SP. http://adsabs.harvard.edu/full/2004ESASP.545…73H
  2. Huhtinen, E. Viikko 6 – auringonpaistetta ja onnistumisen tunteita. 22.2.2019.
    https://blogs.helsinki.fi/huhelina/2019/02/22/viikko-6-auringonpaistetta-ja-onnistumisen-tunteita/ (Luettu 23.2.2019)
  3. Seismologian instituutti, Perustietoa maanjäristyksistä. https://www.helsinki.fi/fi/seismologian-instituutti/maanjaristykset/perustietoa-maanjaristyksista-0 (Luettu 23.2.2019)
  4. Wied, E. 2014. Historian voimakkaimmat maanjäristykset. Tieteen kuvalehti. https://tieku.fi/luonto/luonnonkatastrofit/maanjaristys/maanjaristykset-katso-videopatkia-voimakkaimmista-jaristyksista (Luettu 23.2.2019)

Buffereita ja pohdintaa (Kurssikerta 5)

Qgis:n käyttö alkaa hahmottua, joskin kaukana vielä itsenäisestä luotettavasta käytöstä ollaan. Tämä harjoitus selvensi työkalujen käyttöä, mutta olen silti hieman epävarma, teinkö aina oikeita valintoja. Oli hyvä, että erilaisia harjoituksia ja toistoja oli paljon.

Tällaisia tuloksia sain:

MALMIN LENTOKENTTÄ

  • Asukkaita 1 km säteellä Malmin lentokentästä 8 906 hlöä
  • Asukkaita 2 km säteellä Malmin lentokentästä 57 450 hlöä
  • 1 km säteellä lentokentästä, rakennettu ennen lentokenttää 58 rakennusta. Näissä asukkaita 773 hlöä.

HELSINKI-VANTAA

  • Asukkaita 2 km säteellä Helsinki-Vantaan lentokentästä n. 11 000 hlöä
  • Laskeutumissuunan vaihdoksesta kärsisi n. 18 000 hlöä (*)
  • Asukkaita pahimman lentomelun alueella HKI-Vantaa 324 hlöä
  • Asukkaita 55 dB:n alueella 11 913 hlöä.

*) Tein virheellisesti 1 km leveän bufferin, josta syntyi siis 2 km leveä melualue. Pituus on oikea, bufferin kanssa yhteensä 7 km, mutta leveyden olisi tullut olla puolet kapeampi. Oikea luku on siis alhaisempi.

JUNA- JA METROASEMAT

  • Asuu 500 metrin säteellä asemasta: 106 691 hlöä
  • 500 m säteellä asuvat kaikista (490 173) asukkaista: 21,8 %
  • Työikäiset (15‒74-vuotiaat*) 500 metrin säteellä asemista: 78,7 % asukkaista.

* Tilastokeskuksen mukaan työikäiseen väestöön kuuluvat 15-74 -vuotiaat henkilöt. (1)

TAAJAMAT

  • Taajamissa asuu 97,5 %
  • Taajamien ulkopuolella asuu 1289 kouluikäistä, eli 2,6 %

Olisi minusta ollut hyödyllistä oppimisen kannalta, jos oikeat vastaukset olisivat olleet heti saatavilla. Vertailin tuloksiani useiden muiden tekemisiin, mutta vastauksina saatujen lukujen skaala tuntuu olevan laaja. Esimerkiksi Teemu Lindèn, Johanna Von Frenckell ja Juho Kauppi saivat enimmäkseen samansuuntaisia tuloksia kuin minä, Julia Salmella ja Nur Nabilalla taas useimmat luvut olivat omistani poikkeavia (2-6). Mainitaanpa vielä karttojen ulkoasuihin liittyen, että blogeja selatessa mieleen jäivät Amanda Ojasalon silmää hivelevän tyylikkäät karttaesitykset. (7)

”Not responding” – ohjelman kaatuilu hidastaa

Omalla koneellani Qgis on toiminut tähän asti kaatuilematta, mutta nyt toimituksia on hankala tehdä ohjelman irtisanoessa toimintansa jatkuvasti. Mitenhän tätä ongelmaa voisi vähentää? Koetin hyödyntää mm. fields-välilehdellä tietokantojen pienentelyä poistamalla turhia sarakkeita, tai vastaavasti tallentaa tietokantoja uudelleen vähemmillä kentillä laskutoimitusten keventämiseksi, mutta kaatuilu jatkui tästä huolimatta ja näitäkin toimintoja tehdessä. Esimerkiksi uutta saraketta en nyt pysty tallentamaan tietokantaan, sillä ohjelma kaatuu tai jää aina pysyvästi junnaamaan. En tiedä, johtuuko tämä koneeni tehoista, Qgis:n rajallisuudesta vai siitä, että teen jotain väärin.

Samastun Oula Inkeröisen kokemuksiin (8) tunteiden vuoristoradasta, ohjelman hitaudesta ja välivaiheiden epäonnistumisesta. Toisin kuin Oula, en itse saanut selkoa, mitä harha-askeleeni olivat ja miten ne korjataan.

Matkalla

Amelia Cardwell kirjoitti blogissaan, että ei ole aina ihan selvää, mitä työkalua milloinkin pitäisi käyttää (9). Olen samoissa mietteissä. Toki on monia vaihtoehtoisia reittejä päästä tuloksiin. Lisäksi itse törmään työkalujen käytössä moniin pieniin ongelmiin. Niiden käytännön toteutus ei aina onnistu, vaikka isossa kuvassa uskoisi olevansa oikeilla jäljillä. Ohjelman kaatuilu ei auta asiaa ja kokeilujen kautta oppimista.

Hallussa olevia asioita

Vahvuutenani pidän tarkkuutta ja kriittisyyttä karttojen paikkansapitävyyden arvioinnissa ja johtopäätösten tekemisessä. Olen ainakin havainnut usein tuottaneeni kyseenalaista dataa tai sitten oikeasta datasta harhaanjohtavia visualisointeja, ja osannut korjatakin näitä.

Myös visuaalisesti karttaesitykseni ovat minusta olleet suhteellisen toimivia, joskin haluan vielä hioa esitystyylejä. Motivaatio ja kiinnostus on myös kohdallaan, ja monien omien aukkojen täyttämiseen löytyy ohjeita ja videoita. Aikaa tarvittaisiin vain huomattavasti enemmän.

Työkaluista ainakin bufferointi ja spatial query tuntuvat helppokäyttöisiltä ja hyvin moniin tarkoituksiin sopivilta.

Petrattavaa

Haltuun vielä otettavien asioiden lista onkin pidempi. Täytyy esim:

  •  Saada selvyyttä, mi(t)kä työkaluvalinta(t) ovat oikeita kulloinkin tarvittavaan tehtävään. Esimerkiksi koetin ensin laskea taajamaväestöä count points in polygon -toiminnolla, onneksi tulos oli niin alakanttiin, että havaitsin virheen. Tein sen sitten intersect-työkalulla. Millä muilla tavoilla olisi päässyt samaan tulokseen?
  • Monia yksityiskohtia, työkalujen sujuvaa ja oikeaa käyttöä pitää oppia paremmin. Mm. join attributes by location työkalussa eri vaihtoehtojen (intersects/crosses/within jne) käyttötarkoitusta ja eroja en vielä tarkkaan hahmota. Myöskään sitä, miksi ”within” vaihtoehto ei aina aktivoidu.
  • Kaavat ovat hankalahkoja, hieman epämatemaattisena ihmisenä olisi hyvä saada lisäopastusta siitä, millä funktioilla milloinkin kannattaa toimia. Esim. jonkinlainen luettelo yleisimmistä tiettyihin tarkoituksiin käytetyistä funktioista olisi tässä vaiheessa hyvä tuki.
  •  Tietokannoista on hankala aina tietää, mitä kenttien otsikot oikeasti tarkoittavat eli mitä data on.
  •  Tietokantatiedon/lähteiden luotettavuuden arviointi on myös itselleni vielä mysteeri. Esim. kurssikerran 6 maanjäristystiedot Berkeleyn yliopiston datasta: hakuni antoi aivan puutteelliset tulokset merkittävistä järistyksistä, vaikka haku oli mielestäni teknisesti tehty oikein.
  •  Projektioiden hallinnassa tarvitsisin vielä lisäopastusta.

Eli aika isoja kehittämistarpeita vielä tässä on. Mutta olen silti innoissani ohjelmasta ja sen käyttömahdollisuuksista. Minulla olisi käyttöä tälle. Mene ja tiedä kuitenkin, tuleeko ohjelma selättämään minut ennen kuin minä sitä.

Eteenpäin pääsemistä nopeuttaisi, jos kurssin lopussa saatavilla olisi oikeat luvut (/haarukat) ja koonti siitä, millaisten työkalujen kautta näihin lukuihin on päästy. On opettavaa ja välttämätöntä pähkäillä itsenäisesti, mutta olisi hyvä tietää, jos pähkäilyssä eksyy harhapoluille, tekee väärin tai jättää toistuvasti hyödyntämättä kätevimmän tavan tehdä, niinkuin itse ounastelen minulle tapahtuvan.

ps. En saanut Qgis:n kaatuilun vuoksi tehtyä loppuun taajamaharjoitusta enkä tehtäviä 3-5, palaan näihin myöhemmin.

Lähteet:

1. Tilastokeskus, Työikäinen väestö. https://www.stat.fi/meta/kas/tyoikain_vaesto.html (Luettu 24.2.2019)

2. Johanna Von Frenckell, Fall down 7 times, stand up 8. (Luettu 23.2.2019.)

3. Juho Kauppi. https://blogs.helsinki.fi/juhokaup/2019/02/22/kurssikerta-5/ (Luettu 22.2.2019)

4. Julia Salmi, Bufferointia ja melusaastetta. https://blogs.helsinki.fi/jhsalmi/2019/02/19/osa-5-bufferointia-ja-melusaastetta/ (Luettu 22.2.2019)

5. Teemu Lindèn, Kurssikerta 5. https://blogs.helsinki.fi/lindetee/2019/02/20/viikko-5/ (Luettu 22.2.2019)

6. Nur Nabila, Viides kurssikerta. https://blogs.helsinki.fi/nabila/2019/02/23/viides-kurssikerta/ (Luettu 24.2.2019)

7. Amanda Ojasalo, Vitonen. https://blogs.helsinki.fi/amandaoj/2019/02/20/vitonen/ (Luettu 23.2.2019)

8. Oula Inkeröinen, Buffers and breakdowns. https://blogs.helsinki.fi/inkeroul/2019/02/20/buffers-breakdowns/ (Luettu 24.2.2019)

9. Amelia Cardwell, Viikko 5, Buffereita ja kertailua: https://blogs.helsinki.fi/amca/ (Luettu 23.2.2019)

Rastereiden parissa (Kurssikerta 4)

Neljäs kurssikerta alkoi ruudukon rakentamisella. Ruuduista onkin moneksi.

Ruutukartta on yksi tilastokartan muoto. Kuvattava tieto esitetään tasakokoisina ruutuina, jotka eivät seuraa mitään hallinnollista jakoa.

Toisin kuin koropleettikartassa, voidaan ruutukartassa esittää myös absoluuttisia arvoja. Arvothan on nimittäin jo ”suhteutettu ruutuun”. Ruudut ovat keskenään vertailukelpoisia, samankokoisia kun ovat. Jos lukumäärätietoja haluaa esittää keskenään erikokoisilla ruuduilla, tiedot on suhteutettava. (1)

Verrattuna tähän asti tekemiimme karttoihin ruututeemakartan etuna on, että sillä voidaan esittää tietoa välittämättä hallinnollisista rajoista ja näin ollen mm. vähentää hallintoaluerajoilla tapahtuvaa näennäistä lukuarvojen muutosta. Useinhan lukuarvojen muutos luokkarajoilla vaikuttaa suurelta, vaikka tosiasiassa kyseisen hallintorajan kummallakin puolella luvut olisivat samoja. Aineisto keskimääräistyy. Ruutukoko tulee kuitenkin valita oikein, ettei samaa ongelmaa siirretä hallintoalueista ruutuihin.

Ensiaskelet ruutuihin

Tässä kurssikerralla väkertämäni kartta ruotsinkielisten osuudesta pääkaupunkiseudulla. Mielestäni kartasta erottaa ihan kivasti ne alueet, joilla on ruotsinkielisen väestön keskittymiä, kuten Sipoolta Helsingille siirtyneet alueet idässä.

Edelleen häiritsee, että kunkin luokan ensimmäinen arvo on sama kuin edellisen viimeinen, mutta en tätä vieläkään osannut muuttaa. Samoin mietin, olisiko ollut hyvä nimetä alueita, joilla ruotsinkielisiä on paljon. Lisäsin karttaan tieverkon, jotta alueiden paikantaminen olisi helpompaa, mutta pitää olla kyllä kovin hyvä paikallistuntemus, jotta osaa tästä hahmottaa kaupunginosia. QGIS:n nimikyltti-työkalu on kuitenkin aika avuton, kun kylttejä ei voi raahata haluamiinsa paikkoihin (käsittääkseni). Nimien laatiminen tekstikentillä taas on hidasta (tai ainakaan en hahmottanut, mistä esimerkiksi kylttien asetukset voisi tallentaa siten, ettei muotoiluasetuksia tarvitsisi aina tehdä uudelleen). Karttoja on kuitenkin ihana visualisoida, tykkään värkätä värien ja muotojen kanssa.

Vaikka ruutukartalla on etunsa, kannattaa siihenkin suhtautua varauksella. Amanda Ojasalo kuvaa hyvin ruutukartan ongelmia omassa kurssikerta 4 blogissaan. On esimerkiksi huomioitava, etteivät ruudut kerro asukkaiden määriä – tummassa ruudussa saattaa asua vain muutama asukas,  ja heidän kielitaustansa olla sattumanvarainen. Suuret ruudut yleistävät, pienet taas voivat tehdä suhteellisista prosenttiosuuksista hämäävän jyrkkiä, kuten Amanda kirjoittaa. (2)

Sipoosta Afrikkaan

Oman ruutukarttaläksyni tein Afrikasta käyttäen hyväksi aiemman harjoituksen konfliktidataa. En tosin ole aivan varma, oliko tämä nyt ihan varmasti sellaista pistemäistä dataa, jota voi hyödyntää ruutukartan teossa. Olisi hyödyksi itselleni saada hieman vielä lisäohjausta erilaisten tietokantojen käyttömahdollisuuksiin ja rajoituksiin. No, karttoja tästä aineistosta kuitenkin tuli.

Tein kaksi erilaista karttaesitystä aivan samasta datasta hahmottaakseni sudenkuoppia.

Ensimmäisen kartan kanssa nimittäin putosin sudenkuoppaan:

Sudenkuopat johtuvat luokkaväleistä. Oli huono valinta ottaa ensimmäiseksi luokaksi 0-1 konfliktia. Hämäännyin itsekin ensin karttaa lukiessa luulemaan vaaleinta keltaista nollakonflikti-alueeksi, ja ihmettelin missä olen mennyt vikaan, sillä konfliktejahan on Afrikassa ollut paljon enemmän. Mutta nythän yksittäiset konfliktit eivät erotu alueista, joilla konflikteja ei ole ollut. Silmä on järkeä vahvempi elementti, ja kartan pitää tukea sitä.

Korjasin asian lisäämällä esitykseen luokan 0, ja tämä versiohan muistuttaa jo enemmän mantereen todellisuutta:

Olisin voinut vielä poistaa legendasta turhat desimaalit, mitä en innostuksissani huomannut tehdä.

Minusta ruutukartan edut tulevat hyvin esiin, kun tarkastelee esimerkiksi Uganda, Ruandan, Burundin ja Kongon alueen konfliktiesiintymiä. Konflikteja on nimenomaan tietyillä alueilla yli valtiorajojen. Tämä alueellisuus saattaisi hävitä, jos konflikteja kuvaisi suhteutettuna valtioihin. Pistekarttana taas konfliktien määrä on joillain alueilla niin suuri, ettei päällekäisestä pisteryppäästä saa oikein mitään tolkkua. Ruutukartta peittoaa nämä vaihtoehdot. Tein Afrikan konflikteista karttoja myös harjoituskerralla 3, ihan kiva verrata nyt niitä ruutupohjalla toteutettuihin karttoihin.

Haasteita ruutukartan teossa: projektio ja ruutujen mittakaava

Koetin hyödyntää kartan teossa projektioista aiemin oppimaani. Meni kuitenkin taas päin mäntyä. Yllä olevat kartat on tehty ”Pseudo-Mercatorin projektiolla (WGS-84), eli lähtökohtaisesti ihan väärin. Tämä johtuu siitä, että projektion muuttaminen osoittautui TAAS käytännössä hankalaksi.

Koska ruutukartassa tarkastellaan asioita suhteessa ruutujen kokoon, pitäisi valita sellainen projektio, jossa ruutukoko ei  projektiovalinnan vuoksi vääristy joillain alueilla. Valitsin Mollweiden projektion, sillä se on oikeapintainen projektio (3). Onnistuin tallentamaan käyttämäni tasot uudessa projektiossa, ja ohjelman uudelleen avautuessa projekti ja sen tasot olivat nyt Mollweiden projektiossa (en kylläkään tiedä, miksi kartan muoto ei muuttunut, vaikka sen olisi kaiken järjen mukaan pitänyt ”vääntyä”, eli jotain hämärää tässä taas kerran oli). Ongelmana Mollweiden projektiossa oli, että konfliktidata ei suostunut avautumaan samaan näkymään muiden tasojen kanssa, se sinkoutui ties minne, vaikka tallensin tietokannan samaan projektioon ja suljin ja availin ohjelmaa moneen kertaan, ja kaikki tasot olivat Molweiden projektiossa. Kartalla näkyi joko konfliktidata tai muut tasot, riippuen kumpaan zoomasi.

Tunnen itseni ääliöksi näiden projektioiden kanssa.

Aloitin alusta Mercatorilla, jotta saisin harjoituksen tehtyä, ja nyt tiedot avautuivat samaan näkymään.

Loin ruudukon koko Afrikan yli. Tässä mittakaava hämäsi. Olin ollut tarkistavinani, että projektion mittayksikkö on metri, mutta tosiasiassa mittayksikköä ei ole määritelty (+proj=longlat +datum=WGS84 +no_defs).

Laitettuani ruudun kooksi 1,0 sain järkevän kokoisia ruutuja. Mittaustyökalulla mitattuna yhden ruudun reuna oli n. 100 km, mutta ensimmäisellä mittauskerralla se oli 1000 metriä, mikä ei voi pitää paikkaansa. Paljonko se oikeasti on ja miksi se vaihtelee, en tiedä. Pitää harjoitella enemmän sitä, miksi projektiot eivät ole sitä miltä näyttää. Samoja projektio-ongelmia kohtasin aiemminkin.

Korkeuskäyrien vertailua

Vertasin vielä lopuksi ilmakuvista tekemiämme korkeuskäyriä (kartassa vihreällä) peruskartan käyriin (kartassa ruskella).

Vaikka tekemämme käyrät antavat ihan hyvän kuvan alueen korkeusvaihteluista, jää niistä joitakin tasoja kokonaan pois. Käyrät eivät ole aivan yhtenäisiä, mutta suhteellisen hyvän kuvan ne alueen korkeusvaihteluista antavat.

Oppimista ja ohjeita

On kiva huomata, että vaikka QGIS:ssä riittää haasteita, alkaa sen käyttäminen ja myös vastaantulevien ongelmien ratkominen tuntua jo vähän helpommalta. QGIS:n omasta ohjepankista ja youtubesta löytyy paljon hyvää rautalankaa. Niitä pitää vain lukea ja katsoa paljon, että kokonaisuuden saa haltuun.

Kaikkein hankalin asia itselleni on tuo projektio-asia, harmittaa tehdä harjoituksia ”väärälle pohjalle”, kun en saa projektioita menemään oikein.

 

  1. Tilastokeskus: Tilastokoulu, Ruutukartta. https://tilastokoulu.stat.fi/verkkokoulu_v2.xql?page_type=sisalto&course_id=tkoulu_teemak&lesson_id=4&subject_id=3 (Luettu 8.2.2019)
  2. Amanda Ojasalo (2019). Amandan GIS-blogi, Ruutuja. https://blogs.helsinki.fi/amandaoj/2019/02/08/ruutuja/ (Luettu 9.2.2019).
  3. QGIS.org, Training material: A gentle introduction to GIS: Coordinate Reference Systems
    https://docs.qgis.org/testing/en/docs/gentle_gis_introduction/coordinate_reference_systems.html (Luettu 8.2.2019)

Tietokantojen hyödyntämistä (kurssikerta 3)

Tällä kerralla harjoittelimme tietokantojen yhdistämistä ja tietokantatietojen käsittelyä. Hyödyllisiä perustaitoja.

Konfliktiherkkä Afrikka

Yhdistimme harjoituskerralla erilaisia Afrikan tilannetta käsitteleviä tietoja eri tietokannoista ja muokkasimme tietokannan aineistoa helpommin käsiteltäväksi.

Pohdiskelin tietojen esittämisen mielekkyyttä kahdella eri kartalla. Toteutukseen tosin vaikutti vielä omien taitojen rajallisuus, mutta karttoja tehdessä sai pohtia ja kokeilla käytännössä erilaisten vaihtoehtojen mielekkyyttä ja samalla kerrata opittua.

Laadin ensin yhden karttaesityksen Afrikasta, jossa kuvataan mantereen konflikteja vuosina 1946-2008, öljyesiintymiä, timanttiesiintymiä sekä internetkäyttäjien osuutta väestöstä. Tein aiheesta tällaisen kartan. Alla pohdin sen ongelmia.

Kartta on minusta visuaalisesti onnistunut (tosin desimaaleja on internetkäyttäjäluokituksessa liikaa), mutta välittääkö se katsojalleen mitään olennaista?

Mielestäni aika vähän verrattuna siihen, millaista tietoa samalla tietokanta-aineistolla voisi välittää. Tieto on hyvin yleisluontoista.

Pelkkä konfliktien määrä näin pitkällä ajanjaksolla ei kerro katsojalle paljoakaan. Konflikteja on turha verrata esimerkiksi internetin käyttäjämääriin (jota pidetään yhtenä kehittyneisyyden mittarina). Kyseiset konfliktit voivat nimittäin olla vanhoja ja kuten Arttu harjoituskerralla kuvasi, kasautuneet joko muutamalle vuodelle tai kuvastaa pidempiaikaista yhteiskunnallista levottomuutta. Myös timanttiesiintymistä ja öljyesiintymistä moni on vanhoja.

Parempi mittari onkin konfliktien pitkittyneisyys. Laskimme harjoituskerralla uuteen sarakkeeseen konfliktivuosien määrän.

Näissä harjoituksissa oli tällä kertaa helppo pysyä mukana ja hahmottaa, miksi mitäkin tehdään. Vanhasta viisastuneena tulin myös kurssikerralle puoli tuntia ajoissa lataamaan materiaaleja ja availemaan ohjelmia, sillä koneeni on tahmea, ja pudotti minut heti alussa kärryiltä aiemmilla kerroilla.

Koetin rakentaa kartasta versiota, jossa konfliktivuosien määrä olisi näkynyt sitä tiheämpänä viivoituksena, mitä suuremmasta määrästä konfliktivuosia valtio on kärsinyt. Tällöin mielestäni kartta olisi paljon informatiivisempi, ja tämän muuttujan yhteyttä esimerkiksi kehittyneisyyteen (tarkasteltuna siis internetin käyttöasteella) olisi mielekkäämpi verrata. Samoin timantti- ja öljyesiintymien määrää voisi lukija vertailla siihen, kuinka pitkäaikaisesti konfliktit ovat valtioita koetelleet.

Teknisesti en kuitenkaan vielä ollut niin taitava, että olisin saanut tällaisen viivoituksen oikeasti toimimaan. Alla on hatara yritys, mutta kuten huomaat, ei viivoitus ole kovin informatiivinen, eikä karttaselite kerro, mistä on kyse. Ja itseasiassa viivoituksen tiheys ei tässä kartassa korreloi konfliktivuosien määrään, sillä en osannut säätää asetuksia oikein. (Kun taidot karttuvat, teen tästä vielä oikean version).

Tarkempia analyyseja

Joka tapauksessa tällaisetkin tiedot ovat hyvin suurpiirteisiä. Käyttämistämme tietokannoista löytyy paljon tietoa, josta saisi laadittua edistyneempiä analyseeja.

Tietokannastahan saa tiedot mm. konfliktien tapahtumavuodesta, konfliktien laajuudesta, timantti- ja öljyesiintymien löytämisvuodesta, esiintymän tuottavuudesta ja esiintymän hyödyntämisen aloitusajankohdasta.

Näillä tiedoilla voisi tehdä analyysiä esimerkiksi siitä, tapahtuuko konflikteja paikallisesti erityisesti alueilla, joilla on tehty timantti- ja öljylöydöksiä. Ja korreloivatko konfliktit esiintymän tuottavuuteen, vai laukaisevatko pienetkin esiintymät paikallisia levottomuuksia? Ehkä tällaista analyysiä voisi jopa käyttää konfliktien ehkäisyn apuna?

Timantti- ja öljykaivosten löytämisvuotta voisi myös verrata konfliktien määrään: onko konflikteja puhjennut enemmän kaivosten löytämisen jälkeen? Entä ovatko konfliktit laantuneet kaivostoiminnan tai öljynporaustoiminnan aloittamisen jälkeen? Olisi mielenkiintoista tarkastella, millaisia yhteyksiä kaivannaisten löytymisellä ja ja hyödyntämisen aloittamisella on alueellisten pidempiaikaisten konfliktikierteiden syntyyn. Monissa Afrikan maissa konfliktit ovat pitkittyneitä ja monimutkaisia, tästä yhtenä esimerkkinä on Etelä-Sudanin tilanne (1).

Täytyy huomioida, että käytännössä kuitenkin vain 62/96 öljyalueesta oli tässä aineistossa saatavilla tieto kaivausten aloittamisvuodesta, joten data on aika puutteellista. Timanttikaivoksistakin tietoja oli hieman repaleisesti. 154/287 kohteesta oli saatavilla löytövuosi, ja kaivausten aloittamisesta tieto löytyi 187/287 kohteesta.

Tällaisia seikkoja on näköjään tutkittukin. Tiedetään, että samalla kun kaivosteollisuus tarjoaa työpaikkoja ja kehitysmahdollisuuksia, se voi lisätä levottomuuksia. Vähemmän on selvitetty sitä, miten kaivosteollisuus korreloi rikollisuuteen ja kaupungeissa, sosiaalisissa suhteissa sekä perheissä esiintyvään väkivaltaan. On esitetty, että naisen asema on heikko alueilla, joilla kaivosteollisuus on muuttanut perinteisiä elinkeinorakenteita. Aiheesta on kuitenkin vielä saatavilla suhteellisen vähän kirjallisuutta. (2)

Konfliktien lainalaisuuksia ja leviämistä on tutkittu vain vähän maanosan tasolla. Tällaista tutkimusta on sen sijaan tehty yksittäisistä valtioista (3). Hegren ja Raleighin mukaan analysoimalla koko maanosan tietoja voidaan saada tarkemmin tietoa konflikteja aiheuttavista lainalaisuuksista (3).

Valuma-alueet, järvisyysprosentti ja tulvaindeksi

Sitten ihan toisenlainen harjoitus samoja tietokantaliitosharjoituksia hyödyntäen. Kartan laatiminen tulvaindeksistä ja järvisyysprosentin laskeminen onnistuivat yllättävän helposti verrattuna aiempiin harjoituksiin. QGIS:n perustoiminot alkavat onneksi hieman hahmottua.

Haasteita tuli yllättäen legendan laatimisvaiheessa. Tekstien tasaus ei oikein onnistunut, enkä saanut luokkien välille informatiivisempia rivivälejä. Olisi myös pitänyt kirjoittaa legendaan vuosiluvut, joilta tiedot ovat. Ja tulvaindeksin selite olisi informatiivisempi, jos siinä lukisi tulvaindeksi valuma-alueilla. Nythän lukija ei ehkä tiedä, mikä tämä omituisen näköinen Suomi oikein on.

Lisäksi pylväsdiagrammien koko muuttui omituisesti karttaa tehdessä. Olin jo väsynyt diagrammeja tehdessäni, eikä diagrammien teon periaatteet nyt ihan valottuneet.

Otin kuvakaappauksen projektista, jossa pylväät indikoivat oikeita järvisyysprosentteja, kuva on varsinaisen kartan alla. Pylväät ovat varsinaisessa karttatulosteessa erilaiset, tämän voi havaita esimerkiksi Aurajoen valuma-alueen järvisyysprosenttia kuvaavasta pylväästä. Pylväiden koko ja omituista kyllä keskinäiset suhteet muuttuivat, kun karttazoomauksen kokoa muutti QGIS:n työtilassa tai tulostetilassa. En osannut ratkaista ongelmaa. Siksi näihin pylväisiin ei ole luottaminen:

Ja tässä kuvakaappaus projektista QGIS:n työtilassa ennen tulosteen tekoa, näin erilaisia diagrammit ovat, tässä työtilasta otetussa kuvakaappauksessa ne ovat minusta vielä oikein:


Monella muullakin pylväsdiagrammit vaikuttavat antavan keskenään hyvin erilaisia tietoja. Esimerkiksi Anttoni Tumanoffin kartassa (4) ja Emilia Ihalaisen kartassa (5) järvisyysprosentit ovat keskenään aivan erilaiset (Ihalaisen kartta on muuten visuaalisesti todella hieno!). Näitä kahta karttaesitystä vertailemalla huomaa vastaavan eron Aurajoen alueella, joka omissa kartoissani ilmeni karttaa tulostettaessa – informaatio muuttui. Mitäköhän tapahtuu? Kyllä saa olla todella tarkkana tämän QGIS:n kanssa, täytyy taas kerran todeta.

Pohdintaa

Mielestäni järvisyysprosentin esittäminen pylväsdiagrammeina ei ole informatiivista tällä tavoin ainakaan koko Suomea kuvatessa, sillä pylväät peittävät pienimmät valuma-alueet. Koetin hakea toimintoa, jolla pylväät olisi saanut sijoitettua viivojen avulla kauemmas kohteistaan, esimerkiksi merelle, mutta en löytänyt tällaista. Lähikuvassa pylväät toimivat ihan kivasti.

Tulvaindeksi on suuri rannikkoalueilla. Valuma-alueen koko ei tunnu vaikuttavan tulvaindeksiin, mutta monin paikoin järvisyys korreloi käänteisesti tulvaindeksiin. Olettaisin, että järvet tasaavat tulvahuippuja.

Lähteet:

  1. Anyone who can carry a gun can go – The role of White Army in the current conflict in South Sudan. Prio paper 2014.
  2. Kotsadam, A., Østby, G., Rustad A. S. (2017). Structural change and wife abuse: A disaggregated study of mineral mining and domestic violence in sub-Saharan Africa, 1999-2013. Political Geography, 56, 53-65.
  3.  Hegre, H. & Raleigh, C. (2006). Population size, concentration and civil war. Geographically disaggeregated analysis.
  4. Tumanoff. Anttoni: Geoinformatiikan menetelmät 1, kurssiblogi: Tietokantaliitoksia ynnä muuta, https://blogs.helsinki.fi/gis-1-anttoni/ (Luettu 2.2.2019).
  5. Ihalainen, Emilia: Geonformatiikan menetelmät 1: Tietokannasta tietotulvaan. https://blogs.helsinki.fi/ihem/
    (Luettu 2.2.2019)

Oikean projektiovalinnan merkityksestä (kurssikerta 2)

Toisella kurssikerralla opettelimme käyttämään valintatyökaluja ja huomioimaan projektion merkityksen esitettävän informaation oikeellisuuteen.

Pallo pinnaksi

Kaikki kartat ovat aina jossain määrin vääristyneitä esityksiä todellisuudesta, sillä kolmiulotteista maailmaa ei voi ongelmitta kuvata kaksiulotteisella karttapinnalla.

Kuten kurssin harjoituskerran ohjeissa alleviivataan, myös paikkatieto-ohjelmat – QGIS mukaan lukien – perustuvat matemaattisiin malleihin, joissa kolmiulotteista pintaa väännetään tasopinnaksi aina erilaisia periaatteita noudattaen. Nämä periaatteet tunnetaan käytännössä erilaisina projektioina. Käytetty projektio vaikuttaa siihen, mikä ominaisuus kartassa vääristyy eniten.

Esimerkiksi Mercatorin projektio on oikeakulmainen, mutta vääristää maailmankartalla pinta-aloja napoja kohti mentäessä. Winkelin trippel -projektio taas on kompromissi pinta-alojen, kulmien ja etäisyyksien välillä: näissä kaikissa on vääristymiä, mutta vähemmän kuin kerrallaan vain yhden oikeellisuuteen keskittyvissä projektioissa. Jos laadit maailmankarttaa purjehtijalle, kannattaa valita Mercator, jotta kapteeni voi luottaa kartan tarjoamaan suuntaan. Jos sen sijaan haluaa kuvata maailmankarttalla skandinavian suhdetta päiväntasaajan valtioiden pinta-alaan, tämä valinta on virheellinen.

Kun QGIS-ohjelmalla työskentelee etenkin pinta-alaan suhteutuvan aineiston kanssa, Suomea hyvin kuvaava projektio on ETRS89-TM35 (EPSG:3067). Eurooppalaisia aineistoja käsiteltäessä kannattaa käyttää EU-komission ohjeiden mukaisesti Lambertin oikeapintaista tasoprojektiota (EPSG:3035).

Harjoituksia

Kurssikerralla tutkailtiin käytännössä, miten paljon projektion valinta voi vääristää kartan tietoja. Tämä olikin itselleni hyvä harjoitus QGIS:n perustoimintojen hahmottamiseen, mutta samalla muistutus tietojen tarkistamisen ja oman tekemisen ymmärtämisen tärkeydestä.

Valitsimme ensin kartasta alueen mittatyökalulla (ks. alla) ja lisäksi matkan Suomen länsilaidasta itälaitaan Suomen leveimmän kohdan tietämiltä.

Tarkastelimme sitten näiden muutoksia eri projektioilla. Mercatorin projektio vääristää huomattavasti pinta-alaa ja matkaa verrattuna esimerkiksi ETRS-TM35 -projektioon (EPSG:3067), Mercatorissa alat ja matkat muuntuvat moninkertaisiksi.

Samaa vääristymää kuvaa kuntien pinta-alan vertailu Mercatorin ja Lambertin oikeapintaisen tasoprojektion (LAEA) pinta-aloihin. Sen mukaan pinta-alat projektioiden välillä ovat Mercatorissa huomattavan erilaisia kaikkialla Suomessa, luonnollisesti kasvaen pohjoista kohti mentäessä.

Karttaa tehdessä koin tärkeäksi värivalintojen informatiivisuuden. Vaihdoin myös alimman luokan värin selkeästi vihreäksi, jotta kartta ei välittäisi ajatusta, että Etelä-Suomessa pinta-alaeroja ei projektioiden välillä ole. Myös Etelä-Suomessa ero näyttää nimittäin olevan n. 300 %, mikä vaikuttaa merkittävästi datan oikeellisuuteen, jos aineisto käsittelee pinta-alaan liittyvää tietoa.

Lisää treeniä, virheitä ja oppimista

Tein toisen projektioiden pinta-alavääristymiä kuvaavan kartan kotona opetellen samalla hyödyntämään rajapintoja.

Sain luotua  yhteyden tilastokeskuksen tietokantoihin, joista valitsin Kunnat 2018 aineiston mittakaavassa 1: 4 500 000.

Tein harjoituksen ensin useaan kertaan saaden virheellisiä tuloksia. Ilmeisesti tämä johtui siitä, että en poistanut näkymästä aiempia tietokantoja uuden tietokannan luodessani. QGIS-ohjelma otti projektiotiedon aiemmin käytetyistä tietokannoista, vaikka suljin välillä ohjelman ja päivitin projektion aina oikeaksi aktiivisena olevaan tietokantaan.

Täytyy ollakin tässä tarkkana, en olisi edes huomannut virhettä, ellen olisi verrannut pinta-aloja harjoitusohjeissa näkyviin lukuihin. Laskutoimitus ei nimittäin tullut siitä projektiosta, joka oli tarkastelemassani tasossa valittuna sekä oikeassa alakulmassa että ”general”-valikosta.

Tämä kartta on tulos ”väärästä muistista” päivittyneistä projektiotiedoista. Sen informaatio on hyvin vääristynyttä, karttahan kuvaa muka lähes samaa asiaa kuin yllä oleva kartta. Oikeasti kyse on joidenkin muiden projektioiden välisestä vertailusta.

Käytin visualisoinnissa luokkina ”equal interval” ja valitsin luokkien määräksi viisi luokkaa, sillä halusin verrata tulosta aiempaan karttaani.

Kun ymmärsin – Artun avustuksella – miten tiedot vääristyvät, vertasin harjoituksen vuoksi vielä Lambertin oikeapintaisella projektiolla laskettuja pinta-aloja KKJ0-projektioon. Käytin nyt aineistona vuoden 2015 kuntapohjaa. Kun poistin aiemmin avatut tietokannat projektista, projektiotiedot päivittyivät nyt oikein.

Vääristymät ovat hyvin pieniä näiden kahden projektion välillä, niinkuin oletinkin. Mielenkiintoista kuitenkin, kuinka vääristymä jakautuu maantieteellisesti. En osaa heti selittää, miksi Utsjoen kunnan vääristymä on samaa tasoa Etelä-Suomen kuntien kanssa, mutta esimerkiksi Enontekiön ei ole. Kartta kuvaa, kuinka paljon suurempia pinta-alat ovat Lambertin projektiossa KKJ0-projektioon verrattuna. Vääristymä on suurimmillaankin vain 1,13 %.

Väestötiheys eri projektioilla

Vertasin tämän jälkeen väestötiheyttä Lambertin oikeapintaisella projektiolla ja Mercatorin projektiolla laskettuna.

Koetin tehdä kartoista vertailukelpoisia lukijalle siten, että niiden luokat ja väriskaalat olisivat vertailukelpoisia. Esimerkiksi Riikka Matikaisen kesämökkien määriä kunnissa neliökilometreittäin vertailevat kartat (1) ovat yksinään hyvin luettavia ja visuaalisesti toimivia, mutta vaatii katsojalta paljon aivotyötä verrata kahta eri luokkaväleillä tehtyä karttaa keskenään.

Valitsin siksi omaan vertailuuni ”pretty breaks” -luokittelun ja olisin halunnut toteuttaa samat luokkavälit kumpaankin karttaan. En saanut kuitenkaan käytännössä luokitteluja samanarvoisiksi kummassakin kartassa (ts. ensimmäinen luokka 0-100 jne.).

Koetin myös skaalata värejä siten, että ne jatkuisivat loogisesti Lambertin projektiota käsittävässä kartassa, johon luokkia tuli enemmän. Väriskaalojen loogiseksi saaminen oli kuitenkin hankalaa, enkä onnistunut sävyn tarkentamisessa haluamallani tavalla.

Olisin halunnut, että ihan sama värisävy olisi jatkunut jälkimmäisessä kartassa.

Kartoista kuitenkin selviää, että Mercatorin projektio antaa aivan erilaiset tulokset väestötiheydestä. Mercatoria ei pidä käyttää pinta-alaan suhteutettavien muuttujien laskemiseen.

Parannettavaa

Pohjoisnuolien kanssa on vielä opittavaa. Vaikka jokaisessa työssä olen synkannut nuolen karttaan samalla tavoin, tulos ei ole looginen, jos karttoja vertaa keskenään. En ole varma, tulisiko synkronointi tehdä ”grid north” vai ”true north” -vaihtoehtoon. Ja toki olisi pitänyt muistaa kallistaa nämä kaksi karttaa samaan kulmaan tulostetta tehdessä. Myös fonttikoon ero häiritsee.

Lisäksi mielestäni karttaselitteissä on ongelmallista, että sama luku esiintyy aina kunkin luokan viimeisenä ja seuraavan ensimmäisenä. En kuitenkaan keksinyt, kuinka tämän voisi muuttaa. Esimerkiksi yllä luku 500 kuuluu kahteen luokkaan.

Kartan laatiminen on vastuullista puuhaa

Informaation välittäminen kartalla on mielestäni paljon vastuullisempaa puuhaa kuin esimerkiksi perinteinen kirjoittamalla julkaisu. Kartan lukijan on hyvin vaikea saada selkoa siitä, miten kartan informaatio on tuotetu ja onko tekijä tehnyt matkalla perusteltuja valintoja. Kartan lukija joutuu luottamaan kartan tekijään, ja kartan tekijän oltava tämän luottamuksen arvoinen.

 

Lähteet:

Matikainen, Riikka: Geoinformatiikan menetelmät 2019, Oppimispäiväkirja Viikko 2 – Projektioita ja tietokantaliitoksia. https://blogs.helsinki.fi/riikkama/2019/02/01/viikko-2-projektioita-ja-tietokantaliitoksia/ (Luettu 1.2.2019).

 

Epäonnistunut koropleettikarttaharjoitus ja ongelmanratkaisu (kurssikerta 1)

Lähdin tekemään ensimmäisen kurssikerran kotitehtävää, koropleettikarttaa vuoden 2015 kunta-ainestosta.

Olen ladannut QGIS-ohjelman kotikoneelleni ja ottanut yhteyden Z-asemaan, jonne olen myös purkanut ensimmäisen kurssikerran aineistokansion. Attribuuttitietojen tarkastelussa on kuitenkin jokin ongelma, johon en löytänyt ohjeista ratkaisua. Luin myös ohjeita QGIS-ohjelman sivuilta, tuloksetta.

Avasin Kunnat2015.shp-tiedoston QGIS-ohjelmassa tarkasteltuani ensin sen attribuuttitietoja QGIS-selaimella. Ajattelin, että teen harjoituksen vuoksi ja opittua kerratakseni koropleettikartan suomenkielisen väestön osuudesta Suomen kuntien väestöstä. Funktio olisi kunnan suomenkielisen väestön määrä jaettuna kunnan koko väestöllä x 100.

Näkymä avatessani attribuuttitaulua:

Kun avaan kuntatasolta attribuuttitaulun klikkaamalla kuntatason päällä hiiren oikeaa näppäintä, avautuu tämän näköinen attribuuttitaulu:

Tämä on erilainen näkymä kuin kurssilla opittu, eikä vastaa myöskään QGIS-sivuston ohjeiden kuvaa attribuuttitaulusta. En osaa yrityksistä huolimatta rakentaa tästä haluamaani karttaa, en saa visualisoitua mitään tietoa attribuuttitaulusta kartalle. Uuden sarakkeen luominen onnistuu, mutta en osaa toimia sen kanssa tai luoda funktioita, jotka saisin visualisoitua kartalle.

Olen koettanut myös tarkistaa, voisiko minulta puuttua kotikoneelta jokin tarvittava QGIS-ohjelman laajennusosa. Se on kuitenkin aloittelijalle hankalaa, sillä laajenusosia on huima määrä.

Perustiedot ja ohjelman perusteiden ymmärtäminen ovat kovin tärkeitä, kuin perusta kunnon rakennukselle. Koetan perehtyä ohjelmaan lukemalla QGIS-ohjelmasta perustietoja erilaisista ohjeista. Jospa tämä vielä tästä.

Osa 2: Ongelmanratkaisu

Käytettyäni yllä olevan ongelman pähkäilyyn tuhottomasti aikaa, huomaan lopulta, että attribuuttitaulukon alareunassa on kaksi nappia, joista voi säätää attribuuttitaulukon näkymää:

Näistä minulla oli aktiivisena vasemmanpuoleinen. Tuttu attribuuttitaulukko ilmestyy kuitenkin ruutuun oikeanpuoleista klikkaamalla.

Sen jälkeen harjoituksen toteutus onnistuu ohjeita noudattamalla. Tein suunnittelemani kartan kuntien suomenkielisen väestön osuuksista.

Ohjelman ehdottamalla luokkien määrällä (5 luokkaa) kartan tarjoama tieto jäi köyhäksi, kartasta erottuivat vain siniset kunnat ja muutama keltainen. Kun nostin luokkien määrää kuuteen, useampi kunta siirtyi väliluokkiin, ja kartta tarjoaa katsojalleen enemmän tietoa.

Harjoittelin vielä käyttämään valintatyökalua: kokeilin tehdä rannikkoalueen kunnista oman karttansa, sillä ne näkyvät isossa kartassa epäselvästi. Tämä ei tietenkään ole järkevä tapa toteuttaa ”zoomausta”, mutta valintatyökalua käyttämällä ja poistamalla attribuuttitaulukosta valitsemattomat rivit, syntyi vielä tällainen kokeilu:


Lähteet:

Gandhi, Ujaval: QGIS Tutorials and Tips: Työskentely attribuuteilla. http://www.qgistutorials.com/fi_FI/docs/working_with_attributes.html (luettu 26.1.2019)

 

Typpipäästöt Itämereen (kurssikerta 1)

Ensimmäinen kosketukseni QGIS-ohjelmaan tapahtui Itämeren typpipäästöjä kuvaavan harjoituksen kautta.

Tehtävän toteutus

Tarkoituksena oli kuvata eri maiden osuutta Itämeren typpipäästöistä. Harjoituksessa hyödynnettiin tietokantaa, jossa oli tietoja Euroopan maiden typpipäästöistä Itämereen.

Jotta voidaan hahmottaa kunkin maan suhteellinen päästöosuus, laskettiin ensin tietokannasta typpipäästöjen kokonaissumma. Tämän jälkeen tietokantaan luotiin uusi sarake, johon laskettiin kunkin valtion osuus kokonaispäästöstä. Sen jälkeen siirryttiin visualisoimaan tämä tieto kartalle.

Tiedon välittäminen kartalla

Paikkatietotyö sisältää hyvin paljon informaatiota. Käyttäjäystävällisen kartan luominen vaatii sen laatijalta pohdintaa ja ymmärrystä siitä, mikä on kussakin kartassa olennaista tietoa ja kuinka se välitetään katsojalle visuaalisesti ymmärrettävässä ja vaivattomasti hahmotettavassa muodossa.

Päädyin poistamaan järvet kokonaan kartasta. Mielestäni ne eivät tuoneet lisäarvoa valtioiden typpipäästöjen hahmottamiseen, vaan sen sijaan häiritsivät kartan hahmottamista.

Muokkasin myös valtioiden päästömääriä kuvaavaa väriskaalaa siten, että vaalein väri ei ollut niin vaalea kuin automaattisessa väriskaala-ehdotuksessa. Luettavuuden kannalta Viro näytti  nimittäin kartassa valtion sijaan tyhjältä alueelta.

Muokkasin myös syvyyskäyrien väriskaalaa informatiivisemmaksi, ja vaihdoin nollapäästöisten maiden värin hyvin vaalean harmaaksi, jotta se erottuisi vain maantieteellisenä taustainformaationa sotkematta kartan käyttäjän ajatuksia.

Luettavuuden lisäämiseksi koetin saada valtioiden nimet näkyviin (”näytä nimiöt” -toiminto). Kun laitoin nimet näkyviin muokatulta administrative boundaries -tasolta, ne tulivat tietenkin englanniksi, kuten ne ovat tietokannassa. Jostain syystä tätä tasoa ei pystynyt muokkaamaan – olisin vaihtanut nimet suomalaisiin suoraan tietokantaan. Sen sijaan koettaessani saada nimiä näkyviin muokkaamattoman administrative boundaries -tason kautta – johon onnistuin muokkaamaan valtioiden nimet sillä tietokanta oli muokattavissa – sain kyllä suomenkielisiksi vaihtamani nimet kartalle, mutta samalla tulivat näkyviin kaikkien muidenkin valtioiden nimet. Eli näin:

En osannut rakentaa lauseketta tai löytää komentoa, jolla olisin saanut näkyviin nimet vain niistä valtioista, joiden päästöt olivat yli 0 ja jotka siis olin vaihtanut suomenkielisiksi. Lisäksi olisi ollut tarpeen muuttaa joidenkin maiden nimet vaaleammalla fontilla tummasta taustaväristä erottelemiseksi (ks. yllä esim. Puola) – sama fonttiväri ei toimi kaikilla taustoilla.

Kaikkien näiden hankaluuksien vuoksi nimesin valtiot karttaan tulostusvaiheessa tekstikentillä. Tämä on kuitenkin turhan työläs manuaalinen tapa, jos se on korvattavissa muutoin, etenkin jos nimettävää on paljon.

Valmis karttani on tässä:

Jos haluat tarkastella karttaa suurempana, klikkaa kuvaa.

Jatkotyöstettävää

Olen suhteellisen tyytyväinen karttaan tässä vaiheessa QGIS-ohjelman opettelua. Viilattavaa visualisoinnissa toki jäi, en esimerkiksi osannut poistaa Brittein saaria legendan taustalta. Jostain syystä myöskään kartan suoristus ei päivittynyt karttatulosteeseen huolimatta tulosteen päivittämisestä (”refresh”).

Qgis-ohjelma vaikuttaa todella hyödylliseltä, mutta perusteet on saatava hyvin haltuun, jotta karttana esitettävä informaatio on oikeanlaista. Esimerkiksi erilaiset luokitusvaihtoehdot tulee ymmärtää perinpohjin, jotta tietoa kykenee välittämään luotettavasti. Aion perehtyä tarkemmin esimerkiksi siihen, milloin on syytä käyttää luokiteltua ja milloin porrastettua jaottelua.

Mielestäni nyt kartassa luokitteluvälit eivät aivan palvele tarkoitusta. Puola on yksin luokassa 13.3 – 33.7 % kokonaispäästöistä. Se on liian suuri vaihteluväli, eikä kerro kartan lukijalle, poikkeavatko Puolan päästöt lopulta kovin merkittävästi seuraavaksi suurimpien saastuttajien, Ruotsin ja Venäjän, päästöistä. Samaa kummasteli Aleksi Auvinen (1) kurssiblogissaan.

Luokat ovat tärkeitä myös visuaalisuuden kannalta. Olisin halunnut omassa kartassani vielä vähentää syvyyskäyrien määrää, laajentaa luokkia, mutta en osannut tätä tehdä. Mielestäni luokkia on nyt liikaa ja hahmottaminen on hankalaa.

Lisäksi lueskellessani muiden blogeja huomasin kartastani puuttuvan muutamia keskeisiä tietoja, kuten typpipäästöjen vuoden. Tämä tieto löytyi esimerkiksi Johanna Lehtisen (2) kartasta. Lisäksi olisi ehkä voinut tuoda karttaselitteessä esiin päästöluokan 0 (ei typpipäästöjä Itämereen).

Jäin myös pohtimaan, olisiko päästöjen esittäminen sektorikaavioina kartan lukijalle selkeämpää. Vilma Pylkkö (3) esitti kartassaan päästöt tällä tavoin. Tätä esitystapaa piti selkeänä esimerkiksi Emilia Kostamo (4). Päädyin kuitenkin itse siihen, että perinteinen koropleettikartta väriskaaloineen on tässä tapauksessa informatiivisin esitystapa. Näin toteaa myös Pylkkö itse sektorikaavioita kokeiltuaan.

Viitteet:

  1. Auvinen, Aleksi: Allugaattori, Vain tekemällä oppii (26.1.2019). https://blogs.helsinki.fi/aleksiau/2019/01/26/vain-tekemalla-oppii/ (Luettu 26.1.2019)
  2. Lehtinen, Johanna: Johannan blogi, Geoinformatiikan menetelmät 1, ensimmäinen luento (21.1.2019). https://blogs.helsinki.fi/johanleh/2019/01/21/geoinformatiikan-menetelmat-1-ensimmainen-luento/ (Luettu 25.1.2019).
  3. Pylkkö, Vilma: Vipy’s blog, Ensiaskeleet QGISillä (14.1.2019). https://blogs.helsinki.fi/vipy/2019/01/14/ensiaskeleet-qgisilla/ (Luettu 25.1.2019)
  4. Kostamo, Emilia: Emilia Kostamon blogi, Itämeren typpipäästöt, lasten osuus Suomen kunnissa ja ensikosketus QGIS:iin (kurssikerta 1) (18.1.2019). https://blogs.helsinki.fi/emilikos/2019/01/18/itameren-typpipaastot-ja-ensikosketus-qgisiin-kurssikerta-1/ (Luettu 26.1.2019).