KK3 luonnostilassa – ja siinä pysyy

Kurssikerran 3 aineistona on Afrikkaa. Tehtävien ohessa kiinnostuin oletuksestani, että jos henkilö on käyttänyt facebookia, hän on käyttänyt myös internetiä ja näin ollen voitaisiin laskea kuinka moni internetiä käyttävistä käyttää myös facebookia. Internet-aineisto on vuodelta 2020 ja facebook-aineisto vuodelta 2018, mutta jotain suuntaa antavia lukuja laskutoimituksen oletin antavan.

Luvut varmasti antavat suuntaa, mutta erityisen mielenkiintoisina havaintoina pidin valtioita, joissa joko kaikki tai yli 100% internetin käyttäjistä käyttivät facebookia. Alla olevassa kuvassa tummimman sinisellä värittyneissä valtioissa facebookia käyttivät kaikki internetiä käyttävät ja osassa sitä onnistuttiin käyttämään ilman internetiä 😉

Aineistoa tuntematta arvaisin, että sinänsä päätön tulos voi johtua esimerkiksi siitä, että internet-tieto voi olla vastaus kysymykseen “pääsetkö aina tarvittaessa internetiin” ja facebook-tieto vastaus kysymykseen “onko sinulla facebook-profiilia”. Toisaalta facebook-tieto voi olla kotoisin myös Metan meta-tiedoista, joka kertoo alueella luotujen facebook-tilien lukumäärän, tai alueella annettujen sijaintitietojen lukumäärän? Tai mitä tahansa muuta. Joka tapauksessa tämä alleviivaa erinomaisesti sitä, että kun tekee johtopäätöksiä jonkin aineiston perusteella, se täytyy tuntea.

***

To be continued…

Palaan tämän kurssikerran tehtävän pariin 22.5.2023, avaan viimeisimmän Afrikka-tiedostoni QGISillä ja näkymä on seuraavanlainen:

Tunnustan laiskuuteni ja aloitan puuttuvien kurssikertojen työt puhtaalta pöydältä.

Näkemiin siis 🙂

 

Tulonjakoa kartalla -harjoituksia

Viimeisellä kurssikerralla saimme käyttää vapaavalintaista aineistoa. Valitsin aineistoksi Tilastokeskuksen tulonjakotilaston aineistoja vuodelta 2020. Halusin tuottaa kartalle näkyviin tulonjaon eri tunnuslukuja kunnittain.

Kuva 1. Perusturvan varassa elävien osuus Suomen kunnissa 2020. Lähde: Tilastokeskus. Tulonjakotilasto 2020.

Kuvan 1 tavoite on esittää värikoodattuna perusturvan varassa*) elävien osuudet kunnittain Suomessa vuonna 2020. Luvut perustuvat Tilastokeskuksen tulonjakotilaston avoimen rajapinnan kautta ladattuun aineistoon. Osuudet (%) laskin itse QGISillä. Karttaa voisi edelleen jatkojalostaa interaktiiviseksi siten, että kuntaa klikkaamalla avautuisivat vähintään ne tiedot kunnasta, jota kyseiseen karttaan liittyvät (kunnan nimi, perusturvan varassa elävien osuus).

Huomioitavia seikkoja lisäksi, että blogiin tulostunut kuva on suttua:

  1. Karttakuva on sikäli asiaton, että siitä puuttuvat pohjoisnuoli sekä mittakaava.
  2. Esitetyissä luvuissa ongelmallinen on alin luokka (0-0,99), koska en ehtinyt keksiä miten toisin puuttuvat arvot tietokantaan ja kartalle. Puuttuvia arvoja perusturvan varassa olevien lukumääristä oli neljällä kunnalla; nämä luokittuvat nyt alimpaan luokkaan nolla-havaintojen jatkoksi.
  3. Luokat ei ole loogisia, koska raja-arvot esiintyvät sekä alemmassa, että ylemmässä luokassa. Luokittelun mielekkyyteen en muutenkaan paljoa panostanut tässä harjoituksessa, vaan annoin ohjelman ratkaista, kunhan päällisin puolin näytti järkevältä.
  4. Karttakuvasta voi silmämääräisesti havaita miten perusturvan varassa elävien osuus jakautuu Suomen kunnissa, ja että jossain määrin tältä osin samantyyppiset kunnat sijaitsevat lähellä toisiaan.
Kuva 2. Gini-kertoimet kunnittain 2020. Lähde: Tilastokeskus. Tulonjakotilasto 2020.

Kuvaan 2 halusin tuoda tulonjakoa kuvaavan gini-kertoimen**) kunnittain värikoodattuna. Gini-kertoimet on saatu Tilastokeskuksen tulonjakotilastosta. Tällä kertaa maltoin lisätä myös pohjoisnuolen ja mittakaavan 😉 Muut huomiot karttaan liittyen ovat pitkälti samat kuin edellisessäkin; esimerkiksi luokkien kokoa ja raja-arvoja tulisi harkita tällaista esitystä varten.

(Kuvan 2 toin suoraan QGISistä tallennettuna, kun taas kuva 1 pyörähti kuvakaappauksen kautta. Tällä hätiköinnillä kuva 1 näyttää blogissa paremmalta kuvan 2 sisältäessä liikaa taustapaperia.)

Kuva 3. Pitkittyneesti pienituloisten osuus (%) kunnittain 2020. Lähde: Tilastokeskus. Tulonjakotilasto 2020.

Kuva 3 esittää värikoodattuna pitkittyneesti pienituloisten***) osuudet kunnittain Suomessa vuonna 2020. Luvut ovat Tilastokeskuksen tulonjakotilastosta. Pohjoisnuoli osoittaa tässä kartassa todellista pohjoista (truth north) kohti, kun kuvassa 2 se osoittaa “ruudukko”(?)-pohjoista (grid north) kohti. Muut havainnot karttakuvasta puutteineen likimain samat kuin edellisissäkin.

Kaiken kaikkiaan esimerkiksi näitä kolmea karttaa olisi mielenkiintoista tarkastella rinnakkain. Jotta tarkastelu olisi mielekästä, tulisi viimeistään sitä varten luokkien määrää ja muodostumista harkita tarkoitukseen sopivaksi.

Määritelmät, ks. tarkemmin Tilastokeskus: käsitteet:

*) Perusturvan varassa oleva on henkilö, jonka asuntokunnan tuloista yli puolet muodostuu perusturvaetuuksista.
**) Gini-kerroin on yleisin tuloeroja kuvaava tunnusluku. Mitä suuremman arvon Gini-kerroin saa, sitä epätasaisemmin tulot ovat jakautuneet. Tulonjakotilastossa Gini-kertoimet esitetään prosentteina.
***) Pitkittyneesti pienituloisiksi katsotaan henkilöt, jotka ovat kuuluneet pienituloisiin kotitalouksiin kahtena vuonna kolmesta peräkkäisestä. Pienituloisiksi katsotaan kotitaloudet, joiden käytettävissä oleva rahatulo on alle 60% kaikkien kotitalouksien mediaanitulosta.

Lähteet:
Kunnat 2020 -tietokanta (täydentyy)
Tilastokeskus. Tulonjakotilasto 2020 -tietokannat. Ladattu avoimen rajapinnan kautta 2/2023)
Tilastokeskus: Käsitteet

Onnetonta kompastelua kärryjen perässä…

Kurssikerta 2:a seurasi kaksi poissaoloa harjoitustunneilta, ja ne kärryt, joiden syrjässä aion pysyä kiinni, kolistelevat menemään jossain taivaanrannassa.

Jo harjoitustunnilla minulla, tai QGISillä, oli vaikeuksia saada järkeviä mittaustuloksia eri projektioilla; ne näyttivät aina menevän yksi yhteen, oli valittuina projektioina mikä tahansa. Kotona mittaukset osin onnistuivat, mutta tallentaessani tasoja (kokeilin sekä kunnat2020 että Tilastokeskuksen aineistoilla) eri projektioilla, ei oikean alakulman projektiotieto muuttunut miksikään, vaikka tallennustiedoissa eri projektio olikin:

mutta:

Projektioiden vaihto ja laskutoimitukset onnistuivat lopulta vaihtamalla tason CRS-tiedot hiiren kakkospainikkeen takaa tasoa klikkaamalla. Siitä huolimatta, tulokset eivät näytä useiden uusintojenkaan myötä siltä miltä pitäisi. Mercatorin projektio ei näytä liioittelevan pinta-alaa vaan päinvastoin. Tarkistin myös myös projektioiden mittayksiköt.

***

Tuntien kliksuttelujen ja uudelleen yrittämisten jälkeen Mercator -projektio tuottaa edelleen pienempiä pinta-aloja, itse asiassa vielä pienempiä kuin edellisellä yrittämällä.

Siirryn seuraavaan ja päivitän tämän blogin karttakuvat yliopiston koneelta, josta pääsen tunneilla onnistuneisiin laskelmiin ja visualisoituihin karttoihin.

**

Uusi yritys no n+
Suomi-neito kävi nojatuoliin:

Nojatuoliin käyneen neidon kanssa tekemäni tietokantaliitokset nähdäkseni onnistuivat, vaikkakin kyseenalaisin tiedon (koska Mercator-pinta-alat ovat edelleen pienempiä kuin muut).

Välipala

 

Tulen kurvaamaan kolmosviikon kautta kakkosviikon tehtävään, mutta näin makoisaa välipalaa en malta jättää jakamatta jo sitä ennen.

Oheinen kuva on Jussi Siltasen kirjasta Sata vuotta karttoja (Siltanen, 2019). Kuvan dasymetrisessä* (korjatkaa ihmeessä jos olen väärässä!) kartassa esitetään suomalaisten kalloindeksi vuodelta 1936. Viereisen sivun otsakkeessa kysytään Ovatko suomalaiset alhaista rotua? Kuvatekstissä kerrotaan kartan julkaisijaksi Helsingin yliopiston maantieteen laitos, kuten myös, että se on julkaistu Suomen kartastossa vielä vuonna 1960!!!

Kaikkea sitä…

 

*Edit: Kun vilkaisin huolellisemmin, niin kyllähän nuo rajat joitain hallinnollisia rajoja myötäilevät, joten koropleettinen lienee oikea vastaus?

Lähde: Siltanen, J. (2019). Sata vuotta karttoja. Helsinki: Karttakeskus

Unohduksia ja iloinen palapeli

Polkaisen blogini käyntiin ns. pakon eli Geoinformatiikan menetelmät 1 -kurssin myötä. Blogin pitäminen on osa kurssin suoritusta (Helsingin yliopisto, 2023).

Ensimmäiset neljä harjoitustuntia ”ATK”-luokassa maanantaina 16.1.2023 herättivät innostuksen ja kiinnostuksen kurssia kohtaan. Tutustuimme QGIS-sovellukseen ja jälleen kerran ensimmäinen vanha oppi oli, että muista tallentaa(!) ja selvitä mikä on kumoa-toiminnon pikanäppäin! Kävi nimittäin niin, yritin erästä vahinkoa korjata deletellä, josta seurasi koko näkymän katoaminen kuvasta. Hätäpäissäni kliksuttelin menemään kaikkia mahdollisia seuraavia arvauksia, jonka seurauksena sovellus päätyi tiimalasi-tilaan. Tästä selvisin lopettamalla tehtävän, ja – kuten tässä vaiheessa jo arvaamme – avatessani tiedoston uudelleen, edellisestä tallennuksesta oli hupsahtanut jo valitettavan pitkä aika.

***

Palasin ensimmäisen kurssikerran asioihin vasta seuraava sunnuntaina 22.1., eli päivää ennen toista kurssikertaa. QGISin lataamisessa ja aineistojen haussa en kohdannut ongelmia, mutta aineiston avaaminen QGISillä vaati monta yritystä ja erehdystä. Samoin eteneminen minkäänlaiseen järkevään aineiston tarkasteluun vaati monia tuloksettomia, tai ei-toivottuja tuloksia tuottaneita kliksutteluja siellä täällä. Toisaalta tiedän kokeilujen olevan parhaita keinoja oppia tämäntyyppisiä asioita.

Ensimmäinen iloinen saavutukseni oli osin sattumalta tuottunut värikäs palapeli, jossa Suomen kunnat ovat kartalla kukin omalla värillään (ks. kuva alla).

Kuva 1. Iloinen palapeli.

Seuraava yritykseni tuoda karttaan kuntien väkiluvut luokiteltuina tuotti varsin jännän näkymän; yksi kunta erottuu taustasta eri värillä (seuraa nuolta, kuva alla).

Lopulta onnistuin pääsemään ihan järkevään näkymään luokiteltujen väkilukujen suhteen, jonka lopputuloksen tulostin kuvatiedostoksi. Legendan luokittelua muutin siten, että kukin arvo esiintyy luokissa vain yhden kerran. Muutoinhan yksi kunta voisi periaatteessa kuulua kahteen eri luokkaan. Toisaalta ohjelma ei näyttänyt tästä päällekkäisyydestä välittävän, vaan väritteli kunnat luokkien mukaan mukisematta. Epävarmaksi jäin kuitenkin siitä, poimiko ohjelma luokat uudelleen muokkaukseni jälkeen.

Toistaiseksi lopullinen tuotokseni viikon harjoituksista on alta löytyvä koropleettikartta. Edelleen opittavaksi ja selvitettäväksi jää, miten kuvatiedostot kannattaa tuoda esim. tähän blogiin kulkematta kuvakaappauksen kautta.

Ensimmäisen viikon opit tiivistettynä:

  • Muista tallentaa (Ctrl +S)
  • Undo = kumoa = Ctrl + Z
  • Pysy kärryjen syrjässä, älä unohdu taukoon, ei ole oikotietä, tekemällä edistyy
  • Blogin ominaisuuksia ja käyttöä pitää vielä selvittää; taustakuva ensinnä kohdilleen, jotta olennaiset asiat ovat näkyvillä 😉
  • Selvitettävä, miten kuvia kannattaa tuoda blogiin

Lähdeluettelo:
Helsingin yliopisto. (Tammikuu 2023). Geoinformatiikan menetelmät 2023 -blogi. Noudettu osoitteesta Tervetuloa kurssille!: https://blogs.helsinki.fi/gismen-2023/