KK3 luonnostilassa – ja siinä pysyy

Kurssikerran 3 aineistona on Afrikkaa. Tehtävien ohessa kiinnostuin oletuksestani, että jos henkilö on käyttänyt facebookia, hän on käyttänyt myös internetiä ja näin ollen voitaisiin laskea kuinka moni internetiä käyttävistä käyttää myös facebookia. Internet-aineisto on vuodelta 2020 ja facebook-aineisto vuodelta 2018, mutta jotain suuntaa antavia lukuja laskutoimituksen oletin antavan.

Luvut varmasti antavat suuntaa, mutta erityisen mielenkiintoisina havaintoina pidin valtioita, joissa joko kaikki tai yli 100% internetin käyttäjistä käyttivät facebookia. Alla olevassa kuvassa tummimman sinisellä värittyneissä valtioissa facebookia käyttivät kaikki internetiä käyttävät ja osassa sitä onnistuttiin käyttämään ilman internetiä 😉

Aineistoa tuntematta arvaisin, että sinänsä päätön tulos voi johtua esimerkiksi siitä, että internet-tieto voi olla vastaus kysymykseen “pääsetkö aina tarvittaessa internetiin” ja facebook-tieto vastaus kysymykseen “onko sinulla facebook-profiilia”. Toisaalta facebook-tieto voi olla kotoisin myös Metan meta-tiedoista, joka kertoo alueella luotujen facebook-tilien lukumäärän, tai alueella annettujen sijaintitietojen lukumäärän? Tai mitä tahansa muuta. Joka tapauksessa tämä alleviivaa erinomaisesti sitä, että kun tekee johtopäätöksiä jonkin aineiston perusteella, se täytyy tuntea.

***

To be continued…

Palaan tämän kurssikerran tehtävän pariin 22.5.2023, avaan viimeisimmän Afrikka-tiedostoni QGISillä ja näkymä on seuraavanlainen:

Tunnustan laiskuuteni ja aloitan puuttuvien kurssikertojen työt puhtaalta pöydältä.

Näkemiin siis 🙂

 

Tulonjakoa kartalla -harjoituksia

Viimeisellä kurssikerralla saimme käyttää vapaavalintaista aineistoa. Valitsin aineistoksi Tilastokeskuksen tulonjakotilaston aineistoja vuodelta 2020. Halusin tuottaa kartalle näkyviin tulonjaon eri tunnuslukuja kunnittain.

Kuva 1. Perusturvan varassa elävien osuus Suomen kunnissa 2020. Lähde: Tilastokeskus. Tulonjakotilasto 2020.

Kuvan 1 tavoite on esittää värikoodattuna perusturvan varassa*) elävien osuudet kunnittain Suomessa vuonna 2020. Luvut perustuvat Tilastokeskuksen tulonjakotilaston avoimen rajapinnan kautta ladattuun aineistoon. Osuudet (%) laskin itse QGISillä. Karttaa voisi edelleen jatkojalostaa interaktiiviseksi siten, että kuntaa klikkaamalla avautuisivat vähintään ne tiedot kunnasta, jota kyseiseen karttaan liittyvät (kunnan nimi, perusturvan varassa elävien osuus).

Huomioitavia seikkoja lisäksi, että blogiin tulostunut kuva on suttua:

  1. Karttakuva on sikäli asiaton, että siitä puuttuvat pohjoisnuoli sekä mittakaava.
  2. Esitetyissä luvuissa ongelmallinen on alin luokka (0-0,99), koska en ehtinyt keksiä miten toisin puuttuvat arvot tietokantaan ja kartalle. Puuttuvia arvoja perusturvan varassa olevien lukumääristä oli neljällä kunnalla; nämä luokittuvat nyt alimpaan luokkaan nolla-havaintojen jatkoksi.
  3. Luokat ei ole loogisia, koska raja-arvot esiintyvät sekä alemmassa, että ylemmässä luokassa. Luokittelun mielekkyyteen en muutenkaan paljoa panostanut tässä harjoituksessa, vaan annoin ohjelman ratkaista, kunhan päällisin puolin näytti järkevältä.
  4. Karttakuvasta voi silmämääräisesti havaita miten perusturvan varassa elävien osuus jakautuu Suomen kunnissa, ja että jossain määrin tältä osin samantyyppiset kunnat sijaitsevat lähellä toisiaan.
Kuva 2. Gini-kertoimet kunnittain 2020. Lähde: Tilastokeskus. Tulonjakotilasto 2020.

Kuvaan 2 halusin tuoda tulonjakoa kuvaavan gini-kertoimen**) kunnittain värikoodattuna. Gini-kertoimet on saatu Tilastokeskuksen tulonjakotilastosta. Tällä kertaa maltoin lisätä myös pohjoisnuolen ja mittakaavan 😉 Muut huomiot karttaan liittyen ovat pitkälti samat kuin edellisessäkin; esimerkiksi luokkien kokoa ja raja-arvoja tulisi harkita tällaista esitystä varten.

(Kuvan 2 toin suoraan QGISistä tallennettuna, kun taas kuva 1 pyörähti kuvakaappauksen kautta. Tällä hätiköinnillä kuva 1 näyttää blogissa paremmalta kuvan 2 sisältäessä liikaa taustapaperia.)

Kuva 3. Pitkittyneesti pienituloisten osuus (%) kunnittain 2020. Lähde: Tilastokeskus. Tulonjakotilasto 2020.

Kuva 3 esittää värikoodattuna pitkittyneesti pienituloisten***) osuudet kunnittain Suomessa vuonna 2020. Luvut ovat Tilastokeskuksen tulonjakotilastosta. Pohjoisnuoli osoittaa tässä kartassa todellista pohjoista (truth north) kohti, kun kuvassa 2 se osoittaa “ruudukko”(?)-pohjoista (grid north) kohti. Muut havainnot karttakuvasta puutteineen likimain samat kuin edellisissäkin.

Kaiken kaikkiaan esimerkiksi näitä kolmea karttaa olisi mielenkiintoista tarkastella rinnakkain. Jotta tarkastelu olisi mielekästä, tulisi viimeistään sitä varten luokkien määrää ja muodostumista harkita tarkoitukseen sopivaksi.

Määritelmät, ks. tarkemmin Tilastokeskus: käsitteet:

*) Perusturvan varassa oleva on henkilö, jonka asuntokunnan tuloista yli puolet muodostuu perusturvaetuuksista.
**) Gini-kerroin on yleisin tuloeroja kuvaava tunnusluku. Mitä suuremman arvon Gini-kerroin saa, sitä epätasaisemmin tulot ovat jakautuneet. Tulonjakotilastossa Gini-kertoimet esitetään prosentteina.
***) Pitkittyneesti pienituloisiksi katsotaan henkilöt, jotka ovat kuuluneet pienituloisiin kotitalouksiin kahtena vuonna kolmesta peräkkäisestä. Pienituloisiksi katsotaan kotitaloudet, joiden käytettävissä oleva rahatulo on alle 60% kaikkien kotitalouksien mediaanitulosta.

Lähteet:
Kunnat 2020 -tietokanta (täydentyy)
Tilastokeskus. Tulonjakotilasto 2020 -tietokannat. Ladattu avoimen rajapinnan kautta 2/2023)
Tilastokeskus: Käsitteet