Arkistot kuukauden mukaan: tammikuu 2016

Kuherruskuun loppu – 2. kurssikerta

Niin kuolevat sinisilmäiset aatokset paikkatiedon armottomassa maailmassa, niin korvennetaan viattomuus Mapinfon pätsissä. Viime kerralla suitsutin vielä auliisti Mapinfoa, joka parista kummallisuudesta huolimatta vaikutti kaikin puolin näppärältä ohjelmalta, jopa intuitiivisesti avautuvalta. Nyt tuskanhien aiheuttamaa nestehukkaa viisaampana ja uudella, harmaan sävyttämällä hiustyylillä varustettuna minussa on herännyt tervettä kunnioitusta kyseistä ohjelmaa kohtaan. Olkoon, liioittelen hiukan, ja onhan vain luonnollista, että työn ja hankaluuksien määrä lisääntyy muuttujien myös lisääntyessä.

 

Tällä kurssikerralla aloimme tosiaan pelailla kahdella muuttujalla samalla kartalla. Esitykseen voi ympätä mukaan muun muassa ympyrädiagrammeja, pylväitä, symboleita tai minkä lisäinfoa tuovan palasen nyt keksiikään. Erityisesti koropleettikartoilla, jotka jo sinällään näyttävät varsin paljon tietoa, voi esittää hyvinkin hienostuneita ja monimutkaisia kokonaisuuksia: vaikkapa kahden muuttujan, jotka voisi ensikuvitelmalta luulla erillisiksi, välisiä riippuvuussuhteita. Voidaanpa kaksi koropleettikarttaa asettaa päällekkäinkin, jolloin uudet oivallukset avautuvat vielä helpommin. Erinomainen esimerkki tämän kaltaisten karttojen tuomista mahdollisuuksista on näkyvissä Tuomas Pätärin GIS-tarinoita PAKkastalveen -kurssiblogissa, jossa Pätäri yhdistää nokkelasti kuntakartalle äänestysaktiivisuuden ja pienituloisuusasteen, jolloin näiden välille paljastuu selvä korrelaatio.

 

Viikon tuotoksena olisi siis voinut tehdä yllä kuvatun laisen, mutta itseäni jäi kiehtomaan toisenlaiset karttakikkailut: ns. grid-kartat, liukuvärjätyt, mieluusti pisteaineistosta tehdyt kartat. Tätä varten oli tarjolla Suomen väestöaineistoa 250m x 250m alueelta kerättyinä pisteinä. Aineisto interpoloidaan annettujen raamien mukaan – tässä kohtaa Mapinfolla menee toviksi sormi suuhun, sillä työnsarkaa riittää – ja tadaa, varsin tyylikäs kartta on syljetty ulos. Mistä siis alun tuskailuni, jos karttaa pukkaa kuin vettä juhannuksena? No, ensinnäkin halusin esittää miesten ja naisten sijoittumiset erikseen, lähinnä selvittääkseni, onko perää väitteissä syrjäkuntien miehistymisestä naisten muuttaessa herkemmin suureen maailman töihin ynnä opiskelemaan. Tämä tarkoittaa, että kaikki työ piti tehdä kahtena. Tilastokeskuksenkin mukaan Suomessa oli vuoden 2014 lopussa noin 88 000 naista enemmän kuin miestä, toivoin siis saavani varsin raflaavia tuloksia. Havittelemani räväkät erot… niin, katsokaa alta.

Miehet ja naiset Suomessa

Kuva 1. Mies- ja naispuolisten sijoittuminen. (klikkaa suuremmaksi)

 

Suoraan sanoen melko identtisiä. Jyystin luokkarajoja paljon edestakaisin – jotka tämän seurauksena ovat sangen mielivaltaisia – pyrkiessäni provosoimaan eroja esille, mutta ikävä kyllä niitä ei tällä tasolla osu silmään. Tällä mittakaavalla erottuvat tietenkin kaupungit ja taajamat vähemmän yllättäen haja-asutuksesta, mutta ei sukupuolten railoja. Mainittakoon vielä, että pitääkseni interpolointiajat inhimillisellä tasolla, käytin 1 km² ruutuja. Sikäli mikäli ymmärsin prosessin oikein, tämä tarkoittaa, että Mapinfo jakaa alueen neliökilometrin ruutuihin, laskee yhteen tämän alueen väestötiedot, eli neljältä pisteeltä, ja luo uuden pisteen neliökilometrin keskelle. Näiden pisteiden välistä sitten interpoloitaisiin. Edellinen selitys on kuitenkin vahvaa mutuilua, mistä myös tämän kirjoituksen terminologiasähellys ruutujen sekä pisteiden välillä. Oikea asianlaita pitää vielä varmistaa Artulta.

 

Lähempi tarkastelu voi paljastaa paljon sellaista, mitä etäisempi katselu piilottaa. Kokeillaan siis tarkentaa pääkaupunkiseudulle, jos siellä näkyisi jotain mielenkiintoista.

Kuva 2. Tarkennus kuvasta 1 Helsingin seudulle.

Kuva 2. Tarkennus kuvasta 1 Helsingin seudulle. (klikkaa suuremmaksi)

Tunnetusti Helsingin seutu on naisvaltaista pitkälti muuttoliikkeen ansiosta. Selviä eroja ei ikävästi tälläkään esityksellä nouse pintaan. Syitä tähän voi olla muun muassa kehnot luokkarajat tai luokkien vähyys, sillä 2000 henkeä yhdessä ruudussa ylittyy helposti pääkaupunkiseudulla vaikka väestö olisikin jaettu kahtia sukupuolen mukaan. Lisäksi värit ovat mielivaltaiset, so. ne eivät vaalene samassa suhteessa molemmissa kartoissa, jolloin voi syntyä illuusio, että toisessa kartassa olisi tietyssä kohdassa enemmän väkeä, vaikka syypäänä voikin olla vain kehnot värivalinnat. Jälkiviisaana olisi pitänyt luopua karkean stereotyyppisestä värikoodauksestani ja: 1) Käyttää molemmissa kartoissa samaa väripalettia. 2) Käyttää useampaa väriä, esimerkiksi neliportainen asteikko vihreästä punaiseen. Näillä muutoksilla kartat olisivat olleet vertailukelpoisempia ja helppolukuisempia. Tässä vaiheessa on myöhäistä korjailla menneitä typeryyksiä, joten näillä mennään.

 

Valtakunnan tasolta ei toisaalta voikaan odottaa mitään erityistä hienojakoisuutta. Käännetään siis katseemme Lappiin, jonka syrjäkylillä voisi, jälleen tökerön stereotyyppisellä oletuksella, olla paljon peräkammarin poikia ja siten luvassa mielenkiintoisempi karttaesitys. Alun kriiseilyni juontuu pitkälti tähän työvaiheeseen, sillä kesti aikansa irrottaa molemmista – piste- ja kunta-aineistosta, jolla tuotiin karttaan rajat – yksinomaan Lapin maakunnan alueet, luoda niistä omat tietokantansa ja vielä heittää molemmat omille tasoilleen. Kirjoitettuna yksinkertainen hanke venyi infernaalisiin mittasuhteisiin. Mapinfon loputtomat pudotusvalikot ja karttatasot pyörivät kauhunsekaisina filmipätkinä mielessäni, vaikka olen toki iloinen siitä, että koko homman pystyi ensinnäkään tekemään. Mapinfo on väkevä työkalu, joka, sitten kun sen saloihin on kunnolla vihkiytynyt, tarjoaa varmasti valtavasti vaihtoehtoja.

Kuva 3. Lapin mies- ja naispuoliset.

Kuva 3. Lapin mies- ja naispuolisten sijoittuminen. (klikkaa suuremmaksi)

Yhtä kaikki, yllä näette työn tulokset. Kuten edellisessä kartassa, tässäkin käytettiin 1 km² ruutuja, sillä tätä pienemmät sekoittivat kartan täysin ja alueet levisivät kunta-aineiston raamien ulkopuolelle; syytä en tiedä. Valkoiset alueet ovat tarkastelun ulkopuolella, eli käsittääkseni niissä ei asu ihmisiä ja ne ovat vähintään 25 km päässä lähimmästä asutusta pisteestä. Toinen mahdollisuus valkoisuudelle on virhe aineiston käsittelyssä, jollainen vaikuttaa tapahtuneen lähellä itärajaa, jossa valkoisen alueen raja kulkee viivasuorana. Ilmiselviä sukupuolieroja ei harmikseni vieläkään tahdo nousta esille. Naiset vaikuttaisivat silmämääräisesti arvioituna olevan vahvemmilla joissakin keskittymissä, mutta tämä voi olla väriskaalan aiheuttamaa harhaa. Zoomataan kuitenkin vielä kartan länsiosiin.

Kuva 4. Tarkennus kuva 3:n länsiosiin.

Kuva 4. Tarkennus kuva 3:n länsiosiin.

Kartassa vasemmalla olevan Kittilän ympärillä saattaisi olla naisenemmistöjä, mutta mitään pläkkiselvää ei tästäkään selkiä. Tehdyt kartat miellyttävät silmää esteettisesti, mutta siihen niiden hyödyllisyys taitaakin jäädä: tuotoksilla olisi kiva olla muutakin virkaa kuin seinänkoristeina. Sanottakoon vielä, että ohjeissa neuvottiin tekemään grid-kartoista 3D-versiot ja tämä olisikin onnistunut yhdellä napinpainalluksella, mutta kolmas ulottuvuus syystä tai toisesta särki karttani, eikä muutenkaan tuonut merkittävää lisäinformaatiota. Siksi tyydyin raakavedokseen.

 

Vatvomisen sijaan lienee aika heittää pyyhe kehään, myöntää tappio ja pohtia, miksi toivomiani tuloksia ei herunut. Toisaalta syynä saattavat olla aiemmin mainitsemani väri- ja luokitteluvalinnat, toisaalta edes kymmenientuhansien henkien ero ei Suomen koko väkiluvun miljoonamittakaavassa paljoa paina. Myös vaikka eroja olisikin, niin ne lienee helpompi saada esille kuntasolla kuin pisteaineistosta. Räikeitä eroja on toisaalta hankala saada ilmoille, sillä sukupuolijakauma ei yksinkertaisesti normaalitilanteessa keikahda selkeästi suuntaan tai toiseen, vaan vain poikkeustapauksissa, esimerkiksi Kiinassa yhden lapsen politiikan seurauksena tullut miesvoittoisuus tahi päinvastainen tilanne suursotien jälkeen miesten kaaduttua rintamalla. Tylsä tasapaksuus ei kuitenkaan miellytä skandaalinkäryistä maantieteilijää sisälläni, eikä siitä saa mielenkiintoisia karttoja. Olkoon tämä opetuksena: maantieteilijän osana ei ole vääntää maailmaa sellaiseksi kuin mieli tekee, eikä lopputulos aina ole sellainen kuin villit ennakko-oletukset lupailevat.

 

Lopulta asia on niin kuin Matilda Holkkola toteaa kurssiblogissaan: ”tässä vaiheessa kurssia Mapinfon käytön oppiminen on pääasia”. Sillä saralla taskuun jäi monta uutta temppua ja ensi kerralla hommat hoitunevat huomattavasti vähemmällä tuskailulla.

 

PÄIVITYS 4.2.

Kartat jäivät kaivelemaan minua, ja siksipä palasin vielä kerran Mapinfon pariin ja tein listaamani parannukset – nimellisesti värimaailman peruskorjauksen ja luokkien hienosäätöä. Blogi tarjoaa sähköisenä alustana erilaisia mahdollisuuksia muutoksen tarkkailuun kuin pelkkä paperi: niinpä kokosin uudet kartat GIF-muotoiseksi videoksi alle.

Uudet uljaat lapin miehet ja naiset

Kuva 5. Miesten ja naisten sijoittuminen Lapin läänissä videoesityksenä.

Ja katso! Esirippu repeää! Vihdoin ja viimein voidaan sanoa todellisia eroja näkyvän. Miehet totta tosiaan ovat kautta linjan vahvemmin edustettuina ja varsinkin taajamien ulkopuolilla selkeinä alueina: kartassa tämä näkyy tummemman keltaisina aloina. Erot eivät määrällisesti ole valtaisia, mutta olemassa ne ovat. Nyt voin viimeinkin arkistoida toisen kurssikerran hyvillä mielin.

Lähteet:

Holkkola Matilda . Kurssikerta 1. Pakin (huojentava?) aloitus (2016). Hcmatild’s blog. <https://blogs.helsinki.fi/hcmatild/>  Luettu 3.2.2016.

Pätäri Tuomas. Kurssikerta 2. Äänekkäät rannikot, hiljaiset korvet (2016). Gis-tarinoita PAKkastalveen. <https://blogs.helsinki.fi/ttpatari/>  Luettu 3.2.2016.

Väestö. (2016) Tilastokeskus, Helsinki. <http://tilastokeskus.fi/tup/suoluk/suoluk_vaesto.html> Luettu 3.2.2016

 

 

Paikkatiedon maailmaan – 1. kurssikerta

Nyt kun on lukukauden vääntänyt karttoja piirto-ohjelmalla ja valmiista aineistoista, on ilo käydä paljon kohkattujen paikkatietojärjestelmien kimppuun. Gis:llä valetaan pohja melkein kaikelle metodiosaamiselle maantieteen piirissä, sillä laajennetaan työkalupakkia – sillä työllistyy! Näin olen kuullut useammaltakin puolelta. Onpa toisaalta kiertänyt huhuna kauhukertomuksia paikkatietojärjestelmien kroonisesta kaatumatautialttiudesta ja kuinka ne olisivat käytettävyydeltään komentokehotehirvityksiä.

 

Siksi olikin ilo ja helpotus avata kurssilla pääasiallisesti käytettävä gis-ohjelma Mapinfo, joka ei ensisilmäykseltä ja -kosketukselta vaikuttanut paljoakaan piirto-ohjelmaa pahemmalta – käyttöliittymääkin on kenties rakentanut muutkin kuin insinööriarmeija. Toki joka ohjelmassa on töyssynsä, Mapinfossa esimerkiksi kartoilla liikkuminen ja zoomaaminen vaikuttavat auttamattoman kömpelöiltä, mutta hämmentävän nopeasti sitä huomaa jo tekaisevansa karttoja ja näpräilevänsä luokkavälejä. Välittömyys on ehdottomasti hyvän ohjelman merkki.

 

Ensimmäisellä kurssikerralla sukelsimme aluksi teoriaan. Nimensä mukaisesti paikkatietoon kuuluu aina olennaisesti tieto siitä, missä kuvattu alue sijaitsee: tällöin pitää sisällyttää sijaintitietoa, useimmiten koordinaatteja, harvinaisemmin voidaan myös ilmoittaa alueiden sijainnit vain suhteessa toisiin alueisiin. Jotta paikkatiedosta saadaan jotain merkittävää irti, kohteille on lisättävä myös ominaisuustietoa, siis esimerkiksi kohteen nimitykset tai ajoittavaa tietoa. Paikkatietoa halkoo suuri kahtiajako vektori- ja rasteriaineistoihin, joilla on molemmilla etunsa. Tervetullutta kertausta, muttei mitään radikaalin uutta. Lyhyiden harjoitteluiden jälkeen uppouduttiin jo viikon tehtävään.

Kuva 1. Työssäkäyvien prosentuaalinen määrä kunnittain 2015.

Kuva 1. Työssäkäyvien prosentuaalinen osuus kunnittain 2015. (klikkaa suuremmaksi).

Viikon karttatehtävässä luotiin itsenäisesti teemakartta Mapinfolla perustuen laajaan tilastotietoon Suomen kunnista. Apupyörät otettiin siis melko nopeasti pois, mikä tietysti hermostutti, mutta prosessi osoittautui varsin kivuttomaksi. Valittavana olisi ollut vaikka minkälaisia tietoja muuttoliikkeestä kouluttuneisuuteen. Nappasin työssäkäyvien suhteellisen osuuden työvoimasta, mikä Tilastokeskuksen kuvauksen mukaan käsittää vuoden viimeisellä viikolla työlliset 18–74 vuotiaasta väestöstä, jotka eivät suorita varusmiespalvelusta eivätkä työvoimatoimiston asiakkaina. Ounastelin tämän tarjoavan mielenkiintoisia lukuja kuntien elinvoimaisuudesta. Aivan ensimmäisenä on järkevää tutkia aineiston jakautuneisuutta, mikä hoituu näppärästi Interactivate-histogrammityökalulla.

Kuva 2. Suuntaa-antava jakauma.

Kuva 2. Suuntaa-antava jakauma työssäkäyvien prosentuaalisen määrän jakaumasta.

Helpommaksi havainnollistamiseksi luokkia on kuvassa 11, vaikkakin niitä on lopullisessa kartassa vain 5. Miellyttävästi aineisto on yksihuippuista ja melko tasaisesti jakautunutta – keskiarvon alapuolella olevia havaintoja on kautta linjan vain karvan verran enemmän kuin sen ylittäviä. Tai jälkikäteishuomautuksena pitäisi kai sanoa, että aineisto on normaalisti, ei tasaisesti jakautunutta, eli se asettuu jotakuinkin Gaussin käyrän so. normaalijakauman raameihin. Tätä tietoa tarvitaan luokitteluperustetta valittaessa. Valintani kohdistui Mapinfon termein equal count -periaatteeseen,  jolloin Mapinfo pyrkii pakottamaan jokaiseen luokkaan yhtä monta havaintoa, hyvin samalla lailla kuin kvantiileissa. Tämä tehdään usein luokkavälien kustannuksella. Totta tosiaan, kolmen keskimmäistä luokkaa ovat noin 4 % suuruudeltaan, kun taas ensimmäinen ja viimeinen luokka käsittävät melkein 10 %. Uhraus oli kuitenkin mielestäni sen arvoinen, sillä yhtä suuria luokkavälejä tai luonnollisia luokkavälejä, eli sopivia ryppäitä laskennallisesti aineistosta etsivä, painottavat ratkaisut olisivat puolestaan lihavoittaneet keskimmäisiä luokkia liikaa. Muunkinlaiset luokittelutavat kuin valitsemani ovat ehdottomasti puolustettavissa ja perusteltavissa, mihin, myös työssäkäyvien määrästä kunnittain teemakarttansa tehnyt, Miro Mujunen perehtyy PAK-blogissaan.

 

Oli miten oli, tämän esteen ylitse päästyä Mapinfo sylkee päteviä karttoja hämmentävän nopeasti. Kaikki kartan peruselementit pohjoisnuolesta väriskaalaan oli helppo määrittää ja lisätä. Väreistä vielä sen verran, että viidestä luokasta puhuttaessa aletaan jo olla niillä ja rajoilla riittävätkö enää yhden värin sävyt – kartassani tämä näkyy jonkinasteisena epäselvyytenä kolmen keskimmäisen luokan välillä. Erot eivät ole välittömästi ja ilman lähempää tarkastelua selviä. Pitäisikö hyvän sään aikana osoittaa luokille aivan omat värinsä? Tämä on kelpo ratkaisu epäselvyyteen. Toisaalta suosin – silloin kun käsitellään saman ilmiön eri vahvuista esiintymistä – yleensä yhtä väriä, sillä sävyerot ja aste-erot on helppo assosioida toisiinsa.

 

Entä mitä itse kartta näyttää? Selkeästi työssäkäyntiprosentit ovat suurimpia länsirannikolla, pääkaupunkiseudulla ja ylipäänsä suurien kaupunkien paikkeilla sekä Ahvenanmaalla. Vastaavasti heikommin vaikuttavat menestyvän maan keski-, itä- ja pohjoisosien syrjäisemmät seudut. Aivan näin yksinkertainen asia ei kuitenkaan ole. Mielenkiintoisesti itse isoimmat kaupungit eivät useinkaan kuulu suurimman työssäkäynnin luokkaan, vaan se kunnia lankeaa monesti pikemminkin niiden kehyskunnille. Tästä esimerkkinä Turun ja Tampereen seudut:

Tampereen seutu tarkemmin

Kuva 3. Tarkennus kuvasta 1 Tampereen seudulle. Tummempi tarkoittaa suurempaa työssäkäyvien osuutta.

Turun seutu tarkemmin

Kuva 4. Tarkennus kuvasta 1 Turun seudulle. Tummempi tarkoittaa suurempaa työssäkäyvien osuutta.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Huomataan itse kaupungin jäävän jonkin verran jälkeen monien sitä ympäröivien kuntien tahdista. Mikä voisi selittää tämän? Perehdytään tarkemmin vielä yhteen esimerkkiin itärajalta, Joensuun tienoilta.

Kuva 5. Tarkennus Joensuun seudulle.

Kuva 5. Tarkennus kuvasta 1 Joensuun seudulle. Tummempi tarkoittaa suurempaa työssäkäyvien osuutta.

Kuvassa näkyy harvinainen valopilkku muuten tällä mittarilla sangen ankeassa Itä-Suomessa: Kontiolahden kunta. Korkeimpaan työssäkäynnin luokkaan asettuva Kontiolahti erottuu selkeästi naapurikunnistaan. Tilastokeskuksen PX-Web -tietokannat paljastavatkin sen eroavan näistä ainakin yhdellä mittarilla: kotikunnassaan työssäkäyvien määrässä.

Taulukko 1. Joensuun naapuruskuntien omassa asuinkunnassaan töissäkäyvän väestön osuus 2011 Tilastokeskuksen aineistoista.

Taulukko 1. Joensuun naapuruskuntien omassa asuinkunnassaan töissäkäyvän väestön osuus 2011 Tilastokeskuksen aineistoista.

Pienestä prosenttiosuudesta voidaan päätellä Kontiolahdesta suuntautuvan erittäin paljon työmatkaliikennettä keskukseen, Joensuuhun. Kulkua ainakin helpottaa Kontiolahtea halkova Kajaanintie. Sukkulointi selittänee ilmiötä muidenkin kaupunkien kehyskunnissa: kukaties tontit ovat niissä halvempia ja omakotitaloja tarjolla, mitkä houkuttelevat tilaa kaipaavia lapsiperheitä, siis usein kaksi työtätekevää aikuista. Emäkuntaa korkeampi työssäkäyntimäärä ainakin osassa kehyskunnista näkyy edellä mainittujen lisäksi myös Vaasassa, Oulussa ja Jyväskylässä. Yhteistä kaikille mainituille on, että ne ovat korkeakoulukaupunkeja: tämä tarkoittaa monia työikäisiä, mutta työelämän ulkopuolella olevia, mikä osaltaan repii kaupunkeja alaspäin tällä mittarilla.

Viimeisenä kiintoisana huomautuksena Miro Mujusen huomio Kittilän poikkeavuudesta Pohjois-Lapissa: hän noteeraa sen aivan oikein eroavan ympäristöstään ja esittää syyksi sesonkimatkailun tarjoamaa työllisyyslisää.

 

Lähteet:

Mujunen, Miro. Kurssikerta 1, Perehtymistä paikkatietoon ja MapInfon perusteisiin (2016). PAK-blogi. <https://blogs.helsinki.fi/mimumimu/> Luettu 25.1.2016

PX-Web -tietokannat, Tilastokeskus. <http://pxweb2.stat.fi/dialog/varval.asp?ma=Kuntaportaali&ti=Kuntien+avainluvut&path=%2E%2E%2FDatabase%2FKuntien+perustiedot%2FKuntien+perustiedot%2F&xu=&yp=&lang=3&multilang=fi> Luettu 25.1.2016