Ensimmäinen oppitunti: tutustuminen MapInfoon

Havaintoja MapInfosta

MapInfo oli itselleni ihan uusi tuttavuus – ja melkoisen positiivinen sellainen. Ainakin MapInfo vaikutti helpolta muihin itselleni entuudestaan tuttuihin kartanteko-ohjelmiin verrattuna. Vaikka kurssin kerrotaan soveltuvan ensimmäisen vuoden opiskelijoille, odotin jotain monimutkaisempaa ohjelmaa, kuten GMT tai R. Itse olen tähän mennessä tehnyt karttoja lähinnä MatLabin m-map työkalupaketilla ja yllätyinkin MapInfon muistuttavan enemmän Adobe Illustratoria. Samankaltaisuus tosin liittyy lähinnä ohjelmien käytettävyyteen, tasoihin ja erilaisiin työkaluihin, ei niinkään käyttötarkoitukseen. Samankaltaisuudet varmasti loppuivat ensimmäiseen kurssikertaan.

Mitäs me tehtiin ja siitä kummunnut kummastus

Ensitöiksemme otimme käsittelyyn Helsingin. Lisäsimme valmiiksi annetun kerroksen toisensa jälkeen – rantaviivan, kuntarajat, meret, joet, järvet, Helsingin osa-alueet – ja Itse valitsin koropleettikartan teemaksi “muunkielisten” alueellisen jakauman Helsingissä vuonna 2009 (Tilastokeskus, 2009). Jäin kuitenkin miettimään, mitä kaikkea MapInfossa on valmiina: Sisältääkö se kaikkien mannerten rantaviivat ja merenpohjan topografian? Entä pystyisinkö piirtämään karttapohjalle esimerkiksi satunnaisen havaintopaikan antamalla MapInfolle koordinaatit? Aloin jo epäillä soveltuuko MapInfo omiin tarpeisiini Pohjoisen jäämeren hydrografian tutkimuksessa. No, en ihan vielä jätä kurssia kesken, vaan katsotaan, saanko kysymyksiini vastauksia kurssin kuluessa.

Histogrammin analysointi

En löytänyt “kuvaohjetta”, jolla histogrammista (tehty Histogrammityökalulla, 2014) saisi kuvan (jos joku sellaisen löysi, niin saa kertoa, miten sellainen tehdään), mutta sain tulostettua .pdf-tiedoston. Sitä leikkelemällä onnistuin rajaamaan suhteellisen järkevän näköisen kuvan, vaikka x-akselin loppupää jäikin .pdf:stä puuttumaan ja tekstit näyttävät suhruisilta.

Kuva 1. Histogrammi muunkielisen väestön osuuksien jakaumasta Helsingin osa-alueiden välillä. (Klikkaa kuvaa niin saat näkyviin suuremman version, jos suurennan kuvan tähän, siitä tulee epätarkka: ensi kerralla täytyy siis tallentaa kuva suuremmalla resoluutiolla.)

Histogrammista näkyy, että jakauma on jokseenkin vino, sillä suurimmassa osassa kuntia muunkielisten osuus on kohtalaisen pieni (termissä “muunkieliset” lukija, jolla ei ole koko havaintoaineistoa käsissään, kohtaa ensimmäisen ongelman: muunkielisillä tarkoitetaan tässä siis muita kuin suomea tai ruotsia äidinkielenään puhuvia). Osa-alueita, joissa muunkielisten osuus ylittää 12 %, on melko vähän. Pelkän histogrammin perusteella kummastelee helposti, millä alueilla jopa 50 % asukkaista on muunkielisiä. Havaintoaineistoa tarkastellessani havaitsin, että näistä lähes kaikki ovat alueita, joilla on hyvin vähän asukkaita (kuten Roihupelto ja Herttoniemen teollisuusalue), joten muunkielisiä ei tarvitse olla kuin muutama nostamaan suhteellinen osuus korkeaksi. Tavallaan olisin halunnut saada tämän yksityiskohdan näkyviin kartallani osoittamalla, millä alueilla jopa 50 % asukkaista on muunkielisiä, mutta silloin muu informaatio olisi kärsinyt. (Toisella kurssikerralla tähän annettiinkin vastaus: graduated-teemakartta, jossa eri alueiden merkitystä voi korostaa esim. väestömäärää kuvaavan symbolin suhteellisella koolla.)

Aineiston luokittelu

Ohjeiden mukaan luonnolliset luokkavälit eivät sovi vinolle jakaumalle, mutta minusta niiden avulla sai parhaiten esiin alueelliset erot. Mietin myös kvantiileiden käyttöä, mutta pohtiessani kartan informaatioarvoa tavalliselle lukijalle, pidin luonnollisten luokkavälien prosentteja havainnollisempina: jos olisin laittanut yhtä suuren määrän havaintoja jokaiseen luokkaan, viimeiseen eli suurimpaan luokkaan olisi kuulunut mielestäni suhteettoman paljon alueita, vaikka, kuten jo totesin, lähes kaikilla Helsingin osa-alueilla muunkielisten osuus on kohtalaisen pieni. Tällöin suurin luokka (eli tummin väri) kattaisi suhteettoman suuren osan Helsinkiä ja lukija kauhistelisi maahanmuuttajien valtavaa määrää (hyvä esimerkki siitä, miten luokan valitsemisella voi manipuloida lukijan ajatuksia). Myös esimerkiksi rakkaan kotiseutuni, Itä-Helsingin, alueelliset erot olisivat hukkuneet kvantiileja käytettäessä. (Huomaa, että pyöristin desimaalit pois luonnollisista luokkaväleistä, koska ne eivät tuo mitään lisäarvoa.)

Kuva 2. Muunkielisen väestön osuus Helsingin eri osa-alueilla.

Kuva 2. Muunkielisen väestön osuus Helsingin eri osa-alueilla. (Klikkaa kuvaa niin saat näkyviin suuremman version, jos suurennan kuvan tähän, siitä tulee epätarkka: ensi kerralla täytyy siis tallentaa kuva suuremmalla resoluutiolla.)

Vertailua

Piian blogista näkee, millaisen kartan samasta aineistosta saa kvantiileja käyttämällä (ainakin minusta luokkaväli näyttää noudattavan kvantiileja, vaikka Piia ei asiaa blogissaan mainitsekaan). Sen sijaan Milla määritti jakauman enemmänkin epämääräiseksi kuin vinoksi ja päätyi luonnollisiin luokkaväleihin kuten minä. Tosin hänen karttansa legenda kertoo kartan kuvaavan muiden kuin suomenkielisten osuutta eli muunkielisten lisäksi Millan aineistoon sisältyy mahdollisesti myös ruotsinkielisten osuus.

Antti ja Aleksi tekivät karttansa ulkomaalaisten absoluuttisesta lukumäärästä. Kartoista käy hyvin ilmi, että esimerkiksi jo mainitsemani Itä-Helsingin teollisuusalueilla, joilla muunkielisten suhteellinen osuus on omalla kartallani suuri, lukumäärältään muunkielisiä on kuitenkin hyvin vähän eli alueet saavat Antin ja Aleksin kartoilla kaikkein vaaleimman sävyn.

Kartan havainnollisuus

Karttalla hahmottuvat hyvin alueet, joilla ei ole melkein lainkaan muunkielisiä (alle 3 %), muunkielisiä on jonkinverran (3 – 10 %), melkoisesti (10 – 20 %) ja paljon (yli 20 %) muunkielisiä. Huomaa, että “jonkinverran” -luokkaan kuuluu oikeastaan kaksi eri luokkaa (3 – 6 % ja 6-10 %). Mielestäni tämän luokan olisi voinut yhdistää yhdeksi luokaksi ja kuvata jakauman neljällä luokalla, kuten Johanna on tehnyt oman aineistonsa kanssa. Kartan luettavuus olisi parantunut luokkia vähentämällä. Samalla olisi painottunut, että valtaosa kunnista kuuluu juuri tähän helposti miellettävään alle 10 % -luokkaan, jossa muunkielisillä kuitenkin on näkyvä (tai kuuluva) asema.

Tummimmat alueet eli alueet, joilla on eniten muunkielisiä, keskittyvät Itä-Helsinkiin. Itä-Helsingissä on kuitenkin alueita, joilla muunkielisiä ei kovin paljoa ole: Tammisalo, Marjaniemi ja Vartiokylä. Lisäksi kartan mukaan Itä-Helsinkiin kuuluu myös Helsinkiin 1.1.2009 liitetyt entiset Sipooseen kuuluneet alueet (itähelsinkiläisenä ehdottaisin tälle alueelle omaa nimeä), joilla ei muunkielisiä juuri ole. Huomattavan vähän muunkielisiä on myös Pohjois-Helsingin omakotitalovaltaisilla alueilla kuten Tuomarinkylässä ja Pakilassa sekä saaristossa kuten Suomenlinnassa ja Santahaminassa. Muunkielisten vähyyden huomaa niinikään manteereessa kiinni olevillakin saarilla, Lauttasaaressa ja Kulosaaressa. Mikäli karttaan lisättäisiin vielä tietoa asumiskustannuksista, huomaisi, että kaupungin osa-alueiden välillä vaikuttavat etenkin taloudelliset ja sosiaaliset tekijät. Samoilla alueilla, joilla asuu paljon muunkielisiä, myös pienituloisten suomenkielisten osuus olisi luultavasti korkea.

Jälkiviisaus

Näin jälkeenpäin ajateltuna ainakin joitain Helsingin osa-alueita olisi voinut sittenkin nimetä. Koska kaikki nimet eivät mitenkään mahtuneet kuvaan, jätin ne kokonaan pois. Jos osan nimistä olisi laittanut paikalleen, edes hieman Helsinkiä tuntevan olisi helpompi arvuutella missä päin liikutaan. Toisaalta monet alueista, joilla on joko hyvin vähän (alle 3 %) tai hyvin paljon (yli 20 %) muunkielisiä, ovat hyvin pieniä, ja niiden nimeäminen siksi hankalaa, vaikka juuri nämä tapaukset luultavasti kiinnostaisivat lukijaa eniten.

 

Lähdeluettelo:

Helsingin osa-alueet 2009, MapInfo aineisto, Tilastokeskus, Helsinki (2009).

Histogrammityökalu, Illuminations Histogram Tool. National Council of Teachers of Mathematics (2014).

Leave a Reply

Your email address will not be published. Required fields are marked *