Kurssikerta 5: Lentokentältä saunaan

Tämän tehtävän avulla voit testata omaa osaamistasi ja MapInfon ymmärtämistäsi, ainakin osittain”. Sehän alkoi rohkaisevasti.

Viides kurssikerta oli omalta osaltani poikkeuksellinen, sillä olin palannut Vieraalta Maalta ja olin paikalla kurssisalissa. Poissaolot eivät olleet edistäneet kurssilla tarvittujen perustaitojen oppimista lainkaan. Käsittääkseni kurssikertaa oli myös alustettu jo edellistunnilla? Niin tai näin, kurssikerralla opeteltu bufferointi sujui alkuun yllättävän mukavasti, kunnes tehtävien mennessä eteenpäin ja kysymysten kasaantuessa aloin huomata sen hataran ja rakoilevan pohjan, jonka päälle koitin tätä oppia perustaa.

Puskurointi on lähtökohtaisesti mukavaa. Vaikka buffereiden käyttöä ja niihin liittyvää alkeellista analyysia on tullut harjoiteltua aiemmin Arc-ympäristössä, oli MapInfon hallitseminen taas yllättävän haastavaa. Aiemmin olen mm. selvittänyt puiden sijaintia Viikin kampuksen alueella ja näiden aiheuttamaa potentiaalista riskiä: suuret ja vanhat puut voivat kovalla tuulella kaatua niin rakennusten kuin kulkuteidenkin päälle. Ne harjoitukset sujuivat Arcilla mukavasti, mutta MapInfon käyttö takeltelee. Suurimmat ongelmat ovat heikoissa pohjatiedoissa: kun aiempia kurssitöitä ei ollut mahdollisuutta suorittaa kurssisalissa, missä apua olisi tarvittaessa tarjolla, jotkin toiminnot aiheuttavat siellä ja täällä tenkkapoon. Tällöin eteneminen tapahtuu aina vain yrityksen ja erehdyksen kautta, jos on tapahtuakseen lainkaan. Nämä oppimishaasteet ovat itse aiheutettuja, mutta lisäksi MapInfo tuntuu mielestäni edelleen tönköltä käyttää. QGIS ja ArcGIS tuntuvat puoleensavetävämmiltä, vaan tällä mennään. Hyvä oppia käyttämään myös MapInfoa.

Buffereita voi käyttää monipuolisesti hyödyksi erilaisissa analyyseissa. Puskureihin pohjautuvaa analyysia voisi käyttää esimerkiksi asukastiheyden ja infektiotautien leviämisriskin tarkasteluun, tai uuden kirjaston perusteltuun sijoittamiseen asukasmäärien, etäisyyden muista kirjastoista ja kulkuyhteyksien perusteella. Mahdollisuuksia tuntuu olevan lähes rajattomasti, jos tekninen suorituskyky ja työkalujen toimintojen tuntemus vain käyttäjän osalta riittävät. Käytettävä aineisto olisi kuitenkin hyvä tuntea – mitä dataa on kerätty ja millä tavoin se on tallennettu? Jos aineistoa ei ole ollut itse keräämässä, siihen olisi hyvä perehtyä edes silmäilemällä. Virheelliset solut tai puuttuva informaatio voivat pistää dataa selatessa silmään, ja ”0”, ”9999999” tai ”-” -kaltaisten arvojen moninaiset käyttötavat eri ohjelmistojen ja eritoten niiden käyttäjien välillä voivat aiheuttaa harmaita hiuksia, jos aineistoa ei vaivaudu vilkaisemaan ennen analyyseja laisinkaan. Näitä lapsuksiahan voi käydä jopa oman datan kanssa, sanovat.

Ensimmäiset lentokenttätehtävät menivät varsin mukavasti. Vastaukset paukkuivat helpohkosti heti kahteen ensimmäiseen kysymykseen. Tämän jälkeen pidin parin kuukauden luovan tauon, ennen kuin palasin tehtävän pariin. Keväisessä toukokuussa satakielen tärisyttäessä äänekästä kakofoniaansa ATK-luokan ulkopuolella mietin, meniköhän tämä bufferointi oikein tai ihan samalla tavalla kuin kurssikerralla helmikuussa olin tehnyt. Jonkinlaisia vastauksia MapInfosta kuitenkin irtosi, jopa lentokentältä juna-asemiin siirryttäessä. Pyöristin tulokset valmiiseen vastaukset (Taulukko 1) melko reippaalla kädella. Syy tähän oli yksinkertainen: pyöristykset ovat mielestäni kysymysten kannalta mielekkäät, eivätkä prosenttiyksiköiden desimaalit toisi mielestäni useimmissa yhteyksissä vastauksiin oleellista lisäarvoa.

Taulukko 1. Kurssikerran tehtävien vastaukset.
BLOGIIN_TAULUKKO

Taulukon tulokset vaikuttivat mielestäni MapInfolla harjoituksia väkertäessäni järkeenkäyviltä, mutta muiden blogeja lukiessani huomasin että vaihtelua on tullut erityisesti itsenäistehtävä 2:ssa. Tatu Leppämäen (2016) tulokset ovat hyvin erilaiset kuin omani. Toisaalta Tatu on ihmetellyt blogissaan omalta kohdaltaan samaa: mistä erot muihin ovat syntyneet? Niko Pelkosen (2016) taulukko näyttää sen sijaan taajamien osalta hyvin samankaltaiselta kuin omani. Ainoa ero löytyy ”Ulkomaalaisia >20%”-kohdassa, missä vastauksen arvo heittää vain yhdellä – voisi olla perua jopa jomman kumman näppäilyvirheestä. En ole vastauksineni siis ainakaan yksin.

Itsenäistehtävää kolme aloittaessani korvissani kaikui helmikuussa kurssikerralla käyty keskustelu, jonka kirjoitin kärppänä ylös muistiinpanoihin:

-Opiskelija (tuskastuneena): ”Pitääks nää kaikki tehdä?!”
-Arttu: ”Ainakin kaks ensimmäistä, mieluiten kolmaskin.”

Meinasin mennä sieltä, missä aita on hyvin matala ja jättää kolmostehtävän tekemättä, mutta en sitten kuitenkaan pystynyt. Muutama aiempi tehtävä oli aiheuttanut tuskastumista, mutta kääritään hihat ja yritetään vielä.

Aloitin tehtävän valitsemalla aiheeksi koulut niiden yhteiskunnallisen painoarvon takia. Tämä yritys oli kuitenkin fiasko. Törmäsin luultavasti varsin yksinkertaiseen ongelmaan, joka ei lukuvuoden lopettavaa kenttäkurssia edeltävänä lauantai-iltana yksin ATK-luokassa enää vain ratkennut. Kiroilun määrä oli kasvava. Totesin, että uima-altaissa ja saunoissa on tietynlaista glooriaa, ”todellista luksuksen merkkiä”, kuten harjoituskerran ohjeessa todetaan, ja vaihdoin aihetta.

Se ei lähtenyt liikkeelle sen hienommin.

Tänään oli valtavaa turhautumista kartanteon kanssa. Luotava kartta oli kaiken lisäksi todella yksinkertainen, mikä harmitti entistä enemmän: mikä on jos ei tällaista edes saa väkerrettyä? Itsenäistehtävä 3 vei hirveän pitkän ajan, mutta lopulta sain vastaukset ulos ja kartan luotua (Kuva 1). Tässä näkyi juuri poissaolo kurssikerroilta: ongelmat eivät olisi vaikeita tai ylitsepääsemättömiä, jos ne olisi kohdannut joskus avun ollessa läsnä. Yksin tehdessä pienetkin tehtävän pysäyttävät ongelmat kasvavat suuriksi, ja tuntuu kuin hakkaisi päätä seinään. Kuten Miia Tennilä (2016) osuvasti blogissaan kirjoitti: ”kurssikerrasta jäi hyvinkin vaikea olo ja toivoin vain, että olisin pitänyt lomani, jollain toisella viikolla.” Niinpä.

BLOGIIN_KUVA_uima_altaat
Kuva 1. Uima-altaan sisältävät rakennukset pääkaupunkiseudun eri alueilla.

Kun tämän kurssikerran harjoitukset olivat pitkän työnteon jälkeen valmiit, totesin että kartasta puuttuvat pylväiden vierestä numeroarvot. Yritin hinkata tätä vielä useamman tovin, mutta en vain löytänyt arvot lisäävää asetusta MapInfosta – jokin yksinkertainen ”show values” tai ”show count record” piilossa silmiltäni? Noh, ei voi mitään. Kartasta siis puuttuvat numeroarvot, mutta uima-altaiden yleisyyttä pääkaupunkiseudulla – ja jopa niiden määriä – voi legendan ansiosta silti tarkastella aivan hyvin. Kuten kuvasta näkyy, suurin osa uima-altaista sijaitsee Helsingissä. Helsingin sisällä uima-altaiden tihentymä kiertää keskustan kehäradan kaltaisesti: suuria määriä löytyy mm. lännestä Lauttasaaresta, pohjoisesta Pakilan ja Tapaninkylän sekä idästä Kulosaaren ja Laajasalon alueilta. On kuitenkin huomattava, että kartta ei esitä uima-altaiden absoluuttisia määriä, vaan sellaisten rakennusten määrän, joiden sisällä on uima-allas. Kartan luokittelussa eroa ei siis tee se, sisältääkö rakennus yhden vai yhdeksän uima-allasta. Kaikkiaan jakautuminen on kuitenkin selvä: keskustan rakennuksista ei uima-altaita juuri löydy, kun taas etäämmällä keskustasta Helsingin reunamilla uima-altaita sisältäviä rakennuksia on huomattavasti runsaammin. Yllättävin havainto tässä oli itselleni Espoo: uima-altaat loistavat poissaolollaan laajalta alueelta.

Kartan jälkeen tuntui nautinnolliselta käyttää vain Select-työkalua ja kiskoa muutamat saunoja koskevat arvot ulos ohjelmasta. Vihdoin valmista.

 

Lähteet:

Leppämäki, T. 2016. Puskuroiden etiäpäin – 5. kurssikerta. PAKinoita kartoista. <https://blogs.helsinki.fi/leppatat/> Luettu 14.5.2016.

Pelkonen, N. 2016. Kurssikerta 5 – Bufferi Lohikäärme. Nikon PAK-blogi. <https://blogs.helsinki.fi/nikopelk/> Luettu 14.5.2016.

Tennilä, M. 2016. Raportti 5: bufferointia. mite’s blog. <https://blogs.helsinki.fi/mite/> Luettu 14.5.2016.

 

Kurssikerta 4: Pääkaupunkiseudun väestä

Tällä kertaa puuhattiin ruutukarttoja, kiinnitettiin rasterikarttoja koordinaatistoon ja tarkasteltiin pääkaupunkiseudun väkeä.

Alku sujui hämmentävän vaivatta. Kurssikerta sai hyvän startin. Ensin tosin huoletti, kun ohjeen suositus oli ”tarkista gridistä, että luomastasi uudesta sarakkeesta löytyy myös muita arvoja kuin pelkkiä nollia. Rullaile ikkunaa kärsivällisesti.” Rullailin kärsivällisesti. Pelkkiä nollia. Hetken päästä esiin alkoi tulla kuitenkin arvojakin, eli ei vastoinkäymisiä vielä, jes!

Harjoituskerran ohje meinasi johtaa harhaan: printscreenissä ollut ”Asukkaita > 0” sai lähes hämääntymään, mutta huomasin vaihtaa kohdan muotoon ”Väestö > 0” enkä seurannut sokeana lampaana. Ohje kehotti myös rastittamaan pois ”Replace Layer Stylen”, jonka jälkeen ”ruudut näyttävät siltä kuin niiden kuuluisi”. Selvä. Nyt seurasin sokeana lampaana. Mitäköhän tämä oikeastaan teki? Olisi tehnyt mieli ymmärtää.

Ruudukon luominen ja datan kerääminen grid-tietokantaan sujui ongelmitta. Harjoittelun tuloksena syntyi kartta, joka esittää pääkaupunkiseudun asukkaiden väestötiheyden 500 x 500 m kokoisilla ruuduilla (Kuva 1). Kartan värit ovat mielestäni järkevät, ja se esittää väkikeskittymät ja harvemmat alueet mielestäni kelvollisesti. Muutin taustalla olleen OSM-kartan mustavalkoiseksi, jotta olennainen (asukastiheydet) erottuvat valmiista kartasta paremmin. Aineiston luokittelussa kvantiilit (equal count) vaikuttivat tässä yhteydessä järkevältä vaihtoehdolta. Päädyin silti kuitenkin luonnollisiin luokkaväleihin (natural break), koska sillä on tullut ennenkin hyvää jälkeä ja se sai myös aikaan varsin tyydyttävän lopputuloksen. Kartassa näkyvät selvästi erityisesti kantakaupungin ja idän asutustihentymät, joissa asukkaita voi olla parhaimmillaan jopa yli 2000 yhden ruudun (500 x 500 m) alueella.

BLOGIIN_eka_kartta_vaesto
Kuva 1. Pääkaupunkiseudun asukastiheydet alueittain.

Pääkaupunkiseudun harjoituskartan jälkeen alkoi tämän kerran varsinaisen itsenäistyön tekeminen. Aihetta valitessani halusin esittää ulkomaalaisten ihmisten osuuden (%) koko väestöstä. Tein taulukkoon uuden sarakkeen onnistuneesti, mutta arvot näyttivät käsittämättömän samanlaisilta: kaikki hirveän pieniä. Vaan hups – unohtui kertoa sadalla. Nyt prosenttiluvut näyttivät järkevämmiltä.

…Vaan eivätpä näyttäneetkään. Taulukon loppupään lukemat olivat järjettömiä. Syyn etsiminen tuotti taas tulosta (alkaako tämä oikeasti sujua?): jotkut ULKOKANS-sarakkeen arvoista olivat 999999999, eli tieto luultavasti puuttui. Päätin vaihtaa karttani perustumaan taulukon viereiseen sarakkeeseen, joka on kuvattavana ilmiönä hyvin samankaltainen: muunkielisten osuus (%) koko väestöstä. Tässä vaiheessa tuli taas klassinen töksähdys: en vain saa millään haluamaani esitystä ”Pks_vaki”-taulukosta karttaan. Mikä ihme vialla? Muistiinpanoistani löytyi merkintä ”Kyllä v****aa taas, ei vain toimi”.

Pitkällisen MapInfon hinkutuksen, epäonnistumisten ja eksymisten jälkeen sain kaksi karttaa valmiiksi. Parempi niistä on esitetty alla (Kuva 2).

BLOGIIN_KARTTA_muunkielistenosuusvaestosta
Kuva 2. Muunkielisten osuus väestöstä pääkaupunkiseudulla.

Kartta on ruutujen pakotetun muodon takia hieman nuhjuisen oloinen, mutta parempi kuin ensimmäisenä yrittämäni ruutukoolla 100 m. Se se vasta huono oli. Kartasta olisi luultavasti tullut esteettisesti vielä parempi jos ruutukokoa olisi kasvattanut 500 x 500 metristä vaikkapa kilometriin. Tämä olisi kuitenkin vaikuttanut kartan välittämän tiedon tarkkuuteen reilulla kädellä. Värit ja luokkien määrä ovat puolestaan mielestäni ok: kartasta on helppo hahmottaa, missä muunkielisiä on eniten.Suurimmat tihentymät löytyvät idästä, mutta myös ydinkeskustasta luoteeseen päin siirryttäessä muunkielisten osuus asukkaista kasvaa. Siellä täällä kartassa näkyy yksittäisiä tummansinisiä pisteitä, joissa muunkielisiä on jopa 47 – 100 %. Liekö tällaisten takana isojen ulkomaista alkuperää olevien perhekuntien tai tuttavapiirien keskittyminen hyvin pienelle alueelle? Tämä lienee yksi mahdollinen selitys. Äärisuurien arvojen vastapainona on syytä huomata myös kartan värjäyksen ”vähemmän kiinnostava” pää: suurinta osaa alueesta peittää kellertävä sävy, joka indikoi muunkielisten osuuden olevan alueella vain <5,8 %. Varsinaiseen pakokauhuun ei ole pääkaupunkiseudun kielikulttuurin suhteen aihetta siis Rajat kiinni -porukallakaan.

Tuomas Pätäri (2016) kirjoittaa mainiosti kurssikerran teemasta blogissaan: ”Ruutuaineiston hyvä puoli on se, että sen esittämät alueet ovat samankokoisia, eli määrällinen tieto on aina suhteutettu pinta-alaan. Näin esimerkiksi asukkaat voidaan esittää absoluuttisina arvoina, eli tiedon ei etukäteen tarvitse olla suhteellista (esim as/km2). Ruututeemakarttojen luettavuus ei kuitenkaan aina ole parhaimmasta päästä.” Toteamusta havainnollistaa parhaiten Tatu Leppämäki (2016), joka on toteuttanut ja vertaillut ansioituneesti erilaisia esitystapoja samasta aineistosta ruutu-, liukuvärjäys- ja koropleettikartan muodossa. Kuten Leppämäki blogissaan toteaa: ”Yhteenvetona väitän ruutukarttojen soveltuvan täsmällisimmän tiedon esittämiseen, mutta hukkaavan jouheasti helppolukuisuutensa siinä ohessa. Koropleettikartta on kadunmiehen valinta ja liukuvärjätty- eli grid-kartta näyttää kivalta seinällä.” Olen suurimmilta osin samaa mieltä.. On kuitenkin syytä nostaa esiin, että myös ruutukartan luettavuudessa voidaan saavuttaa hyvä taso, jos muista asioista (esimerkiksi aineiston paikallinen tarkkuus) voidaan tapauskohtaisesti joustaa.

Harjoituskerran loppupuolella harjoittelimme rasterikuvan rekisteröintiä karttapohjaan. Luulin että rekisteröinti toimi ihan hyvin, mutta sen jälkeen auennut ”karttaikkuna” oli tyhjä eikä Map –> Save Cosmetic Objects toiminut. Mikähän tässä taas oli? Suljin kaiken ja aloitin uusiksi. Nyt edes rekisteröinti ei onnistu.

BLOGIIN_kartan_rekisterointi_mita_helvettia
Kuva 3. Taas menee vahvasti.

Käynnistin kaiken vielä kerran uusiksi. Rekisteröinti ei vain onnistu. Manailua siivitti virheilmoitus (Kuva 3), kunnes tajusin koordinaattisysteemin puuttuneen MapInfon uudelleenkäynnistämisen jälkeen. Sen korjattuani rekisteröinti onnistui. Pornaisten keskusta tuotti kuitenkin ongelmia, sillä sitä merkkaavan punaisen suorakaiteen sisällä ei vain näkynyt mitään. Onkohan kartan rekisteröinti edelleenkin väärin? Tämä oli taas näitä hetkiä jolloin olisi kaivannut avunkysymisen mahdollisuutta.

 

Lähteet:

Leppämäki, T. (2016). Teemoja ruuduittain ja kolmin kerroin – 4. kurssikerta. PAKinoita kartoista. <https://blogs.helsinki.fi/leppatat/2016/02/12/4-kurssikerta-tyon-alla/> Luettu 28.5.2016.

Pätäri, T. (2016). <https://blogs.helsinki.fi/ttpatari/2016/02/10/rakennusvuosia-ruuduittain/> Luettu 28.5.2016.

Kurssikerta 3: Afrikan tuomat haasteet

Taas mennään! Ja jälleen jotain uutta tällä kertaa: pääasiassa tietokantojen valmisteluja, liitoksia ja muokkauksia. Lopuksi myös teemakartan tekoa vanhoista kunnon valuma-alueista.

Kurssikerran alkupuoli oli ohjeistettu harjoitustyökerran työnannossa selkeästi. Tästä huolimatta tekeminen jumitti järjettömän paljon: taulukoiden yhdistäminen SQL Queryllä ei vain toimi. Mikä eteen? Kysy Artulta? No enpä kysy toukokuun pimenevässä illassa Viikin ATK-luokassa. Olisi tämän voinut helpommaksikin itselleen tehdä.

Angola näyttäytyi ihmeellisenä vaakaviivoituksena ”Afrikka”-browserissa. Luomassani ”Angola_yhdistetty”-browserissa ei sen sijaan näkynyt mitään tietoja. Ei edes vaakaviivoja. Kaikki alusta. Close all. Exit.

En tiedä mitä oikein kävi ja missä meni vikaan. Uusi yritys kuitenkin tuotti tulosta: ehkä ruksin ottaminen pois kohdasta Table –> Combine objects using Column –> Country [ ] Indexed? En tiedä, mutta nyt SQL Query toimi!

Ohjeiden seuraaminen ei tuottanut hankaluutta. Suurimmat vastoinkäymiset tulivat sen sijaan niinä hetkinä, kun jokin ei sujunutkaan yhtä kätevästi kuin ohjeessa, eikä apua ollut luvassa muuta kuin lukuisten epäonnistuneiden klikkailujen, googletusten sekä yrityksen ja erehdyksen kautta. Timanttikaivoksia, öljykenttiä ja konfliktialueita käsittelevä osio meni ensin aivan metsään. Taulukkoon ei ilmestynyt mitään. Pitkällisten yritysten jälkeen asia kuitenkin korjautui, kun vaihdoin Table –> Maintenance –> em. sarakkeiden tyypeiksi Character –> Float. Muutoksen jälkeen sain laskettua timanttikaivokset, öljykentät sekä konfliktialueet. Sitä helpotuksen määrää, kun jokin asia onnistui ja toimi. Tänä Herran hetkenä blogitekstiä kirjoittaessa – jonkin aikaa harjoituksen suorittamisen jälkeen – en kuitenkaan löydä numeerisia vastauksiani mistään. Muistan vain, että lukumäärien esiin saaminen onnistui moitteetta. Sen sijaan olen tehnyt aiheesta taannoin kartan (Kuva 1).

BLOGIIN_Afrikka_timanttikaivokset_oljykentat_konfliktit_kartta
Kuva 1. Kartta Afrikan timanttikaivoksista, öljykentistä ja konfliktialueista.

Tämän täytyy olla huonoin kartta, jonka olen kurssin aikana tehnyt. Siitä puuttuvat paitsi Afrikan rajat, myös legenda, pohjoisnuoli ja mittakaava. Viisainta olisi jättää tällainen tekele postaamatta blogiin, mutta haluanpa näyttää mahdolliselle bloginlukijalle, että ei nämä aina mene muillakaan niin hienosti kuin tarkoitus oli. Tarkastaisin symbolien selitteet, mutta tällä Lammin biologisen aseman koneella ei ole MapInfoa. Siispä tyydyn toteamaan, että parahin lukija, älä tee tällaista.

Onnistuneemman kartan perusteella olisi mielenkiintoista tarkastella esimerkiksi öljykenttien/timanttikaivosten löytämisvuoden ja konfliktien tapahtumavuoden välistä yhteyttä, jos sellaista on lainkaan löytyäkseen. Konfliktien laajuutta (säde km) olisi myös mielenkiintoista tarkastella alueella esiintyvien öljykenttien ja timanttikaivosten summaluvun perusteella: ovatko konfliktit paisuneet kokomitaltaan suuriksi alueilla, joilla arvokkaita luonnonvaroja esiintyy laajalla alueella? Niin ikään öljyn ja timanttien kaltaisten rikkauksien tarkastelu yhdessä alueen internetkäyttäjien lukumäärään olisi kiintoisaa, sillä internetiin yhteyden saavien määrä nähdään tänä päivänä usein yhtenä alueen kehittyneisyyttä kuvaavana tekijänä: mitä useammalla asukkaalla on pääsy internetiin, sitä kehittyneempää alueen informaatioverkosto on. Vaan jakautuvatko rikkaudet infrastruktuuriin ja tavallisille kansalaisille, vai valuvatko ne harvojen valittujen taskuihin? Nämä ovat vain muutamien esimerkkien pintaraapaisu asioista, joita aineiston avulla voisi tarkastella. Atte Aholainen (2016) nostaa blogissaan esille muita mielenkiintoisia mahdollisuuksia: millainen on konfliktien keskimääräinen esiintymistiheys ennen ja jälkeen timanttikaivosten tai öljykenttien löytymistä? Myös Petra Saari (2016) on nostanut blogissaan esille hyviä kysymyksiä: miksi joihinkin timanttikaivoksiin ei liity konflikteja? Saaren (2016) arvion mukaan ”ne voivat olla huonosti tuottavia ja siten ei niin kiinnostavia”, mikä olisi ihmistoiminnan tuntien varsin uskottava selitys. Toisaalta, jos tällaista yhteyttä ei havaittaisikaan, herättäisi se aihetta lisäkysymyksille: selittääkö konfliktien puutetta jokin muu tekijä? Tällaista tarkastelua voisi käyttää hyvin opetustarkoituksessa keskustelun herättämiseksi.

Afrikan jälkeen harjoituskerta taipui tulvakartan puolelle. Harjoitustyönä luotavan kartan avulla oli tarkoitus ilmentää Suomen vesistöjen valuma-alueiden ominaisuuksia ja niiden tulvaherkkyyttä.

Tällä kertaa homma lähti jotenkin rullaamaan. Tietokantojen (”valuma-alueet” ja ”keskiylivirtaama”) yhdistäminen onnistui SQL-Selectillä yllättävän näppärästi ja kivuttomasti. Taulukkoon tuli turhaa tuplatietoa, kuten valuma-alueen ID-nro ja nimi, mutta ne eivät tässä yhteydessä haitanneet. Eteenpäin.

Myös tulvaindeksin lasku kullekin valuma-alueelle onnistui hämmentävän ongelmitta. Tadaa! Tosin juurihan sitä edellä Afrikassa harjoiteltiin (no en harjoitellut Afrikassa, heh-heh. Jätin väliin ja tein Suomessa.) Järvisyys-data jatkoi onnistumisten suoraa: myös sen tuonti ja yhdistäminen Excelistä sujui kauniisti. Kyllä ihmetyttää. Päädyin kuitenkin tässä vaiheessa hiomaan taulukkoa poistamalla duplikaatit, koska ne eivät miellyttäneet silmää. Tämän vaiheen aikana Excel tosin kaatui kolme kertaa, mutta johan siinä olikin raskas tiedosto käsiteltäväksi: melkein 80 riviä ja kaksi saraketta.

Kun aineisto oli saatu järkevään muotoon, tarkastelin sitä ensin silmämääräisesti. Aineistosta erottui kirkkaasti Aurajoki hurjan korkealla tulvaindeksillään (1100). Kuten kurssohjeessa annetusta histogrammista näkyy, tulvaindeksien jakauma on vahvasti vino vasemmalle ja Aurajoki aivan omassa yksinäisyydessään. Kokeilin ensin valitsemani luonnollisten luokkavälien (Natural Breaks) lisäksi muutamaa muuta luokittelua, mutta nämä olivat järjettömiä Aurajoen erityislaatuisuuden takia. Aurajoki saa histogrammin lisäksi pysytellä myös minun luokittelussa siellä omassa yksinäisyydessään.

Kun aloin tehdä karttaa, palasin ajassa taaksepäin, ja luin huolella kuinka toisen kerran ohjeessa lausuttiin: ”Kun käytetään päällekkäisiä teemoja, ei ole suositeltavaa käyttää kolmea useampaa luokkaa luettavuuden ja kartan selkeyden säilyttämiseksi. Tästä syystä harjoituksen molempien teemojen luokkien lukumäärä valitaan kolmeksi.” Vaikka tässä tulvaindeksin osalta viisikin luokkaa olisi epäilemättä hoitanut asiansa, niin minäpä menin kolmella! Äärevöitetään vähän karttaa ja eroja.

Jälleen kerran itse kartanteon parissa tuli kuitenkin tenkkapoo. Miksi ihmeessä en saa tulvaindeksi-tietoja kartan muotoon haluamastani taulukosta – täytyykö niiden olla ”valuma-alueet”-taulukossa? Jämähdin tähän pitkäksi aikaa. En vain saanut koropleettikarttaa tehtyä. Suljin koneen, menin ulos kuuntelemaan saapuneita satakieliä ja jatkoin seuraavana päivänä.

Uusi päivä. Olipas se vaikeaa. Yhdistin taas SQL Selectillä ”valuma-alueet” ja oman uusimman tabini, ja sain aikaan yhdistetyn taulukon josta löytyivät valuma-alueet. Nyt Map –> Create thematic map –> Table: Selection from valuma-alueet –> Field: Join –> tulvaindeksi! Hahaa!

Luomani kartta ei kuitenkaan ollut tyydyttävä. Pienimmälle luokalle antamani valkoinen väri loi kuvan, ettei tulvaindeksiä ole alueilla olemassa lainkaan. Muutin värejä siten että pieninkin luokka on edes jotenkin sinisävyinen. Näin oli parempi.

Vaan voi pyhä sylvi että oli vaikeaa saada järvisyys-% ja sitä kuvaavat pylväsdiagrammit natsaamaan. Tein varmaan 10 SQL Selectiä ja kartta hävisi silmistä monta kertaa syystä minulle tuntemattomasta – olisi tämä varmasti helppoa jos osaisi. Taas meni kurssikerta todella yrityksen ja erehdyksen kautta. Lopulta muutaman oivalluksen jälkeen kartanteko onnistui. JES. Valmis tekele näyttää tältä (Kuva 1):

BLOGIIN_tulvakartta_parempi
Kuva 1. Suomen valuma-alueiden tulvaindeksit (sininen värjäys) sekä järvisyysprosentit (pylväsdiagrammit).

Kartta on mielestäni onnistunut. Nyt valmista työtä katsoessa tulee mieleen, että järvisyysprosenttia ilmentäviä pylväitä olisi voinut hieman venyttää erojen näkyvyyden kasvattamiseksi, mutta käyvät ne tuostakin selväksi. Ei suuri vajavaisuus.

Tekstini meni tässä blogitekstissä aiemmin turhautumisen vallassa kuvailuksi, mutta nyt päästään pureutumaan itse asiaan: mitä tästä kartasta oikeastaan ilmenee? Valuma-alueiden tulvaindeksin ja järvisyysprosentin välillä vaikuttaa olevan selkeä yhteys. Niillä valuma-alueilla, joissa järvisyysprosentti on korkea, tulvaindeksi on matala. Toisinpäin ilmaisten tulvaindeksi-huiput saavutetaan alueilla, joissa järvisyys on vähäistä. Negatiivinen korrelaatio vaikuttaa vahvalta. Myös syy kartalla havaittavaan yhteyteen vaikuttaa ilmeiseltä: alueilla, joissa järviä on paljon, sateiden tai lumensulamisen aiheuttamat vesimassat varastoituvat paremmin tulvimatta yli äyräiden. Järvet siis tasaavat vesimäärän vaihteluita. Samaan johtopäätökseen oli blogissaan päätynyt Jasmiina Myllys (2016): ”Järvet toimivat veden varastoina, joten jos alueella on paljon järviä, vettä ei yhtä lailla keräänny jokiin ja jokien virtaamat pysyvät alhaisempina.” Kartasta huomaa, että maamme länsinnikolla tulvariskit ovat todellisia, vaikka ne eivät aiheuttaminsa vahinkojen puolesta yletäkään maailmalla esiintyvien, lukuisia ihmishenkiä vievien tulvien tasolle.

Kurssikerran yhteenvetona voisi todeta, että Afrikka tuotti tällä kerralla todella haastetta. Suomessa pysyminen olisi ollut varmasti helpompi valinta. Tällä kertaa ensimmäisen kerran blogituksesta oli kuitenkin todella hyötyä. Törmäsin sekä Afrikan että Suomen tulvaindeksin kohdalla pohjoisnuoli-ongelmiin, mutta muistin ongelman vanhastaan ja luin 1. kerran blogituksesta, miten se silloin ratkesi. Kirjoitin tuolloin kaukaa viisaasti ”Ohjelman työkalujen hallinta alusta alkaen säästää pitkällä kurssilla jatkossa hermoja.” Näin on. Tulevaisuuden Joni kiittää.

 

Lähteet:

Aholainen, A. 2016. Kurssikerta 3 – Tietokantojen yhdistämistä ja sen sellaista, 27.1.2016. Uusi blogipalvelut-sivusto. https://blogs.helsinki.fi/ammahola/2016/02/07/kurssikerta-3-tietokantojen-yhdistamista-ja-sen-sellaista-27-1-2016/

Myllys, J. 2016. Artikkeli 1. Jasmiinan PAK-blogi. <https://blogs.helsinki.fi/myllyjas/2016/02/03/3-kurssikerta-tietotulva-tietokannoista/> Luettu 22.5.2016.

Saari, P. 2016. Tietokannan muokkauksesta kartaksi. Karttoja, karttoja. <https://blogs.helsinki.fi/petrasaa/2016/02/15/tietokannan-muokkauksesta-kartaksi/> Luettu 22.5.2016.

 

Kurssikerta 2: Diagrammeista työttömyyteen

Toisella kurssikerralla perehdyttiin teemakarttoihin, joissa on esitettynä kaksi teemaa yhdessä kartassa päällekkäin. Lisäksi tällä kerralla verestettiin syksyn TAK-kurssin muistoja aineiston luokittelun yhteydessä. Konkretiaa luokitteluun toi erilaisten luokittelujen havainnollistaminen karttojen muodossa MapInfossa.

Teemakarttojen tekoon sai tällä kertaa monipuolista treeniä. Tehtiin ennestään tutumpaa pylväsdiagrammia, ympyrädiagrammia, pistekarttaa, sekä nimiensä puolesta vähemmän tuttuja individual-, graduated- ja grid-karttoja. Alkusäikähdyksen jälkeen nämäkin osoittautuivat sisällöltään varsin tutuiksi: esimerkiksi grid-kartassa tuotettiin lopulta yksinkertaisesti liukuvärjätty kartta, jossa aineistoa interpoloidaan kahdella vaihtoehtoisella tavalla. Ei mitään järisyttävää siis sisällöllisesti. Harjoituksista prismaattinen kartta sekä 3D-kartta olivat sisällön puolesta uusimpia itselleni, ja tarjosivat lähestulkoon jännittäviä hetkiä MapInfon parissa: kolmiulotteisuus on vain niin in.

Tämän kerran itsenäistehtävässä tavoitteena oli tuottaa kartta, johon sai valita itse esitettävän ilmiön ja aineiston. Tavoitteena oli laittaa tietotaito kartan muotoon: löytää aivonystyröitä kutkuttavat tarkastelun kohteeh, luokitella aineisto järkevästi, valita ilmiön esittämiseen sopiva väriskaala ja tuottaa valmis kartta. Kurssikerran lisälukemiston hengessä teemakartassa tuli esittää kaksi teemaa. Koska Lapin alue on mielestäni kiinnostava, päätin käyttää kurssikerralla tarjottua Pohjois-Suomen karttaa, ja luoda siihen kuntakohtaisen tarkastelun työttömyysasteesta (2010) ja selvitettyjen rikoksien määrästä (2010) alueella. Loin alkuun työttömyysastetta ilmentävän tavallisen koropleettikartan sinistä väripintaa käyttäen. Tämän jälkeen lisäsin karttaan selvitetyt rikokset pistemäisenä kuviopintana. Valmis kartta on esitettynä alla (Kuva 1).

BLOGIIN_kartta
Kuva 1. Työttömyysaste ja selvitettyjen rikoksien määrä Pohjois-Suomen kunnissa vuonna 2010.

Työttömyysastetta kuvaava luokittelu (luonnolliset luokkavälit, kolme luokkaa) ja värjäys (sinisen sävyt) ovat mielestäni melko onnistuneet. Kartta näyttää kuntien väliset erot työttömyydessä selkeästi, joskin ehkä hieman korostaen. Sen sijaan selvitettyjä rikoksia kuvaava, tiheydeltään vaihteleva pistekuviopinta herättää enemmän mietteitä ja spekulaatiota. Luokittelin aineiston ensin viiteen luokkaan. Tämä ei osoittautunut lainkaan hyväksi valinnaksi, sillä jo kolmella luokalla pisteiden tiheyden erottaminen menee omalla kohdallani havaintojen prosessoinnin rajamaille: kartta on mielestäni OK, mutta pisteitä saa hetken aikaa todella tuijottaa, jotta selvitettyjen rikosmäärien erot käyvät ilmeisiksi. Viisi luokkaa olisi ollut tähän aivan liikaa.

Aineiston luokittelutavan valinnat menivät melko omalla painollaan. Kokeilin rikoksille ensin kvantiileja (equal count), mutta luonnolliset luokkavälit (natural break) tarjosi toimivamman vaihtoehdon. Tähän mennessä luonnolliset luokkavälit eivät vielä ole kurssiharjoitusten yhteydessä tuottaneet pettymystä. Ehkä myöhemmin kohdataan sellainenkin aineisto.

Kuten edellä sanoin, kartta (Kuva 1) on mielestäni kelvollinen. Siitä on kuitenkin huomattava muutamia seikkoja. Ensinnäkin kartassa esitetty selvitettyjen rikosten määrä on absoluuttinen, ei osuus tai suhdeluku. Toisin sanoen kartalla kunnan pistetiheyden määrää se, kuinka monta rikosta on selvitetty – ei se, kuinka monta rikosta kunnassa on tehty per asukas. Kuten kartasta näkyy, tiheimmät pistekuviopinnat löytyvät Rovaniemen, Kemin ja Tornion kunnista. Erityisesti Rovaniemen olisi voinut arvata ilman karttaakin: kyseessä on alueen väkiluvultaan isoin kaupunki, minkä voi ilman kristallipalloakin ennustaa lisäävän kunnassa suoritettavien rikosten määrää. Victoria Ollus (2016) esitti omassa blogissaan koropleettivärjäykseen ja pylväsdiagrammeihin nojautuvan kartan väkiluvun ja selvitettyjen rikosten yhteydestä Uudellamaalla, ja johtopäätös on samanlainen: siellä missä väkiluku on suuri, myös selvitettyjen rikosten määrä on suuri.

Kartan yllättävyyttä ei voi kuitenkaan redusoida pelkkään väkilukuun. Tulosta voi lisäksi vääristää myös muun muassa virkavallan riittävyys: kokemukseni mukaan esimerkiksi Käsivarren alueella on vaikeaa saada ylinopeussakkoa, vaikka mittari huitelisi järjettömissä lukemissa. Tilanne on toinen Rovaniemen kaduilla. Voi toki myös olla, että Rovaniemellä, Kemissä ja Torniossa rikoksen suorittajat ovat laadultaan huonompia ja jäävät rötöksistään useammin kiinni. Tätä data ei kuitenkaan kerro.

Kartan vajeista huolimatta siitä voi tehdä jonkinlaisia johtopäätöksiä. Työttömyyden ja selvitettyjen rikosten yhteys ei kuitenkaan osoittaudu havainnollistuksen (Kuva 1) perusteella niin ilmeiseksi kuin olisi etukäteen odottanut: pistekuviot eivät ole järjestään tiheimpiä tummansinisissä eli niissä kunnissa, joissa työttömyysaste on suurin. Esimerkiksi edellä mainitut Rovaniemi ja Tornio sijoittuvat alhaisimman työttömyyden vaaleansiniseen luokkaan, mutta niistä löytyy silti suurimmat määrät selvitettyjä rikoksia. Monet työttömyydestä kärsivät kunnat, kuten Enontekiö, Savukoski ja Pelkosenniemi taasen sijoittuvat pienimpään selvitettyjen rikosten luokkaan. Näiden esimerkkien kautta käy ilmi parhaiten selvitettyjen rikosten ongelma, jonka edellä esitin: luvut eivät ole asukkaiden määrään suhteutettuja osuuksia. Jos kartassa olisi esitetty absoluuttisten selvitettyjen rikosmäärien sijaan niiden määrä per asukas, kartta olisi varmasti toisenlainen. Saman toteaa Victoria Ollus (2016) omassa blogissaan: ”olisi siis ollut järkevämpää käyttää suhteellisia arvoja, kuten rikoksia sataa tai tuhatta asukasta kohden.” Olettaisin, että yhteys työttömyyden ja rikosten välillä olisi tällöin ilmeisempi siten, että korkean työttömyyden kunnissa myös rikokset olisivat yleisempiä.

Tämä kurssikerta sujui teknisesti kohtalaisesti, vaikka diagrammista ja teemakartasta toiseen hyppiminen meinasikin aluksi tuottaa hankaluuksia. Naurettavan lopputurhautumisen tarjosi legendan lisääminen karttaan: miten voikin olla näin vaikeaa saada selite legend-ikkunasta valmiiseen karttaan? Turhautuneiden klikkailujen jälkeen muistin törmänneeni aiemmin samaan ongelmaan, kaivoin ensimmäisen kerran muistiinpanot esiin ja löysin sieltä ratkaisun: Layout-ikkunaan siirtyminen ratkaisi tämän osaltani erävoitoksi: Joni 1 – MapInfo 0. Luultavasti tämä on kuitenkin vasta alkua.

 

Lähteet:

Ollus, V. 2016. Toinen kurssikerta: Kaksi teemaa, yksi kartta. Victorian kurssiblogi. <https://blogs.helsinki.fi/ollus/2016/02/02/toinen-kurssikerta-kaksi-teemaa-yksi-kartta/> Luettu 22.5.2016.