SWOT juttu

Tutustuinpa tässä taannoin New York Timesin karttapalveluun. Tässä SWOT-, tai kuten Tiia S. osuvasti blogissaan ilmaisi: VHUM -analyysi siitä.

Vahvuuksia

  • ns. open data on monien mielestä itseisarvo, “datasta” riippumatta
  • helppokäyttöinen: zoomailu ja tasojen vaihtaminen
  • nopea saada tietoja eri etnisten ryhmien alueellisesta jakautumisesta
  • Informatiivisuus; tieto sekä asutuksen tiheydestä että asukkaista
  • teknisesti erittäin onnistunut ja toimiva viritys

Heikkouksia

  • ei ole työkaluja esim. pinta-alojen tai etäisyyksien selvittämiseen

Mahdollisuuksia

  • Tuo jokaisen ulottuville valtavan määrän dataa
  • -> kuka vain voi helposti tutkia esitettyjä ilmiöitä ja pohtia niiden jakautumista
  • Kuka vain voi miettiä ratkaisuja aiheisiin liittyviin yhteiskunnallisiin ongelmiin
  • Havainnot (karttanäkymät) ovat helposti jaettavissa sosiaalisessa mediassa jakopainiketta painamalla

Uhkia

  • Palvelu on omiaan luomaan stereotypioita eri alueista
  • Niin helppokäyttöinen, että lapsikin osaa käyttää -> lapsi ei välttämättä osaa tulkita kriittisesti
  • Voi aiheuttaa kierteen, joka entisestään vahvistaa alueiden etnistä eriytymistä

Boom Kah(vi)!

Olipa kerran viimeinen kurssikerta.

Oli aika ottaa ohjat omiin käsiinsä, ja tehdä jotain ennennäkemätöntä. Tarkoitus oli samalla kerrata mahdollisimman paljon tähän mennessä opeteltuja asioita.

Koska kahvi on hyvää ja pidän sen kanssa hifistelystä, päätin tehdä siihen liittyviä karttaesityksiä. Aloitin projektin armottomalla googletusrupeamalla. Sen tuloksena löysin enemmän tai vähemmän hyödyllisiä tietopläjäyksiä aiheesta. Ehkäpä hyödyllisin sivusto kahviin liittyvän gis-datan suhteen oli Kansainvälisen kahviorganisaation kotisivut.

Tietoja oli sivustolla isketty taulukkomuotoon maittain, mikä sopi minulle mainiosti. Löysin mielenkiintoisia tietokantoja kahvin kulutuksesta, tuotannosta ja viennistä. Ajattelin, että nämä olisivat melko helposti yhdistettävissä kk6:n gis-aineistona olleeseen world -tietokantaan, yhteisenä nimittäjänä valtioiden nimet.

Tietojen mapinfotus sujui virheiden kautta voittoon -tyylillä. Niitä oli ensin siistittävä excelissä, ja varmistettava että kaikki valtioiden nimet vastasivat world-aineiston taulukoissa olevia. Tämä oli helpommin sanottu kuin tehty. En keksinyt muuta keinoa taulukoiden yhdistämiskelpoisiksi saattamiseen kuin tarkistaa kohta kohdalta excelin valtioiden nimien vastaavuus Mapinfossa liitosta odottaneeseen aineistoon. Se ei onneksi kuitenkaan ollut niin ikävää puuhaa kuin miltä kuulostaa, sillä taulukoiden vertailu vertailu rinta rinnan oli kohtalaisen nopeaa puuhaa. Pitkät lyhennyksiä sisältävät valtioiden nimet, Viet Nam ja muutama muu omituisuus saivat lopulta tarvitsemansa oikaisut ja tietokantaliitos onnistui kaikkien excelistä tuotujen rivien osalta.

Numeroissa excelillä oli paikoin taipumuksena kompastella omaan näppäryyteensä. Oli päästävä eroon päivämääristä ja muista automaattisista muotoiluista.

Toin yhteensä kolme taulukollista tietoja jo ennestään varsin monipuoliseen world -tietokantaan. Ilman sen suurempia suunnitelmia siitä mitä oikeastaan haluaisin tiedoillani tehdä, aloin yksinkertaisesti vain kokeilemaan erilaisia visualisointeja. Lopputuloksena kaksi karttaa, joissa yhdistyvät tiedot kahvin tuotannon, viennin ja juonnin määristä.

Tässä niistä ensimmäinen:

Kuva 1. Kahvin tuotanto suhteutettuna pinta-alaan maittain (Total production of exporting countries)

Kuva 1. Kahvin tuotanto suhteutettuna pinta-alaan maittain (Total production of exporting countries, ICO)

Kartta esittää kahvin tuotannon määrää suhteessa kunkin maan pinta-alaan (Kuva 1). Kartalle on myös nimetty 46 tärkeintä kahvintuottajamaata. Kartan ulkoasussa panostin siihen, että esitetty teema olisi mahdollisimman selkeästi esillä. Karsin kaiken ylimääräisen pois, ja jätin näkyviin vain valkoisen mannerkartan ja sen päälle asetetun violetin teemakartan.

Kuva 2.

Kuva 2.

Aineiston histogrammi on laskeva, mutta hajanainen (Kuva 2). Mikään Mapinfon valmiista luokittelualgoritmeistä ei tuottanut mielestäni kelvollista luokittelua. Halusin superkompromissin, joten tuunasin Mapinfon ehdottamia kvantiililuokkia. Ainoa heikkous näissä mukauttamissani luokkaväleissä on niiden vaihtelevat koot. Isoin luokka sisältää 40 säkin eroja neliökilometrituotannoissa, kun taas toisiksi pienin viiden säkin. Tästä huolimatta kartta kuvaa oleellisimpia alueellisia eroja kahvin tuottamisen määrissä havainnollisesti, muttei silti suuremmin liioitellen.

Se, mistä nämä erot kahvintuotannossa johtuvat onkin haastavampi kysymys. Ensinnäkin on otettava huomioon mahdolliset virheet kirjanpidoissa; aineisto ei välttämättä ole täydellinen. Joidenkin maiden tiedot saattavat olla puutteellisia, tai suoranaisesti virheellisiä. Tämän jälkeen on otettava pohdintaan mukaan seikat, jotka vaikuttavat sadon määrään. Kahvipensas on nirso, mutta oikealla paikalla tuottoisa rahakasvi. Vaatimuksena on 15-25 asteen lämpötila, 1000m-2000 mm vuotuinen sademäärä, 600-2200 m korkeus merenpinnasta (vaihtelee lajikkeittain) ja savipitoinen, paksumultainen /“vulkaaninen” maaperä (Kahvin viljely, kahvi.net).
Kahvin alkuperä on Afrikassa, mutta suurimmat sadot nykypäivänä kerätään Latinalaisesta Amerikasta. Tämä lienee monta syytä, kuten kahvipensaan kasvun suhteen hyvin ajoittuvat (säännölliset) sateet, oikea kasvualusta ja -korkeus ja logistiset syyt.

Loppujen lopuksi kysynnän ja tarjonnan lait johtavat aina siihen, että kahvia tuotetaan kullakin maapallon alueella juuri niin paljon kuin vain on kannattavaa. Kahvin suuren kysynnän ja arvon vuoksi potentiaalisia kahvinviljelyalueita onkin niukasti hyödyntämättä.

Ensimmäinen karttani suhteutti kahvin tuotannon pinta-alaan. Toisessa kartassani kyseistä muuttujaa käsitellään absoluuttisena arvona (Kuva 3).

Kuva 3. Kahvin kulutus henkilöä kohti + tuotannon ja viennin suhde tuottajamaiden osalta (Total production of exporting countries, Exports by exporting countries to all destinations, Coffee consumption).

Kuva 3. Kahvin kulutus henkilöä kohti + tuotannon ja viennin suhde tuottajamaiden osalta (Total production of exporting countries, Exports by exporting countries to all destinations, Coffee consumption).

Yllä oleva kartta esittää kahvin tuotannon ja viennin suhdetta maittain. Toisena teemana siinä on koropleettikartalla esitetty kahvin keskimääräistä vuosikulutusta henkilöä kohti maittain.

Havaitaan, että pohjoismaissa juodaan paljon kahvia. Suomessa juodaan kahvijuomia vuodessa noin 12 kilon edestä kahvia. Miksiköhän? Tässä kohtaa ei voi muuta kuin viitata legendaariseen suomi-reggae orkesteriin ja antaa biisin puhua puolestaan. (Olipa kerran aika jolloin Kapteeni Ä-ni oli voimissaan, ja Jukka Poika jaksoi vielä ihmetellä muutakin kuin naishuoliaan)

Kuva 4.

Kuva 4. Histogrammi kahvin vuosikulutuksista kiloissa henkilöä kohti

Histogrammista paljastuu taas kerran selvästi laskeva jakauma (Kuva 4). Päätin tällä kertaa tehdä tasaväliset luokat, tosin hieman venytetyllä ylimmällä luokalla, jottei Suomelle tarvitsisi tehdä omaansa.

Yleistäen voisi sanoa, että kahvi on oikeastaan aika pitkälti länsimaiden juttu, Pohjois-Amerikkaa unohtamatta. Ilmiön kääntöpuolena on mielenkiintoinen huomio: kahvin juonti kahvintuottajamaissa on verrattain vähäistä, Brasiliaa lukuun ottamatta. Tämä voisi johtua esimerkiksi siitä, että tuottajamaissa kaikki ovat saaneet tarpeekseen kahvista. Epäilen kuitenkin, ettei asia johdu siitä. Kahvi lienee yksinkertaisesti liian arvokasta juotavaksi maissa, joissa käteisestä on pulaa. Kyse on myös kulttuurisista eroista. Monissa maissa, joissa kahvia käytetään vähän, juodaan puolestaan enemmän teetä. Jos kahvia ei edes ole tarjolla, on siihen hankala muodostaa riippuvuussuhdetta. Jos kutsutaan teekutsuille, saattaa olla epäkohteliasta alkaa vaatimaan kahvia jne.

Tähän epätasapainoon kahvin juonnin ja tuotannon välillä liittyy suuria ongelmia. Monilla rahakasvien viljelyyn keskittyvillä alueilla on myös nälänhätää. Vaikka kahvi on arvokasta, niin se mitä viljelijä kahvipavustaan saa, on usein vain murto-osa siitä millä pohjoismaalainen suurpaahtimo jauhetun pavun lopulta myy. Samalla, kun kahvin viljely tuottaa onnettoman pientä tuloa paikallisille, on se usein ruoan tuotannon tiellä, kirjaimellisesti. Reilu kauppa yrittää osaltaan lisätä reiluutta tähän kaikkeen, muttei yksistään riitä ratkaisuksi. Vikaa on isoissa maailmanlaajuisissa vaikeasti ymmärrettävissä systeemeissä.

Kartalle on nimetty neljä suurinta kahvin tuottajaa. Näistä itselleni yllättävin oli Vietnam, joka suhteellisen pienellä maa-alallaan onnistuu viljelemään moninkertaisen määrän kahvia esim. perinteisesti tärkeänä “kahvimaana” pidettyyn Kolumbiaan verrattuna.

Palkit jotka kuvaavat viennin määriä ovat mittakaavassa legendassa olevan palkin kanssa. Mikäli olen tulkinnut löytämiäni aineistoja oikein, mikä on täysin mahdollista, on palkkien erotuksena nähtävissä kuhunkin maahan jäävä kahvi. Tähän liittyen onkin mielenkiintoista tarkastella Väli-Amerikan valtioiden erotuksia. Vaikuttaisi siltä, että Guatemalasta viedään enemmän kahvia, kuin mitä tuotetaan. Ensimmäinen ajatukseni oli, että aineistossa tai sen tulkinnassa on oltava virhe. Hetken mietittyäni tajusin kuitenkin, että sitäkin todennäköisemmin Guatemalassa on iso satama, jonka kautta suuri osa lähialueiden kahveista lähtee maailmalle.

Kartoista tuli mielestäni tällä kertaa ihan kivoja, vaikkei niiden tekemiseen kohtuuttomasti aikaa mennytkään. Tekisinkö jotain toisin? Ehkä en, mutta jäi kyllä vähän kutkuttamaan ajatus muutamasta lisäteemasta… Olisi ollut mielenkiintoista tutkia myös kahden tärkeimmän kahvilajikkeen (arabican ja robustan) viljelyn alueellista jakautumista, reittejä joita pitkin kahvi kulkee maailmalla, eroja kahvin keskimääräisissä paahtoasteissa maittain, eri kahvijuomien suhteellisia osuuksia eri maissa jne. En kuitenkaan löytänyt kohtuullisessa googletusajassa tarpeeksi laadukasta dataa em. teemoista, joten tyydyin tuontiin juontiin ja vientiin.

Kurssikerta oli tähänastisista mielekkäin. Oli mukava tehdä karttoja aiheesta, joka todella kiinnosti. Tuntui että Mapinfonkin kanssa työskentely sujui jo miltei leikiten, kommelluksetta. Oli helppo samaistua esimerkiksi Jatta Lahtisen voittajafiilikseen:

“Nyt oli viimeiset mahdollisuudet olla samalla sivulla MapInfon kanssa, ja voin tyytyväisesti myhäillen ilmaista, että YMMÄRSIN koko ajan, mitä olin tekemässä.”

Lähdeluettelo

  • ICO, 2014. Exports by exporting countries to all destinations
    <http://www.ico.org/prices/m1.htm>
  • Kahvi.net, 2014. Kahvin viljely
    <http://www.kahvi.net/index.php?k=110896>
  • ICO, 2014. Total production of exporting countries
    <http://www.ico.org/prices/po.htm>
  • World Resources Institute, 2011. Coffee consumption
    <http://www.wri.org>

KK6 ja seikkailu kentällä

Tällä kurssikerralla pääsimme paikkatietomeiningin ytimeen. Lähdimme ulos gps-laitteen kera keräilemään ennalta valituista aiheista pistemuotoista paikkatietodataa. Ryhmäni kartoitti ulkomainosten sijainteja Kumpula-Arabia -akselilla. Raikas ilma ja kahvi osoittautuivat hyväksi komboksi, ja olo oli mitä mahtavin. Suoriuduimmekin tehtävästä kunnialla. Vedoten vanhaan legendaan kuvista, jotka kertovat enemmän kuin tuhat sanaa, tässä seikkailultamme muutama sellainen:

2014-02-18 08.52.442014-02-18 09.07.45 2014-02-18 08.56.51 2014-02-18 09.03.02 2014-02-18 08.56.392014-02-18 08.49.342014-02-18 09.26.30Kuvat 1-7

Palattuamme luokkaan, oli vuorossa kerätyn aineiston näpytteleminen exceliin ja siirtäminen siitä edelleen Mapinfoon. Mapinfossa tärkein työvaihe oli oikean koordinaattijärjestelmän valitseminen ja aineiston siirtäminen pisteiksi kartalle create points -toimintoa käyttäen.

Emme jääneet sen enempää tuijottelemaan hieman tyhjänpäiväistä aineistoamme Kumpulan ja Arabian ulkomainoksista, vaan siirryimme soveltamaan juuri opittua tekniikkaa taulukkomuotoisen paikkatietoaineiston viemisestä Mapinfoon – aiheena maanjäristykset ja tulivuoret.

Lopputunnin karttapuuhasteluissa hyödynsimme Kalifornian Yliopiston ylläpitämää maailmanlaajuista maanjäristystietokantaa. Tein tietokannasta kyselyn, jolla sain listan kaikista rekisteröidyistä yli 6Mw maanjäristyksistä sitten 60-luvun alun. Ehdot täyttäviä maanjäristyksiä palvelu listasi olevan vajaa kuusituhatta. Pisteiden siirtäminen kartalle ei ollut temppu eikä mikään, kun alkutunnin harjoitusten opit olivat vielä tuoreessa muistissa. Alle vartissa näytölle pamahtikin jo kartta:

Kuva 2.

Kuva 8

Verratessa yllä olevaa karttaa Ilkka Saarisen löytämään karttaan mannerlaattojen rajoista ja liikesuunnista (Kuva 9), on silmiinpistävää, kuinka molemmat jakavat maailmankartan lähestulkoon samanlaisiin osa-alueisiin. Näiden osa-alueiden, mannerlaattojen, reunoilta löytyvät epävakaat, maanjäristyksille alttiit alueet. Laattatektoniikkaa kuvaavaan karttaan on merkitty myös mannerlaattojen liikesuunnat ja nopeudet eri pituisilla nuolilla. Kuten arvata saattaa, on “vauhdikkaimmilla” törmäys- ja alityöntövyöhykkeillä havaittu valtaisat määrät maanjäristyksiä. Maanjäristykset ovat satunnaisempia esimerkiksi rauhallisemmalla Atlantin keskiselänteellä. Kartat 8 & 9 toimivatkin yhdessä erinomaisesti maanjäristysten alueellisen jakautumisen havainnollistamisessa ja selittämisessä.

Kuva 9

Kuva 9

Pistekartta maanjäristyksistä ei kuitenkaan sellaisenaan riitä kuvaamaan alueellisia eroja maanjäristysten määrissä. Se sisältää lähes kuusituhatta pientä pistettä, jotka pienuudestaan huolimatta menevät pahasti päällekkäin maanjäristysherkimmillä alueilla. Koska päällekkäin menevät pisteet eivät aiheuta minkäänlaista visuaalista efektiä, joka kuvastaisi niiden päällekkäisyyttä, on maanjäristysten määrää esimerkiksi Tyynenmeren tulirenkaan tuntumassa mahdotonta arvioida tämän visualisoinnin perusteella. Onneksi ratkaisu tähän oli jo kielen päällä.

Ruututietokanta! KK4:stä oli vierähtänyt jo tovi, ja päällimmäisenä siitä jäi mieleen tyytymättömyyteni silloin tekemääni tilastoruutukarttaan. Karttani vanhusten määristä Vantaalla on niin karkea, että melkein silmiin sattuu. Siispä päätin tehdä maanjäristysteemasta uuden, paremman ruutukartan.

Hain ensin vähän tuntumaa tietokoneen sisuskalujen ja ohjelmiston asettamista käytännön rajoitteista. Koska ns. big data on muodikas ja hieno juttu, yritin ensin luoda ruututietokannan 20:llä miljoonalla solulla. Mapinfo mietti ja mietti. Jatkoi miettimistään. Ja lopulta kaatui.

Jouduin luopumaan suurista haaveistani, ja päädyin lopulta karkeahkoon 190 km ruutuleveyteen. Näin muodostui maltillinen, vajaan 24:n tuhannen solun tietokanta, joka näytti tietokoneen ruudulla hieman kartan päälle asetetulta ohuelta pellavakankaalta. Mapinfo ei enää osoittanut epävakauden merkkejä, ja tietojen yhdisteleminen juuri luotuun tietokantaan sujui ongelmitta.

Kuva 8.

Kuva 10

Ruutuihin osui odotetusti hyvinkin vaihtelevia määriä maanjäristyksiä. Tutkin aineiston histogrammia Aleksi Raution linkkaamalla histogrammityökalulla, ja kuten arvasin, oli jakauma selvästi laskeva (Kuva 10). Vähäjäristyksisiä ruutuja on ollut huomattavasti enemmän kuin “järistysrikkaita” ruutuja. Käytin teemakartassa luokkaväleinä Mapinfon “erikoiskvantiileja”, jotka mielestäni parhaiten toimivat tämän laskevan jakauman havainnollistamisessa kartalla. Toinen vaihtoehto olisi ollut käyttää tasavälisempiä luokkia. Niillä alueelliset erot maanjäristysten määrissä eivät olisi korostuneet niin paljoa, mutta toisaalta eroja olisi ollut myös hankalampi erottaa kartalta. Olen kaiken kaikkiaan ihan tyytyväinen tuottamaani karttaan (Kuva 11). Siitä ilmenee selvästi missä maanjäristyksiä on ollut kymmenittäin, missä muutamia ja missä ei juuri lainkaan.

Kuva 11

Se mihin kartta ei ota kantaa, on maanjäristysten voimakkuus. Pohjalla oleva pistekartta käsittää eri voimakkuuksisia järistyksiä kuudesta momenttimagnitudista aina kymmentä lähenteleviin megajäristyksiin. Momenttimagnitudiasteikon logaritmisuudesta johtuen, em. välillä puhutaan kymmen- ja tuhatkertaisista eroista voimakkuuksissa. Tämän olisi voinut ottaa huomioon laittamalla kartalle erillisinä pisteinä esim. kaikki yli 8Mw suuruiset järistykset. Itse asiassa muistan jossain vaiheessa tällaisen kartan olleenkin ruudulla, mutta enpä tullut tallentaakseni sitä erillisenä kuvana. Työläämpi, mutta ehdottomasti tyylikkäin tapa olisi ollut laskea jonkinlainen ruutukohtainen maanjäristysindeksiluku, joka ottaisi huomioon sekä maanjäristysten määrän, että voimakkuuden. Luku kuvastaisi siis maanjäristysten todellista “järistysvaikutusta” kyseisellä alueella. Tämä olisi kuitenkin vaatinut syvällisempää tietoutta maanjäristysten maata järisyttävistä mekanismeista (järistysten kestosta, syvyydestä jne), joten tyydyin vain jälkiviisastelemaan aiheesta täällä näin.

Keskustelin kartastani Aleksi Rikkisen kanssa ja päädyttiin siihen, että siinä on eräs projektion aiheuttama pulma; ruutujen alle jäävät pinta-alat pienenevät päiväntasaajalta napa-alueita kohti liikuttaessa. Teoriassa tämä vääristää hiukan ruutujen saamia maanjäristyslukemia. Mikäli pohjakartta olisi ollut Mollweiden projektiolla, ei tätä ongelmaa olisi päässyt syntymään. Käytännössä projektion vaikutus koropleettikartan väritykseen tuskin olisi kuitenkaan ollut dramaattisen suuri.

Seuraavaksi oli tulivuorten vuoro päästä kartalle. Lista vuoden 1964 jälkeisistä tulivuorenpurkauksista sijaintitietoineen löytyi sekin kätevästä rapakon takaisesta verkkopalvelusta. Tulivuoret pamahtivat kartalle pitkälti samanlaisten työvaiheiden kautta kuin maanjäristyksetkin (Kuva 12). Koska niitä ei ollut kuin parisen tuhatta (en muista tarkkaa lukua), mahtuivat ne kohtalaisen hyvin maanjäristysruutujen kanssa samalle maailmankartalle (Kuva 13). Jälkimmäinen kartta havainnollistaa mielestäni mainiosti sitä minkälainen suhde maanjäristys- ja tulivuoririkkailla alueilla on toisiinsa; niillä on useimmiten taipumusta asettua päällekkäin.

Kuva 12

Kuva 12

tulivuoretkin

Kuva 13

KK5: buffereita yms

Tämän kurssikerran teemana oli bufferointi. Se osoittautui oikein mukavaksi puuhaksi. Ideana oli luoda vyöhykkeitä erilaisten objektien ympärille. Näiden vyöhykkeiden alueilta oli sitten mahdollista valita kohteita ja laskea niistä erilaisia tietoja. Toisaalta kurssikerta oli myös eräänlainen tähän asti opittujen tietojen ja taitojen soveltamistesti, kuten Samuli Massinen blogissaan luonnehtii. “Olemme tähän asti käyttäneet MapInfoa pääasiassa teemakarttojen luomiseen sekä tiedon visualisointiin, mutta nyt keskityimme enemmän aineiston tutkimiseen, laskemiseen ja analysointiin.”

Kurssikerran aikana kävimme läpi muutamia bufferoinnin soveltamismahdollisuuksia harjoitusten muodossa. Tässä lista harjoitusten aiheista:

  • Pornaisten teiden ja julkisten palveluiden vaikutusalueita
  • Malmin lentoaseman melualueella asuvien määriä
  • Helsinki Vantaan lentoaseman melualueella asuvien määriä
  • Juna-asemien vaikutusalueita Vantaalla

taulukko-tuloksista-Sheet1.pdf

Bufferointia apuna käyttäen olisi mahdollista tutkailla erilaisten palveluiden riittävyyden (vaikutusalueiden) lisäksi myös esim. konserttien kuuluvuusalueita ja vaikkapa erilaisten langattomien verkkojen tukiasemien peittoalueita.

On ilmeistä, että bufferointi on verrattoman hyödyllinen menetelmä juuri vaikutusalueellisten ilmiöiden tarkastelussa. Sen tarjoamia mahdollisuuksia kuitenkin rajoittavat/kasvattavat piirustustyökalujen ominaisuuksiin liittyvät seikat, hyödynnettävän aineiston monipuolisuus, ja paikkatieto-ohjelman analysointityökalut. Mikäli aineistossa on jo valmiiksi sijaintitiedot bufferoinnin lähtökohdiksi haluttavista kohteista, kuten vaikkapa sairaaloista, nopeuttaa se huomattavasti suurten kysymysten vastausten selvittämistä.

Tällainen suuri kysymys voisi olla vaikkapa koko väestön keskimääräinen etäisyys lähimmästä sairaalasta. Luulisin, että vastauksen selvittämisessä olisi periaatteessa mahdollista hyödyntää bufferointia. Ensin tarvittaisiin aineisto maan kaikkien sairaaloiden sijainneista. Kaikille sairaaloille tehtäisiin samansuuruiset puskurivyöhykkeet ja näiden alueella asuvien ihmisten määrää tutkittaisiin eri vyöhykekoilla. Tässä tulisi tietysti vastaan ongelma ihmisten joutumisesta useamman vyöhykkeen alueelle. Olisi saatava sellainen lisäehto toteutettua, että kukin ihminen lukeutuisi vain lähimmän puskurivyöhykkeen “laskuihin”. Toinen haaste olisi kehittää bufferien luontiin ja ihmisten laskemiseen jonkinlainen makro, automatisoitu prosessi, joka tuottaisi tiedon eri etäisyyksillä asuvien ihmisten määristä. Näillä määrillä kerrottujen etäisyyksien yhteenlaskulla, ja jakamisella ihmisten lukumäärällä, saataisiin keskiarvo vähän samaan tapaan kuin keskiarvo noin yleisesti ottaen muutenkin lasketaan. Eri asia onkin sitten mihin saatua tietoa käytettäisiin. Ainakin sen vuosittaisia muutoksia olisi ihan mielenkiintoista tarkastella. Niin tai näin, olisipahan sekin yksi bufferoinnin hyödyntämiskohde, vaikkei ehkä kovinkaan luonteva. Keskietäisyyden laskemiseen olisi varmasti olemassa jokin kätevämpikin keino. Sellainen jossa jollain yksinkertaisella komennolla laskettaisiin jokaisen rakennuksen (asukkaiden) etäisyys lähimmästä sairaalasta ja tuloksesta otettaisiin keskiarvo.

Asiasta kukkaruukkuun; tällä kertaa tuntui, että nyt alkaa olemaan hanskassa (tai jos nyt ei ihan hanskassa, niin ainakin käsien ulottuvilla) sellainen paletti työkaluja ja menetelmiä, että ainakin periaatteessa osaisin tehdä vaikka minkälaisia karttoja. Eri asia onkin sitten kuinka hyvin muistan kaikki tunneilla käydyt toimintojen asetukset ja muut pikkujutut ulkoa. Onneksi Mapinfossa on se hauska puoli, että yleensä valikkojen tekstit ja toiminnot on nimetty kyllin osuvasti niiden käytön onnistumisen kannalta. Ja vaikkei kaikki aina onnistukaan, niin kantapään kauttahan sitä oppii melkeinpä paremmin – ainakin silloin kun kärsivällisyyttä riittää. On kätevää, että vaikka tekisi jonkin mitättömän pienen, mutta harkitsemattoman virheliikkeen, niin koko karttaprojektin voi aina tarvittaessa aloittaa alusta ja yrittää muistaa olla kompastumatta uudestaan samaan virheeseen.

Oman kartan aiheeksi valitsin harjoitusmonisteesta pk-seudun lähitulevaisuudessa putkiremontin tarpeessa olevat talot. Kartan laatiminen oli opettavainen prosessi, jossa tuli kerrattua ja opeteltua lähes kaikkea tähän mennessä opeteltua. Vasta nyt alkoi olla täysin selvää miten taulukoiden luominen ja yhdisteleminen, sarakkeiden lisääminen ja SQL-select toimivat. Etenkin viimeksi mainitun “työkalun” monipuolisuus on vasta aivan viime aikoina alkanut hahmottumaan.

Kartan (Kuva 1) aineistona toimii jälleen kerran pk-seudun rakennustietokanta. Jokaista rakennusta vastaa piste kartalla, ja kustakin on kymmeniä sarakkeita rakennus- ja asukastietoja. Tehtävänannon mukaan vuosien 65-70 välillä rakennettuja taloja odottaa lähitulevaisuudessa putkiremonttien aalto, mitä ajatellen oli tarkoitus tehdä kartta esim. putkiremonttifirman iloksi. Perustin uudet tietokannat kyseisenä ajanjaksona rakennettuja rakennuksia varten, ja uuden sarakkeen näiden suhteellisia osuuksia jokaisen pienalueen yhteenlaskettuihin rakennuksiin nähden.

Kuva 1.

Kuva 1.

Vaikka kartassani olisi vielä hiottavaa, on se tähän mennessä tekemistäni selvästi paras. Se perustuu suureen määrään informaatiota, mutta on silti kohtalaisen selkeä ja informatiivinen. Putkiremonttien kannalta otollisimmat alueet erottuvat selvästi punaisena. Jakauma osuuksista oli laskeva. Päätin selkeyden vuoksi tehdä (vaihteeksi) samasuuruiset luokkavälit, jolloin jakauman luonne (Kuva 2) ei vääristy karttaa luettaessa.

Kuva 2.

Graafinen lopputulos ei kuitenkaan ihan vastaa sitä minkälaisen tekisin, jos uudestaan tekisin. Valkoiset lähempänä 0%:aa olevia arvoja saavat alueet olisi ihan hyvin voinut sisällyttää alimpaan, keltaiseen luokkaan. Tai ainakin valkoisten alueiden aluerajat olisi voinut laittaa näkyviin. Mittakaavaksi asetin tasan 5 km, mutta jostain syystä layout-ikkunaan vietäessä mittakaavan lukema muuttui – tyylivirhe sekin.

Alueiden saamia tarkkoja remontoitavien asuntojen määriä en saanut kartalle näkyviin, mutta toisaalta kyseisen tiedon tuoma lisäarvo tuskin olisi ollut päätä huimaavan suuri tässä tapauksessa. Nythän on niin, että jos kävelee punaisen värin saavalla alueella, niin sattumanvaraisesti valittu rakennus todennäköisesti on ennemmin kuin myöhemmin putkiremontin tarpeessa. Mikäli remonttifirma ei jaksaisi panostaa mainonnan suunnitteluun sen kummemmin, voisi se lähettää punaisille alueille mainoksen vaikka jokaiseen taloon.

Tätä kirjoittaessa soi Aamumusaa

KK4: ruututietokantajuttuja

Neljännen kurssikerran aiheena oli tietojen yhdistäminen itse luotuun ruututietokantaan annetusta paikkatietoaineistosta.

Harjoitusten ja itsenäistyön tärkein opetus oli update columns -toiminnon ymmärtäminen. Lähes kaikki Mapinfolla tehtävät karttaesitykset ja tutkimukset perustuvat taulukkomuotoisiin aineistoihin. Ymmärrys niistä mahdollisuuksista, joita taulukkojen yhdisteleminen toisiinsa avaa onkin ehkä tärkein taito mitä tähän mennessä olen oppinut. Se että perustamaansa taulukkoon pystyy lisäämään/laskemaan juuri halutut tiedot haluamaltaan alueelta, antaa vapauden tehdä juuri sellaisia karttaesityksiä (/tutkimuksia) kuin itse haluaa. Tämä onkin ehkä hienointa Mapinfossa, vapaus tietojen pyörittelyssä on esimerkiksi graafisen suunnittelun “vapauteen” verrattuna aivan omaa luokkaansa.

Haasteellista tässä harjoituksessa oli asioiden tekeminen tismalleen oikeassa järjestyksessä, juuri oikeat asetukset voimassa. Tämäkin meni kyllä nopeasti jakeluun ihan vain keskittymällä koko ajan siihen mitä oli tekemässä. Ohjeiden pilkuntarkan seuraamisen huomasin haittaavan asioiden omaksumista. Tavoitteenahan olisi saavuttaa taitotaso jonka turvin pystyisi itsenäisesti tekemään ties mitä, kaikkea aikaisemmin opittua soveltaen. Yritinkin lukea tarkkoja työohjeita mahdollisimman paljon vasta jälkikäteen, tarkistusmielessä.

Yksi asia mitä en vielä täysin hahmottanut, on update columnin takaa löytyvän join -valikon vaihtoehdot: within ja contains. Niiden käyttö onkin tähän asti sujunut parhaiten ihan vain kokeilemalla. Jonkinlaista intuitiivista kutinaa oikean vaihtoehdon valitsemiseksi olen kuitenkin jo havainnut. Uskoisin näiden selkiytyvän pian.

Tein ruututietokannan ja kartan Vantaalla asuvien vanhusten määristä (kuva 2). Siitä tuli aikamoinen. Ruutujen saamat värit perustuvat tasamääräisiin luokkiin, joilla alueelliset erot vanhusten määrissä korostuvat, mutta eivät silti suoranaisesti vääristy. Aineiston jakauma on laskeva (kuva 1). Pienoiseksi ongelmatapaukseksi muodostuu ylin luokka, joka saa arvoja niinkin laajalla skaalalla kuin 51-486. Tummimman sinisen värin saavilla ruuduilla saattaa siis olla suurestikin toisistaan poikkeavia määriä vanhuksia. Jos nyt tekisin kartan uudestaan, miettisin myös luokkajakoa uudestaan – siten, että viimeiseen luokan sisällä olisi vähemmän vaihtelua. Tähän auttaisi esim. tasaväliset luokat, tai jonkinlainen kompromissi niiden ja kvantiililuokkien välillä.

Kuva 1.

Kuva 1.

Kuva 2.

Kuva 2.

 

Kartan luettavuus ja hyödyllisyys paranisi, jos siihen lisäisi esim. tärkeimmät tiet ja paikannimet. Silloin “väritetty ruututietokanta” ei jäisi ikään kuin vain irralliseksi informaatioksi, pelkäksi “pikselitaiteeksi”.

Loppuhuomautuksena mainittakoon, että musiikiton bloggailu on melko ikävää puuhaa. Musiikin merkityksen onnistuneen bloggailukokemuksen kulmakivenä nostaa blogissaan esille myös Aino-Maija Määttänen.

Musiikin kera bloggailu on toisinaan jopa oikein mieluisaa puuhaa. Olen huomannut, että parhaiten ennen iltapäivää tapahtuvia bloggailuja on tukenut esim. lämminhenkinen pianomusiikki. Iltapäivän jälkeen, kun aamukahvin vaikutus alkaa hiljalleen haihtumaan, on ollut tarkoituksenmukaista siirtyä johonkin piristävämpään musiikkiin. Kun aurinko lopulta painuu taivaanrannan taa, on uupumustaso yleensä jo pahanlainen. Viimeistään silloin onkin syytä lisätä desibelejä siinä määrin, että naapuritkin osaavat varautua seuraavaan postaukseen. Tähän tilanteeseen voin varauksetta suositella vaikkapa nostalgista, mutta silti niin ajatonta Gorillazia.

KK3: tietokantoi ja tulvakartta

Kolmas kurssikerta oli tähänastisista kivuttomin.

Aiheena oli tällä kertaa tietokantojen muokkaus ja yhdistely. Kävipä kuitenkin niin, että kurssikerran sijoittuminen aivan aamuyön tuntumaan ei tuona kyseisenä aamuna oikein käynyt järkeen. Nukuinpa siis pommiin. Tehtävät jäivät odottamaan parempaa hetkeä, joka oli saapuva noin kolme viikkoa myöhemmin. Välissä kerkesin tehdä kurssikertojen 4, 5 ja 6 kartat ja blogit.

Tietojen pyörittely tietokannoissa oli tässä vaiheessa jo siinä määrin tuttua puuhaa, ettei asioiden itsenäinen opiskelu tuottanut ongelmia. Uusina asioina opin nyt yhdistelemään sarakkeita ja myös erillisiä tietokantoja toisiinsa, yhteisten “nimittäjien” perusteella. Kyse oli siis sekä yleistämisestä (sarakkeiden vähentäminen), että tietojen syventämisestä (rivien lisääminen).

Harjoitustehtävien aineistot käsittelivät Afrikan timanttikaivoksia, öljykenttiä, netinkäyttäjiä ja konfliktialueita. Näiden väliltä olisi mielenkiintoista tutkia erilaisia yhteyksiä. Koska aika oli etenkin tuona nimenomaisena torstaina kovin rajallista (Suomen välieräottelu alkamassa), ja tyhjässä gis-luokassa piinaavan yksinäistä, en jäänyt kovin pitkäksi aikaa näiden mahdollisia syy-seuraus-suhteita miettimään, saati sitten kartoin osoittelemaan.

Siirryin kurssikerran itsenäistehtävän pariin. Niiden aiheena oli Suomen tärkeimpien valuma-alueiden järvisyysprosentit ja tulvaindeksit. Hyvänä kertauksena pääsin taas kopioimaan sarakkeita tietokannasta toiseen ja laskemaan uusiin sarakkeisiin tietoja aineiston muista sarakkeista.

Tietokantojen parissa säätäminen ei vienyt kohtuuttomasti aikaa ja päätinkin tällä kertaa panostaa kartan visuaaliseen ilmeeseen enemmän kuin koskaan aikaisemmin. Lopputuloksena olikin ihan kelpo kartta (Kuva 2).

Histogrammi eri valuma-alueiden tulvaindekseistä oli laskevahko, mutta silti hiukan epämääräinen (Kuva 1). Annoin Mapinfon laskea luokkavälit luokkien tasamääräisyyksiin pyrkien. Oletuksena tulleet luokkavälit olivat hyvä lähtökohta, mutta jouduin hieman tuunaamaan yläpäätä. Halusin nimittäin erottaa tulvaindekseiltään korkeimmat valuma-alueet kartalle. Lopputuloksena syntyi mielestäni kelpo kompromissi, joka on omiaan tulvaindeksin ja järvisyyden yhteisvaihtelun kuvaamiseen.

Kuva 1

Kuva 1

Ylin luokkani on kuitenkin todella laaja (350-1100), eivätkä sen sisäiset vaihtelut erotu kartalla millään tavalla. Aleksi Rikkinen ratkaisi tämän pulman nimeämällä suurimman tulvaindeksiarvon (1100) saavan Aurajoen erikseen kartalle. Päätin tehdä samoin. Aurajoen saama tulvaindeksiarvo on kuitenkin niin poikkeuksellisen suuri, että olisi harmillista jos se kvantiililuokkien takia hukkuisi samaan luokkaan melkein 1000 yksikköä pienempiensä kanssa.

Kuva 2

Kuva 2

Kartan viesti on kaikessa yksinkertaisuudessaan se, että tulvaherkkyydellä (tulvaindeksi korkea) ja vähäjärvisyydellä on monesti taipumusta esiintyä samoilla alueilla.

Rannikkojen suurempaa tulvaherkkyyttä selittäviä asioita:

  • vesivarastoina toimivien järvien vähäisyys
  • maaston suuremmasta gradientista johtuvat suuremmat virtausnopeudet
  • -> suuremmat virtaamat
  • rannikkojen tiivis rakentaminen heikentää maan vedenläpäisykykyä
  • merivesitulvien mahdollisuus myrskytuulien tai matalapaineiden aiheuttamana
  • suurempi sateisuus rannikkoalueilla

KK2 ja artikkelireaktio

Anna Leonowiczin kirjoittama artikkeli “Two-variable choropleth maps as a useful tool for visualization of geographical relationship” käsittelee kahden muuttujan koropleettikarttojen ja yksinkertaisten koropleettikarttojen vahvuuksia ja heikkouksia. Lopputulemana todetaan, että kahden muuttujan koropleettikartat ovat oikein tehtyinä hyviä muuttujien välisten riippuvuussuhteiden tarkastelussa, ja toisaalta normaalit koropleettikartat taas vahvimmillaan alueellisen jakautumisen kuvaamisessa. Ensimmäisenä mainitun todetaan kuitenkin olevan haastavampi karttalaji sekä tehdä, että tulkita. Artikkelin päätelmät perustuvat pitkälti tutkimukseen, jossa 128 maantieteen oppilasta tekivät erilaisia kartantulkintatehtäviä sekä kahden, että yhden muuttujan koropleettikartoilla, jonka jälkeen heiltä kysyttiin lomakkeella mielipiteitä karttojen ominaisuuksista.

Omat kokemukseni kahden muuttujan teemakartoista eivät ole kovin runsaslukuisia. Tätä artikkelia lukiessa niitä tulikin tutkiskeltua enemmän kuin viime vuosina yhteensä. Kiinnostus niitä kohtaan kuitenkin heräsi.

Lukiessa oli helppo olla samaa mieltä kirjoittajan kanssa. Kahden muuttujan koropleettikartat ovat tosiaan herkästi hiukan vaikeaselkoisia. Tämä on tietysti jossain määrin väistämätöntä, sillä ne esittävät moninkertaisen määrän tietoa samankokoiselta alueelta tehtyyn yhden muuttujan koropleettikarttaan verrattuna. Onkin ilmeistä, että molempien muuttujien tieto olisi esitettävä mahdollisimman selkeällä tavalla, jotta kartasta olisi mahdollista tutkailla myös näiden muuttujien välisen mahdollisen yhteisvaihtelun luonnetta.

Se, että parhaan lopputuloksen saavuttamiseksi aineisto on molempien muuttujien osalta jaettava juuri kolmeen luokkaan, oli hauska yksityiskohta. Asian tiimoilta on artikkelin mukaan tehty enemmänkin tutkimusta. Luokkien määrän vaikutusta legendojen luettavuuteen havainnollistetaan myös erilaisilla legendoilla.

Vaikka “tuplateemainen” kartta olisi tehty kuinka hyvin ja selkeäksi, tarvitsee se silti vierelleen hyvän legendan. Kuten Millakin blogissaan kirjoittaa, on kartan lukijan aloitettava kartan tulkinta legendan tutkimisella. Legendan merkitys kartan luettavuuteen onkin selvästi suurempi yksinkertaisempiin karttoihin verrattaessa.

Idea legendasta, joka koostuu läpikuultavista väripalikoista, ja niiden yhdistelminä syntyvistä sävyistä, ei välttämättä johda hankalaselkoisuuteen. Tällainen legenda voi sisältää paljonkin tietoa ilman, että siitä tulee mahdoton tulkita. Johanna Hakanen ottaa blogissaan esille teorian lineaarisesta regressiosuorasta. Ja toden totta, kun asiaa tarkemmin miettii, voi tällainen “ruudukkolegenda” tosiaan toimia myös alustana mahdolliselle regressiosuoralle. Legendasta voidaan ottaa kaikki irti, kun kahden muuttujan koropleettikartan jokainen pienalue ajatellaan pisteinä, jotka kukin saavat arvon kahden muuttujan suhteen. Legenda toimiikin ikään kuin koordinaatistona erilaisille pistejoukoille. Mikäli kahden muuttujan välillä esiintyy lineaarista korrelaatiota, on kyseisen pistejoukon pohjalta myös mahdollista muodostaa regressiosuora.

Artikkelissa puhutaan tieteellisin termein, jatkuvasti kuviin ja tutkimuksiin viitaten asioista, joita itse ei ole sen kummemmin koskaan pysähtynyt miettimään. Mapinfossa on ollut helppo vain testailla erilaisia vaihtoehtoja luokkien määrissä ja värityksissä ja päätyä johonkin mahdollisimman ymmärrettävän näköiseen ja järkevään ratkaisuun. Artikkelin tieteellinen ja analyyttinen ote aiheeseen olikin hauskaa vastapainoa kaikelle sille käytännönläheisyydelle millä tähän mennessä olen aihepiireihin pintaraapaisuja tehnyt.

KK2; teemakarttoja “tuplamuuttujilla”

TSÄDÄÄM!

Aamukahvi maistui hyvältä. Tuntui, että tänään pystyisin mihin vain.

Homma lähti rullailemaan iloisesti eteenpäin valkokankaalle heijastetun power-point esityksen siivittämänä. Teemana oli “tuplamuuttujilla” varustetut teemakartat. Kävimme läpi erilaisia teemakarttavaihtoehtoja ja teemakarttapareja. Näistä jännittävin oli tilastokeskuksen ruututietokantaan perustuvan 3d -kartan luominen Mapinfolla. Se tosin osoittautui koneelleni sen verran vaativaksi tehtäväksi, että ohjelma päätti potkaista tyhjää. Kokeilin uudestaan ja sillä kertaa homma toimi! Sain kuin sainkin ruudulleni huikean koko suomea esittävän piikikkään asukastiheyskartan. Karttaa saattoi pyöritellä ruudulla mielivaltaisesti, joskin kömpelösti.

Loppuhuipennuksena oli tuttuun tapaan oman tuplamuuttujallisen teemakartan laatiminen. Aihe, alue ja esitystapa (-tavat) olivat vapaavalintaisia. Päätin tehdä kartan Oulun seudun kuntien bisnesmeiningeistä (Kuva 1).

Pohjalla on koropleettikartta alueen kuntien yritysten määristä. Luokkavälit perustuvat tasamääräisyyksiin. Siispä jokaisessa luokassa on sama määrä havaintoja. Välitys perustuu histogrammin pohjalta tehtyyn melko syvälliseen pohdiskeluun. Jakauma on varsin epämääräinen (Kuva 2) ja siksi kvantiilit toimivatkin eräänlaisena kompromissina aineiston havainnollistamisessa.

Kuva 1.

Kuva 1.

Kuva 2.

Kuva 2.

 

Koropleettikartan päälle on isketty palikoita, jotka kuvaavat asuntojen ja kesämökkien lukumääriä. Lukumäärät vaihtelevat sekä vähemmän, että enemmän, kuin mitä kartta antaa ymmärtää. Tämä johtuu siitä, että palikat on suhteutettu toisiinsa neliöjuuriasteikolla. Ongelma palikkojen mahtumattomuudesta kartalle ja toisaalta pienten palikkojen katoamisesta omaan pienuuteensa tuli näin kierrettyä, palikkojen totuudenmukaisuuden kustannuksella. Kartan luettavuus meneekin tässä totuudenmukaisuuden edelle. Palikoista näkee helposti missä kesämökkejä on paljon ja missä vähän. Myös kesämökkien ja asuntojen määrien suhde toisiinsa on jokaisen kunnan osalta nähtävissä nopealla vilkaisulla.

Kompastuin samaan sudenkuoppaan kuin ensimmäisenkin koropleettikarttani kohdalla. Osa-alueiden väritys perustuu vain ja ainoastaan niiden saamiin absoluuttisiin arvoihin yritystoimipaikkojen määrästä. Pulma liittyy isojen ja pienten kuntien välisiin kokoeroihin. Isoilla alueilla (kunnilla) on ns. kokoetua pienempiin alueisiin verrattuna. Sen takia ne todennäköisesti sisältävät enemmän yritystoimipaikkoja kuin pienet alueet, ja saavat näin järjestään tummempia sävyjä, isommilla yritysmäärillään. Tämä on epäreilua pienempiä alueita kohtaan, sillä minkäs ne pienuudelleen mahtavat. Suuntaa antavuus toteutuu tälläkin kertaa, mutta parempaankin olisin pystynyt.

Punaiset alueet eivät siis väistämättä kerrokaan siitä, että niiden alueella olisi yrityksiä jotenkin erityisen tiheästi. Väritykset ovat silti suuntaa antavia sen suhteen, missä yrityksiä ylipäätään on ja missä ei. Toinen (pikku)vika kartassa on janamittakaavan alle kummittelemaan jäänyt suhdeluku, joka erinäisten zoomailujen takia ei tuskin enää pidä paikkaansa.

Ongelmat tajuttuani yritin tietysti pelastaa tilanteen avaamalla viimeisimmän workspace -tiedostoni (joita olin luonnollisesti (tämä ei ole sarkasmia!) tallentanut tehtävän eri vaiheissa). Kuinka ollakaan, sen aukeaminen ei sujunutkaan ihan niin kuin olin toivonut. Ei sinne päinkään. Ruudulle ilmestyi lähes koskemattoman näköinen työtila, joka muistutti sitä tilannetta mihin olin jäänyt suunnilleen yhtä paljon kuin liito-orava muistuttaa leivänpaahdinta.

Koska aika on rajallista, päädyin jälleen kerran vain toteamaan karttani puutteet enkä tekemään sitä alusta lähtien uudestaan. Varoittava esimerkki toimii toki hyvin jutun juurena, mutta vakaana aikomuksenani on tuottaa jatkossa myös selvästi järkevämpiäkin karttoja.

Tämän kartan tulkinta on pidettävä sen puutteiden ja yksinkertaisuuden takia maltillisena. Kartta kertoo hyvin yleisellä ja yleistetyllä tasolla siitä, missä Oulun seudun kuntien alueella yritystoimipaikkoja on paljon ja missä vähän, ja toisaalta siitä minkälaisia suhteita arki-asuntojen ja vapaa-ajan asuntojen määrillä missäkin on. Näihin aiheisiin liittyviä teemoja ja soveltamiskohteita ovat mm. pendelöinti, työllisyys, tuotannon määrä, työttömyys, kaavoitus ja rakentaminen. Tarvittaisiin kuitenkin lukuisia muitakin karttoja, ja parempia karttoja, jos em. teemoista haluttaisiin todella sanoa jotain.

Vaikuttaisi siltä, että asuntojen määrä suhteessa kesämökkien määrään on sitä suurempi, mitä enemmän alueella on yritystoimipaikkoja. Vastaavasti alueilla joissa on vähän yritystoimipaikkoja näyttäisi olevan verrattaen vähän asuntoja suhteessa kesämökkeihin, jopa niitä vähemmän. Yritystoimipaikat ovat sijoittuneet hyvien liikenneyhteyksien varrelle ja ilmeisesti myös jotakuinkin sinne missä asuntoja on paljon.

Mielenkiintoisessa valossa esiintyy Yli-Iin kunta. Sillä on ympäröiviin kuntiin verrattuna reippaasti vähemmän kaikkia mitattuja arvoja: asuntoja, mökkejä ja yritystoimipaikkoja. Yritystoimipaikkojen määrän suhteen on kuitenkin taas huomioitava kunnan pieni koko. Esimerkiksi vieressä oleva Pudasjärven kunta kuuluu yritystoimipaikkojen määrän osalta korkeimpaan luokkaan varmasti suurelta osin vain sen takia, että se on niin iso paikka. Käytännössä Pudasjärvellä voi siis hyvinkin olla yrityksiä ihan yhtä harvakseltaan kuin edellä mainitussa Yli-Iin kunnassa.

Yhteiselo Mapinfon kanssa sujui edelliskertaa paremmin. Pidin pääni kylmänä, enkä tehnyt (ainakaan paljoa) hätiköityjä liikkeitä. Tallensin työtilan vähän väliä, vaikkei siitä mitään hyötyä ollutkaan. Lopputuloksestakin tuli jo (ainakin hiukan) nätimpi.

Kyse oli loppujen lopuksi ennen kaikkea siitä, minkä Pyrykin blogikirjoituksensa lopussa toteaa;

“Harjoitus oli erittäin hedelmällinen oppimiseni kannalta. Ensikäden kokemus haasteista ja niiden ratkaisemisesta jättivät selkeän kuvan siitä, mitä kannattaa ja mitä ei kannata tehdä käytössämme olevilla ohjelmistoilla.”

Tutustumisleikkejä Mapinfon kanssa

PAM!

Ennen kaikkea jännää on syytä hieman valaista mistä oikein on kyse. Tämä tässä on kurssiblogi. Kurssin nimi on Paikkatiedon hankinta, analyysi ja kartografia (PAK/PHAK). Kurssin tarkoituksena on tutustuttaa meidät paikkatietojen ihmeelliseen maailmaan. Opettelemme käyttämään erilaisia paikkatieto-ohjelmia ja tuottamaan niillä mitä jännittävimpiä karttaesityksiä. Siinä sivussa on tarkoitus tutustua myös bloggailun ja verkostoitumisen ihmeellisiin maailmoihin.

Tarinamme alkaa aamusta.

Olipa kerran synkkä ja hyytävä tiistai aamu. “PAK” -kurssin ensimmäinen kerta. Homma lähti kätevästi lapasesta heti alkuun. Myöhästyin bussista ja unohdin aamupalan. Siinä missä kahvi toisinaan oikein kihahtaa päähän, ei tuona kyseisenä tammikuun aamuna niin käynyt. Kahvi parhaimmillaankin vain piti hereillä. Viikonlopun jälkimainingeissa gis-luokkaan pääseminen oli jo itsessään jonkinasteinen saavutus.

Kurssikerran teemana olikin yllättäen itsenäinen tutustuminen Mapinfoon, opettajan sairastumisen vuoksi. Kävimme  läpi ohjelman perustoiminnallisuutta ja työkaluja. Ne tuntuivat suhteellisen helpoilta omaksua.

Kurssikerta huipentui oman koropleetti-teemakartan tekemiseen (Kuva 2). Päätin tehdä sellaisen tarhaikäisten määristä eri asuinalueilla Helsingissä. Kartta perustuu kurssia varten annettuun paikkatietoaineistoon. Tutkin aineistoa ensin ohjeessa olleen linkin takaa löytyneellä histogrammipalvelulla. Histogrammista tuli jokseenkin vino (Kuva 1). Päätin käyttää luokitteluna kvantiileja, jolloin jokaiseen luokkaan tulisi (ainakin lähes) sama määrä arvoja. Näin eri alueiden väliset erot korostuvat parhaiten. Pienenä miinuksena tässä on se, että alueet joilla on vähän tarhaikäisiä saavat useamman luokan, vaikka erot määrissä eivät verraten suuria olisikaan. Tällä nimenomaisella aineistolla kyseinen ongelma esiintyy kuitenkin hyvin pienenä, sillä histogrammi on vain vähän vino.

Eetu Summanen on kuvannut kk1:n kartallaan Helsingin asukastiheyksiä, ja saanut histogrammityökalulla aineistostaan varsin samankaltaisen, joskin jyrkemmän, vinon jakauman. Hän on luokittelussaan päätynyt myös tasamääräisiin luokkiin, niiden tuodessa alueiden väliset erot varmimmin esille.

Kuva 1. Histogrammi aineistosta

Kuva 2.

Kuva 2. Koropleettikartta tarhaikäisten määristä Helsingin eri asuinalueilla

Kuva 3.

Kuva 3. Rgb -väriavaruus

Lisäsin kartalle pohjoisnuolen ja mittakaavan. Molempiin löytyi valmis työkalu erään Mapinfon valikon takaa. Kartasta tuli loppujen lopuksi varsin epämiellyttävä. Pohjoisnuoli on kummallisesti aivan Hakunilan tuntumassa, eikä ylempänä missä se näyttäisi paremmalta. Väriskaalakin on hieman epäselvä, ainakin kun käytössä on viisi luokkaa. Luokat toki erottuvat, mutta niiden keskinäinen “järjestys” ei karttaa tarkastelemalla ole kovin selvä. Ongelman aiheuttaa punaisen ja sinisen väliin jäävän väriasteikon suppeus;  mikään väliin jäävistä sävyistä ei sisällä lainkaan vihreää. Väliin jääkin vain pieni joukko ankeita lilan ja violetin sävyjä (Kuva 3). Neljällä luokalla nämäkin olisivat saattaneet toimia, eikä kartan informatiivisuus olisi siitä juuri kärsinyt.

Toinen oleellinen probleema kartassani piilee pinnan alla: osa-alueiden saamat väritykset määräytyvät niiden absoluuttisista tarhaikäisten lukumääristä. Kartan informatiivisuuden kannalta olisi parempi, jos väritys perustuisi tarhaikäisten lukumääriin niin, että määrät olisi suhteutettu aina kunkin osa-alueen pinta-alaan tai asukaslukuun. Tällöin kartan avulla olisi huomattavasti mielekkäämpää lähteä tutkimaan sitä missä tarhaikäiset lapset oikein tuppaavat asumaan.

Tekemiäni kartografisia valintoja on hieman vaikea lähteä perustelemaan. En mielellään puhuisi niistä tämän ensimmäisen tunnin osalta edes valintoina, vaan vaikkapa kärsivällisyyden äärirajoilla muodostuneina väsyneinä ja epäonnekkaina yhteensattumina. Tästä on kuitenkin hyvä lähteä parantamaan.

Ensivaikutelmani tästä “ohjelmasta” oli jotain ihan muuta kuin rakkautta ensisilmäyksellä. Tuntui kuin se olisi jotenkin keskeneräinen. Koska ‘peru’ -nappi ei juuri toiminut, oli (ja on) siis opittava tekemään hommia hieman rauhallisemmin, pää kylmänä. Tallennuskin oli epävarmaa puuhaa. “Työtila” tallentui hermoja raastavan pienellä todennäköisyydellä niin, että se olisi auennut samanlaisena vielä uudestaan. Tämä tarkoitti käytännössä sitä, ettei hommia voinut jättää kesken ilman pelkoa siitä, että koko projektin sai aloittaa alusta sitten kun mieli sitä jatkaa. Myös kartan loppuunsaattaminen oli nihkeää puuhaa. Jonne Alkiomaa kiteyttää hyvin Mapinfon keskeisimmän heikkouden:

“Eri elementtien pitäminen oikeilla paikoillaan ja sen kokoisena kuin niiden halusi olevan tuntui olevan huomattavasti vaikeampaa kuin sen kuuluisi olla.”

Kääntöpuolenahan tässä pelleilyssä on tietysti se, mistä äidit pelissä hävinneille lapsille lohduttaen muistuttavat; luonteenkasvatus. Pettymyksiä ja takaiskuja on vain opittava sietämään.