Kurssikerta 3. Aineistojen yhdistely ja uuden tiedon tuottaminen

Kurssikerran alkuun harjoiteltiin eri aineistojen yhdistämistä ja harjoituksessa aineistona käytettiin Afrikan internetin käytöstä, luonnonvaroista ja konflikteista kertovia aineistoja. Taulukoiden yhdistely oli lähinnä MapInfon ja hieman SQL kyselyiden käytännön harjoittelua, mutta silti harjoituksen sivutuotteena saatiin kasaan varsin mielenkiintoinen aineisto. Aineistossa ei oltu eritelty konflikteja tai luonnonvarojen käyttöön liittyvää tietoa ajankohdan mukaan, mutta tässä blogimerkinnässä pohdimme, mitä aineistolla olisi voinut tehdä, jos siitä olisi saatu irti seuraavat tiedot:

  • Konfliktin tapahtumavuosi
  • Konfliktin laajuus/säde kilometreinä
  • Timanttikaivosten löytämisvuosi
  • Timanttikaivoksen kaivausten aloitusvuosi
  • Timanttikaivosten tuottavuusluokittelu
  • Öljykenttien löytämisvuosi
  • Öljykenttien poraamisvuosi
  • Öljykenttien tuottavuusluokittelu
  • Internetkäyttäjien lukumäärä eri vuosina

Ensimmäisenä yllä olevaa listaa tarkasteltaessa tulee tietysti mieleen tarkastella, onko jollakin alueella luonnonvarojen (timanttikaivokset ja öljykentät) käyttöönotto johtanut konfliktin puhkeamiseen. Toisaalta voitaisiin myös tutkia luonnonvarojen tuottavuuden vaikutusta konfliktin laajuuteen. Aineisto olisi vieläkin mielenkiintoisempi, jos siitä selviäisi mahdollinen konfliktin päättymisvuosi, sekä luonnonvarojen kohdalla niiden hyödyntämisen loppumisen ajankohta. Näin voitaisiin selvittää myös päättyvätkö konfliktit sen jälkeen kun luonnonvarojen hyödyntäminen alueella lopetetaan.

Internetkäyttäjien lukumäärää on ainakin minun mielikuvituksellani vaikea nähdä konfliktien aiheuttajana, mutta se voisi hyvinkin olla mittari alueen varallisuudesta ja teknologisesta kehittyneisyydestä. Vertaamalla luonnonvarojen käyttöönoton aloittamista internetinkäyttäjämäärien kasvuun voitaisiin tutkia, kuinka alueen ihmiset mahdollisesti hyötyvät luonnonvarjojen käyttöönotosta. Voitaisiin myös pohtia vaikuttaako internetinkäyttäjämäärät siihen, kuinka hyvin konfliktista saadaan tietoa ja voisiko tämä mahdollisesti näkyä konfliktitilastoissa. Pekka Jalkanen tuo myös hyvän ajatuksen siitä, että internetin käyttäjäaste heijastelee koulutusastetta, vuoden 2013 blogitekstissään. Kuten Pekka mainitseekin, on ajatus järkeenkäypä, onhan lukutaito perusedellytys internetin käyttämiselle.

Kurssikerran toisena tehtävänä oli luoda kartta, josta selviää järvisyysprosentti sekä tulvaindeksi valuma-alueittain. Aineistoina tehtävässä oli valuma-alueittain luokiteltu aineisto, josta selvisi keskialivirtaama (MNQ) ja keskivirtaama (MQ), keskiylivirtaama (MHQ) aineisto, joka oli myös luokiteltu valuma-alueittain, sekä valmis tietokanta eri alueiden järvisyysprosenteista ja polygonitietokanta suomen järvistä. Ensimmäinen tehtävä oli siis yhdistää aineistot yhteen tietokantaan, jotta kartta saataisiin laadittua.

Tulvaindeksin laskemiseen tarvittavat tiedot saatiin varsin suoraviivaisesti virtaama-aineistoja yhdistelemällä, sillä aineistoissa oli käytetty samaa aluejakoa. Järvisyysprosenttia lisättäessä oli valmiissa tietokannassa käytetty samaa aluejakoa, mikä teki aineiston käytöstä myös suoraviivaista. Kun järvisyysprosenttia lähdettiin laskemaan digitoitujen järvien pinta-aloista, täytyi järvet ryhmitellä sen mukaan, minkä valuma-alueen sisään ne jäivät.

Koska minulla oli nyt käytössä kaksi eri lähteistä saatua järvisyysprosenttia eri valuma-alueille, täytyi seuraavakasi valita kumpaa aineistoa tulisin käyttämään varsinaisessa lopputuotoksessa eli teemakartassa. Tietokannan taulukkoa tarkastellessa huomasin digitoitujen järvien pinta-alojen perusteella lasketun järvisyysprosentin olevan kauttaaltaan hieman matalampi, mutta tämä ei vielä kertonut minulle mitään, siitä kumpaa aineistoa pitäisin luotettavampana. Kun laadin pylväskartogrammin, josta näkyi molempien aineistojen perusteella laskettu järvisyysprosentti, kävi selväksi, että digitoitujen järvien perusteella laskettu järvisyysprosentti oli huomattavasti alhaisempi niillä valuma-alueilla, jotka ulottuivat Suomen rajojen ulkopuolelle. Selitys tälle löytyi siitä, että järvi aineistossa oli ainoastaan Suomessa sijaitsevat järvet. Tästä syystä päädyin käyttämään valmiista tietokannasta saamiani järvisyysprosentteja, joiden olettaisin olevan luotettavampia niillä valuma-alueilla, jotka ulottuvat Suomen rajojen ulkopuolelle.

Kuva 1. Järvisyysprosentit valmiista tilastosta sekä digitoitujen järvien pinta-alan mukaan laskettuna.
Kuva 1. Järvisyysprosentit valmiista tilastosta sekä digitoitujen järvien pinta-alan mukaan laskettuna.
Järvet -aineistossa esiintyvien järvien sijainti Suomen rajojen sisäpuolella, vaikka valuma-alueet ulottuisivat rajojen ulkopuolelle.
Kuva 2. Järvet -aineistossa esiintyvien järvien sijainti Suomen rajojen sisäpuolella, vaikka valuma-alueet ulottuisivat rajojen ulkopuolelle.

Tuottamassani teemakartassa kuvataan järvisyysprosenttia pylväsdiagrammilla, ja tulvaindeksiä koropleettikartalla. Koropleettikarttaa laadittaessa päädyin luokittelemaan aineiston luonnollisten luokkarajojen perusteella, sillä aineiston jakauma oli vinoutunut varsin epäsäännöllinen. Päädyin viiteen luokkaan, sillä halusin pitää kartan luettavuuden hyvänä, ja mielestäni viisi luokkaa riitti tuomaan esiin tulvaindeksiin vaikuttavia tekijöitä. Ylimpään luokkaan tuli ainoastaan Aurajoen valuma-alue, joka on 1100 tulvaindeksillään selvästi muiden alueiden yläpuolella. (seuraava alue Halikonjoki 500). Tämä tarkoitti sitä että muu aineisto käytännössä jakautui neljään luokkaan. Mielenkiintoisesti jo aiemmin mainitsemassani Pekka Jalkasen blogissa Pekka oli päätynyt käyttämään samassa tehtävässä neljää luokkaa, perustellen asiaa sillä, että viidennen luokan lisääminen heikentäisi kartan luettavuutta. Verrattaessa minun ja Pekan tuottamaa karttaa täytyy minun ehkä myöntää, että erityisesti pienessä koossa neljä luokkaa tuo selkeämmän kontrastin Pohjanmaan ja etelä-rannikon valuma-alueitten välille, mutta toisaalta mielestäni käyttämäni viisi luokkaa tuovat selkeämmin esille erityisesti Pohois-Suomessa järvisyyden vaikutusta tulvaindeksiin. Hyvänä esimerkkinä Inarinjärvi ja ympäröivät alueet. Kai se mitä tästä pitää oppia, on se, että jo luokkarajoja valittaessa tulee kartan lopullinen käyttötarkoitus ja julkaisumedia pitää mielessä.

Järvisyysprosenttia kuvaavia pylväitä laadittaessa, suurimmaksi ongelmaksi muodostui pienempien valuma-alueiden ahtaus, mutta käyttämällä pieniä pylväitä saadaan pylväät erottumaan toisistaan kohtalaisesti. Koska kartalta ei ole tarkoitus tehdä mitään tarkempia mittauksia, ei mielestäni ole täysin tarpeellista saada pylväitä täysin erilleen vaan riittää, että karttaa katsomalla saa suurpiirteisen kuvan jonkin alueen järveisyysprosentista.

Kuva 3. Tulvaindeksi, ja järvisyysprosentti Suomessa valuma-alueittain
Kuva 3. Tulvaindeksi, ja järvisyysprosentti Suomessa valuma-alueittain

Karttaa tarkasteltaessa huomataan suuren tulvaindeksin omaavien valuma-alueiden olevan sellaisia, että ne eivät jatku laajoille alueille sisämaahan vaan ovat pienempiä alueita rannikon tuntumassa. Järvisyys prosentin ja tulvaindeksin korrelaatiota tarkastellessa havaitaan, että järvisemmillä alueilla tulvaindeksi on pienempi, kuin muutoin saman tyyppisillä alueilla joilla järvisyys on vähäisempää. Tässä erottuu hyvin järvisemmän Etelä-Suomen ja vähäjärvisemmän Pohjois-Suomen välillä. Havaintojen perusteella vaikuttaisi siltä, että laajoja alueita käsittävät valuma-alueet eivät ole niin herkkiä tulvimaan, koska paikalliset sateet eivät vaikuta suurempaan kokonaisuuteen yhtä voimakkaasti, kuin pienemmällä alueella. Toisin sanoen on todennäköisempää, että koko pienen valuma-alueen alueella sataa rankasti, kuin että koko suuren alueen alueella sataa rankasti. Järvisyyden vaikutus selittyy luultavasti sillä, että järvet varastoivat valuma-alueelle satavaa vettä, ja näin tasaavat virtaamaa.

Lähteet:

Pekka Jalkanen “PAK: Kurssikerta 3” Geosciencing and Cartography,  6.2.2013, Luettu 31.1.2015 https://blogs.helsinki.fi/pjalkane/2013/02/06/pak-kurssikerta-3/

Afrikan pohjakartta: http://www.maplibrary.org/stacks/Africa/index.php

Afrikan väestö-ja internetkäyttäjätiedot: http://www.internetworldstats.com/stats1.htm

Timantit: http://www.prio.no/CSCW/Datasets/Geographical-and-Resource/Diamond-Resources/

Öljyvarat: http://www.prio.no/CSCW/Datasets/Geographical-and-Resource/Petroleum-Dataset/Petroleum-Dataset-v-12/

Konfliktien sijainnit: http://www.prio.no/CSCW/Datasets/Armed-Conflict/Conflict-Site/

Valuma-alueet: Syken Oiva-tietokanta http://wwwp2.ymparisto.fi/scripts/paikkatieto.asp
(vaatii käyttäjätunnuksen)

Kurssikerta 2, Kahden muuttujan koropleettikartat

Kurssikerralla harjoiteltiin useamman teeman esittämistä samalla teemakartalla. Päätin tutkia teemakarttani avulla kaupunkiasumisen ja maaseutumaisen asumisen vaikutusta sairastamiseen Pohjois-Suomessa. Valitsin asumisen laatua kuvaavaksi mittariksi taajama-asteen (Tilastokeskus 2013), ja sairastamisen mittarina erikoiskorvattaviin lääkkeisiin oikeutettujen osuus väestöstä. (THL 2013) Päätin esittää teemat päällekkäisellä koropleettikartalla, siten että Taajama-astetta ilmaistiin värisävyllä ja lääkekorvauksiin oikeutettujen osuutta pisterasterilla. Luokkarajoja valittaessa tasaväliset luokkarajat ja kolme luokkaa toimi hyvin kummassakin aineistossa. Luokkien määrän pidin pienenä pitääkseni kartan luettavuuden siedettävänä.

Minulla oli hieman vaikeuksia rasterikuvion valinnassa, jotta rastereiden erot erottuisivat selkeäst, mutta toisaalta eivät peittäisi värejä alleen tiheimmässäkään luokassa. Erityisesti rasterikuvioiden erottaminen toisistaan oli erittäin hankalaa pienikokoisissa kartoissa. Tähän ongelmaan liittyen huomasin oman karttani tehtyäni Oskar Rönnbergin koulutusta ja tuloja käsitelleessä kartassa varsin näppärän ratkaisun ongelmaan.  Jättämällä pienimmästä rasteriluokasta rasteri kokonaan pois, saatiin kuvaan selkeästi kolme eri rasteriluokkaa, ilman että väreillä esitettyjen luokkien luettavuus siitä pahemmin kärsi. Kuten omassa kartoissanikin, ei pisterasterin luettavuus pienikokoisessa kartassa tästä kuitenkaan parantunut suuremmin.

Kuva 1. Erikoiskorvattaviin lääkkeisiin oikeutettujen osuus ja taajama-aste Pohjois-Suomessa.
Kuva 1. Erikoiskorvattaviin lääkkeisiin oikeutettujen osuus ja taajama-aste Pohjois-Suomessa.

Olin ajatellut että kaupungeissa ihmiset olisivat keskimäärin sairaampia, perustuen mielikuvaani siitä, että maaseudulla ihmiset elävät aktiivisempaa ja stressittömämpää elämää, mikä johtaisi pienempään sairastavuuteen. Kartalta kuitenkin näyttäisi siltä, että tilanne on pikemminkin päinvastoin. Kaupunkilaiset vaikuttavat käyttävän keskimäärin vähemmän lääkkeitä. Hetken tuloksia pohdittuani totesin että väestö on kaupungeissa keskimäärin nuorempaa, mikä selittää pienempää sairastavuutta. Testatakseni tätä ajatusta tein toisen kartan, josta näkyy eläkeläisten osuus (Tilastokeskus 2013) ja erityiskorvattaviin lääkkeisiin oikeutettujen osuus.

Kuva 2. Erikoiskorvattaviin lääkkeisiin oikeutettujen osuus ja eläkeläisten osuus Pohjois-Suomessa
Kuva 2. Erikoiskorvattaviin lääkkeisiin oikeutettujen osuus ja eläkeläisten osuus Pohjois-Suomessa

Tällä kertaa kartasta näkyy selkeä korrelaatio. Siellä missä on paljon eläkeläisiä, käytetään paljon lääkkeitä. Molempia karttoja tarkastelemalla voidaan myös todeta eläkeläisten osuuden olevan pienempi kaupungeissa, erityisesti Oulun alueella, mikä selittää alueen matalaa lääkkeiden käyttöä.

Jotta varsinaisesta ilmiöstä, jota halusin tutkia, eli kaupunkiasumisen vaikutuksesta sairastavuuteen, saataisiin parempi kuva, täytyisi lääkekorvauksia saavien osuudet ryhmitellä iän mukaan. Harjoitus oli kuitenkin sikäli informatiivinen, että siinä tuli hyvin esille, kuinka korrelaatio ei välttämättä tarkoita kausaliteettia, vaan taustalla voi vaikuttaa kolmas selittävä tekijä.

Artikkelihajroitus:

Kurssikerran toisena harjoituksena luimme Anna Leonowicz:in artikkelin “Two-variable choropleth maps as a useful tool for visualization of geographical relationship” (GEOGRAFIJA 2006). Kuten jo otsikosta havaitaan artikkeli käsittelee kahden muuttujan koropleettikarttoja, kahden ilmiön vuorovaikutuksen visualisoinnissa. Siinä käsitellään kahden värin käyttöä molempien muuttujien ilmaisussa kurssikerran harjoitustyössä käyttämäni väri-rasteri esityksen sijaan. Artikkelissa esitellään koe, jossa tutkittiin hyvin tehdyn kahden muuttujan koropleettikartan, sekä yhden muuttujan koropleettikartan kykyä esittää lukialle tietoa kahden ilmiön alueellisesta esiintymisestä, sekä korrelaatiosta. Kokeen lopputuloksena todetaan johtopäätöksissä yhden muuttujan karttojen antavan paremman kuvan ilmiön aluuellisesta esiintymisesta, mutta, että riittävän luettava kahden muuttujan koropleettikartta antaa paremman kuvan kahden ilmiön korrelaatiosta alueittain. Johtopäätöksissä todetaan myös, että kahden muuttujan kartoissa, on suuri vaara, että kartoista tulee epäselkeitä.

Artikkeli oli mielestäni erittäin mielenkiintoinen, erityisesti sen osalta kuinka se havainnollisti värien käytön merkitystä kahden ilmiön korrelaatiota esitettäessä. Ajatus siitä, että sen sijaan, että pyrittäisiin esittämään kahden ilmiön esiintymistä samalla kartalla, jotta lukija voisi sitten tulkita havaitaanko ilmiöiden välillä yhteyttä, estetäänkin kartalla suoraan väreillä ilmiöiden korrelaatiota, vaikuttaa mielestäni hyvinkin järkevältä. Erityisen hyvin tämä ajatus tuli mielestäni esille artikkelin kuvassa 4. jossa alueet, joilla molemmat ilmiöt esiintyvät samassa suhteellisessa suuruusluokassa, kuvataan A kohdassa harmaalla, minkään väriesityksen sijaan. Tälläisestä kartasta nähdään hyvinkin helposti onko kahden ilmiön välillä havaittavissa korrelaatiota joillakin alueilla, mutta toisilla ei. Kun A kohdan kuvaa verrataan B kohdan kuvaan tulee harmaan käyttämisen etu mielestäni erittäin hyvin esille. Vaikka B kohdan kuva rajattaisiinkin kolmeen luokkaan (jätettäisiin viher-kelta-puna –osio kokonaan pois) antaa harmaan käyttö mielestäni paremman kuvan, siitä missä ilmiöt esiintyvät yhdessä, kuin B kohdassa käytetyt sinisen eri sävyt.

Värien valinta kahden muuttujan koropleettikartassa A: J.R.Eyton (1984) B: Us Bureau of Census. Lähde: A. Leonowicz
Värien valinta kahden muuttujan koropleettikartassa A: J.R.Eyton (1984) B: Us Bureau of Census. Lähde: A. Leonowicz

Artikkelissa esitetty legenda on myös mielestäni mielenkiintoinen, silä tavanomaisesta legendasta poiketen, se sisältää olellista informaatiota itsessään, pelkän kartan tulkinnan helpottamisen sijaan. Legendan jokainen ruutu kertoo, mihin molempien muuttujien luokkaan se kuuluu. Toinen luokka luetan pysty- ja toinen vaaka-akselilta. Legendasta voidaan havaita yksittäisten aineiston alkioiden todelliset arvot, pelkän luokittelun sijaan. Se myös esittää 9 eri luokkaa varsin kompaktissa muodossa, josta on helppo havaita luokkien keskenäiset suhteet. Jos legenda olisi tehty samoin kuin yhden muuttujan koropleettikartoissa tyypillisesti on yhdekssällä erivärisellä laatikolla, olisi sen ymmärtäminen varmasti todella paljon vaikeampaa.

Kahden muuttujan koropleettikartan legenda. Lähde A. Leonowicz
Kahden muuttujan koropleettikartan legenda. Lähde A. Leonowicz

Artikkelissa minua jäi hieman hämmentämään luokkarajojen valinnassa käytetty metodi. Kuten legendastakin voidaan havainnoida tulee luokkarajat valita siten, että alueet joilla tutkittavat ilmiöt esiintyvät samassa suhteessa sijaitsevat kummankin muuttujan asteikolla samassa kohtaa, mutta miten nämä toimivat luokkarajat lasketaan jai hieman epäselväksi. Tähän varmasti vaikuttaa oma osaamattomuuteni tilastollisiin menetelmiin liittyvissä asioissa, sekä artikkelissa esiintyvien termien tuntemattomuus.

Kahden muuttujan koropleettikartta vaikuttaisi olevan joissakin tapauksissa varsin toimiva ratkaisu, mutta se vaatii, että kartan lukija ymmärtää mistä kartassa oikein on kyse. Käytännössä lukijan tulee itsekkin olla ollut tekemisissä tälläisten karttojen kanssa, eli kahden muuttujan koropleettikartan käyttö on hyödylistä lähinnä muille maantieteilijöille, tai muille asiaan perehtyneille henkilöille suunnatuissa esityksissä. Kartasta on mahdollista lukea tehokkasti paljon informaatiota, mutta se ei ole kovinkaan intuitiivinen ja kun myös legendan ymmärtäminen vaatii, sen että lukija tietää miten tälläistä legendaa pitäää oikein tulkita, ei tämä esitystapa tunnu kovinkaan toimivalta esimerkiksi sanomalehdessä tai muussa julkaisussa, jossa lukija helposti sivuttaa koko artikkelin, jos ei tunnu sitä heti ymmärtävän.

 

LÄHTEET:

O. Rönnberg, “Päällekkäiset koropleettikartat” Oskarin PAK-Blogi 23.1.2015 luettu 31.1.2015

https://blogs.helsinki.fi/oskaronn/2015/01/23/paallekkaiset-koropleettikartat/

Erityiskorvattaviin lääkkeisiin oikeutettujen osuus: THL, SOTKANET 2013.

Taajama-aste: Kunnat 2013 aineisto, Tilastokeskus

Eläkeläisten osuus: Kunnat 2013 aineisto, Tilastokeskus

A. Leonowicz, “Two-variable choropleth maps as a useful tool for visualization of geographical relationship” GEOGRAFIJA 2006, Nr. 42 sivut: 33-37.

https://moodle.helsinki.fi/pluginfile.php/888755/mod_resource/content/0/KK2/Geog_033_037_spalvotas.pdf

 

Ensimmäinen kurssikerta, Koropleettikartat ja MapInfon käyttö

Ensimmäisellä kurssikerralla käsiteltiin MapInfon peruskäyttöliittymää, sekä koropleettikartan laatimista MapInfolla. Koska olin käyttänyt MapInfoa jo aiemmin, tuli käyttöliittymä kerrattua melko nopeaan, ja suurin osa kurssikerrasta menikin koropleettikarttojen parissa.

Laadin kurssikerralla kaksi koropleettikarttaa, joista toinen käsittelee eläkeikäisten osuutta asukkaista Helsingin eri alueilla, ja toinen tehtyjen rikosten määrää suhteessa asukaslukuun Suomen eri kunnissa. Molempien karttojen laadinnassa keskeisin vaihe oli kartassa esiintyvien luokkarajojen määrittely.

Eläkeläisten osuus asukkaista Helsingissä alueittain
Kuva 1. Eläkeläisten osuus asukkaista Helsingissä alueittain (oletettavasti Helsingin kaupungin tilastokeskus)

 

Kuvatessani eläkeikäisten osuutta asukkaista päädyin tasaväliseen luokkajakoon, sillä tämä johti mielestäni informatiivisimpaan lopputulokseen. Tasaisia välejä käytettäessä värisävyn vaihtuessa on muutos edelliseen luokkaan nähden aina yhtä suuri, ja näin ei synny virheellistä kuvaa eri alueilla esiintyvistä eroista. Koska erot eri alueiden välillä eivät olleet hirvittävän suuria (5-25% asukkaista), eikä mitään luokkaa ollut erittäin suuressa osassa alueita, ei tasaisten välien käytölle ollut mielestäni mitään esteitä.

Kartasta voidaan havaita eläkeikäisten osuuden väestöstä olevan suurempi keskustan ja aivan syrjäisimpien alueiden välisillä alueilla. Kuitenkin siten, että keskustassa suurempi osa asukkaista on eläkeläisiä, kuin aivan uloimmilla alueilla. Voidaan myös havaita, että kaikkein kalleimmilla asuinalueilla eläkeikäisten osuus on suuri (Esim. Kulosaari, Kaivopuisto). Tätä selittää, se ettei nuorella väestöllä yleensä ole tarvittavaa varallisuutta asunnon hankkimiseen kaikkein kalleimmilta alueilta. Muutoinkin eläkeläisten suurta osuutta jollakin alueella, saattaa selittää myös muiden asukkaiden haluttomuus asua alueella, eikä niinkään alueen erityinen vetovoimaisuus eläkeläisiä kohtaan.

Kartografisesta näkökulmasta tarkastellen eläkeikäisten osuutta kuvaava kartta onnistui mielestäni varsin hyvin. Se esittää tarkasteltavan ilmiön mielestäni helppotajuisessa muodossa ja siitä saa mielestäni yhdellä silmäykselläkin suhteellisen oikean kuvan siitä missä alueen väestöstä suhteellisesti suurin osa on eläkeikäisiä. Visuaalisesti kartta oli hieman haastava, sillä koska kyseessä oli koropleettikartta täytyi alueet tietysti värittää luokan kertovalla sävyllä, mutta jos olisin vain värittänyt alueet kokonaan, olisi Helsingin saaristossa olevia alueita ollut vaikea tunnistaa. Toisaalta jos nostin meren ja rantaviivan aluejaon yläpuolelle oli vaikea hahmottaa missä eri alueiden rajat kulkivat saaristossa, Erityisesti jos kaksi vierekkäistä aluetta kuuluivat samaan luokkaan. Päädyinkin kompromissiratkaisuun, jossa nostin meren ja rantaviivan alueiden täytevärin yläpuolelle, mutta jätin päällimmäiseksi alueiden rajaviivat, jotta eri alueiden rajat tulisivat selkeästi esille. Mielestäni tämä ratkaisu tarjosi varsin tyydyttävän kompromissin.

SuomenRikoksetKunnittain
Kuva 2. Tietoon tulleet rikokset sataa asukasta kohden kunnittain Suomessa (oletettavasti Tilastokeskus)

 

Rikosten määrää suhteessa väkilukuun esitettäessä päädyin hieman erilaiseen luokkajakoon. Aineiston jakauma oli voimakkaasti vinoutunut, siten että suurimmassa osassa kunnista oli rikosten määrä per 100 asukasta välillä 0-10, mutta joissakin kunnissa huomattavasti tämän välin yläpuolella. Tämä tarkoitti sitä, että tasavälistä luokkajakoa käytettäessä ei jokaiseen luokkaan olisi edes tullut yhtään kuntaa, ja kunnissa joissa rikollisuus oli vähäistä, ei eri kuntien välisiä eroja olisi tullut lainkaan esille. Toisaalta tasamääräistä luokkajakoa käytettäessä olisi ylimmästä luokasta tullut kohtuuttoman suuri. Tästä syystä päädyin käyttämään luokitusta, jossa rikosten määrä asukasta kohden kaksinkertaistuu luokasta toiseen siirryttäessä. Muiden blogeja selatessani huomasin myös Leila Soinion päätyneen saman tyyppiseen ratkaisuun oman ulkomaiden kansalaisten osuutta Suomen kunnissa käsittelevän, vinon jakauman omaavan, aineistonsa kanssa (Leilan blogi).

Aineiston jakaumaa tutkittaessa, ja sitä kautta luokkarajojen jakoperustetta valittaessa oli histogrammityökalu oiva apu, koska sillä oli helppo havainnoida nopeasti, kuinka eri kokoisilla luokilla luokkien määrä, ja tietyn luokan edustajien määrä vaihtelee .  Leilan blogissa on myös hyvä kuva, joka selventää histogrammin hyötyjä jakaumaa tutkittaessa.

Käyttämäni luokitus ei kuitenkaan ollut täysin optimaalinen sellaisenaan, sillä aineistossa oli yksi kunta, Virolahti, joka erottui selvästi muusta aineistosta. Virolahdella tehtyjen rikosten määrä sataa asukasta kohti oli 48, kun taas seuraavana aineistossa olleessa Tohmajärven kunnassa se oli vain 16, eli kolmasosa siitä mitä Virolahdella. Koska Virolahti oli ylimmässä luokassa yksinään, asetin ylimmän ja toisiksi ylimmän luokan välisen rajan seitsemääntoista kahdenkymmenen sijaan, jotta ei syntyisi virheellistä kuvaa, että jossakin toisiksi ylimmän luokan kunnassa rikosten määrä  sataa asukasta kohden yltäisi kahteenkymmeneen.

Kartasta näkyy rikollisuuden olevan yleisempää suurissa kaupungeissa, sekä EU:n ulkorajoilla, rajanylityspaikkojen läheisyydessä. Esimerkkeinä tästä Kilpisjärvi, Virolahti, Lappeenranta, Imatra ja Tohmajärvi. Erityisesti virolahden erottumista aineistossa selittää varmasti sen sijainti itärajalla ja vaalimaan rajanylityspaikan sijainti kunnassa. Kartta ei ota kantaa siihen minkälaista rikollisuutta poliisin tietoon on tullut, joten esimerkiksi Virolahdelle saattaa hyvinkin rekisteröityä kaikki Vaalimaalla tapahtuneet rajanylitykseen liittyvät rikokset, kuten salakuljetus tms. Tämä ei siis sinänsä kerro mitään esimerkiksi Virolahden turvallisuudesta asuinympäristönä. Myöskään ei ole todennäköistä, että rajakunnissa tapahtuneessa rikollisuudessa olisi kovinkaan usein tekijänä, taikka uhrina kunnan asukas, joten rikosten määrän vertaaminen asukaslukuun ei ehkä ole kovin mielekästä.

Kartta tarjoaa mielestäni varsin hyvän kuvan itse ilmiöstä muualla Suomessa, eli rikosten suhteesta asukaslukuun, mutta se vaatii saatteekseen kuvatekstin, jossa muistutetaan, ettei kartta tarjoa tietoa siitä minkä tyyppistä rikollisuutta kunnassa tapahtuu, tai esimerkiksi tietoa siitä onko rikollisuus kunnan asukkaiden vai sen ulkopuolelta tulevien henkilöiden tekemää, kuten on esimerkiksi rajalla sijaitsevien kuntien tapauksissa todennäköistä. Visuaalisesti kartta on suhteellisen helppolukuinen ja eri alueet erottuvat mielestäni hyvin. Värien valinnassa virolahti aiheutti hieman päänvaivaa, sillä suhteellisen pienikokoisena, oli hieman hankalaa havaita sen kuuluvan eri luokkaan, kuin toiseksi ylimpään luokkaan kuuluvat kunnat, joten päätin tehdä sävynmuutoksesta ylimmän ja toisiksi ylimmän luokan välillä hieman korostetumman, kuin mitä olin tehnyt muiden luokkarajojen kohdalla. Muutoinkin käytin kartassa kohtalaisen räikeitä sävyeroja, mikä on mielestäni perusteltua, sillä ero suurimman ja pienimmän luokan välillä on 12 kertainen. Pohjoisnuolen ja mittakaavan merkitystä tässä kartassa voidaan hieman miettiä, sillä voidaan mielestäni olettaa, että lukija tietää mikä pää suomesta on pohjoista kohti. Myöskään kuntien todellinen koko, ei ehkäpä ole kovin oleellista tarkasteltavan ilmiön kannalta. Kartta toimii mielestäni parhaiten kun ilmiötä halutaan kuvata karkealla tasolla, mutta toisaalta tämä mahdollistaa kartan selkeyden ja toimimisen varsin pienikokoisenakin.

Lähteet:

Eläkeläisten määrä ja asukasluku alueittain Helsingissä: Helsingin kaupungin tilastokeskus

Tietoon tulleet rikokset ja väkiluku kunnittain Suomessa: Tilastokeskus

Moikka Maailma ja MapInfo! (Leila Soinio 2015) Leilan paikkatietopulinaa. Luettu 21.1.2015
https://blogs.helsinki.fi/lsoinio/2015/01/19/moikka-maailma/