Kurssikerta 7 – Rikoksia ja patentteja

Viimeisellä kurssikerralla oli tarkoituksena hyödyntää edellisillä kerroilla opittua siten, että prosessi käytäisiin läpi aivan alusta pitäen, päätyen lopulta kauniisiin ja informatiivisiin karttoihin. Ihan niin syvälliseen ja perusteelliseen prosessiin ei onneksi tarvinnut ryhtyä, jossa aineistot tuotettaisiin ja kerättäisiin itse ja pohjakartatkin pitäisi piirtää joko Corelilla, tai MapInfolla. Kädet olivat vapaat, joten aiheen ja esitettävän asian sai valita mielensä mukaan.

Maailmaan mahtuu käsittämätön määrä erilaista tilastotietoa lähes mistä tahansa aiheesta, joten valinnanvaikeus iski kurssia edeltävänä iltana aiheita miettiessä. Keskiviikkoaamuna en ollut vieläkään aivan varma, mitä tulisin tekemään ja miltä alueelta, vaan selasin Eurostatin datapankkia toivoen jonkun mielenkiintoisen tilaston pistävän silmään. Lopulta minulla oli kerättynä Exceliin toistakymmentä saraketta, aiheiden vaihdellessa kalastussaaliiden määrästä liikennekuolemiin. Pikainen SPSS-analyysi aineistolle osoitti, että päällekkäistä koropleettikarttaa ei ainakaan näistä edellä mainituista kannattanut lähteä tekemään – harmi!

1. Kartta

Päädyin käyttämään valmista ensimmäiseltä kurssikerralta löytyvää pohjakarttaa, joten joutuisin tekemään itse kaksi karttaa (=4 muuttujaa). Rajasin alueeksi Euroopan, sillä olin kerännyt tietoni yksinomaan Eurostatin sivuilta. Siivosin Excel-taulukon huolellisesti, jotta siirrossa ja datojen yhdistämisessä ei tulisi MapInfon kanssa ongelmia. Lisäksi olin laskenut valmiiksi joihinkin sarakkeisiin suhteellisia osuuksia, koettaen näen minimoida riskejä. Ohjelman puolella kaikki sujui yllättävän kivuttomasti, joten oli helppo lähteä kokeilemaan erilaisia yhdistelmiä ja hyödyntää sitten toimivimmat ja mielenkiintoisimmat.

Yhtenä tietona minulla oli poliisien määrä, jonka laskin ja suhteutin väkilukuun sataatuhatta asukasta kohden. Saman tein myös rikosten määrälle, jolloin näitä voisi verrata keskenään. Absoluuttiset arvot vaihtelivat liikaa maiden välillä, esim. Italiassa oli vuonna 2007 liki 250 000 poliisia (väkiluku 58 miljoonaa), kun Iso-Britannian vastaavat luvut olivat 141 381 poliisia väkiluvun ollessa 61 miljoonaa. Suomen kanssa väkiluvultaan yhtäläisessä Slovakiassa poliisien määrä oli liki kolminkertainen meihin verrattuna. Mietin melko pitkään kuinka nämä tiedot esittäisin kokeillen läpi erilaisia karttavaihtoehtoja, mutta päädyin lopulta koropleettiin, josta käy ilmi rikosten määrä, jonka päällä pylväsdiagrammi kertoo poliisien suhteellisesta määrästä (kuva 1).

Kuva 1. Poliisin kirjaamat rikokset vuonna 2007 (/100 000 as.), sekä poliisien määrä (/100 000 as.) Lähde: Eurostat

Kuva 1. Poliisin kirjaamat rikokset vuonna 2007 (/100 000 as.), sekä poliisien määrä (/100 000 as.) Lähde: Eurostat

Lopputuloksesta tuli aika mielenkiintoinen ja päädyin useampaankin kertaan takaisin Exceliin tutkailemaan arvoja, sillä kartta oli mielestäni jotenkin nurinkurinen. Ennakkokäsityksiin nojaamat mielikuvat olisivat sijoittaneet tulokset lähes päinvastoin. Mietin olinko tehnyt virheitä tallentaessa tietoja Exceliin ja pähkäilin myös tekemäni suhteuttamisen oikeellisuutta. Tietojen ollessa Excelissä omissa sarakkeissaan oli niitä helppo tarkastella myös tilastollisten muuttujien osalta. Siispä tein samasta datasta myös hajontadiagrammin sijoittaen poliisit Y-akselille ja rikokset X-akselille (kuva 2.) Lisäsin taulukkoon vielä regressiosuoran ja yhtälön, jotta ei tarvitsisi mennä pelkän arvailun varassa. Poliisien ja rikosten määrän välillä näyttäisi olevan negatiivinen korrelaatio, sillä poliisien määrän ollessa suuri on rikosten määrä pienempi. R² on 0,1284 josta neliöjuuri antaa selityskertoimeksi 0,358. Tästä saadaan Pearsonin korrelaatiokertoimen kautta selville, että tulos on tilastollisesti merkittävä 0,05 tasolla (N=29). Uskottava siis on! Kokeilin huvikseni samanlaista taulukkoa absoluuttisilla arvoilla ja tulos oli päinvastainen – siellä missä poliiseja oli paljon, niin myös rikosten määrä oli suurempi.

Kuva 2. Hajontataulukko rikoksien ja poliisien määrän suhteesta

Kuva 2. Hajontataulukko rikoksien ja poliisien määrän suhteesta

Pitäisikö tästä ja kartasta sitten tehdä päätelmiä, että Pohjoismaissa ja Keski-Euroopassa on erityisen turvatonta ja Turkissa, Romaniassa, Bulgariassa ja Serbiassa kansalaiset saavat pyörittää arkeaan huolia vailla, sillä virkakoneisto turvaa ja palvelee? Ehkä, mutta epäilisin kyseessä olevan enemmänkin erilaisista kirjaamiskäytännöistä. Poliisien määrä voi olla pienempi, mutta koneisto ja hallinto tehokkaita ja laki jättää vähän tulkinnan varaa. Vastakohtana on sitten paisunut virkakoneisto, jossa käytännössä on puolet liikaa työntekijöitä, byrokratia ja kirjaamiskäytännöt lepsuja, tai epätarkkoja. Itä- ja Etelä-Euroopan suuret poliisimäärät ovat mielestäni pikemminkin tietynlaisen hallintomuodon ”jatke” ja tulos, kuin osoitus toimivasta järjestelmästä. Idässä kyseessä voi olla eräänlainen entisen Neuvostoliiton henkinen perinne – KGB:n varjo. Jostain syystä kartassa ei näy Norjan poliisien määrä, enkä ymmärrä syytä, sillä tiedot löytyvät taulukosta. En pikaisella yrityksellä saanut muutosta aikaan, joten tällä mennään.

Mitro on kuvannut omassa kartassaan väkivaltarikoksien määrää (Müller 2016) suhteutettuna sataatuhatta henkeä kohden ja päätynyt hauskasti pohtimaan kanssa tilastojen oikeellisuutta; ”Tässä vaiheessa kehtaan epäillä tietojen paikkansapitävyyttä joidenkin valtioiden kohdalla”. Eurostatia voi varmaankin pitää melko luotettavana lähteenä itsessään, mutta sitä en tiedä, kuinka he tiedot keräävät. Väkivaltarikoksienkin suhteen erot voivat johtua virkakoneiston erilaisista kirjaamiskäytännöistä. Sekä Mitro, että Jasmina Myllys (2016) omassa taskuvarkauksia Italiassa kuvaavassa kartassaan olivat päätyneet käyttämään aihetta havainnollistavia karttasymboloita. Jasmina kirjoittaa: ” Ehkä kartoissakin pitäisi enemmän käyttää toiminnalisia symboleita tylsien palluroiden sijaan, jotta lukijan aivot jaksaisivat keskittyä kartan analysointiin.” Nyt omat kankeat ja epäselvät pylväsdiagrammit alkoivat ärsyttämään jo itseäni.

2. Kartta

Jos ensimmäisen kanssa oli ongelmia aiheen valinnan kanssa, niin toinen tuotti vielä enemmän päänvaivaa, varsinkin toteutuspuolella. Koska uutisissa on viime aikoina puhuttu paljon hallituksen koulutusleikkauksista, niin päätin katsoa mitä tietoja Eurostatin sivuilta löytyisi aihetta liippaamaan. Löysinkin GBAORD:n (Goverment budget appropriations or outlays on R&D), josta valitsin kategoriaksi koulutuksen ja yksiköksi €/as. Ajankohdaksi valitsin vuoden 2013, jotta mahdollisimman monesta valtiosta olisi tiedot. Koulutuksesta tulikin nopeasti mieleen kansainvälinen PISA-vertailu, jossa Suomi on ollut eräänlainen mallioppilas ja esimerkki erinomaisesta koulujärjestelmästä. Etsin siis tietooni OECD:n sivuilta viimeisimmän testin (2012) tulokset. Kokeessa mitataan kolmea muuttujaa, lukemista, matematiikkaa ja luonnontieteitä ja maat pisteytetään erikseen kussakin kategoriassa. Laskin kolmen kategorian pisteet yhteen maittain, jolloin sain kokonaistuloksen. Mikä muu voisi kertoa koulutuksesta ja osaamisesta? Sivuilta löytyi tietoa myös patenttihakemusten määrästä ja mielestäni se olisi ihan hyvä indikaattori kertomaan väestön osaamistasosta. Niinpä valitsin yhdeksi muuttujaksi vielä patenttihakemusten määrän Euroopan patenttitoimistoon suhteutettuna miljoonaa asukasta kohden. Koska tilastosta löytyi aika kattavasti maakohtaista dataa pidemmältä aikaväliltä, niin laskin hakemukset yhteen aikaväliltä 2005–2010, jotta mahdolliset yhden vuoden heilahdukset eivät liikaa vaikuttaisi tulokseen.

Sitten alkoikin melkoinen päänsärky, kun aloin pistämään kerättyjä aineistoja kartalle. Alkoi jo kaduttamaan, että otin kolme muuttujaa, sillä niiden esittäminen sulavasti samalla pohjalla alkoi tuntumaan mahdottomalta. Olin kuitenkin tehnyt töitä aineistojen eteen, joten myös päätin saada ne näkyviin. Kokeilin gridiä, päällekkäisiä koropleettikarttoja eri esitystavoilla, erivärisiä pallukoita yms, mutta aina ongelmaksi tuli jonkin muuttujan epäselvyys. Lisäksi yksittäiset selvästi muuta aineistoa suuremmat poikkeamat vääristävät luokkia ja esitettävyys kärsi. Esimerkiksi Luxemburg käyttää koulutukseen huikeat 66,6€, joka on 3,6 kertaa enemmän, kuin toiseksi eniten käyttävällä Tanskalla.

Myös ohjelman puolella kankeus alkoi ärsyttämään, sillä esimerkiksi palkkien, tai varsinkin gridin sijaintia olisi hyvä saada muutettua, jotta suurempi kappale ei peittäisi pienempiä alleen. Kokeilin tehdä kaksi gridiä siten, että toinen kuvaisi patenttien määrää ja toinen budjettia, jolloin niitä voisi verrata rinnakkain. Eihän se tietenkään onnistunut, kun uusi muuttuja kuvautui suoraan vanhan päälle. Koetin kiertää tätä seuraavaksi tekemällä kaksi erillistä pylväsdiagrammia, mutta jälleen sama juttu. En tiedä onko näitä mahdollisuus ylipäätänsä siirtää, mutta ainakaan mistään kovin loogisesta paikasta en tuollaista ominaisuutta löytänyt. Välillä legendassa palkin kohdalla suurinta arvoa esittävä luku olikin väärään muuttujan arvo. Näiden kanssa tapellessa tuhraantui tolkuttomasti aikaa joten päädyin lopulta samaan malliin, kuin ensimmäisessä kartassani (kuva 3).

Kuva 3. Vuoden 2012 PISA-testin tulokset, sekä koulutukseen käytettävä budjetti/as. vuonna 2013. Sininen pylväs kuvaa vuosien 2005-2010 välillä jätettyjen patenttihakemusten määrää per miljoona asukasta.

Valtioiden koulutusbudjetista erottuu vain suurimmat panostajat, sillä yleisellä tasolla suurin osa käytti alle 2€/as. Tämä näkyy hyvin ohuena sinisenä viivana vihreän palkin vieressä, joten tästä ei juurikaan pysty päättelemään summia. Eniten koulutukseen käytti siis Luxemburg, seuraavaksi Tanska (18.2 €/as.), Norja (6 €/as.), Italia (5.6 €/as.) ja Itävalta (5.2 €/as.). Suomi käytti 0.5 €/as ja Ruotsi 0.6 €/as. sijoittuen listan loppupäähän. PISA-tulosten top5 taasen oli seuraavanlainen (pistemäärä sulkeissa):

  1. Suomi (1588)
  2. Viro (1578)
  3. Liechtenstein (1576)
  4. Puola (1562)
  5. Hollanti (1556)

Rahalla ei siis välttämättä ostella hyviä tuloksia, joskin täytyy muistaa että tilastot ovat vain yhden vuoden ajalta, jolloin asiaa pitäisi tarkastella pidemmällä jaksolla. Baltian maat muodostavat kartalla mielenkiintoisen sisarkolmikon; kaikki muuttajat näyttävät laskevan tasaisesti pohjoisesta etelään siirryttäessä. Ehkä kymmenen vuotta eteenpäin, niin Latvia ja Liettua ovat kaventaneet eroa pohjoiseen naapuriinsa, mutta tällä hetkellä Viro on omassa luokassaan koulutuksen budjetin ja PISA-tuloksen suhteen.

Vihreä palkki kuvaa Euroopan patenttitoimistoon jätettyjen patenttihakemusten yhteenlaskettua määrää vuosilta 2005-2010/miljoona asukasta. Top5 näyttää seuraavalta:

  1. Sveitsi (2545,6)
  2. Ruotsi (1752,85)
  3. Saksa (1730,82)
  4. Suomi (1496,78)
  5. Tanska (1351,69)

Pohjoismailla on varsin hyvä edustus tässä joukossa. Sattumalta silmiini osui myös ajankohtainen aihetta käsittelevä Helsingin Sanomien uutinen, jossa käsitellään myönnettyjen patenttien määrää (HS). Suomi on samalla listalla myös neljäntenä ja sijoitusta selitetään Nokian viestintä- ja tietoteknologian patenttimäärillä. Ihan järkeenkäypää, sillä isojen kansainvälisten yritysten sijoittuminen voi vaikuttaa paljonkin patenttihakemuksien määrään. Olisikin pitänyt ehkä tarkastella pikemminkin myönnettyjen patenttien määrää, kuin hakemuksia, sillä pelkkä hakemus ei sinänsä kerro vielä mitään.

Loppujen lopuksi pylväät eivät välttämättä ole paras vaihtoehto tässä kartassa, sillä arvoja on vaikea hahmottaa, vaikkakin keskinäinen kokovertailu onnistuu tyydyttävästi. Lukijalle arvot vaikkapa palkkiin (tai sen viereen) kirjoitettuna antaisivat kuitenkin enemmän pohjaa katselulle. En saanut näitä kuitenkaan näkyviin, joten koetin legendassa selventää arvoja hieman tarkemmin.

Lopuksi

Olen tyytyväinen molempien karttojen yleisilmeeseen, värit erottuvat ja ulkoasu on yleisesti selkeä. MapInfon käyttö sujui, vaikka ongelmia ja puutteita ilmenikin. Ohjelma ja sen käyttö ovat kuitenkin muuttuneet selkeämmiksi kurssin edetessä. Mikäli heti perään olisi toinen samanmoinen kurssi, niin uskon, että käyttötaidoissa olisi saavutettavissa ihan hyvä taso. Ohjelma vaatisi aktiivista käyttöä, sillä pelkäänpä että tulevien kurssien uudet ohjelmat sysäävät MapInfon syrjään. Uskon kuitenkin saavuttaneeni Artun (Paarlahti 2016) WebOodissa kurssille asettaman tavoitteen:

”Opiskelija tutustuu paikkatieto-ohjelmien mahdollisuuksiin kartografisessa viestinnässä. Opiskelija saa valmiudet käyttää paikkatieto-ohjelmia sekä tuottaa niiden avulla viimeisteltyjä painokelpoisia kartografisia esityksiä”

Kiitos kurssista!

Kirjallisuus:

Eurostat (2007). Police officers. http://ec.europa.eu/eurostat/data/database Luettu 2.3.2016

Eurostat (2007). Crimes recorded by police by offence category. http://ec.europa.eu/eurostat/data/database Luettu 2.3.2016

Eurostat (2013) Total GBAORD by NABS 2007 socio-economic objectives: Education.

http://ec.europa.eu/eurostat/data/database Luettu 2.3.2016

Eurostat (2005-2010). Patent applications to the European patent office (EPO) by priority year. http://ec.europa.eu/eurostat/data/database Luettu 2.3.2016

Lassila, A. (2016). Suomen patenttimaine on yhä täysin Nokian varassa. Helsingin Sanomat. Helsinki 3.3.2016. <http://www.hs.fi/talous/a1456973017510> Luettu 7.3.2016

Müller, M. (2016). Kurssikerta 7: Opit käyttöön. https://blogs.helsinki.fi/mcmitro/ Luettu 8.3.2016

Myllys, J. (2016). 7. kurssikerta: paikkatietoa italialaisittain. https://blogs.helsinki.fi/myllyjas/ Luettu 8.3.2016

OECD (2014). PISA 2012 results in focus: What 15-year-olds know and 42 what they can do with what they know.

<http://www.oecd.org/pisa/keyfindings/pisa-2012-results-overview.pdf >Luettu 2.3.2016

Paarlahti, A. (2016). Paikkatiedon hankinta, analyysi ja kartografia. Kurssikuvaus, tavoite. WebOodi, Helsinki.

The World Bank Group (2016). Population, total.

< http://data.worldbank.org/indicator/SP.POP.TOTL?page=1> Luettu 2.3.2016

 

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *