Osaamistason arviointia (vk 5)

Olemme kurssilla tähän mennessä oppineet käyttämään jo melko laajasti erilaisia työkaluja kun ottaa huomioon ettei ohjelma ollut aluksi lainkaan tuttu. Osaisin esimerkiksi tehdä vilkkaasti liikennöidyn tien ympärille 100m suojavyöhykkeen jolta tietäisin olla keräämättä marjoja (Marttaliitto suosittelee) ja jos alueelta olisi vektorimuotoista dataa esimerkiksi asuinrakennuksista, voisin katsoa kuinka monen asunnon kotipihalta ei kannata poimia marjoja.

Olen oppinut tekemään omia tietokantoja piirtämällä viivoja ja pisteitä rasteriaineiston päälle, tekemään laskutoimituksia olemassaolevilla arvoilla, yhdistelemään eri tietokantoja joko intersect-toiminnolla tai vain valitsemalla tiettyjä elementtejä eri kerroksista jos tietoa ei tarvitse pysyvästi yhdistää. Myös karttojen piirtäminen tulostustyökalulla (layout) alkaa sujua nopeammin nykyään. Tähän mennessä mikään työkalu ei ole tuntunut erityisen vaikealle käyttää, mutta tietysti ne joita tarvitsee harvemmin, saattavat unohtua. Esimerkiksi aina ei heti muista minkä nimistä työkalua kannattikaan etsiä työkaluvalikosta. Tänään yritin tehdä Vantaan kuudesta karttalehdestä kokeeksi virtuaalirasteriaineiston mutta se ei onnistunut kovin hyvin vaan kartasta tuli tumma ja melko mahdoton lukea. Tämä on oikeastaan ainoa kohtaamani selvittämätön ongelma kurssin aikana.

Teknisiä haasteita enemmän on tuntunut vaikealta osata tehdä järkevän näköisiä ja informatiivisia karttoja. Aiheen valinta ja sen esittäminen fiksusti on yllättävän vaikeaa. Onneksi kurssilaisilta on saanut myös hyviä vinkkejä näihin kysymyksiin. Esimerkiksi näin jälkikäteen toisten blogeja tutkiessa mm. Rasmuksen hienot visualisoinnit (kurssikerta 3) antoivat lisää ideoita miten jatkossa voisi visualisoida karttoja ja erityisesti ruutuaineistokarttojen vertailu suhteellisten ja absoluuttisten määrien välillä (kurssikerta 4) herätti ajattelemaan miten erilaisia tuloksia voikaan saada riippuen minkä vertailutavan valitsee.

QGIS:in avulla pystyy tutkimaan monenlaisia tietoja, joiden kaikkien ei tarvitse edes olla spatiaalisia. Jos yhdessä tietokannassa on kuntarajat kartalla ja vaikkapa kuntanumerot, niin kuntiin liittyviä muita ei-spatiaalisia tietoja voi yhdistää toisesta tietokannasta kuntanumeron perusteella ja tutkia asioita siten kartalla. Aineistojen käsittelyssä voi kuitenkin tehdä monenlaisia virheitä, jos ei huomaakaan esimerkiksi että on tullut valinneeksi liikaa asioita analyysiinsä tai jos laskutoimitukseen on eksynyt omituisia arvoja (joskus esim -1 tai 999999999 merkitsee sitä ettei tietoa ole) jotka sotkevat kokonaisuuden. Joskus voi myös käyttää vääriä laskutapoja vertailun näkökulmasta. Aineistotkaan eivät ole aina täydellisiä ja puuttuvat arvot täytyisi ottaa myös jotenkin huomioon. Tilastotieteen kurssi olisi hyödyllinen kaikille jotka tekevät analyysejä näillä työkaluilla. QGIS-ohjelman rajoitteista aineistojen käsittelyssä en vielä osaa sanoa tarkemmin, koska tähän mennessä on tuntunut siltä että ohjelma on todella monipuolinen ja en ole keksinyt vielä asiaa jota sillä ei voisi esittää. Toki jotkin käytettävyysratkaisut ovat hieman erikoisia, mutta ne eivät silti estä ohjelman käyttöä vaan hankaloittavat sitä vain.

Tehtävistä saatuja tuloksia

MALMI:
4822 asukasta lentokentästä 2km säteellä
792 asukasta lentokentästä 1km säteellä

HELSINKI-VANTAA:
2235 asukasta 2km säteellä kentästä
65db melualueella asukkaita 17 eli 0,8 prosenttia 2km säteen rajaamasta alueesta
55db tai kovemmalla melualueella asuu 11923 asukasta
26424 Tikkurilan ja lähialueen asukasta melualueella 7km x 1km jos laskeutumissuunta käännetään kaakkosta luoteeseen

ASEMAT:
111765 asuu 500m päässä asemasta eli 2,2%
näistä 72230 on työikäisiä (18-64v) eli 45 %

KOULUT:
Helsingin Yhtenäiskoulun alueella asuu 14 kuusivuotiasta eli oletettavasti he aloittavat koulun seuraavana vuonna
12-14 -vuotiaita alueella on 62, jotka oletetavasti ovat yläasteikäisiä seuraavana vuonna.
159 koululaista alueella eli 8,4% kaikista asukkaista
muunkielisiä on alueella 110 joten heistä kouluikäisiä (8,4%) on noin 9

Lähteet:

Sohlman, Rasmus (2021). Rasmuksen GEM-kurssiblogi. Haettu 16.2.2021 osoitteesta https://blogs.helsinki.fi/sohlrasm/

Oma ruutuaineisto (vk4)

Ruutuaineisto isosta pisteaineistosta

Tällä kertaa teimme itse pisteaineiston pohjalta ruutuaineiston. Tämä oli mielenkiintoista, koska pisteaineisto itsessään ei ole kovin informatiivinen. Mieleen tuli heti monta ideaa mitä haluaisin aineistosta visualidoida.

Löysin Liisan blogista (Ahokas, 2021) hyvin visualisoidun ruutuaineiston, kartta oli sopivan kokoinen, selkeä ja informatiivinen. Päätin ottaa siitä hieman mallia omaan karttaani, mutta jättää taustan vihreän värin pois ja ehkä lisätä vähän läpikuultavuutta. Liisan vinkistä kävin myös vilkaisemassa Ronin blogia (Kurvinen, 2021) ja innostuin Ronin käyttämästä aiheesta! Roni oli havainnollistanut ruutuaineistolla pääkaupunkiseudun vanhimmat asutut talot. Tätä aineistoa katsoessani kiinnostuin siitä, että mikähän on keskimääräinen asuttujen rakennusten ikä per neliökilometri, että olisikohan kartta saman näköinen vai ei, olisiko jollain alueella keski-ikä kuitenkin hyvin nuori, vaikka vanhimmat asutut talot olisivat todella vanhoja. Halusin nähdä tällaisen jaottelun, joten otin siitä itselleni aiheen. Aineistosta ei kuitenkaan löytynyt rakennusten valmistusvuotta, vaan ainoastaan kaavoitusvuosi tai käyttöönottovuosi. Jäi hieman epäselväksi mikä vuosiluku on kyseessä. Käytän jatkossa nimitystä käyttöönottovuosi. Suurimman osan rakennuksia kanssa tämä vuosiluku vastaa melko hyvin rakennusvuotta mutta joidenkin kohdalla ei. Tarkistin tämän muutaman hyvin tuntemani asuinrakennuksen perusteella. Eräs 1995 rakennettu oli merkitty vuodelle 1988 vaikka sen tilalla ei ole ollut 80-luvulla rakennettua taloa. Sitten taas vuonna 1984 rakennettu talo oli merkitty vuodelle 1982. Suurin osa vuosiluvuista oli kuitenkin hyvin lähellä rakennusvuotta, joten en anna tämän häiritä. Ehkä se kuitenkin antaa osvittaa siitä, missä järjestyksessä alueet on rakennettu joten päätin pysyä aiheessa.

Käyttöönottovuosia (aineistossa KAVU) ei ollut saatavissa kaikille rakennuksille ja nämä oli merkitty luvulla 999999999. Poistin tällaiset kohteet ennen käsittelyä, ettei laskutoimitukset vääristyisi. Pätin käyttää keskilukuna mediaania, koska keskiarvo toimii huonosti vuosilukujen kanssa jos esimerkiksi alueella yksi talo saa arvokseen 2015 ja loput 1920, niin luku havainnollistaa hyvin huonosti sitä että pääosin rakennukset ovat 1920-luvulla rakennettuja. Ruutuaineistossa olisi toki voinut esittää myös absoluuttisia arvoja, mutta tähän havainnollistukseen halusin saada alueen keskiluvun jotta näkisi alueiden kehitysjärjestyksen.

Kokeilin kahta eri ruutukokoa, 2km x 2km ja 1km x 1km mutta totesin jälkimmäisen paremmaksi koska uudet asuinalueet eivät yleensä ole edes neliökilometrin kokoisia vaan voivat olla pienempiäkin, joten 2km särmän pituus johti keskilukujen lähestymiseen ja kartan epäselvyyteen. Puolen neliökilometrin ruutujakin harkitsin, mutta se näytti näin laajalla kartalla jo hieman sekavalta.

Ruutujen värien valinta ja kategorioiden rajojen asettaminen tuotti haasteita kun mikään valmiista kategorisoinneista ei minusta tuntunut hyvältä. Rakennuskaudet eivät jakaudu tasaisin väliajoin ja älykäs rypäsjakokaan ei tehnyt loogisia jakoja mielestäni, koska halusin että sota-aika ja sodan jälkeinen aika sivat oma ryhmänsä. Päädyin käyttämään yhdeksää kategoriaa, mikä on hieman epätavanomaista, mutta mielestäni tässä käytössä se toimi hyvin. Kuitenkin varhaisimmat vuodet ovat samansävyisiä joten muodostavat sinänsä oman isomman kategorian.

Kuva 1. Rakennusten käyttöönottovuodet 1km x 1km alueilla

Jos tätä ruututeemakarttaa vertaa kuvitteelliesti koropleettikarttaan, niin tässä näen hyvänä puolena sen, että ruutujen koon voi valita itse teemaan sopivaksi. Jos vastaavan keskiluvun olisi laskenut perustuen esimerkiksi kaupunkien osa-alueisiin, olisi tulokset niin ympäripyöreät, ettei ne oikeastaan kertoisi mitään. Ruututeemakartassa luettavuutta voi kyllä hieman häiritä ruutujen viivat, koska ne helposti peittävät alleen esimerkiksi kuntarajat tai muut hahmottavista helpottavat maantieteelliset merkit. Sen vuoksi vedin kuntarajat punaisella ja nostin järvet ja joet kartan päälimmäiseen kerrokseen, että ne erottuisivat paremmin.

Kartalta nähdään että Espoo on rakentunut melko tasaisesti tietyllä aikakaudella, kun taas esimerkiksi siellä missä Helsingin keskusta aiemmin oli (Helsingin pitäjän kirkonkylä) on hyvinkin vanhoja rakennuksia ryppäänä uusien asuinalueiden keskellä. Sama on nähtävissä Espoon pohjois-osissa (luultavasti vanhoja maatiloja). Tuoreimmat asuinalueet näyttäisivät olevan Vantaalla ja Itä-Helsingissä. Espoon tasaisempi väritys todennäköisesti kertoo siitä, että Espoossa on enemmän tehty viime vuosina täydennysrakentamista kuin ihan uusia asuinallueita. Espoossa tuoreimmat keskiluvut osuvat radan varrelle ja rantatonteille, erityisesti meren lahtien ympärille. Helsingin keskustan väritys taas kertoo että keskusta on ollut jo pitkään niin täynnä vanhoja rakennuksia, ettei mediaania mitenkään saada nostettua rakentamalla väliin muutamia uusia. Keskusta onkin pitkälti vanhaa rakennuskantaa. Ainoastaan uudet täyttömaat loistavat uudiskohteillaan, esimerkiksi Jätkäsaari ja Kalasatama.

Verrattuna Ronin (Kurvinen 2021) tekemään karttaan alueen vanhimmista rakennuksista, tämä näyttää visuaalisesti hyvin samalla tapaa jakautuneelta vaikka itse käsittelen alueiden mediaaneja. Molemmissa kartoissa Helsinki ja Vantaa ovat hyvin kirjavat, eli vierekkäiset alueet voivat olla hyvinkin eri ikäisiä, kun taas Espoo on paljon tasaisemmin jakautunut naapurusalueidensa suhteen.

Rasteriaineiston käsittelyä

Tällä kertaa tutustuimme myös rasteriaineiston käyttöön ja teimme itse vektoriaineistoa rasteriaineiston pohjalta. Merkitsimme asutut rakennukset ja tiet Pornaisten alueelle. Tätä ehkä pääsemme tutkimaan paremmin seuraavalla kerralla, miten tekemiämme aineistoja voi hyödyntää.

Lähteet:

Ahokas, Liisa (2021). Liisan kurssiblogi. Haettu 15.2.2021 osoitteesta https://blogs.helsinki.fi/ahokliis/

Kurvinen, Roni (2021). ronikurv’s blog. Haettu 15.2.2021 osoitteesta https://blogs.helsinki.fi/ronikurv/

Teemakartan tulkintaa (vk 3)

Harjoittelimme erilaisten aineistojen liittämistä toisiinsa ja taistelimme hieman teknisten ongelmien kanssa. Tällä kertaa tuli selväksi mm. missä välissä kannattaa tallentaa tai luoda uusi tietokantatiedosto, ettei menetä kaikkia uusia tietoja joita on saanut yhdisteltyä.

Tein teemakartan josta näkee valuma-alueittain tulva-indeksit. Valuma-alueet koskee aina tiettyä jokea. Kartasta näkee myös punaisena palkkina mikä on kyseisen alueen järvisyys prosentteina. Mitä korkeampi palkki, sitä suurempi osuus valuma-alueella on järviä. Pisimmät palkit lähentelevät 20 prosenttia. Legendaan en saanut merkittyä järkevästi että mitä prosenttilukua minkäkin kokoinen palkki tarkoittaa. Huomasin joidenkin kurssilaisten käyttäneen palloa palkin sijaan ja saaneet selkeämmän legendan aikaiseksi, esimerkiksi Ville Väisänen (Väisänen 2021) oli tehnyt näin.

En ole maantieteen – vaan tietojenkäsittelytieten  – opiskelija, joten minulle on täysin uutta tällaisten karttojen tulkinta tai pohtiminen että mitä kartta mahtaa kertoa. Yritin jakaa kategoriat fiksusti niin että kartta havainnollistaisi tulvien todennäköisyyttä. Kartasta nähdäänkin että Pohjanmaalla joet ovat melko tulvaherkkiä, samoin kuin lounaisrannikolla. Järvi-Suomessa tilanne on toisin, johtuisiko se sitten siitä että sade- ja sulamisvedet valuvat järviin joita on paljon tarjolla ja ei pääse käymään niin että koko alueen vedet yrittävät mahtua samaan jokeen valuakseen mereen.  Yllättävä havainto oli, että Tornionjoen alueella indeksi on niin alhainen että se jää samaan kategoriaan muiden sisämaan alueiden kanssa. Tai olisi alimmat kategoriat voinut vielä erottaa yhdellä pykälällä niin että Tornionjoen alue olisi erottunut Järvi-Suomesta mutta en nähnyt siinä riittävän painavaa syytä kun luvut olivat kuitenkin niin lähellä toisiaan. Pohdin että onkohan Pohjanmaalla maan muoto keskimäärin sen verran vähemmän viettävää, ettei jokien virtaus ole yhtä voimakas joten tulvan aikaan vesi ei “ehdi” virrata mereen vaan jää tulvimaan herkemmin? Tai johtuuko se siitä että maa on hyvin alavaa joen molemmin puolin? Toisin kuin Tornionjoen vierellä alkaa heti maasto nousta. Vai onko kyseessä koko, niin että isoon Tornionjokeen vaan yksinkertaisesti mahtuu enemmän vettä myös tulva-aikaan. Tai mahdollisesti pidemmän talven ansiosta sulaminen tapahtuu maltillisemmin. Jään odottamaan kanssaopiskelijoiden mietteitä aiheesta.

 

Lähteet:

Väisänen, Ville (2021). Villen GIS-Blogi. Haettu 3.2.2021 osoitteesta https://blogs.helsinki.fi/villvais/

Projektiot pielessä (vk2)

Oikean projektion valitseminen on tärkeää! Tarkastelemme tällä kertaa projektioita QGIS-ohjelman käytössä.

Mercator-projektio ja Lambert-projektio pinta-alojen mittauksessa

Alustavat tietoni projektioista ovat johdantokurssin muistojen varassa ja en tiennyt mitä projektiota kannattaa käyttää jos haluaa saada oikeapintaisen Suomen kartan. Materiaalista löytyi että Lambertin (EPSG: 3035) projektiota suositellaan siihen käyttöön. Harjoittelimme geometrisen tiedon tallentamista eri projektioista ja tein kartan jossa verrataan Mercatorin projektion (EPSG: 53004) pinta-alojen kokoa Lambertin projektioon. Väritetty karttakuva on piirretty ETRS89 / TM35FIN -projektiolla jotta se näyttää katsojan silmään järkevältä. Toisaalta myös Mercatorin -projektion käyttäminen piirtämisessä olisi  voinut olla hauskan havainnollistava.

Mittasuhteita havainnollistin prosentteina siten, että jos verrattavat pinta-alat ovat täysin samat, niin luku olisi tällöin 0. Eli esimerkiksi Inarin pinta-ala on 669% suurempi kuin se on Lambertin projektiossa.

Kokeilin erilaisia jakoja väritettyjä luokkia luodessa. Mitä enemmän luokkia oli, sitä tiheämmin ne vaihtuivat etelään päin mentäessä kun käytti ohjelman älykästä luokkajakoa. Tämän vuoksi valitsin 8 luokkaa, koska tätä tihentymistä oli vaikea havaita esim. neljällä luokalla. Mercator-projektio näyttää vääristävän pinta-aloja pohjoista kohti mentäessä enemmän ja enemmän. Vääristymä on jopa kaksikertainen verrattaessa Etelä-Suomen ja Pohjois-Suomen vääristymiä (siis jos Etelä-Suomessa vääristymä on 4-kertainen niin pohjoisessa voi olla 8-kertainen). Tämä johtuu siitä että Mercator-projektio on tarkimmillaan päiväntasaajalla, jolloin napa-alueita lähestyttäessä vääristys on suurimmillaan ja kasvaa “kiihtyvästi” pohjoiseen päin.

Muita projektioita

Tutkin myös muita projektioita ja mittasin miten pinta-alat vaihtelevat. (Taulukko 1) Mitattava ala oli Suomen “päälaella” oleva kolmikulmainen ala. Oli tarkoitus vaihdella mittauksia myös ellipsoidin ja tason välillä mutta oma versioni QGIS:istä ei näyttänyt niiden välillä mitään eroja (A Coruña). En kuitenkaan vielä vaihtanut versiota koska linux-koneessa se aina ole niin yksinkertaista ja toivon että tämä olisi ainoa versioon liittyvä ongelma joka tulee kurssilla vastaan.

Eri projektioilla oli suuria vaikutuksia mitattavaan alaan. Luontevasti Lambert ja Suomen kohdalla tarkka TM35FIN olivat erittäin lähellä toisiaan. Sen sijaan Mercator vääristi valtavasti, ollen n. 760% suurempi kuin pitäisi. Robinsonin projektio ei heittänyt yhtä paljon, sillä se on kompromissiprojektio joka ei ole missään asiassa täysin oikeassa mutta ei hirvittävän pahasti väärässäkään. Gall-Petersin projektio taas näyttä pinta-alat oikein suhteessa toisiinsa, mutta verrattuna oikeaan alaan, siinäkin oli heittoa niin että luku oli 83% suurempi kuin pitäisi. Tämän halusin ottaa mukaan siksi, että ymmärtää kuinka väärä luku silti on jos verrataan Gall-Petersin projektion ulkopuolelle. Eli suhteet ovat oikein vain projektion sisäisesti.

Taulukko 1. Projektioiden pinta-alavertailua (ellipsoidi ja karteesinen ilmoitettu neliökilometreinä)

 

 

 

 

 

Projektion valinnalla on suuri merkitys esitettävän tiedon luotettavuuteen. Uutisissakin näkyy usein virheitä projektion valinnassa. Jos kartoista vähän tietävä piirtää vaikkapa 200km säteen jonkin kaupungin ympärille, saadaan täysin väärää tietoa vaikutusalueesta mikäli kartta on esitetty väärässä projektiossa, esimerkiksi jos käytetään oikeakulmaista projektiota. Täytyy siis olla tarkkana siinä, että valitsee oikean projektion kyseiseen käyttötarkoitukseen. Erityiesti silloin jos tarvitaan isoa aluetta esittävää karttaa, esim. tehdään havaintoja Euroopan alueesta.

Robinson-projektion pinta-alat

Tarkastelin vielä Robinson-projektion pinta-alojen mittavirhettä verrattuna Mercatorin projektioon. Tässäkin on hieman heittoa, pinta-alat ovat 18-42 prosenssia suurempia kuin niiden pitäisi olla (vertailukohtana Lambert), mutta heitto on pienempi kuin Mercatorin projektiolla. Kuitenkin jakauma on hyvin samanlainen, eli pohjoista kohti virhe pahenee, mutta Etelä-Suomea ja Pohjois-Suomea vertailtaessa mittavirhe ei kaksinkertaistu, vaan se on noin 1,16-kertainen.  Tämä kertoo siitä, että vaikka vääristymää tulee lisää pohjoista kohden, niin vääristymän skaala on huomattavasti maltillisempi. Kuvasta nähdään että luokitusrajat menevät hyvin samaan tapaan kuin Mercatorin projektiossa, mutta huomattavasti pienemmillä luvuilla.

Robinson-projektiota oli mielenkiintoista tutkia, koska se näytti aluksi niin hämmentävästi antavan saman näköisen teemakartan kuin Mercatorin projektio. Tutkin kuntien pinta-alojen eroja Etelä- ja Pohjois-Suomessa aika tarkasti jotta sain kunnollisen kuvan siitä, miten projektio elää etelä-pohjois -akselilla. Projektiosta huomaa sen, että se on kompromissi. Se ei ole täysin tarkka missään kohtaa maailmaa, mutta ei täysin väärässäkään. Oletan että sen takia mittavirhe ei pahene yhtä voimakkaasti pohjoista kohti mentäessä kuten Mercatorin projektiossa, vaikka muuten virheen “etenemissuunta” on sama.

Pinta-alaan suhteutetun tiedon esittäminen

Kokeilin esittää lasten asumistiheyttä teemakartalla (lasten määrä neliökilometrillä). Ensin käytin oikeapintaista Lambert-projektiota ja sitten Mercator-projektiota jotta tulokset olisivat selkeästi erilaiset. Nähdään että kartta näyttää molemmissa erittäin uskottavalta jos ei kiinnitä huomiota lukuarvoihin. Molemmat kartat näytävät samalta, mutta koska Mercator vääristää pinta-aloja valtavasti suuremmiksi, niin vaikuttaa siltä kuin lapsia asuisi harvemmassa kuin mikä tilanne oikeasti on.

Mitä jäi päähän

Oli hyvä kerrata projektioita ja erityisesti oppia etsimään niitä QGIS:istä. En ollut huomannut ajatella miten paljon ne voi vääristää jos jotain lukua halutaan suhteuttaa esim. pinta-alaan. Olin ajatellut enemmänkin niin että väärä projektio vääristää kartalle piirrettyjä asioita, esimerkiksi niin että suorin reitti ei kuljekaan siitä missä se on kartalle piirrettynä jos kartta ei ole oikeakulmainen. En ollut sen tarkemmin miettinyt miten väestöntiheys tai muut verrattavat asiat muuttuvat jos esitystapa on väärä. Tämä saa minut varovaiseksi jatkossa projektiota valitessa.

Viikolla tuli opittua myös teknisiä asioita, kuten geometrisen tiedon tallennusta tietystä projektiosta ja rajapintojen käyttöä. Rajapinnoista on varmasti hyötyä paljon jatkossa. Tulostettavan karttakuvan luominen alkoi sujua jo helpommin viimeisiä karttoja tehdessä.

Olisin halunnut ottaa vertailuun mukaan luennolla mainitun Equal Earth -projektion, nähdäkseni miten paljon Robinsonia tarkempi se on. En kuitenkaan löytänyt sitä, mutta huomasin kurssilaisen Kasperin löytäneen sen. (Mickos 2021) Ymmärsin että se täytyisi ladata custom-projektiona jos sitä haluaisi käyttää. Koetan ensi kertaan mennessä saada sen asennettua.

 

Lähteet:

Mickos, Kasper (2021). Kasperin Blogi. Haettu 27.1.2021: https://blogs.helsinki.fi/kmickos/

QGIS-ohjelma auki ensimmäisen kerran! (vk1)

Ensikokemus QGIS-ohjelmistosta oli samanlainen kuin monesta muustakin ammattiohjelmistosta. Ruutu täynnä erilaisia pieniä kuvakkeita joista ei saa aluksi itse tutkimalla mitään selvää mitä niillä voi tehdä. Kuvankäsittelyohjelma on ehkä lähinnä tätä käyttöliittymäkokemusta mutta toki QGIS:in toiminnot ovat erilaisia. Kuitenkin hyvin nopeasti kuvakkeista alkoi saada selkoa ja teimme luennon aikana luennoitsijan esimerkkiä seuraamalla omat koropleettikartat (ensimmäinen opittu uusi termi maantieteestä!) Itämeren typpipäästöistä.

Tulostetta suunnitellessa tuli muutamia teknisiä haasteita mutta sain ne selvitettyä ja tulosteesta tuli juuri sellainen kuin halusin. Näin pienenä kuvana ainoaksi harmittavaksi asiaksi jäi järvien ääriviivojen sumppuuntuminen mustiksi parviksi.

Sitten ryhdyin etsimään netistä aineistoja joita olisi mielenkiintoista tutkia kuntakohtaisesti kartalla. Päätin tehdä tehtävän vaikeustasolla 2. Halusin löytää jotain peruskoululaisiin liittyvää joka olisi valmiiksi .csv-muodossa. Sivustolta avoindata.fi löytyikin useita vaihtoehtoja ja lopulta päädyin Yleisradion julkaisemaan aineistoon, joka kertoo kuinka moni kunnan oppilaista joutuu opiskelemaan väistötiloissa syyslukukaudella 2018. (Yleisradio 2018) Kiinnostukseni heräsi koska en ollut lukenut aiheesta mitään lehdistä ja halusin itsekin tietää onko väistötiloissa opiskelu yleistä koko maan tasolla.

Aineiston liittäminen kuntapohjaan aiheutti ongelmia koska aineistossa oli vain kuntien nimet, eikä yhdistäminen niiden perusteella onnistunut kunnolla vaikka molemmat aineistot olivat merkitty käyttävän UTF-8 merkitstöä. Virheitä tapahtui silti esimerkiksi ääkkösen kohdalla. Aluksi liitetyt aineistot näyttivät tältä, eli monia kuntia jäi puuttumaan:

Yritin muokata aineistoa eri tavoin ja lopulta löysin Sanna Jantusen blogista idean, että voisi yrittää yhdistää tietoja kuntanumerolla. (Jantunen 2021) Aineistossani ei sellaista numeroa tosin ollut, joten etsin ensin käsiini toisen valmiiksi .csv-muodossa olevan aineiston joka sisälsi kuntanumerot. (Digi- ja väestötietovirasto 2021) Liitin tämän ensin väistötila-aineistoon kuntien nimien perusteella ja nyt ääkkösongelmaa ei tullut kun molemmat tiedostot olivat .csv-muodossa. Sitten täytyi vielä tehdä kuntapohjaan uusi kenttä jossa kuntanumero olisi tekstin sijaan kokonaislukuna ja lopulta liittäminen onnistui. Tässä blogissa ei ollut tarkoitus avata tarkemmin teknisiä vaikeuksia mutta toivon että tästä voisi olla toisille apua, kuten minulle oli Sannan kirjoituksesta!

Lopullinen kartta näyttää tältä:

Peruskoululaiset väistötiloissa syksyllä 2018

Kaikista kunnista ei ollut tietoa väistötiloista, mutta suurimmasta osasta kuitenkin oli. Päädyin esittämään asian osuuksina, koska ymmärsin luennolla että tarkkoja lukumääriä ei saa esittää. Tähän täytyy vielä kysyä tarkennusta myöhemmin, että miksi näin on ja mitä tilanteita tämä ohje koskee.

Joissain kunnissa oli alle 10hlö väistötiloissa, jolloin osuuttakaan ei pystynyt laskemaan, joten nämä kunnat jätin harmaaksi. Valitsin kategorioiden rajat aluksi ohjelman älykkäällä toiminnolla ja muokkasin niitä vielä itse. Rajoja valitessa yritin tehdä kartasta mahdollisimman informatiivisen ja ajattelin että tärkeintä on nähdä missä kunnassa ei ole ketään väistötiloissa. Lisäksi halusin että näkyisi selvästi jos yli puolet tai kaikki oppilaat ovat väistötiloissa (55.8% valikoitui rajaksi jotta toisiaan hyvin lähellä olevat arvot pysyisivät samassa kategoriassa). Joissain pienissä kunnissa voi olla vain muutama koulu, ehkä jopa vain yksi, joten minusta on hälyttävä merkki jos kunnalla on yli puolet oppilaista väistötiloissa. Tiheästi asutuilla alueilla puolestaan on varmasti aina jonkin koulun oppilaat väistötiloissa, minkä vuoksi 0-5% luokitus toimii hyvin indikaattorina että väistötila-asiat ovat kunnassa melko hyvällä tolalla. Toisaalta kiinnostavaa olisi myös nähdä aineisto kouluista, joissa epäillään sisätilaongelmia mutta väistötiloja ei ole saatu tai haluttu ottaa käyttöön! Samoin olisi mielenkiintoista nähdä tämä sama aineisto päivitettynä vaikka vuodelta 2020.

Kun sain tulokset kartalle, olin yllättynyt siitä kuinka paljon oppilaita onkaan väistötiloissa. Mielestäni kartta näyttää aika hyvin sen, missä kunnissa tilanne on vakava ja selkeästi sen missä tilanne on hyvä. Tiheämmin asutuilla alueilla joutuu tosin suhteuttamaan prosenttilukuja siihen että pohtii samalla montako koulua alueella on. Esimerkiksi olisi minusta paljon huolestuttavampaa jos kunnan 30 koulurakennuksesta 10 on poissa käytöstä kuin että kunnan 3 koulusta yksi on poissa käytöstä. Eli kartan tarkastelu voi olla vaikeaa sellaiselle joka ei tunne Suomen väestöjakaumaa lainkaan.

Viikon uudet opit

QGIS-ohjelmiston käytöstä opin paljon uusia asioita, koska käyttökerta oli ensimmäinen. Huomasin myös että kun pari päivää oli kulunut luennosta, olin jo ehtinyt unohtaa osan asioista ja sain todella kaivella muistia kun aloin tehdä varsinaista viikon tehtävää. Viikon suurin oivallus oli varmastikin se, että miten tietoja kannattaa muuttaa ja yhdistää jotta tulos on järkevä.

Tällä viikolla sain myös paljon ajatella sitä, mitä haluaisin oikeastaan teemakartalla kertoa ja miten asiat kannattaisi esittää. Tässä aihealueessa minulla on vielä valtavasti opittavaa, koska en ole työskennellyt sen paremmin karttojen kuin tilastotieteenkään parissa tätä ennen juurikaan. Ensi kerralla ehkä koetan valita karttaan aiheen joka on selkeämpi esittää osuuksina kartalla ja on lopuksi vielä informatiivisempi.

Tapani etsiä tietoa on kokeileva. En lukenut kertaakaan QGIS:in ohjeita tai googlannut, vaan sinnikkäästi etsin ohjelmistosta toimintoja, joita toivoin sieltä löytyvän. Matkan varrella löysin myös useita toimintoja joista voi olla hyötyä tulevaisuudessa. Join-toiminto tuntui hankalalta kun on tottunut toimimaan tietokantojen kanssa tietokannan tasolla eikä ohjelmiston välityksellä. Tuntui kuin kädet olisi sidottuna. Toivoisin jatkossa löytäväni jonkin reitin koskea suoraan tietokantaan tai sitten oppivani ymmärtämään vielä paremmin ohjelmiston logiikkaa.

 

Lähteet:

Digi- ja väestötietovirasto 2021. Kuntaluettelo. Haettu 19.1.2021 osoitteesta https://www.avoindata.fi/data/fi/dataset/kuntaluettelo

Jantunen, Sanna (2021). Sannan blogi. Haettu 19.1.2021 osoitteesta https://blogs.helsinki.fi/smjantun/

Yleisradio (2018). Väistötiloissa opiskelevat peruskoululaiset syyslukukaudella 2018. Haettu 19.1.2021 osoitteesta https://www.avoindata.fi/data/fi/dataset/vaistotiloissa-opiskelevat-peruskoululaiset-syksy-2018