VIIKKO 7: Oma kartta

Viimeisellä kurssikerralla teimme oman kartan omavalintaisista aineistoista. En suoraan keksinyt aihetta kartalleni, joten inspiroiduin mallikartasta ja päätin käyttää pohjana Yhdysvaltojen karttaa. Latasin osavaltioiden pohjakartan Yhdysvaltojen väestönlaskentatoimiston sivuilta (United States Census Bureau) ja aloin latailemaan erilaisia väestötietokantoja. Latasin CORGIS nimisestä github-repositoriosta Yhdysvaltojen väestönlaskentatoimiston luoman väestötietoaineiston (CORGIS Project, 2021) valmiiksi tiivistettynä ja jaettuna osavaltioiden perusteella. Alkuperäisenä ideana oli tehdä Yhdysvaltojen 2020-vuoden presidentinvaalien äänestystilastoista jonkinlainen esitys, mutta idea osoittautui hieman haastavaksi erilaisten vaalipiirien (esimerkiksi yhdessä osavaltiossa monta ‘districtiä’) ja valitsijamies-systeemin vuoksi. Päätin lopulta tehdä esityksen köyhyydestä ja murhatilastoista.

Ensimmäisen kartan tein oppitunnin aikana. Kohtasin ongelmia ensiksi käyttämäni rikosaineiston kanssa, joten latasin netistä toisen sen enempää tutkimatta. Kartan valmistumisen jälkeen osoittautui, että murhatilastot olivat vuodelta 1973, joten alla olevassa kartassa (Kuva 1) on esitettynä köyhyysrajan alapuolella olevat henkilöt 2010-luvulla sekä murhatilastot 1970-luvulta. Ympyröiden koot ovat myös hyvin samankaltaisia, joten eroja osavaltioiden välillä on vaikea erottaa. Esimerkiksi Länsi-Virginian ja Georgian murhat 100 000 ihmistä kohden eroavat noin 10:llä, mutta kartassa tätä ei huomaa niin hyvin kuin ehkä pitäisi.

Kuva 1: Köyhyys 2010-luvulla ja murhatilastot 1970-luvulla

Päätin yrittää uudelleen ensimmäisen rikosaineiston käyttöä. Aineisto oli samasta CORGIS-githubista ja aineiston tuottajat olivat Yhdysvaltain oikeusministeriö ja FBI. Alkuperäinen ongelma aineistossa oli se, että en saanut järkevästi joinattua sitä väestöaineistoon, sillä se sisälsi joka osavaltion tilastot 60 vuoden ajalta. En keksinyt nopeaa tapaa ratkaista ongelmaani, joten päätin lopulta tehdä virtuaalitason SQL-kyselyn avulla (Kuva 2).

Kuva 2: SQL-kysely virtuaalitason luomiseen

Joinasin virtuaalitason vielä alkuperäiseen pohjakarttaan ja loin uuden kartan. Ajantasaisen datan lisäksi uudessa versiossa ympyrädiagrammit erottaa toisistaan paremmin. Lopputuloksessa District of Columbiassa eli Washington D.C.:ssä oli helposti suurin murhien määrä, jonka voisi selittää sillä, että alue koostuu pelkästään yhdestä kaupungista, joissa ainakin Yhdysvalloissa murhamäärät ovat suurempia. Muuten köyhyydellä ja murhamäärillä on jonkinlainen korrelaatio, esimerkiksi etelävaltioissa. Vähäisen köyhyyden osavaltioissa (7,5 – 12) ympyrädiagrammit näyttävät myös olevan aika pieniä.

Kävin myös tarkastelemassa muiden tekemiä karttoja. Veeralla oli hyvin tehty kartta energiankulutuksesta ja energianlähteistä, jossa oli saatu kahden muuttujan kartta näyttämään hyvinkin selkeälukuiselta. Aten blogissa oli myös mielenkiintoinen esitys maailman huumekuolemista sekä tarkemmat kartat Euroopasta sekä Yhdysvalloista. Näitä karttoja katsellessani mietin, että omaa esitystapaani olisi voinut vielä hioa selkeämmäksi. Karttaa tehdessäni huomasin, kuinka vaikeaa monen muuttujan kartta on saada näyttämään hyvältä. Esimerkiksi pienet osavaltiot Koillis-Yhdysvalloissa sekoittuvat esityksessäni toisiinsa. Vielä jälkeenpäin ajateltuna niistä olisi voinut lisätä zoomatun kartan Alaskan ja Havaijin viereen.

Yhteenveto kurssista

Kurssin jälkeen tunnen osaavani QGISin käytön OK-tasolla ja osaan soveltaa opittuja asioita tarkoituksiini. Moniin toimenpiteisiin QGISIssä ei ole vain yhtä oikeaa tapaa jonka lisäksi Googlesta löytää helposti vastauksia ongelmiin. Ehkä QGISin käyttöä tärkeämpänä pidän sitä, että olen oppinut paljon siitä, miten karttoja yleisesti luodaan. Esimerkiksi erilaiset analyysit sekä karttojen visualisointi ovat asioita, joista en tiennyt paljoa ennen kurssia. Opetustapa oli mielestäni myös virkistävä, ja kuten ensimmäisessä postauksessani mainitsinkin, tämänkaltainen opetus olisi saattanut sopia myös aikaisemmin käymiini tietojenkäsittelytieteen opintoihin. Välillä on hyvä, että asiat opetetaan ns. kädestäpitäen, jonka jälkeen niitä voi alkaa soveltaa. Yleisesti kurssi oli mielestäni mielenkiintoinen ja opin todella paljon uutta.

Kiitos!

Linkit:

United States Census Bureau. 2018 States. Viitattu 7.3.2024. https://www.census.gov/geographies/mapping-files/time-series/geo/carto-boundary-file.html

CORGIS Project. State Demographics. United States Census Bureau. Luotu 5.11.2021. Viitattu 7.3.2024. https://corgis-edu.github.io/corgis/csv/state_demographics/

CORGIS Project. State Crime. U.S. Department of Justice & FBI. Luotu 19.10.2021. Viitattu 7.3.2024. https://corgis-edu.github.io/corgis/csv/state_crime/

Ala-Heikkilä, V. Viikko 7: Oma karttaprojekti. Viitattu 7.3.2024. https://blogs.helsinki.fi/veeraala/

Nevala, A.  Kartta vapaavalintaisesta aiheesta. Viitattu 7.3.2024. https://blogs.helsinki.fi/nevalatt/

VIIKKO 6: Ulkoilua ja luonnonhasardikarttoja

Kuudennella kurssikerralla keräsimme omaa dataa, josta toteutimme pisteaineiston sekä opettelimme muokkaamaan netistä löytyvää dataa. QGISn käyttö tähän mennessä sujuu hyvin, mutta hitaasti.  Kaikkien työkalujen muistamiseen kuluu jonkin verran aikaa, jonka lisäksi onnistun tehokkaasti tuhlaamaan aikaa pikkuasioiden selvittämiseen. Kuitenkin yleisesti mielestäni hallitsen QGISn perusasiat ihan hyvällä tasolla.

Oman datan tuottaminen

Kävimme aamulla noin tunnin ulkoilulla keräämässä kohteiden koordinaattitietoja. Kohteet kerättiin Epicollect5-sovellukseen, jossa piti koordinaattien lisäksi myös vastata muutamaan kysymykseen esimerkiksi kohteen viihtyvyydestä ja turvallisuudesta. Kiersimme kolmen hengen ryhmässä jossain Kumpulan kasvitieteellisen puutarhan ja Vallilan siirtolapuutarhan suunnalla. Lopputuloksessa kartalla ei kuitenkaan näkynyt kaikkia pisteitämme, joten uskon, että osasta unohtui merkitä koordinaatit.

Kurssikerralla oli bussilakon vuoksi vähemmän porukkaa kuin normaalisti, joten myös kohteita oli vähän. Keräämämme kohteet sai kätevästi ladattua Epicollectista csv-tiedostona. QGISissä visualisoimme kohteet kartalle. Otimme turvallisuuden tutkittavaksi muuttujaksi. Turvallisuutta mitattiin kohteissa asteikolla 1-5 ja arvot olivat välillä 2-5. Interpoloimalla saimme hienon esityksen Kumpulan turvallisuudesta (Kuva 1). Turvattomana alueena ryhmämme koki Kustaa Vaasan tien ja Hämeentien risteyksen ympärillä olevan alueen ja etenkin bussipysäkin risteyksen kohdalla (punainen alue). Turvallisia alueita olivat taas Kumpulan kampus sekä asuinalue Arabian kauppakeskuksen takana. Hauska ilmiö kartassa on myös polarisaatio punaisen ja sinisen välillä Kumtähdenkentän portaat laskeuduttaessa: portaiden yläpää on koettu turvattomaksi ja alapää turvalliseksi. Turvattomuuteen vaikuttaa oleellisesti suurten autoteiden läheisyys. Eipä itselleni ainakaan tule mieleen Kumpulasta muita turvallisuutta laskevia tekijöitä, kuin liikenneonnettomuuksien riski.

Kuva 1: Interpolaatio turvallisuuden tunteesta Kumpulan kampuksen ympäristössä

Hasardit (itsenäinen tehtävä)

Kumpulan turvallisuudesta siirryimme seuraavaksi itsenäisenä tehtävänä tarkastelemaan hasardeja globaalisti. Tarjolla oli hieno pohjakartta sekä nettisivuja, joista löytyi dataa maanjäristyksistä, tulivuorenpurkauksista ja meteoriiteista. Päätin käyttää meteoriittien putoamispaikka-aineistoa kartan tekemiseen. Tein kartan yli 10kg:n meteoriiteista, jotka on löydetty vuoden 2000 jälkeen. Sijainteja on hieman haastavaa nähdä kartasta, mutta ne näkee suurin piirtein.

Kuva 2: Yli 10kg:n meteoriitit, jotka löydetty vuoden 2000 jälkeen

Tein myös maanjäristysaineistosta kartat yli 7 magnitudin maanjäristyksien esiintymisestä välillä 1980-2000 sekä 2000-2024. Kartasta voidaan huomata, että suurin osa suurista maanjäristyksistä tapahtuu Tyynenmeren tulirenkaalla. Katseltuani muiden kurssilaisten, kuten Veeran, karttoja tajusin, että olisin voinut tehdä omista kartoistani visuaalisesti hienompia. Nykyisellään niiden ulkoasu on aika tylsä.

Kuva 3: Yli 7 magnitudin maanjäristykset vuosien 1980 ja 2000 välillä
Kuva 4: Yli 7 magnitudin maanjäristykset vuosien 2000 ja 2024 välillä

Lähteet

Ala-Heikkilä, V. Viikko 6: Pistekartat ja interpolointi. Veeran blogi. Haettu 4.3.2024. https://blogs.helsinki.fi/veeraala/2024/02/22/viikko-6-pistekartat-ja-interpolointi/

VIIKKO 5: Bufferit

Viidennellä kerralla harjoittelimme erilaisten analyysityökalujen, kuten intersectionin, clipin ja bufferin käyttöä. Näistä intersection-analyysilla saadaan kahta aineistoa vertaillessa tuloksena kaikki alueet, jotka kuuluvat molempiin tietokantoihin. Clipillä puolestaan lähtöaineistosta voidaan toisesta aineistosta tehdyllä “piparkakkumuotilla” leikata alueita. Tämä eroaa intersectionista siten, että tuloksessa on vain lähtöaineiston tietokannasta valitut kohteet. Buffer tuntui kuitenkin olevan näistä kiinnostavin. Siinä kohteen, esimerkiksi viivan tai polygonin, ympärille luodaan valitun kokoinen vyöhyke. Näin voidaan tarkastella kohteita, jotka jäävät vyöhykkeen sisäpuolelle. Kerran itsenäisissä tehtävissä pääsin myös testaamaan QGIS-taitojani ilman opettajan ohjeistusta ja se sujuikin alun jälkeen ihan mukavasti.

Jatkoa Pornaisten kartan digitointiin ja analysointiin 

Viime kurssikerralla aloitettu Pornaisten keskustan alueen tutkiminen sai jatkoa tällä kerralla analyysien harjoittelun muodossa. Intersectionilla ja clipillä vertailimme pellot-tason peltojen polygoneja ja teitä toisiinsa. Opettelimme käyttämään bufferia ensiksi koulun ja terveyskeskuksen ympärille tehdyillä vyöhykkeillä. Kartoitimme bufferilla myös kaikki rakennukset melualueella 50 metrin säteellä “isoista” teistä. Näiden perusanalyysien käyttö oli onneksi hyvin yksinkertaista. Liitin alle vielä kuvan Pornaisten rajatusta alueesta, jossa bufferi on näkyvissä. 

Kuva 1: Pornaisten rajattu alue

Itsenäisiä tehtäviä

Tällä kerralla olikin paljon itsenäisiä tehtäviä, joissa piti hyödyntää aikaisemmin opittuja taitoja.  Ensimmäisenä tarkasteltiin Malmin lentokenttää. Piirsin Malmin lentokentän kiitoradasta polygonin ja tein sille bufferin 1 ja 2 kilometrin säteellä. Näiltä alueilta laskin rakennusten ja asukkaiden määrät. 

Taulukko 1: Malmin lentokenttä

Tämän jälkeen tein samanlaisen toimenpiteen Helsinki-Vantaan lentokentälle. 2 kilometrin säteellä olevien rakennusten lisäksi laskin myös rakennuksien määriä erilaisten melualueiden sisällä, joista oli oma aineisto. Vuonna 2002 väliaikaisesti laskeutumissuunta lentokentälle oli Tikkurilan suunnasta, joten loin samanlaisen melualueen myös tälle suunnalle bufferin avulla. Melualueesta tuli noin 7 kilometrin pituinen ja kilometrin leveä.

Taulukko 2: Helsinki-Vantaan lentokenttä

Seuraavaksi tehtävänä oli laskea rakennusten määrä 500 metrin päässä juna- tai metroasemasta. Taulukkoon lisäsin myös prosenttiosuuden kaikista asukkaista, työikäisten määrän ja työikäisten prosenttiosuuden 500 metrin vyöhykkeellä asuvista.

Taulukko 3: 500 metrin päässä asemista

Taajamissa asuvat henkilöt saivat myös oman taulukkonsa. Lisäsin taulukkoon myös kouluikäisten määrän taajamissa sekä taajamissa asuvien kouluikäisten prosenttiosuuden kaikista kouluikäisistä. Suurin osa ihmisistä siis näköjään asuu taajamassa.

Taulukko 4: Taajamien asukkaat

Lopuksi vielä laskin taajamissa asuvat ulkomaalaiset. Taulukossa näkyy, kuinka monessa taajamassa on yli 10%, 20% ja 30% ulkomaalaisia.

Taulukko 5: Ulkomaalaiset taajamissa

Tämän jälkeen siirryin tarkastelemaan uima-altaita ja saunoja. Tehtävänä oli laskea pääkaupunkiseudun rakennukset, joissa oli uima-allas tai sauna. Uima-altaiden taulukkoon lisäsin erilaisten rakennustyyppien määrät.

Taulukot 6 ja 7: Uima-altaat ja saunat

Yritin myös muodostaa visuaalisen kartan uima-altaista. Ohjeen mukaan alueisiin piti liittää pylväsdiagrammi sekä määrä, mutta päädyin lopullisessa kartassa pelkkään määrään, sillä kartta näytti muuten aivan liian sekavalta. Alueet ovat niin pieniä, että niiden sisään on vaikea saada mahtumaan paljon tietoa. QGISini myös kaatui, kun olin tekemässä ensimmäistä print layouttia, joten sain tuhlattua tähän tehtävään runsaasti aikaa. Jälkeenpäin katsottuna tekstit olisivat voineet olla hieman isommat tai alueitta olisi voinut värittää, sillä blogissa numerot on vaikea erottaa.

VIIKKO 4: Pisteitä ja ruutuja

Neljännellä kurssikerralla käsittelimme ruutu- ja pisteaineistoja. Ruutuaineistoissa dataa tallenetaan ruutuihin, joilla voidaan kuvata laajoja alueita ja pisteaineistoissa pisteisiin, joilla voidaan kuvata melkeinpä mitä tahansa. Tarkin tapa tuottaa pisteaineistoja on laserkeilaus, jossa hyödynnetään lasersäteitä 3D-mallien luomiseksi. QGISissä opettelimme lisäämään ruudukkoja ja pisteitä sekä esimerkiksi käyttämään rinnevarjostusta.

Ruudukko QGISissä

Ensimmäisenä tehtävänä lisäsimme ruudukon pääkaupunkiseutu-aineistoon. Loimme pääkaupunkiseudun (Helsinki, Vantaa, Espoo) päälle ruudukon, jonka solukoko oli muistaakseni 1km. Sen jälkeen karsimme suuresta väestötietokannasta tehtävän kannalta turhia sarakkeita pois. Karsiminen nopeutti tietokannan käsittelyä huomattavasti. Jätin tietokantaan sarakkeen muunkielisten määristä rakennuksissa ja laskin ruudukkokohtaisesti muunkielisten prosenttiosuudet.

En ole täysin varma, mikä tässä tilanteessa olisi ollut paras keino visualisoida tulokset. Ensimmäisessä versiossa kartasta (Kuva 1) oli esitettynä muunkielisten absoluuttiset määrät ruuduissa, jolloin korkean asukastiheyden alueet korostuivat. Mielestäni loogisempaa oli suhteuttaa muunkielisten määrä ruudun asukaslukuun, joten muutin määrät prosenttiosuuksiksi. Lopputuloksessa muutama ruutu alueen reunalla korostuu, mutta todellisuudessa näissä ruuduissa on yksinkertaisesti niin vähän ihmisiä, että muunkielisten osuus nousee yli 50%. Esimerkiksi yhdessä ruuduista muunkielisten määrä on 100%, sillä sen alueella on neljä asukasta. Harhaanjohtavat ruudut johtuvat ruudukon asettelusta ja itse korjaisin virheen asettelemalla ruudukon uudelleen tai kasvattamalla solukokoa.

Kartasta erottaa hyvin, että esimerkiksi Itä-Helsingissä on paljon muunkielistä väestöä, mutta tarkemmat kaupunginosat jäävät hämärän peittoon. Onnin blogissa tämä on mielestäni esitetty paremmin, sillä ruudukko on jaettu suuralueittain tekstien kera. Muuten kartta on mielestäni ihan informatiivinen, mutta värimaailma voisi olla toisenlainen, sillä tällä hetkellä korkea muunkielisten määrä näyttää negatiiviselta ilmiöltä punaisen värin vuoksi. Toisaalta muunkielisen väestön epätasainen jakautuminen on negatiivinen ilmiö.

Kuva 1: Muunkielisten %-osuudet pääkaupunkiseudulla 1x1km ruudukossa

Rasterikuvien lisääminen ja karttaelementtien luominen

Seuraavassa tehtävässä tarkastelimme rasteriaineistoa Pornaisten kunnasta. Tämä oli ensimmäinen kerta, kun kurssilla käsiteltiin rasteriaineistoja. Pornaisten kartta syntyi lisäämällä aineistot neljässä osassa ja yhdistämällä ne virtuaalisessa tasossa. Lisäsimme karttaan rinnevarjostuksen ja korkeuskäyrät. Mielenkiintoinen seikka rinnevarjostuksessa oli se, että paras visuaalinen ilme syntyy, kun valo tulee suurin piirtein luoteesta, sillä silloin ihmissilmä erottaa parhaiten korkeuserot kuvasta. Korkeuksien tarkastelun jälkeen rajasimme Pornaisten keskustan alueen ja piirsimme sinne autoteitä. Teitä varten piti tehdä uusi shapefile taso, johon ne tallentuivat. Piirtotyökalun käyttö oli onneksi hyvin yksinkertaista. Tämän alueen tarkastelua oli ilmeisesti tarkoitus jatkaa seuraavalla kurssikerralla, mutta lisäsin alle vielä kuvan edistymisestäni tähän mennessä.

Kuva 2: Rajattu alue Pornaisissa, johon tiet piirretty punaisella

Lähteet

Miettinen, O. kk4 blogi. opmietti’s blog. Haettu 19.2.2024. https://blogs.helsinki.fi/opmietti/

VIIKKO 3: Tietokantoja

Kolmannella kurssikerralla tutustuimme QGIS:n tietokantaoperaatioihin. Tietokantojen käsittely on jollain tapaa itselleni tuttua tietojenkäsittelytieteestä, mutta toisaalta QGIS:n omat työkalut vaativat harjoittelua. Kuitenkin ainakin tunnilla esitellyt työkalut vaikuttivat tarpeeksi yksinkertaisilta vaikka olen aika varma, että ilman ohjeita unohdan monta asiaa. QGIS:ssä tuntuu olevan oma työkalu jokaiselle toimenpiteelle.

Harjoittelua Afrikka-aineistoilla

Tunnilla tehdyssä harjoituksessa käytettiin aineistoja Afrikan valtioista, väkiluvuista, öljykentistä, timanttikaivoksista ja konflikteista. Valtiot-aineistossa oli erikoisesti merkitty samasta valtiosta monta kohdetta, jos ne olivat erillisiä polygoneja kartalla, kuten esimerkiksi saaret. Ensimmäisenä ne piti yhdistää uudelle tasolle aggregate-toiminnolla, jolloin kohteiden määrä väheni huomattavasti. Join-toiminnolla siihen liitettiin vielä tietokanta väkiluvuista. Sen jälkeen siihen tehtiin erilaisia laskutoimituksia öljykenttä-, konflikti- ja timantti-tietokannoista. Laskimme esimerkiksi näiden kaikkien määrät jokaiselle valtiolle Count points in polygon-työkalulla.

Tallensin vielä Afrikan kartan (Kuva 1), jossa näkyvät öljykentät, timantit ja konfliktit. Tästä ei ehkä vielä voi vetää johtopäätöksiä näiden luonnonvarojen yhteydestä konfliktien määrään, mutta uskon, ettei se ollut tarkoituskaan. Kartan ulkoasu on mielestäni ihan toimiva.

 

Kuva 1: Kartta Afrikan timanttikaivoksista, öljykentistä sekä konflikteista

Valuma-alueiden tulvaindeksi

Itsenäisenä tehtävänä piti toteuttaa visualisointi Suomen valuma-alueiden tulvaindekseistä sekä järvisyydestä. Tehtävässä piti yhdistellä aineistoja samalla tavalla, kuin edellisessä tehtävässäkin. Kohtasin hieman ongelmia, kun UTF-8 koodaus ei näyttänyt ä ja ö kirjaimia, mutta nopealla googlauksella vaihdoin sen ISO-8859-1:seen. Ymmärsin, että UTF-8:n pitäisi myös tukea suomalaisia aakkosia, mutta ongelma saattoi johtua siitä, että alkuperäinen tiedosto käytti myös ISO-8859-1 koodausta. Järvisyys-prosentti oli myös tallennettu tekstimuodossa, mutta sen vaihtaminen onnistui edellisen tehtävän opeilla. Muuten kartan koostaminen sujui hyvin.

Myönnän, että lopputulos ei ole ihan onnistunut. Mielestäni tuntui loogiselta merkitä kaikkea veteen liittyvää sinisellä, mutta en ajatellut, että oikeastaan kaikki karttaan piirretty liittyy siihen. Nyt järvisyys-pylväitä on vaikea erottaa kartasta. Omasta mielestäni pylväät eivät myöskään ole kovin informatiivisia, vaan parempi ratkaisu olisivat olleet tehtävässä mainitut ympyrädiagrammit, joista näkee suoraan järvien osuuden alueen pinta-alasta. Valuma-alueiden rajat olisivat voineet olla myös selkeämmät. Yhtenä ongelmana pitäisin myös sitä, että tulvaindeksiä ei ole selitetty auki, sillä se ei ole mikään virallinen mittari. Esimerkiksi MHQ/MNQ:n (keskiylivirtaama jaettuna keskialivirtaamalla) olisi voinut merkitä legendaan, toisaalta ainakaan itselleni sekään ei kertoisi paljoa.

Kartasta kuitenkin suurin piirtein näkee, mitkä alueet ovat alttiimpia tulville. Siitä voidaan tehdä johtopäätökset esimerkiksi siitä, että tulvaisimmat alueet sijaitsevat rannikolla ja, että korkea järvisyysprosentti ei tarkoita korkeaa tulvaisuutta vaan pikemminkin päinvastoin. Julian blogissa on myös hyvä havainto ja visualisointi siitä, kuinka tulvaherkillä alueilla Pohjanmaalla sijaitsee suuria jokia. Pohjanmaan tulvaisuuteen tietysti vaikuttaa myös sen tasaisuus.

Lähteet

Julia Olenius. Timantteja ja tulvia (3. kurssikerta). Julian GIS-blogi. https://blogs.helsinki.fi/jolenius/