7: Omavalintaisen datan visualisoimista (päivittyy)

Hei taas!

Viimeisellä kurssikerralla saimme tehtäväksi luoda kartta/karttasarja, jossa esittettäisiin vähintään kaksi muuttujaa per kartta. Kurssikerta oli muista poikkeava, sillä emme oikeastaan saaneet minkäänlaisia ohjeita karttojen tekoon, vaan tehtävänämme olikin testata omia taitojamme ja muistella jo oppimaamme.

Halusin kovasti valita karttaani alueen, jota emme olisi vielä luennoilla käsitellyt. Yhdysvallat kiehtoivat, sillä alueella asuu niin monenlaista väkeä ja osavaltiot olisivat hyvä aluejako tehtävään. Tiedostin, että omalla gis-osaamisellani tehtävä tulisi olemaan hyvin haastava, mutta jos ei nyt niin ei milloinkaan!

Heti aluksi kohtasin ongelman, kun minun olisi pitänyt itse etsiä pohjakartta projektiini. Suurin osa netin rasterikartoista oli maksullisia, kunnes googlessa selailun jälkeen löysin sivun, jossa ohjeistettiin asentamaan QGIS:iin plugin, josta ohjakarttojen lataaminen kävisi kädenkäänteessä. Näin tehtiin ja käytin pohjakarttanani QuickMapServices-pluginista tuotua ESRI Standard -karttaa. Kartalla ei valitettavasti näy Alaskaa tai Hawaiia, jotka nekin ovat tietysti osavaltioita.

Seuraavaksi oli vaikeamman vaiheen vuoro, koska nyt oli tarkoitus oikeasti etsiä dataa kohteesta ja visualisoida se. Löysin Yhdysvaltain datakirjastosta todella hyvän aineiston sydänsairauksiin kuolleista henkilöistä aikavälillä 2015-2017. Aineisto tosin oli silti todella suuri ja haasteeksi tulikin sen visualisoiminen.

Huomasin, että koska pohjakartassa osavaltiot olivat aika vaaleasti merkatut, oli arvojen alueellinen lukeminen vaikeahkoa. Teinkin pienen peruutusliikkeen ja etsin vielä tietokannan, joka näyttäisi osavaltioiden rajat paremmin. Tietokannan etsimisessä ei mennytkään paljoakaan aikaa ja se löytyi näppärästi Census.gov -osoitteesta.

Kartta näytti nyt tältä (Kuva 1). Halusin pienentää aineiston suuruutta hieman, joten valitsin Select By Value -toiminnolla vain vuonna 2016 kuolleet. Vaikka datassa ei lukenutkaan miten arvot ovat esitetty, uskon silti, ettei yksi pallo kuvaa aivan yhtä ihmistä, vaan arvot ovat jotenkin suhteutettu väestöön. Toisaalta cdc.gov -sivuston mukaan n. 655 000 amerikkalaista kuolee sydänsairauksiin vuosittain, mutta pisteiden lukumäärää kartallani on vaikea arvioida, koska ne menevät päällekkäin.

Ensimmäinen huomioni kun karttaa katselin oli, että sydänsairauksiin kuolleita oli huomattavasti enemmän idässä, kuin lännessä. Keksin, että olisi todella kiinnostavaa löytää selitystä ilmiölle esimerkiksi pikaruokaloiden määrästä. Näin olisin voinut visualisoida pikaruokaravintoloiden sijainnit kartalle ja nähdä mahdollisesti, onko idässä kyseisiä rafloja enemmän. Tällaisen aineiston etsiminen oli kuitenkin todella vaikeaa, sillä tuloksina google haulla löysin lähinnä valmiiksi visualisoituja karttoja. Datankin löysin, mutta se oli vuodelta 2007, eli ei kovin käytännöllinen omassa kartassani. Löysin kuitenkin ArcGIS:in omakehittelemän kartan ja liitänkin sen oman tekemäni kartan alle (Kuva 2).

Kuva 1. Keskeneräinen kartta kuvaa sydänsairauksiin kuolleita henkilöitä vuonna 2016.
Kuva 2. Kymmenen suosituimman pikaruokalaketjun sijoittuminen Yhdysvalloissa. Lähde: ArcGIS. Fast Food Nation: Mapping the Top Ten Chains

Kuvan 2. kartalta voidaankin siis periaatteessa jo vastata aiemmin esittämääni kysymykseen, sillä kyllä, pikaruokaravintoloita on enemmän idässä kuin lännessä! Uskon, että näillä kahdella onkin jonkinlainen yhteys, sillä pikaruoka on Yhdysvalloissa todella halpaa ja jos se on helposti saatavilla, kasvaa sen kulutus myös huomattavasti.

Loppujen lopulta löysinkin aineiston pikaruokaloista! Sivulla ei kuitenkaan ollut yhtä aineistoa, joka olisi kattanut kaikki Yhdysvaltojen pikaruokaravintolat, vaan jokaisella ravintolaketjulla oli oma aineistonsa. Päätin valita käsiteltäväkseni siis Yhdysvaltain tunnetuimman pikaruokaravintolan, Mc Donald’s:in. Kuvassa 3 näkyy vielä pelkkien Mc Donald’s ravintoloiden sijoittuminen Yhdysvalloissa. Jo nyt voidaan huomata, että eniten ravintoloita on juuri idässä, missä sydänsairauksiin kuolevia on eniten.

Kuva 3. Kartalla vihreällä Mc Donald’s ravintoloiden sijoittuminen Yhdysvalloissa. Lähde: POI Factory 2021

Seuraavaksi yhdistinkin kaksi muuttujaa ja loin kartan, jossa näkyy sekä sydänsairauksiin kuolleet, että Mc Donald’s ravintolat (Kuva 4.) Päätin, että interpoloin kartan sydänsairauksiin kuolleiden mukaan ja ihana QGIS päätti taas, että operaatioon menee seuraavat kaksi päivää. Yritin myös käynnistää sovelluksen uudelleen, mutta se ei edes suostunut sammumaan.

 

jatkuu…

Haluan mainita Lotan blogin, jossa hän on tehnyt mielestäni kaksi erinomaista karttaa toisen turvattomuudesta ja toisen pahoinpitelyrikoksista! Kartat ovat todella huolellisesti tehty, joka saa minut hieman kateelliseksi, omat gis-taitoni kun tuntuvat junnaavan paikallaan…

Lähteet:

ArcGIS. (2020) Fast Food Nation: Mapping the Top Ten Chains

<https://www.arcgis.com/apps/MapSeries/index.html?appid=6b23b5dd8cc84a5e9f8d6fca7ce58607>

Data.gov (10.12.2020) Heart Disease Mortality Data Among US Adults (35+) by State/Territory and County – 2015-2017. <https://catalog.data.gov/dataset/heart-disease-mortality-data-among-us-adults-35-by-state-territory-and-county-2015-2017-8fd97>

Open.gis.lab (20.4.2018) Adding Basemaps In QGIS 3.0. <https://opengislab.com/blog/2018/4/15/add-basemaps-in-qgis-30>

POI Factory (27.2.2021) McDonalds USA/Canada.

<http://www.poi-factory.com/node/11154>

Puodinketo, L (2.3.2021) 7. kurssikerta: Omaa työskentelyä.

<https://blogs.helsinki.fi/lottapuo/2021/03/02/7-kurssikerta-omaa-tyoskentelya/>

 

6: Interpoloimista ja hasardikarttoja

Tänään pääsimme itse datan keruuseen, mikä toi flashbackit lukion maantiedon neljänteen kurssiin, jossa lähdimme tämän kurssikerran kaltaisesti ulos reippailemaan. Oltiin Roosan kanssa itseasiassa samassa lukiossa (ja ehkä samalla kurssilla) ja hänen blogissaan on myös linkki siellä tekemäämme projektiin!

Käytimme datan keruuseen Epicollect5 sovellusta. Kävelin sellaisen 2,5km lenkin ja sain kun sainkin 10 pistettä kartalle kerättyä. Aika tosin meinasi loppua kesken, kun päädyin hieman harhailemaan ympäriinsä. Latasimme aineiston QGIS:iin missä pystyimme käsitellä sitä pidemmälle. Interpoloin aluksi aineiston niin, että kartalla näkyi väreittäin kuinka turvalliseksi opiskelijat olivat tunteneet olonsa eri pisteissä (Kuva 1.)

Kuva 1. Koettu turvallisuuden tunne opiskelijoiden satunnaisesti vierailemilta alueilta.

Antti pohtii blogissaan tarkemmin, millä alueilla turvattomuutta eniten esiintyy ja mitkä seikat tulokseen voivat vaikuttaa.

Kotitehtäväksi saimme etsiä tietoa eri hasardeista ja tehdä tietojen pohjalta kolme karttaa, joita voisi käyttää myös opetuksessa. Toisin sanoen tavoitteenani oli luoda mahdollisimman selkeä, mutta informatiivinen kartta!

Aloitin tehtävän tekemisen tarkastelemalla seismologista toimintaa maapallolla. Hain datan Northern California Earthquake Data Centerin sivuilta, jossa seismologista dataa pystyi etsimään esimerkiksi eri aikaväleillä tai eri voimakkuuden mukaan.  Päätin etsiä tietoa kaikista yli 7.5 richterin maanjäristyksistä aikavälillä 1990-2020. Halusin aikavälistä hyvin lyhyen, jotta saisin käsityksen siitä, kuinka paljon voimakkaita maanjäristyksiä on ilmennyt viimeisen kolmenkymmenen vuoden aikana.

Kartan teko kävikin todella nopeasti, joten lisäsin mukaan vielä toisen tietokannan; tällä kertaa tulivuorista (Kuva 1). Päätin tarkastella kaikista maailman kolkista Aasiaa ja tarkemmin vielä Japanin ympäristöä, sillä minua kiinnosti todella paljon minkälainen yhteys tulivuorilla ja maanjäristyksillä alueella on.  Aasia sijaitsee Tyynenmeren tulirenkaan alueella, joten alue on hyvinkin hasardiherkkä.

Kuva 1. Vulkaaninen toiminta ja maanjäristykset Japanin alueella.

 

Myös Liisa on blogissaan tutkinut Aasian aluetta, mutta hieman pidemmällä aikavälillä ja tuonut kiinnostavia pointteja esiin mm. infrastruktuurin heikkoudesta alueella ja tästä seuraavasta haavoittuvuudesta hasardeille. Yritin aluksi interpoloida kartan, mutta siitä tuli ehkä hieman sekava, joten päätin sitten esittää kartan ihan vain ilman kyseistä vaihetta. Antin blogissa kartta on kuitenkin interpoloitu!

Kuvan 1. symboli “vulkaaninen toiminta” on sen niminen, sillä pelkkä “tulivuoret” ei olisi ollut tarpeeksi kuvaava. Aineistossa oli nimittäin  perinteisten tulivuorien lisäksi myös mm. kalderoita ja tuhkakartio, joiden symboli on nyt sama. Kartalta voidaan hyvin huomata, että moni tulivuorista seuraa jonossa toisiaan. Tälle selitys löytyy laattatektoniikasta, sillä juuri jonon kohdalla sijaitseva Tyynenmeren mannerlaatta tunkeutuu sekä Euraasian että Filippiinien mannerlaatan alle. Kuvaa voitaisiin käyttää opetuksessa esimerkiksi koekysymyksessä, jossa voitaisiin kysyä tulivuorten ja mannerlaattojen yhteyttä toisiinsa.

Kuvasta voidaan huomata, että vaikka vulkaanista toimintaa on paljon, ei todella suuria maanjäristyksiä alueella kuitenkaan ole. Pienempiä alle 7 magnitudin järityksiä kuitenkin alueella on enemmän, johtuen valtion sijoittumisesta laattojen risteämiskohtaan. Toisaalta magnitudiasteikolla seitsemän ja sitä isomman magnitudin järistykset ovat jo erittäin voimakkaita ja tuhoisia. Kahdeksan magnitudin järistykset tuottavat jo täydellistä tuhoa.

Seuraavaksi tarkastelin vielä meteoriittien törmäyspaikkoja maapallolla (Kuva 2). Olisin halunnut tehdä kartasta yhtä hienon kuin Ilarin blogissa interpoloimalla sen, mutta valitettavasti QGIS ei suostunut yhteistyöhön, vaan ilmoitti että interpoloinnissa kestäisi 600 minuuttia.. Lopputuloksena päätin sitten vain julkaista kartan tälläisenaan. En myöskään saanut maailmankartalle järkevää mittakaavaa tehtyä, mutta sama ongelma näytti olevan monella muullakin.

Kuva 2. Meteoriittien törmäyspaikat. Viimeksi päivitetty 2018. Lähde: NASA

Olisin kovasti halunnut, että kartan interpolointi olisi onnistunut, sillä tällaisenaan kartta ei ole kovinkaan informatiivinen. Kartta kylläkin kertoo törmäyspaikkojen sijainnin, mutta ei esimerkiksi meteoriittien massaa, kuten Ilarin kartalla. Yritän koittaa interpolointia myöhemmin uudelleen ja jos onnistaa, päivitän tätä postausta!

Lähteet:

Ahokas, L. (26.2.2021) kuudes kurssikerta. Luettu 26.2.2021.

<https://blogs.helsinki.fi/ahokliis/2021/02/26/kuudes-kurssikerta/>

 

Harmonen, R. (23.2.2021) Kuudes kurssikerta. Luettu 24.2.2021.

<https://blogs.helsinki.fi/harmoroo/2021/02/23/kuudes-kurssikerta/>

 

Leino, I. (25.2.2021) Kuudes kurssikerta. Luettu 28.2.2021

<https://blogs.helsinki.fi/ilarilei/2021/02/25/kuudes-kurssikerta/>

 

NASA (2018) Meteorite Landings.

<https://data.nasa.gov/Space-Science/Meteorite-Landings/gh4g-9sfh>

 

NCEI Volcano Location Database. NOAA National Centers for Environmental Information. (2021)

<https://data.nodc.noaa.gov/cgi-bin/iso?id=gov.noaa.ngdc.mgg.hazards:G02135>

 

Northern California Earthquake Data Center. (2021) Historic ANSS Composite Catalog Search 

<https://ncedc.org/anss/catalog-search.html>

 

Paakkari, A. (26.2.2021) Viikko 6. Luento ja harjoitukset. Luettu 26.2.2021.

<https://blogs.helsinki.fi/anttipaa/2021/02/26/viikko-6-luento-ja-harjoitukset/>

 

 

 

5: Bufferien käytön harjoittelemista ja turhautumista (päivittyy)

Varoitus! Tämä postaus sisältää todella paljon työvaiheiden kuvailua ja tekstiä. Pääasiat , sekä tehtävänannot on boldattu, joten niiden välillä on helppo navigoida. 🙂 

Aloitimme luennon heti itse harjoitusten parissa. Aluksi teimme töitä toiminnoilla “sum line lengths”, “clip” ja “intersection”. Näin saimme kartan ulkoasua muokattua niin, ettei uuden tietokannan “pellot” ylittäisi Pornaisten rajoja ja teiden pituudet laskettua yhteen.

Yksi luennon uusista asioista, joita harjoittelimme oli bufferien käyttö. Bufferien avulla on mahdollista luoda vyöhykkeitä, jonka alueelta laskea arvoja. Teimme harjoitukseksi bufferin Pornaisten kartan tie-tasolle. Halusimme bufferin avulla laskea, kuinka moni asunto sijoittuu 100m  etäisyydelle teistä. Bufferin luominen oli todella helppoa, niin kuin myös komentojen esittäminen. Tuloksena oli taso, jossa 100 metrin etäisyydellä olevat talot on merkitty keltaisella (Kuva 1.)

Kuva 1. Bufferin käytön harjoittelemista.

Loppuosa luennosta olikin itsenäisten tehtävien tekemistä. Ensimmäisessä tehtävässä tuli luoda bufferi Malmin lentokentän kiitoratojen ympärille ja selvittää, kuinka monta ihmistä asuu kahden ja yhden kilometrin päässä lentoasemasta. Kahden kilometrin sisällä lentokentästä asuu 58922 ihmistä (Kuva 2).

Kuva 2. Luotu bufferi, jossa nähdään keltaisella 2 kilometrin säteellä Malmin lentokentästä asuvat ihmiset.

Toistin saman pienemmällä alueella eli loin bufferin yhden kilometrin alueelle ja seuraavaksi käytin toimintoa “select by location”. Yhden kilometrin säteellä lentokentästä asuu noin 9182 ihmistä. Tein vielä saman Helsinki-Vantaan lentokentälle, jossa kahden kilometrin säteellä asui 11764 ihmistä.

Seuraavaksi piti selvittää kuinka monta ihmistä äskeiseltä 2 kilometrin alueelta asuu Helsinki-Vantaan lentokentän pahimmalla melualueella (65 dB). Valitsin aktiiviseksi kohdaksi meluaste-layerin ja valitsin “select by value” toiminnolla alueeksi vain 65 dB-alueet. Sen jälkeen käytin edellisten kohtien tapaan select by location -toimintoa ja kappas sain laskettua arvon kysymykselle. Pahimmalla melualueella asuu 303 ihmistä, joka prosentteina on kaikista kahden kilometrin  alueella asuvista ihmisistä on n. 2,6%. Vähintään 55dB meluhaitan alueella asuu 11923 ihmistä.

Toisessa harjoituksessa otettiin katse kohti kartan asemia ja luotiin näiden ympärille 500 metrin bufferit. Buffereiden alueelle sijoittui 111765 ihmistä. Kaikista alueen ihmisistä siis 21,6% asuu asemien läheisyydessä. Näistä ihmisistä työikäisiä oli 74989 ihmistä.

Seuraavaksi oli vuorossa taajamien kanssa työskentely. Tarkoituksena oli ensimmäisenä selvittää, kuinka monta ihmistä alueella asuu taajamissa. En ollut aivan varma, pitikö meidän käyttää Vantaa vai Pk-tietokantaa, joten pitäydyin tutussa Vantaan väestö -tietokannassa. Tämän kohdan suoritin taas kerran select by location -toiminnolla, joka sujui jo melkein automaattisesti! Tuloksena sain 74989 ihmistä, joka on n. 96%.

Koko tietokannan asukkaista kouluikäisiä on 58511 ja taajamassa asuvia kouluikäisiä on 50762. Taajaman ulkopuolisia kouluikäisiä on siis 58511-50762 = 7749/13,2%.

Itsenäiseksi tehtäväksi valitsin uima-altaiden ja saunojen parissa puuhailun.  Heti aluksi meidän täytyi laskea, kuinka monta uima-altaalla varustettua rakennusta PK-seudulla oikein olisi. Sanotaanko, että en tosiaan tehnyt tätä ehkä helpoimman kautta, tai niin kuin muut olivat tehneet, mutta laskin vastauksen vain field calculatorilla sum-toiminnolla. Vastaukseksi sain, että uima-altaita olisi 855 kpl ja jos nyt oletan, että jokaisessa asunnossa niitä on vain yksi niin silloin myös altailla varustettuja rakennuksia olisi tämän verran.

Taloissa, joissa on uima-allas asuu yhteensä 12 170 ihmistä.

(jatkuu)

Bufferien käyttö on itselleni yllättävän helppoa ja vaikka viime kurssikerralla peloteltiin tämän kerran olevan se kaikista vaikein, niin itsestäni tuntuu aivan päinvastaiselta. Kuten Sannakin blogissaan sanoo, ei oikeastaan minkään työkalun käyttö ole tuntunut vaikealta, mutta kun niitä harvemmin käyttää, saattaa moni asia unohtua.

Viimeiset tehtävät epäonnistuivat totaalisesti. Voin samaistua Roosan fiiliksiin tästä kurssikerrasta. Turhauttaa, että en osaa tehdä edes muiden mielestä helppoja tehtäviä. Vaikka yritin kuinka monta kertaa saada selville, kuinka monta uima-allasta eri talotyypeittäin alueilla on, en sitä vain yksinkertaisesti saanut selville. Loppujen lopuksi QGIS kaatui ja kadotti kaikki aineistotkin..

Lähteet:

Korpi, S. (16.2.2021). Osaamistason arviointia (vk 5). Luettu 18.2.2021

<https://blogs.helsinki.fi/sakorpi/>

Harmonen, R (18.2.2021) Viides kurssikerta: bufferointia. Luettu 23.2.2021

<https://blogs.helsinki.fi/harmoroo/>

Harjoitus 4: Eri aineistot käsittelyyn

Neljännellä kurssikerralla kävimme läpi suurimmaksi osaksi jo tuttua asiaa, eli piste- ja rasteriaineistoja. Kertaus on opintojen äiti, joten oli kiva virkistää muistia eri aineistojen suhteen.

Teoriaa, teoriaa…

Pisteaineistot ovat erinomaisia kuvaamaan esimerkiksi rakennuksia ja muita pistemäisiä kohteita. Vaikka piste itsessään vaikuttaa todella yksinkertaiselta täpältä kartalla, voidaan siihen tallentaa lukematon määrä tietoa, kuten esimerkiksi rakennuksen rakennusvuosi ja pinta-ala. Pisteaineistoista tarkin on laserkeila-aineisto, koska se sisältää miljoonia pisteitä ja sen raakaversiosta voidaan valikoida  monenlaisia asioita joita visualisoida, kuten rakennuksia tai kasvillisuutta. Pisteaineisto on kuitenkin vaikeampi esittää, kuin ruutuaineisto.

Ruutuaineistot ovat hyviä aineistoja, kun halutaan kerätä tietoa jostakin alueesta ilman valmista aluejakoa. Käyttäjä voi itse valita, minkä kokoisia ruutuja tarkastelee. Ruutuaineistot ovat kuitenkin huomattavan kalliita, mikä tekee niistä peruskansalaiselle vaikeamman “saavuttaa”.

Ruutuaineiston käsittely

Tunnin aikana harjoittelimme ruutuaineiston käsittelyä. Luennon aikana tutuiksi tulivat uudet työkalut kuten Vector Grid ja Select by Location. Loimme myös kurssimateriaalin avulla kartan, josta näkyy ruotsinkielisen väestön osuus pääkaupunkiseudulla. Tehtävänämme oli myös luoda kartta käyttäen jotain muuta attribuuttitaulukon muuttujaa ja oman luomukseni näette alla (Kuva 1).

Kuva 1. Muun kuin suomea äidinkielenään puhuvan väestön sijoittuminen pääkaupunkiseudulla.

Myös Liisa oli blogissaan tutkinut muunkielisen väestön määrää pääkaupunkiseudulla ja tykkään erityisesti hänen karttansa värimaailmasta, joka on kivan vihreä ja tekee kartasta helposti luettavan.

Kuvasta 1 voidaan huomata, että suurin osa muuta kuin suomea äidinkielenään puhuvasta väestöstä sijoittuu Helsingin, Espoon ja Vantaan alueille. Kuten Liisakin blogissaan mainitsi, on kartta melko yleistävä, ja koska esimerkiksi paikannimet puuttuvat kartalta kokonaan, ei sitä ole kaikkein helpoin lukea. Uskon, että henkilölle, joka ei paljoakaan tiedä pääkaupunkiseudusta, kartta ei antaisi paljoakaan irti.

Miksi muunkielinen väestö on keskittynyt kaupunkien katveeseen? Myös Annika on pohtinut samaa blogissaan. Vaikka karttaa on vaikeahko lukea, voidaan kuitenkin yleistiedon perusteella sanoa, että esimerkiksi työpaikat houkuttelevat asukkaita tietyille alueille. Kaupunkien läheisyydessä on luultavasti enemmän työpaikkoja, joissa työntekijä voi esimerkiksi käyttää vain englannin kieltä, kuin maaseudulla. Junaratojen vierustoilla asuinalueet kuten Kivistö Vantaalla ja Espoon Keskus Espoossa houkuttelevat muunkielisiä halvempien vuokrien avulla.

Espoossa Otaniemi on maailmallakin tunnettu korkeakoulu, joten se houkuttelee alueelle paljon ulkomaalaisia opiskelijoita. Itä-Helsingissä halvat vuokrat ja muiden maahanmuuttajien muodostamat yhteisöt houkuttelevat alueelle uusia asukkaita. Helsingin Sanomissa on julkaistu kiinnostava artikkeli mikä havainnollistaa muunkielisen väestön sijoittumisen Helsingissä.

Korkeuskäyrien pariin

Aloitimme luennon toisen puoliskon tarkastelemalla Pornaisten peruskarttaa ja paria rasteriaineistoa. Aluksi tehtävänä oli muuttaa aineistojen koordinaattijärjestelmät tuttuun TM35-järjestelmään ja sen jälkeen yhdistää tasot virtual raster-toiminnon avulla. Tämän jälkeen teimme alueelle rinnevarjostuksen jonka jälki oli todella tarkkaa! Oli mielenkiintoista kuinka yksityiskohtainen aineistosta tuli, jopa peltojen pienet kyntöurat näkyivät.

Loimme kartalle myös korkeuskäyrät, minkä tekeminen oli yllättävän helppoa. QGIS kuitenkin latasi korkeuskäyriä aivan todella kauan, mikä johtui luultavasti suuresta aineistosta. Luodussa kartassa näkyivät sekä pohjakartta, rinnevarjostus, että uudet korkeuskäyrät (Kuva 2.)

Kuva 2. Kartta, johon lisätty korkeuskäyrät ja rinnevarjostukset.

Seuraavaksi saimme luvan kerrata TEM-kurssin saloja, nimittäin pääsimme kliksuttelemaan erilaisia kohteita kartalta. Voin sanoa, että pieni epätoivon äännähdys pääsi itseltänikin, kun tämän kuulin, mutta tehtävä sujui kuitenkin nopeahkosti (Kuva 3.)

Kuva 3. Pornaisten alueelle digitoidut rakennukset sekä tiet.

Siinä kaikki tällä kertaa. Tsemppiä kaikille kanssaopiskelijoille! 🙂

Lähteet:

Innanen, A. (11.2.2021) Harjoitus 4: Väestöteemakartta ruutuaineistosta. <https://blogs.helsinki.fi/anninnan/>

Ahokas, L. (13.2.2021) rasteria ja muuta kivaa (neljäs kurssikerta). <https://blogs.helsinki.fi/ahokliis/>

Kuokkanen, K. (2020) Satatuhatta helsinkiläistä <https://dynamic.hs.fi/a/2020/helsinginkielet/>

 

Tietokantaliitoksia ja harjoitus 3 (päivittyy)

En päässyt osallistumaan kolmannen kurssikerran liveluennolle, joten minulle jäi itseopiskeltavaksi tämän luennon aihe. Onneksi luennot olivat tallennettuja, joten pääsin näppärästi katsomaan ne Moodlen kautta, eikä tarvinnut ihan yksin käpristellä uusien harjoitusten kanssa.

Tällä kertaa emme tehneetkään töitä Suomen valtion kanssa, vaan hyppäsimme Afrikan mantereelle. Harjoittelimme aluksi samanlaisten sarakkeiden yhdistämistä niin, että myös laskemamme pinta-alat siirtyisivät sarakkeiden mukana. Tämä tehtiin siksi, että attribuuttitaulukossa oli jokaista valtiota todella monta riviä, koska jos valtiolla oli esimerkiksi saaria, näkyivät ne omina riveinään. Testasimme kahta eri toimintoa, dissolve ja aggregate, joista aggregate oli huomattavasti parempi tähän hommaan. Dissolve oli ihan hyvä, mutta se ei laskenut pinta-aloja yhteen vaan valitsi riveiltä suurimman luvun.

Harjoittelimme myös excel-aineiston liittämistä QGIS-aineistoon, joka kävikin yllättävän helposti, kun excel-tiedostosta muunnettiin csv-tiedosto. Lisäsimme aineistoomme myös muita tietoja, kuten tiedon internetin käytöstä valtioittain ja laskimme myös internetin käyttöasteen.

Tarkastelimme myös Afrikan valtioiden konflikteja ja mietimme niiden suhdetta esimerkiksi timanttilouhontaan. Huomasimme, että esimerkiksi Angolassa, jossa timanttikaivoksia oli peräti 43, oli konfliktivuosia 42. Vaikka emme voi olla varmoja onko näillä kahdella asialla kausaatiota, voi niillä olla jonkinlainen korrelaatio, sillä valtioissa joissa konflikteja oli huomattavan vähän, oli myös todella vähän timanttikaivoksia. Vaikka luulisi, että timanttien louhonta rikastuttaisi valtioita ja näin vähentäisi konflikteja, ei taulukon perusteella näin ole. Sannan blogissa onkin kerrottu ns. veritimanteista ja kuinka esimerkiksi Sierra Leonin sisällissotaa on tuettu alueen timanttikaivoksilla. Myös Time-magazine on julkaissut kiinnostavan artikkelin jossa käsitellään veritimantteja tai toiselta nimeltään konfliktitimantteja.

 

Kotitehtävänämme oli luoda kartta Suomen järvisyydestä, sekä laskea eri tietokantoja yhdistelemällä tulvaindeksi. Voin sanoa, että meinasin repiä viimeisetkin hiukseni päästä, kun avasin tehtävän pari päivää luennon jälkeen (päähän ei selvästikkään ollut ihan tarttunut opittu asia). Aluksi en löytänyt alikeskivirtaamaa, mutta sitten keksin katsoa eri tasojen attribuuttitaulukoita ja sieltähän se löytyikin (tietenkin..). Muistelin, että join-toiminnolla sai kaksi eri tietokantaa liitettyä toisiinsa ja näinhän kävikin, jes yksi askel eteenpäin!

Seuraavaksi laskin tulvaindeksin jakamalla keskiylivirtaaman keskialivirtaamalla. Termit olivat itselleni aivan hepreaa, joten eiköhän tsekata, mitä harjoituksen ohjeissa näistä kerrotaan. Okei, eli keskialivirtaama tarkoittaa alimpien mitattujen arvojen keskiarvoa jollain ajanjaksolla mitattuna. Ylikeskivirtaama taas tarkoittaa päinvastaisesti ylimpien mitattujen arvojen keskiarvoa. Tulvaindeksi vertaa näitä kahta arvoa toisiinsa.

Kuva 1. Attribuuttitaulukkoon on laskettu tulvaindeksi oikealle.

Kuvassa 1. näkyy attribuuttitaulukko joins-toiminnon ja tulvaindeksin laskennan jälkeen. Lisäsin toisesta tietokannasta vahingossa pari saraketta, jotka olivat jo myös toisessa, joten esimerkiksi sarake “nimi” ilmenee taulukossa kaksi kertaa. No ainakin tulvaindeksi saatiin laskettua! Suurin tulvaindeksi taulukon mukaan löytyy Aurajoelta ja pienin Vuokselta.

Koropleettikartan (Kuva 2.) luominen tulvaindeksin pohjalta aiheutti aluksi päänvaivaa, kunnes muistin miten arvot saa esille kartalle ja sen jälkeen kartan viimeistely sujuikin hyvin. Sitten aloin tarkastelemaan karttaani tarkemmin ja huomasin, että se näytti erilaiselta kuin muiden opiskelijoiden. Kuten Tapiokin blogissaan ihmetteli, oli itsellänikin tulvaindeksin arvot hieman erilaiset. Voisiko tämä johtua esimerkiksi siitä että opiskelija on valinnut jonkin muun kuin “natural breaks”-kohdan karttaa väsätessään?

Kuva 2. Tulvaindeksi valuma-alueittain. Lähde: Kurssimateriaali (2020)

Seuraavaksi tehtävänä oli vielä lisätä samaan attribuuttitaulukkoon tieto alueiden järvisyydestä, joka oli alkuperäisesti exel-muodossa. Tämän jälkeen oli tehtävänä luoda teemakartta, josta järvisyys selkenisi diagrammeina. En saanut join-toimintoa millään toimimaan ja kahta tietokantaa näin ollen liitettyä toisiinsa, joten yritän uudelleen myöhemmin… (päivittyy)

Lähteet:

Baker, A. Blood diamonds. Time Magazine.<https://time.com/blood-diamonds/>

Jantunen, S. (3.2.2021). Veritimanteista keskivirtaamiin. <https://blogs.helsinki.fi/smjantun/>

Turpeinen, T. (4.2.2021). 3: Konflikteja ja tulvaindeksejä <https://blogs.helsinki.fi/tapiotur/>

Projektioita ja tietokantoja (Harjoitus 2)

Hei taas! Toisen luennon aiheena oli tällä kertaa datan lähteet ja erilaisten projektioiden kanssa työskentely. Alkutunnista tutustuimme erilaisiin datan lähteisiin (joita muuten oli todella monta) ja erityisesti erilaisiin rajapintoihin, kuten WFS-, WMS-, WMTS- ja WCS-palveluihin. Aluksi nämä “rajapinnat” olivat itselleni aivan hukassa, lyhenteet epäselviä ja termit vaikeita käsittää. Pääsimme lopputunnista kuitenkin käsittelemään WFS-palveluita ja ne osoittautuivatkin hyvin helpoiksi käyttää.

Ensimmäiseksi harjoittelimme QGIS:illä erilaisten valintojen tekemistä select features by expression -työkalulla. Olin avannut Moodlesta aineiston, jossa Suomi oli jaettu kuntiin. Select by expression -työkalulla pystyin valitsemaan kartalta tiettyjä alueita jatkokäsittelyyn; tässä tapauksessa Pohjois-Karjalan. Toiminto oli hyvin kätevä ja helppo käyttää, joten tulen varmasti käyttämään sitä myös tulevaisuudessa.

Lopputunnista vertailimme vielä erilaisia projektioita ja miten ne vaikuttavat kartan ulkonäköön ja esimerkiksi pinta-aloihin tai pituuksiin. Teimme kaksi tasoa, joista toinen käytti projektiota ETRS89/TM35 ja toinen World-Mercatoria. Attribuuttitaulukkoa tarkastelemalla voitiin huomata, että kahden eri projektion pinta-alat kartalla olivat hieman erilaiset.

Laskin vielä suhdeluvun näille kahdelle projektiolle ja loin kartan, jossa värit kuvaavat pinta-alojen suhteen vääristymistä (Kuva 1). Kuten kartalta voidaan huomata, vääristyy pinta-ala sitä enemmän, mitä kauemmas päiväntasaajasta mennään. Mercatorin projektiolle ominaista onkin, että mittakaava kasvaa päiväntasaajalta navoille siirryttäessä, jolloin kauempana päiväntasaajaa olevien alueiden pinta-alat vääristyvät.

Kuva 1. Mercatorin projektion pinta-alojen vääristymän suhde verrattuna ETRS89 (TM35)-projektioon. Lähde: Moodle, Kunnat 2020 tilastoja

Meille jäi vielä kotiin tehtäväksi vertailla samalla tavoin vääristymiä myös muilla projektioilla. Aluksi minulla oli todella paljon ongelmia QGIS:in kanssa, sillä aina kun yritin valita uuden projektion tarkasteltavaksi, ohjelma jumittui. Sain kuitenkin lopulta sen toimimaan ja valitsin toiseksi vertailtavaksi projektioksi Winkel-Tripel nimisen projektion (Kuva 2). Lähes mikään muu projektio ei itselläni toiminut, vaan ohjelma jumittui tai herjasi erroria. Ties mistä sekin johtui? Toisaalta myös Tapio oli blogissaan potenut samaa ongelmaa eri projektioiden toimimattomuuden kanssa.

Kuva 2. Winkel-Tripelin projektion vääristymien suhde verrattuna ETRS89 (TM35)-projektioon (%).

Ylläolevaa karttaa tutkaillessa voidaan ihan ensimmäiseksi huomata koko Suomineidon ulkonäkö. Suomi on Winkel-Tripelin projektiossa kallistunut hieman vasemmalle päin. Pinta-alat Mercatorin projektion tapaan vääristyvät enemmän pohjoisemmassa. Kartassa on tapahtunut pieni virhe, sillä olisi loogisempaa, että isommat vääristymät olisivat punaisella ja pienemmät sinisellä, kuten kuvassa 1; huolittomuusvirhe siis.

Winkel-Tripelin projektiossa pinta-alojen erot verrattuna TM35:een eivät ole suuret ja tämä johtuu siitä, että projektiossa ei pyritä täysin eliminoimaan vääristymiä vaan hakemaan kompromissi, jossa mikään kartan osatekijöistä ei vääristy liikaa. Pinta-alojen vääristymä on tästä syystä hillitympi, eikä erot kahden projektion välillä ole suuria, mutta kuten useat muut projektiot, vääristymät suurenevat päiväntasaajilta navoille mentäessä.

Lähteet:

Turpeinen, T. (28.1.2021). “Kurssikerta 2 (27.1.) Pohjois-Karjalaa ja projektioita”. <https://blogs.helsinki.fi/tapiotur/>

Koponen, J. (14.4.2017). “Mercatorin projektio ei sovi maailmankarttoihin. Gall-Peters on lähes yhtä surkea vaihtoehto”.<http://informaatiomuotoilu.fi/2017/04/mercatorin-projektio-ei-sovi-maailmankarttoihin-gall-peters-on-lahes-yhta-surkea-vaihtoehto/>

Esri, ArcGIS Pro (2021) “Winkel Tripel”. <https://pro.arcgis.com/en/pro-app/latest/help/mapping/properties/winkel-tripel.htm>

Kurkistus geoinformatiikan maailmaan

Ensimmäinen kurssikerta ja kurkistus geoinformatiikan maailmaan ovat nyt takana päin. Tämän blogin ideana on harjoitella akateemista kirjoittamista ja omien harjoitusten julkaisua, sekä muiden kurssilaisten harjoitusten analysointia. Kurssin nimi geoinformatiikan menetelmät 1 kertoo jo paljon. Kurssin ideana on pikku hiljaa alkaa ymmärtämään geoinformatiikan käytännön puolta vain teorian kertaamisen sijaan. Kurssilla tullaan luomaan erilaisia kurssitöitä ja harjoituksia, jotka sitten julkaistaan tässä blogissa. Blogi toimii tällätavoin myös samanaikaisesti eräänlaisena oppimispäiväkirjana.

Geoinformatiikka on itselleni vielä hieman vieras maantieteen ala. Lukiossa geoinformatiikan kurssi ei paljoakaan inspiroinut, joka tietenkin kantoi yliopistoon asti hieman negatiivisena suhtautumisena oppiaineeseen. Itseäni geoinformatiikassa eniten kiinnostaa datan analysoiminen ja erilaiset taulukkohommat. Karttojen tekeminen ja niiden visualisointi taas ovat pahin painajaiseni.

Ensimmäisellä luennolla kävimme aluksi hieman geoinformatiikan teoriaa, jonka jälkeen kävimme itse hommiin. Sovelluksena käytimme QGIS-nimistä ohjelmaa, joka kädestä pitäen näyttämällä toimi suhteellisen hyvin. Ohjelma kuitenkin toimii parhaiten englanninkielellä, joten ilman kirjallisia ohjeita, olisi tehtävien suorittaminen varmasti todella vaikeaa tällaiselle aloittelijalle kuin minä. Loimme luennolla QGISillä kartan, joka visualisoi typen päästöjä valtioittain (kuva 1). Voin heti sanoa, etten todellakaan olisi osannut tehdä tällaista karttaa ilman step-by-step ohjeistusta. Harjoitus kuitenkin tekee mestarin!

Kuva 1. QGIS:illä tuotettu koropleettikartta kuvaa typen päästöjä valtioittain (%).

 

QGIS:issä oli monta hyödyllistä toimintoa, jotka tekivät siitä mukavemman käyttää, kuin esimerkiksi Corel Draw -ohjelmasta. Tällaisia olivat esimerkiksi valmiit pohjoisnuolen ja mittakaavan symbolit, jotka tekivät kartasta heti selkeän ja asiallisen näköisen. Luomassani kartassa on kuitenkin myös hieman epäselvyyksiä, kuten mustat alueet valtioiden päällä. Yritin kovasti etsiä tähän keinoa selventää karttaa, mutta se meni minulta aivan ohi. Muuten kartta on ensimmäiseksi tuotokseksi mielestäni oikein mainio. Kartan teossa oli kuitenkin varsinkin aineiston tuomisessa monenlaisia erilaisia vaiheita, joiden harjoittelua minun pitää vielä jatkaa.

Koropleettikartan luomista

Luennolta ei jäänyt käteen vain yhtä tehtävää, vaan sain jatkaa aivojeni kiusaamista  vielä kotitehtävän parissa. Tehtävänä oli luoda koropleettikartta omavalintaisesta aineistosta hyödyntäen Suomen kuntien tietokantaa vuodelta 2015. Harjoituksessa oli kolme vaikeustasoa joista valitsin nyt ensialkuun helpoimman, taitoni QGISin parissa kun eivät ole vielä hääppöiset. Jos teitä kiinnostaa nähdä miltä vaikeampien tasojen luomukset näyttävät, niin suosittelen tsekkaamaan Annikan blogin, missä hän myös selittää todella hyvin vaiheet joita on käynyt läpi harjoitusta tehdessään!

Mutta nyt oman luomukseni pariin. Tehtävänä oli siis luoda koropleettikartta, joka tuttuna terminä ei kuitenkaan aivan muistunut mieleen. Pienellä googlailulla selvisi kuitenkin, että koropleettikartta on niin sanottu aluesymbolikartta, jossa kartan alueet on usein luokiteltu ryhmiin niiden saamien lukuarvojen pohjalta (tilastokoulu.stat.fi).

Aika avata QGIS! Olin ladannut tehtävään tarvittavan kunta-aineiston Moodlesta ja avasin sen ohjelmassa. Aluksi minulla oli ongelmia löytää kartalta minkäänlaista tietoa ja aineistojenkin etsintä oli hankalaa, mutta lopulta ne löytyivät “statistics” nimisen ikkunan alta. Päädyin tarkastelemaan vain näitä aineistoja, enkä hakenut netistä uutta ihan jo sen takia, että olin käyttänyt niin paljon aikaa vain sovelluksen käytön ymmärtämiseen.

Valitsin visualisoitavaksi aineistokseni yli 65-vuotiaiden osuuden Suomessa (kuva 2).

Kuva 2. Yli 65-vuotiaiden osuus väestöstä (%) vuonna 2015. Lähde: kurssimateriaali

Kun kartan tekemiseen tarvittavat työkalut oli vihdoin löydetty, oli se helppo visualisoida. Valitsin kartan väriksi viileän sinisen kuvaamaan Suomen ikääntyvää väestöä ja sen sijoittumista kunnittain. Karttaa tarkastelemalla voidaan huomata, että tummimmat alueet, eli kunnat missä väestö on ikääntynein, sijaitsevat enimmäkseen Keski- ja Itä-suomessa. Myös pohjoisessa sijaitsee pari suurta kuntaa, joilla väestöstä 26-37% on iältään yli 65 vuotiaita.

Iäkäs väestö on pääasiassa sijoittunut kuntiin, joissa opiskelijoita ja nuoria on vähemmän (vrt. opiskelijakaupungit). Esimerkiksi Jyväskylän, Oulun ja Helsingin alueilla väestö on enimmäkseen työikäistä, mikä tietysti selittyy esimerkiksi työpaikkojen sijainnilla. Vanhukset ovat sijoittuneetkin enimmäkseen maalle ja rannikolle, missä eläminen on ehkä seesteisempää kuin kaupungeissa.

Yhteenvetona ensimmäisestä harjoituksesta voisin sanoa, että vaikka QGIS:in käyttö on itselleni vielä lähinnä opetusvideoiden varassa, tuli ensimmäisistä kartoista jo ihan kelvolliset ja selkeät. Itselläni parantamisen varaa tulee vielä pienissä säädöissä, koska esimerkiksi luokittelu vaikuttaa hyvin paljon kartan ulkonäköön. En kokeillut tällä kertaa käyttää muita luokittelutapoja kuin “natural breaks”, joka luennollakin oli esitelty ihan vain siksi, että pääsisin aluksi helpommalla ja voisin sitten myöhemmin taitotason kasvaessa alkaa tutustumaan monimutkaisempiin kommervenkkeihin, mitä ohjelma tarjoaa.

Lähteet:

Tilastokeskus, Tilastokoulu, 4.2 Koropleettikartta <https://tilastokoulu.stat.fi/verkkokoulu_v2.xql?course_id=tkoulu_teemak&lesson_id=4&subject_id=2&page_type=sisalto> (luettu 25.1.2021)

Innanen, A. (22.1.2021), Harjoitus 1: Koropleettikartan laatiminen QGIS:issä.  <https://blogs.helsinki.fi/anninnan/> (luettu 25.1.2021)