Daycare centers within poor air quality zones

In this exercise i analyzed the distribution of daycare centers within poor air quality zones. I used multiple data sources to do the analysis. The traffic volume data was a table created by the Helsinki urban environment division. Daycare center data was created by Information technology unit, the file format was .KML. The road network data we used was the Digiroad data made by Finnish transport agency and the air quality table was created by HSY.

After the initial planning and CRS transformations it was time to start building the models. I made the first model with QGIS. It took some time to understand how the QGIS model builder works, but once I got the hang of it, it turned out to be an easy and understandable method for modelbuilding. I already had some experience with the ArcMap model builder, so it didn’t require much thinking. The main difference between the ArcMap and QGIS models is that the QGIS model is “reusable” in the sense that it can be applied for a different set of data whereas the ArcMap model is made for a specific dataset. For example, you could use the model made with QGIS to do the same analysis for another city. In practice, however, the data would have to be very specifically refined in order to work similarly to the data used in this exercise. The straight-forward approach of the ArcMap model builder is probably more suitable for the PPDAC (Problem, Plan, Data, Analysis, Conclusions) framework. However, I think it’s mostly about personal preference and for me, the QGIS model builder worked better.

In the bonus task an additional buffer zone was created based on the recommended distances from roads. The first step was to create a new column for the distance variable. I used a basic IF- “chain” (if(”2016_1″<=5000,20,if(”2016_1”>5000 AND ”2016_1″<=10000,40…) etc.) to classify the recommended distances based on traffic amounts. After the classification the same variable distance buffer was created for the roads, but this time based on the recommended distances. To avoid overlapping of the daycare centers within the minimum and recommended distances, the overlap of the two buffer zones had to be erased. Rather amusingly, the QGIS difference-function did not work on the version that I used for this exercise, so I had to use the SAGA-version of the same function. Lastly the model extracted the daycare centers within the min-rec -difference buffer. (Figure 1)

Figure 1: Finalized model of the air quality zone – daycare unit analysis.

Now we finally had the results (Figure 2): 20 daycare centers within the minimum distance and 33 within the recommended distance. So in total 53 daycare centers are at risk and 964 are not. As the PPDAC model suggests, this leads to further questions: How is this possible? Were the daycare centers established before or after these air-quality zone classifications were published?

Figure 2: Distribution of daycare centers within poor air quality zones in the Helsinki area.

Työpaikkojen jakautumista pääkaupunkiseudulla hotspot-analyysein

Lähtöaineisto tässä harjoituksessa oli taulukkomuodossa, mutta se sisälsi myös koordinaattitietoa, jonka avulla se pystyttiin muuttamaan vektorimuotoiseksi pisteaineistoksi. Pistemuotoinen aineisto muutettiin edelleen rasterimuotoiseksi 500 x 500 metrin tilastoruudukoksi ja tästä tehtiin karttaesitys työpaikkojen alueellisesta vaihtelusta pääkaupunkiseudulla. (Kuva 1)

Kuva 1: Työpaikkojen levittäytyminen pääkaupunkiseudulla 500m ruudukossa.

Hotspot-analyysillä halutaan selvittää, muodostaako tarkasteltava ilmiö alueellisia klustereita. Se on siis eräänlainen geostatistinen työkalu. Itse hotspot-aineisto luotiin neljälle eri alalle. Hotspotit luotiin 1500 metrin tarkasteluetäisyydellä, eli jokaisesta pisteestä tarkasteltiin toimialan keskittymistä 1500 etäisyydellä. Klusteroitumisen tilastollisena merkitsevyystasona käytettiin viittä prosenttia. Kun hotspotit oli luotu kullekkin alalle, pisteet interpoloitiin IDW-menetelmällä. Nyt syntyi neljä karttaa, joissa näkyi kunkin alan työpaikkojen jakautuminen pääkaupunkiseudulla.

Kuva 2: Eri alojen hotspotien jakautumista pääkaupunkiseudulla.

 

 

Viimeinen kerta ja omat sovellukset

Viimeisellä kurssikerralla ei enää ollut opetusta, vaan saimme nyt itse soveltaa kurssilla opittuja menetelmiä. Tehtävänä oli siis luoda karttoja itse hankituista aineistoista. Saimme kurssiblogiin joitakin esimerkkisivuja joissa jaettiin avointa spatiaalista dataa.

Suurimpana ongelmana kurssikerrassa oli lähinnä se, etten tiennyt mistä oman karttaesitykseni tekisin. Aineistojen etsiminen, valitseminen ja kokeileminen veikin ehdottamasti eniten aikaa tästä uurastuksesta. Lopulta päätin kuitenkin lähestyä tehtävää hieman eri näkökulmasta ja keskityin enemmän uusien toimintojen kokeilemiseen. Löysin mielenkiintoisen pluginin nimeltä OSM-tools. Tällä pluginilla tarkastellaan saavutettavuutta ajan tai matkan perusteella. Pitää kuitenkin ottaa huomioon, että lisäosalla tuotettu aineisto ei täysin vastaa todellisuutta, sillä se on automaattisesti generoitu. Plugin käyttää siis open street mapin matka-aikadataa ja luo niiden perusteella saavutettavuusalueita.

Saavutettavuudella tarkoitetaan sitä, kuinka helposti jokin asia, ihminen tai paikka on saavutettavissa eri tekijöiden perusteella. Saavutettavuusanalyysillä on merkittävä osa esimerkiksi kaupunkisuunnittelussa. Kun mietitään, minne sijoittaa jokin palvelu on tärkeää katsoa kuinka monta asukasta tämä palvelu saavuttaa.

Päätin tarkastella Meilahden sairaalan saavutettavuutta luomalla kymmenen, seitsemän ja viiden minuutin isokronit. Tämän jälkeen liitin kuhunkin isokroniin väestödataa spatiaalisella liitoksella. Näin sain siis selvitettyä, kuinka monta ihmistä saadaan saavutettua henkilöautolla eri matka-ajoissa (Kuva 1). Taustalle laitoin esteettisistä syistä bing road-kartan, mutta lopullisessa esityksessä pienten katujen nimet häiritsevät kartanlukua. Olen kuitenkin tyytyväinen lopputulokseen, sillä saavutettavuusanalyysi kiinnostaa ja sen ymmärtäminen ja osaaminen on varmasti hyödyllistä tulevaisuudessa.  Matti Moisalalla oli samaan aiheeseen liittyvä hieno karttaesitys.

Kuva 1: Saavutettavien asukkaiden lukumäärä henkilöautolla viiden, seitsemän ja kymmenen minuutin matkalla.

Kiitokset kurssista! Ehdottomasti mielenkiintoisin tähän mennessä.

Lähteet:

Moisala, Matti. 7. Datojen keräilyä.
https://blogs.helsinki.fi/moisalam/2018/03/15/7/
(Luettu: 28.3.2018)

Tekniikka & talous
Näin vältät aamuruuhkan ja etsit uuden asunnon hyvillä kulkuyhteyksillä – saavutettavuusanalyysi yhdistää alypuhelinten aineiston liikennedataan
https://www.tekniikkatalous.fi/talous_uutiset/liikenne/nain-valtat-aamuruuhkan-ja-etsit-uuden-asunnon-hyvilla-kulkuyhteyksilla-saavutettavuusanalyysi-yhdistaa-alypuhelinten-aineiston-liikennedataan-6687680

HARVEY J. MILLER, YI-HWAWU
GIS Software for Measuring Space-Time Accessibility in Transportation Planning and Analysis
https://link.springer.com/content/pdf/10.1023%2FA%3A1009820006075.pdf

Pedagogiset katastrofit

Kuudes kurssikerta alkoi pienellä reippailulla. Keräsimme dataa älypuhelinsovelluksella kampuksen lähialueilta ja avasimma datan QGIS:ssä. Avaamalla taustalle vielä Open Street Mapin, tuli  aineistosta luettavaa. Saimme siis ensikosketuksen paikkatiedon keräämiseen ”kentällä”. Aineistosta itsestään ei välttämättä mitään järkevää saisi aikaan sen  suppeuden ja subjektiivisuuden takia. Jos datankeruu olisi ollut laajamittaisempaa ja paikkojen arvioinnille oltaisiin annettu tarkat kriteerit, olisi dataa voitu soveltaa paremmin. Toimme QGIS:iin myös uuden pluginin, joka salli google street viewin käytön. Tämän avulla ”kenttätyötä” pystyi tekemään tietokoneelta.

Ensimmäiseen karttaan sisällytin yli 1000kg painavat meteoriitit (Kuva 1). Ongelmaksi muodostui kuitenkin suurten arvojen jakaminen pilkuilla. Sain kuitenkin korjattua ongelman käyttämällä komentoa ”regexp_replace( ”Mass, g”, ’,’, ”)”, eli siis korvasin ”Mass, g” sarakkeen arvojen pilkut ”tyhjällä” jolloin niiden erottamat suuret luvut muuttuivat yhtenäisiksi. Eli esimerkiksi arvo 60,000,000 muuttui arvoksi 60000000. Nyt pystyin siis luokittelemaan meteoriitit niiden massan mukaan. Yli 20 000 kiloa painavien meteoriittien massan sisällytin karttaesitykseen ja skaalautin karttaselitteet massan mukaan värillä ja koolla. Yli tuhannen kilon meteoriitteja oli  vain 48 kpl, mutta näistä huomattava osa oli sijoittunut Pohjois-Amerikan länsipuolelle. Myös muilla tunnetusti ”kuivemmilla” alueilla meteoriittien esiintyvyys oli suurempaa. Tämä voisi johtua yksinkertaisesti siitä, että meteoriitteja on helpompi löytää kuivilta ja karuilta alueilta, sillä kasvusto ei ole peittämässä kraatereita.

(Kuva 1: Yli 1000kg:n meteoriitit, yli 20 000kg:n meteoriittien massa merkattu karttaan.)

Seuraavaksi tein kartan yli 6,5 magnitudin maanjäristyksistä ja kerrostulivuorista esittääkseni niiden alueellisen korrelaation (Kuva 2). Kartalta pystyy helposti näkemään, että tulivuoret ja maanjäristykset sijoittuvat suurilta osin samoille alueille, kerrostulivuoret sijoittuvat etenkin subduktiovyöhykkeille. maanjäristyksiä taas esiintyy kaikilla laattojen reuna-alueilla. Tämän kartan avulla pystyisi havainnollistamaan koululaisille sitä, miten maanjäristykset ja tulivuoret sijoittuvat maapallolla. Niin kuin Elli-Nora Kaarto blogissaan kirjoittaa, karttaan olisi voinut vielä lisätä aineiston Maan litosfäärilaatoista ja niiden kulkusuunnasta, jotta niiden reunat olisivat vielä lisänä havainnollistaneet järistysten ja tulivuorten sijoittumista, mutta lyhyellä haulla en tällaista aineistoa löytänyt.

(Kuva 2: Maanjäristyksiä ja kerrostulivuoria kuvaamassa niiden alueellista korrelaatiota.)

Kokeilin vielä lopuksi tehdä kartan interpoloimalla maanjäristyksiä niiden syvyyden perusteella (Kuva 3). Aineistoa ei kuitenkaan mielestäni ole järkevää interpoloida, sillä ne sijoittuvat hyvin pienille alueille. Kartalta kuitenkin erottui hyvin alueet, joilla esiintyy järistyksiä. Huomasin myös, että syvemmällä tapahtuvia maanjäristyksiä esiintyy erityisesti subduktiovyöhykkeillä (kuva 4). Myöhemmällä tarkastelulla heatmap-tyylinen esitys olisi toiminut tässä kokeilussa paremmin.

(Kuva 3: Interpolointikokeilu maanjäristysten syvyydestä. Tummemmilla alueilla järistyset syvemmällä.)
(Kuva 4: Subduktiovyöhykkeet maailmalla.)

Suoraan sanottuna en tällä kurssikerralla oppinut erityisen paljon mitään uutta. Toki erilaisten taulukkoaineistojen tuonti QGIS:iin toi pieniä ongelmia, joista kuitenkin selvittiin pienellä googlauksella. Interpolointi oli myös uusi toiminto QGIS:ssä ja odotankin, että sitä pääsee soveltamaan jatkossa enemmänkin.

Lähteet:

Subduction zone 1.8.2018: https://www.britannica.com/science/subduction-zone  (luettu 23.2.2018)

Elli-Nora Kaarto, 22.2.2018, 6. Kurssikerta: QGIS järisee  (Luettu 23.2.2018)

Homma rupee sujumaan…

Innostuin viidennellä kurssikerralla QGIS-harjoittelusta niin, että päätin tehdä kaikki kurssikerran harjoitukset. Kaikkia tuloksia en tähän postaukseen haluaisi laittaa, sillä jostain syystä tietokantojen dataa hävisi kesken harjoituksen ja moni saamani tulos vääristyi. Tein siis kaikki harjoitukset oikealla tavalla, mutta väärällä datalla. Virheet huomasin vasta, kun näin muiden tekevän samoja harjoituksia ehjillä tietokannoilla.(Taulukko 1) Kurssikerta oli tähän mennessä mielestäni antoisin, sillä tällä kertaa piti oikeasti itse miettiä, mitä tekee.

(Taulukko 1: Tuloksia kurssikerran tehtävistä.)

Join attributes by location- ja spatial query-toimintoja tuli ehdottomasti käytettyä kurssikerran harjoituksissa eniten, eikä minun niitä käyttäessä enää tarvitse arvailla, mitä valintoja mihinkin kenttään tulee laittaa. Buffer-toiminnon käyttö oli helppoa ja yhdessä edellä mainittujen toimintojen kanssa sillä pystyi tekemään yksinkertaisia puskurianalyysejä. Alkaa siis pikkuhiljaa tuntua siltä, että ymmärrän QGIS:in perustoiminnot.

Puskurivyöhykkeiden avulla pystytään esimerkiksi tarkastelemaan saavutettavutta, teiden melu- ja ilmansaasteita, sekä vaikkapa jokien alueiden maanviljelysmahdollisuuksia.  Löysin mielenkiintoisen artikkelin jokien lähimaaston viljelystä kestävästi pitämällä jokivarren puskurialueen viljelemättömänä vesien saastumisen minimoimiseksi. Vedet pysyvät puhtaampana, kun niiden lähiympäristössä kasvaa puu- ja pensaskasvillisuutta sitomassa pelloilta tulevia ravinteita ja varjostamassa vettä auringonvalolta. (Wei-Ning Xiang  1996) Liisa Niemi mainitsi blogissaan myös tietoliikenneverkkojen sijoittamisen ja ydinonnettomuuksien evakuointikartan.

Koulutehtävä oli mielestäni melko helppo. Selvitin googlen avulla Helsingin yhtenäiskoulun sijainnin ja käytin spatial query- ja join attributes by location-toimintoa rajatakseni alueen pisteet. Tämän jälkeen pystyin laskemaan kouluikäisten määrän select features by expression-toiminnolla ja tekemällä yksinkertaisia laskutoimituksia. Yhtenäiskoulun koulupiirissä alakoulun aloittavia oli todella vähän (vain 14) ja niin kuin Sini Virtanen blogissaan kirjoittaa, on Helsingin kaupunki suunnitellut yhtenäiskoulun yhdistämistä Käpylän ja Koskelan peruskouluihin. Eniten tehtävässä piti miettiä sitä, mitkä luokat pitää sisällyttää laskutoimitukseen oikean tuloksen saavuttamiseksi. Tässäkin tehtävässä taisin valita väärät luokat, joten tulokset eivät välttämättä ole oikeita.(Taulukko 1) 

Seuraavaksi tein tehtävän liittyen Pääkaupunkiseudun uima-altaisiin ja saunoihin.  Tehtävän tekemiseen käytin samoja toimintoja kuin edellisissäkin tehtävissä. ja listasin tulokset taulukkoon (Taulukko 1). Lopuksi tein kaksi karttaa uima-altaiden määrästä Pääkaupuniseudulla. Tehtävänä oli merkitä pienalueihin uima-altaiden määrä pylväin ja numeroin (Kuva 1). En itse ainakaan onnistunut liittämään samaan tietokantaan sekä numeroita, että pylväitä, vaan jouduin tekemään uuden läpinäkyvän tietokannan, johon lisäsin numerot. Mielestäni pylväät toimivat huonoina indikaattoreina kartassa ja ne tekevät esityksestä epäselvän. Toisaalta kartasta ei tulisi yhtään selkeämpi jättämällä siihen pelkät numerot. Päätin siis tehdä toisen kartan verratakseni esitettävyyttä. Luokittelin pienalueet niiden arvojen mukaan ja tein tavallisen koropleettikartan, johon lisäsin vielä numeroarvot. Kartan luettavuus kasvoi mielestäni huomattavasti tällä yksinkertaisella toiminnolla (Kuva 2). Kartalta erottui hyvin tunnetusti ”rikkaammat” asuinalueet, kuten Lauttasaari, Kulosaari ja Länsi-Pakila.

(Kuva 1: Uima-altaiden määrä pienalueittain pylväin ja numeroin esitettynä. Mielestäni huonompi vaihtoehto.)
(Kuva 2: Uima-altaiden määrä pienalueittain Pääkaupunkiseudulla. Määrä esitetty numeroin ja värein. Tämä esitys on mielestäni selkeämpi kuin pylväin ja numeroin esitetty kartta.)

Tehtävistä mielenkiintoisin oli ehdottomasti viimeinen, sillä siinä oli eniten haastetta ja tehtävän teema oli ajankohtainen. Ensimmäisessä kohdassa käytin select features by expression-toimintoa ja Boolen AND-operaattoria saadakseni valittua talot, jotka on rakennettu vuosien 1965 ja 1970  välillä. Tämän jälkeen loin valituista pisteistä uuden tietokannan ja suodatin siitä vielä edelleen kerrostalot. Jälkeenpäin mietittynä olisin varmasti voinut suodattaa kaiken samalla valinnalla käyttämällä Boolen operaattoreita. Tein lopuksi kartan (Kuva 3) pienalueiden remontti-indeksistä. Voisin kuvitella, että kartan sanomaa on hieman vaikea heti ymmärtää, vaikka siinä olisi selitys siitä, mistä tekijöistä remontti-indeksi on tehty.

(Kuva 3: Pääkaupunkiseudun pienalueiden remontti-indeksi, eli vuosien 1965 ja 1970 välillä rakennettujen kerrostalojen osuus rakennuskannasta.)


Lähteet:

Wei-Ning Xiang (14.7.1995) GIS-based riparian buffer analysis: injecting geographic
information into landscape planning (Luettu 19.2.2018)
https://ac.els-cdn.com/0169204695002065/1-s2.0-0169204695002065-main.pdf?_tid=506a15ae-1569-11e8-91ee-00000aab0f6c&acdnat=1519040450_5739adc4af589fc6c0dde5806293f047

Sini Virtanen 2018: https://blogs.helsinki.fi/7k110738/2018/02/13/verta-hikea-ja-puskureita/ (Luettu 19.2.2018)

Liisa Niemi 2018 :https://blogs.helsinki.fi/nliisa/2018/02/17/5-kurssikerta-pohdintaa-buffereita-ja-ongelmien-ratkaisua/ (luettu 19.2.2018)

 

Ruutuja.

Neljännellä kurssikerralla tutstuimme ruutuaineiston luomiseen ja saimme ensikosketuksen rasteriaineiston käyttämiseen. Blogitehtävänä oli luoda ruututeemakartta saadusta laajasta aineistosta. Toisena tehtävänä saimme ensikosketuksen raa’an rasteridatan käsittelyyn.

Ruutuaineiston luominen toimi samalla periaatteella kuin sijaintitietoa sisältävien ominaisuustietojen liittäminen polygoniaineistoon. Saimme materiaaliksi pisteaineiston, johon oli merkattu jokainen pääkaupunkiseudun asuinrakennus. Jokaisessa pisteessä oli myös hyvin monta sarakkeellista ominaisuustietoa, kuten asukaslukuja iän ja äidinkielen mukaan. Päätin tehdä oman ruutukarttani (Kuva 1) opiskelijaikäisten osuudesta kokonaisväestöön 500m x 500m ruuduissa. Määritin opiskelijoiden iäksi 18-29 vuotta. Toki myös vanhempia ja jopa nuorempiakin opiskelijoita on, mutta suhde olisi niin marginaalinen, että jo valmiiksi herkkä esitys olisi kärsinyt entistä enemmän, jos ikähaarukka olisi ollut laajempi.

Suhteutin 18-29-vuotiaiden määrän ruutujen kokonaisväkilukuun, ja muutin suhdeluvun prosenttiyksiköiksi. Aineistosta voi erottaa joitakin alueita, joissa asuu tunnetusti paljon opiskelijoita, kuten Otaniemi ja Viikki. Kartalta erottuu myös ruutuja, joissa opiskelijaikäisten osuus väestöstä sijoittuu suurimpaan luokkaan, vaikka ruutu sijaitsee kaukana keskustasta. Tarkastelemalla näiden ruutujen ominaisuustietoja saattoi kuitenkin havaita, että korkea opiskeluikäisten osuus johtui siitä, että ruudussa saattoi asua vain yksi henkilö. Tämä ”ominaisuus” teki hallaa kartan tarkoitukselle, varsinkin kun kuvattava alue oli koko pääkaupunkiseudun laajuinen. Selkeyttääkseni esitystä olisin voinut esimerkiksi rajata kuvattavaa aluetta pienemmäksi ja pienentää ruutukokoa, tai jättää niitä ruutuja pois laskuista, joiden asukasluku on pieni. Tuuli Lahin havaitsi saman ongelman tarkastellessaan eläkeikäisten sijoittumista ja korjasikin ongelman poistamalla juurikin näitä pienen asukasluvun ruutuja.

(Kuva 1: Opiskelijaikäisten osuus väestöstä 500m x 500m ruudukossa pääkaupunkiseudulla.)

Päätin tehdä vielä toisen, hieman erilaisen kartan pääkaupunkiseudun rakennuskannan iästä (Kuva 2).  Valitsin tähänkin aineistoon 500m ruutukoon, sillä uskoin sen olevan tarpeeksi tarpeeksi tarkka ilmiön kuvaamiseen. Liittäessäni käyttöönottovuosidataa ruudukkoon huomasin, että joidenkin ruutujen talojen käyttöönottovuoden keskiarvo saattoi olla esimerkiksi 1300000. Pisteainestosta ilmeni, että n. 600 talon käyttöönottovuosi oli 999999999. Korjatakseni ongelman valitsin kaikki talot, joiden käyttöönottovuosi oli epärealistinen ja poistin ne aineistosta. Syytä näille oudoille käyttöönottovuosille en keksinyt. välttyäkseni samalta ongelmalta, minkä kohtasin tehdessäni ensimmäistä karttaa, päätin myös poistaa aineistosta alle kolmen talon ruudut. Näinkin pienen talomäärän valitsin sen takia, ettei liian moni reuna-alueen ruutu jäisi pois laskuista.

Rakennuskannan iän alueellinen jakautuminen ei erityisemmin yllätä. Tummimpana näkyy Suomenlinnan ja Westerkullan kartanon alueita. Kantakaupungista ulospäin mentäessä rakennuskanta nuortuu vaiheittain. Yleisimmin esiintyvän ruudun käyttöönottovuoden keskiarvot sijoittuvat vuosien 1953 ja 1982 välille. Tälle aikavälille sijoittuu myös voimakas väestönkasvu Helsingin seudulla rakennemuutoksen aiheuttaman kaupungistumisen seurauksena (Kaavio 1).

(Kuva 2: Rakennusten käyttöönottovuoden keskiarvot 500m x 500m ruudukossa pääkaupunkiseudulla. Alle kolmen rakennuksen ruudut poistettu aineistosta.)
(Kaavio 1: Helsingin, Pääkaupunkiseudun ja Helsingin seudun väestönkehitys vuosien 1950 ja 2012 välillä. Lähde: Helsingin tilastollinen vuosikirja 2012.)

Ruutukartassa on koropleetti- ja pisteteemakarttaan verrattaessa sekä huonoja, että hyviä puolia. Ruutukarttaa on helppo lukea ja ymmärtää, kun esitetty alue on jaettu yhtä suuriin ruutuihin, jotka on taas jaoteltu omiin luokkiinsa. Niin kuin edellisissä kappaleessakin kuitenkin sanoin, on ruutuaineiston esityksessä myös heikkouksia. Ruudut ovat samankokoisia, mutta otannan suuruus tutkittavaan ilmiöön saattaa vaihdella todella paljon. Ruututeemakartta ei siis aina sovellu jokaisen ilmiön kuvaamiseen. Esitettävyys saattaa kärsiä hyvinkin paljon, jos dataa ei käsitellä esitykselle edullisella tavalla.

Lähteet:

Tuuli Lahin 2018: https://blogs.helsinki.fi/lahintuu/, luettu 8.2.2018.

Helsingin tilastollinen vuosikirja 2012, https://www.hel.fi/hel2/tietokeskus/julkaisut/pdf/13_01_03_Tilastollinen_vuosikirja_2012.pdf, Luettu: 8.2.2018

Lisää soveltamista

Afrikka harjoittelukenttänä

Kolmannella kurssikerralla tutustuimme tietokantojen käyttöön ja niiden yhdistämiseen eri tavoin. Saimme aineistoksi Afrikan kartan, taulukon Afrikan väestö- ja internetin käyttäjätideoista, sekä karttatasot timanttikaivos, öljykenttä ja konfliktisijainneista.  Yhdistämällä näitä aineistoja pystyttiin tarkastelemaan eri ilmiöiden, kuten timanttikaivosten ja konfliktien alueellista korrelaatiota.

Ensimmäiseksi yksinkertaistimme tietokantaa yhdistämällä alueita niitä yhdistävän valtion nimen perusteella. Tämän jälkeen pystyimme lisäämään taulukon tietokantaan valtion nimen perusteella. Taulukkoaineistossa oli tietoa Afrikan valtioiden asukasluvuista, sekä internetin ja facebookin käyttäjämääristä. Tarkastelemalla internetkäyttäjien suhdetta väkilukukuun, pystyi tekemään myös päätelmiä valtion kehityksestä.

Valtiossa olevien timanttikaivosten määrän pystyi selvittämään toiminnolla, joka laskee pisteet polygonin sisällä. Konflikteja oli joillakin alueilla todella paljon, mutta iso osa niistä oli tapahtunut samana vuonna, joten todellisuudessa ne olivat osa samaa, laajempaa konfliktia. Tämän takia valtion konfliktien määrät laskettiin siten, että samassa valtiossa samana vuonna tapahtuneet konfliktit laskettiin yhdeksi.  Vertailemalla konfliktien ja timanttikaivosten määrää valtiossa, huomasin, että esimerkiksi Angolassa, jossa on paljon timanttikaivoksia on ollut myös paljon konflikteja.

Öljykenttätaso koostui yhdistyneiden pisteiden muodostamista polygoneista.  Ominaisuus lisättiin suurempaan tietokantaan sen mukaan, minkä polygonin sisällä ne olivat. Näin saatiin tieto valtioiden öljykenttien määrästä.  Monissa maissa, missä oli paljon öljykenttiä oli myös paljon internetin käyttäjiä suhteessa väestöön. Öljykenttien määrä ei kuitenkaan vaikuttanut suoraan internetkäyttäjien määrään, vaan esimerkiksi Keniassa, jossa ei ole lainkaan öljyä oli Afrikan maista suurin internetin käyttöaste.
…Kenian suuri käyttöaste (89,4%) rupesi mietityttämään ja päätin tarkastaa asian. Kävi ilmi ettei käyttöaste ole lähelläkään aineistosta saatua tietoa, vaan todellinen luku oli n. 26% (CIA world factbook, 2016).

Vaikka Afrikan maiden internetin käyttöaste on kasvanut paljon vuodesta 2000, on kehitysmaiden ja teollisuusmaiden käyttöasteen ero edelleen suuri. Tätä eroa kutsutaan digikuiluksi. Digitalisaatio on nykyään tärkeä osa kehitystä ja kehitysmaiden ero teollisuusmaihin saattaa kasvaa, jos kehitysmaat eivät saavuta kehittyneempää tieto- ja viestintäliikenneverkostoa. (Sirola 2018)

Valuma-alueita ja tulvia

Seuraavaksi harjoitukseksi teimme kartan Suomen valuma-alueista, niiden järvisyydestä sekä tulvaindeksistä. Aineisto oli tässäkin harjoituksessa siroteltu moneen eri tietokantaan ja saimmekin vapaat kädet niiden yhdistelemiseen. Tulvaindeksillä tarkoitetaan valuma-alueen tulvaherkkyyttä ja se oli helppo laskea jakamalla alueen keskiylivirtaama, eli tulvahuippujen keskiarvo keskialivirtaamalla, eli kuivien kausien alimpien arvojen keskiarvolla.

Valuma-alueiden  järvisyysaste pystyttiin laskemaan kahdella tavalla: Ensimmäinen tapa oli laskea järvien pinta-alojen osuus valuma-alueen pinta-alasta. Toimitus onnistui helposti, mutta tulos ei täysin vastannut todellisuutta, sillä järvi- ja valuma-alueiden karttatasoja oli yleistetty jonkin verran. Toinen tapa tuoda järvisyysprosentti aineistoon oli siirtää excel-muotoinen taulukko aineistoon. Excel-tiedosto piti kuitenkin muuttaa ensin csv-tiedostoksi. Csv-tiedosto piti vielä QGIS:iin tuodessa muokata niin, että sarakkeet erotettiin puolipilkulla. Taulukkoaineiston tuomisessa oli myös ongelmana se, ettei QGIS tuonut aineistosta ä- ja ö-kirjaimia. Merkistö oli siis väärä, joten sen vaihtaminen IBM850:een korjasi asian ja aineisto pystyttiin yhdistämään tietokantaan.

Päätin tehdä kartan(Kuva 1) kuitenkin QGIS:in työkalujen avulla saadusta järvisyysprosentista.  Oli hieman haastavaa saada sekä järvisyyttä, että tulvaindeksiä esitettäväksi samalle kartalle. Päätin histogrammin sijasta käyttää ympyrädiagrammeja, sillä mielestäni ne havainnollistavat huomattavasti selkeämmin valuma-alueen järvisyyttä. Järvisyysaineiston yleistyksen takia muutaman valuma-alueen järvisyysprosentti oli nolla. Päätin poistaa kartasta näiden alueiden järvisyysdiagrammit selkeyttääkseni esitystä.  Diagrammien koko määräytyi valuma-alueen pinta.alan mukaan.

Tarkastelemalla valuma-alueita voi huomata, että rannikkoalueilla ne ovat huomattavasti pienempiä.  Usein myös tulvaindeksi on korkeampi näillä pienemmillä alueilla.  Alueen koko ei kuitenkaan näytä määrittämän tulvaindeksiä, vaan pikemminkin järvisyysprosentti. Päätin tehdä pienen excel-kaavion(Kaavio 1) havainnolistaakseni tulvaindeksin ja järvisyysasteen kääntäen verrannollisuuden. Ilmiö on helposti selitettävissä: Järvet toimivat varastoina sulamisvesille ja rankkasateille.

(Kaavio1: Havainnollistava kaavio järvisyyden ja tulvaindeksin käänteisestä verrannollisuudesta.)

 

(Kuva1: Suomen valuma-alueet, niiden tulvaindeksit, sekä niiden järvisyysaste.)

Lähteet:

Sirola, Eveliina. Kurssikerta 3: Afrikan valtioita, Internetinkäyttöä ja tulvaindeksejä 30.1.2018
https://blogs.helsinki.fi/evsirola/2018/01/31/kolmas-kurssikerta-afrikan-valtioita-ja-tulvaindekseja/
(Luettu: 1.2.2018)

CIA World Factbook 2016.
https://www.cia.gov/library/publications/the-world-factbook/geos/ke.html
(Luettu: 1.2.2018)