3. Tietokantojen käsittelyä

Kolmannella kurssikerralla käsiteltiin erityyppisiä tietokantoja.

Tarkasteltava Afrikka-aineisto oli hyvin yksityiskohtainen – jopa liiallisuuksiin saakka, joten sitä piti ”karsia” ennen seuraavia vaiheita. Dissolve-työkalulla onnistuin yhdistämään tietokannan alueet maiden mukaan – eli jokaista maata kohden jäi yksi sarake attribuuttitauluun. Vielä ennen varsinaisia tehtäviä oli tuotava taulukkomuotoinen tiedosto Excelistä QGIS:iin. Tämä tapahtui tallentamalla tiedosto ensin csv-muodossa ja tuomalla se ohjelmistoon Delimited text layer -tyyppisenä. Myös tietokantojen yhdistäminen edellisestä kerrasta tutulla Join-toiminnolla sujui kätevästi: Afrikka-tietokantaan liittyivät siis Excelistä tuodut tiedot muun muassa internetin ja sosiaalisen median käyttöön liittyen.

Yleensä alueellista tietoa on järkevää tutkia suhteutettuna väkilukuun tai vastaavaan muuttujaan: tässä tapauksessa internetin käyttäjien suhteellista osuutta absoluuttisten lukujen sijaan. Prosentuaalisten osuuksien laskeminen onnistui Field Calculatorilla totuttuun tapaan, ja attribuuttitaulukkoon syntyi uusi sarake kuvaamaan internetin läpäisevyyttä (käyttäjien osuus valtion väestöstä). Visualisoin nämä tiedot kartalle (kuva 1) , josta näkyvät maakohtaiset erot. Yleisesti ottaen internetin läpäisevyys on melko hyvä valtion kehittyneisyyden mittari – se kertoo samalla myös yleisestä infrastruktuurista, sähköverkkojen laajuudesta ja taloudellisesta tilanteesta. Kartan perusteella suhteellisesti eniten internetin käyttäjiä on Keniassa, Libyassa, Malissa ja Marokossa.

Kuva 1. Internetin läpäisevyys Afrikan valtioissa vuonna 2018.

 

Kurssikerralla käsiteltiin myös muita Afrikkaan liittyviä tietokantoja, joita olivat konfliktit, öljykentät ja timanttikaivokset. Tavoitteena oli tarkastella ilmiöiden esiintymistä valtioiden sisällä, joten Count Points in Polygon -työkalu toimi tässä tarkoituksessa hyvin timanttien ja konfliktien kohdalla. Aluemuotoisten öljykenttien tietojen liittäminen puolestaan tapahtui Join Attributes by Location -työkalulla. Laadin tuloksena saaduista uusista tietokannoista kaksi karttaa: toisen konfliktien määristä eri valtioissa (kuva 2) ja toisen timanttien esiintymisestä (kuva 3). Oli mielenkiintoista myös pohtia annettujen tietojen perusteella, onko tapahtumien välillä mahdollista korrelaatiota – tapahtuuko esimerkiksi öljy- ja timanttialueilla paljon konflikteja tai korreloivatko luonnonvarojen löytyminen ja internetin yleistyminen ja elintason nousu keskenään.

Kuva  2. Afrikassa esiintyneet konfliktit maittain vuosina 1947 – 2008.

 

Kuva 3. Timanttikaivosten sijainti Afrikassa.

 

Tekemistäni kartoista löytyy muutamia kiinnostavia havaintoja. Ainakin muutamilla alueilla esimerkiksi Angolassa ja sen naapurivaltioissa on runsaasti sekä timanttikaivoksia että konflikteja – sen sijaan internetin läpäisevyys on alueilla pysynyt heikkona. Monissa Afrikan valtioissa kaivostoiminta on ulkomaisten yhtiöiden hallussa, eivätkä paikalliset välttämättä hyödy voitoista – tämä yhdessä aluekiistojen kanssa voi olla yksi konfliktien aiheuttaja. Ne alueet, joilla internetin läpäisevyys on korkea (Kenia, Libya, Mali yms.), on myös esiintynyt keskivertoa vähemmän konflikteja. Tämä näyttäisi tukevan oletusta, että internetin saavutettavuus korreloi korkeamman elintason ja sitä myöten kenties vakaamman yhteiskunnan kanssa.

Afrikan jälkeen siirryttiin melko erityyppiseen aineistoon: tulvaindekseihin ja järvisyyteen Suomessa. Tehtävän vaiheet olivat kuitenkin samat kuin aiemmin. Aluksi tuli lisätä tietokantoja ja sitten yhdistellä niiden tietoja valuma-alueet -tietokantaan. Tarkoituksena oli laskea eri jokien valuma-alueiden tulvaindeksejä, mikä tapahtuu jakamalla keskiylivirtaama (MHQ) keskialivirtaamalla (MNQ). Kasattuani kaikki vaaditut tiedot samaan taulukkoon, tapahtui tulvaindeksien laskeminen helposti uuteen sarakkeeseen. Samaan loppukarttaan tuli liittää myös valuma-alueiden järvisyysprosentit (taulukko tuotu Excelistä) joko pylväinä tai ympyrädiagrammeina. Laadin siis lopuksi kartan, josta käyvät ilmi sekä tulvaindeksit että järvisyys (kuva 4).

Kuva 4. Suomen jokien valuma-alueiden tulvaindeksit ja järvisyysprosentit.

 

Kuten yllä olevasta kartasta näkyy, tulvaindeksit ovat suurimmillaan Etelä-Suomessa ja Pohjanmaalla. Tämä ei ole sinänsä yllättävää ainakaan matalilla alueilla meren läheisyydessä, joissa on tyypillisesti tulvia etenkin keväisin. Sen sijaan pienin tulvariski on alueilla, joissa järvisyys on suuri (Keski-Suomi, Itä-Suomi). Tulvaindeksin ja järvisyyden välillä näyttää siis olevan selvä korrelaatio – kenties järvisillä alueilla maastonmuodot ja vesistöjen laajuus estävät tulvien syntymistä, kuten muun muassa Amelia Cardwell pohtii blogissaan (Cardwell, 2019). Lisäksi myös meren läheisyys saattaa vaikuttaa asiaan.

Kolmas kurssikerta oli hyvää harjoitusta etenkin erilaisten tietokantojen yhdistelyyn ja käsittelyyn liittyen – toisessa tehtävässä toimenpiteet alkoivat sujua jo rutiinilla. Jälkikäteen mietittynä Afrikka-tehtävässä olisi voinut tehdä vielä yhden kartan, jossa tarkastellaan öljyä ja konflikteja rinnakkain. Laura Ahola toteaa blogissaan (Ahola, 2019), että myös öljyn vaikutus alueiden talouteen olisi ollut kiinnostava tutkimuskohde. Yleensähän juuri suurilla öljylöydöksillä on nopea vaikutus valtioiden kehitykseen, mikä on nähtävissä esimerkiksi Lähi-Idässä. Valuma-aluetehtävän kartasta oli aavistuksen hankalaa saada selkeää – informaatiota tuntui olevan liikaa (pylväät yms.), mutta mielestäni lopputulos on kuitenkin ihan kohtuullisen ymmärrettävä.

 

Lainatut lähteet

Ahola, L. (31. tammikuu 2019). Hermot koetuksella. Noudettu osoitteesta https://blogs.helsinki.fi/lauahola/2019/01/31/hermot-koetuksella/

Cardwell, A. (31. tammikuu 2019). Viikko 3: Tulvaindeksejä, järvisyysprosentteja sekä pettyminen teemakarttaan. Noudettu osoitteesta https://blogs.helsinki.fi/amca/2019/01/30/viikko-3-valuma/

2. Projektioita

Toisella kurssikerralla perehdyttiin tarkemmin projektioihin ja niiden merkitykseen. Vaikka aiemmilla kursseilla onkin käyty erilaisia projektioita melko kattavasti läpi, yllättää niiden vaikutus karttoihin ja paikkatietokantoihin kerta toisensa jälkeen.

Tarkastelimme projektion merkitystä pinta-alojen ja pituuksien laskemisessa. Piirsin aluksi suomineidolle ”hatun” eli rajasin koilliskärjestä alueen pinta-alatyökalulla. Muutin projektiota lennosta ja tarkkailin, miten näkyvä pinta-ala muuttui. Piirsin Suomen päälle myös itä-länsi –suuntaisen mittausviivan noin Oulun korkeudelle ja vaihdoin edellisen kohdan tapaan projektioita lennossa kirjaten uudet tulokset Exceliin. Koostin näistä tuloksista taulukon (taulukko 1), josta näkyvät mittaustulokset useilla eri projektioilla.

Taulukko 1. Eri projektioiden pituuksien ja pinta-alojen vertailua.

 

Useilla yleisimmällä Suomessa käytetyillä projektioilla (ETRS-TM35FIN, ETRS-LAEA, vanhempi KKJ) tulokset olivat melko samanlaisia. Pahamaineisella Mercatorin Sphere-projektiolla tulokset muuttuivat puolestaan täysin – mitä pohjoisempia alueita tarkastellaan, sitä suurempi vääristymä on. Sen sijaan pohjoisessa arktisilla alueilla käytetyllä WGS 84 Arctic Polar Stereographic – projektiolla vääristymät kasvoivat etelään mennessä.

Laadin näistä pinta-alavääristymistä kaksi karttaa, joista käyvät ilmi pinta-alojen suhteelliset erot. Tätä varten tuli ensin yhdistää tietoa kahdesta eri tietokannasta Join-toiminnolla, joka toimi melko sujuvasti. Myös prosenttilaskun (kuinka monta % suurempi kuin…) tulokset näyttivät olevan oikeaa suuruusluokkaa. Kuten edellä taulukkoa laatiessa havaitsin, Sphere Mercatorin pinta-alavääristymät kasvavat asteittain pohjoiseen mennessä (kuva 1).

Kuva 1. Sphere Mercatorin aiheuttamat pinta-alavääristymät verrattuna ETRS-TM35FIN-projektioon.

 

WGS 84 Arctic Polar Stereographic -projektion virheet pinta-aloissa ovat sen sijaan suurimmillaan eteläisessä Suomessa (kuva 2). Löysin muiden kurssilaisten blogeista lisää mielenkiintoisia vertailuja – esimerkiksi Emma Sinisalo oli tarkastellut blogissaan (Sinisalo, 2019) Lambertin ja Bonnen projektioita. Pinta-alavääristymät olivat suurimmillaan koillisessa Suomessa, mutta vääristymät eivät kasvaneet ”asteittain”, kuten itseni tarkastelemissa projektioissa, mikä oli mielenkiintoista.

Kuva 2. Pinta-alojen erot WGS 84 Arctic Polar Stereographic -projektion ja ETRS-TM35FIN:n välillä.

 

Projektioiden merkitys on suuri etenkin, jos tarkastellaan pinta-alaan suhteutettuja muuttujia. Yleisimpiä tällaisia muuttujia ovat esimerkiksi väestöntiheys ja eri ikäryhmien osuudet alueilla. Kurssikerran toisena tehtävänä olikin testata, miten projektion vaihtaminen vaikuttaa pinta-alojen suhteellisiin osuuksiin vääristävästi. Valitsin tarkasteltavaksi Natura 2000-alueet, jotka olivat alun perin ilmoitettu absoluuttisina lukuina. Suomessa Natura 2000-alueiden verkosto kattaa viisi miljoonaa hehtaaria, josta maa-alueita on kolme neljäsosaa ja vesialueita yksi neljäsosa (Ympäristöministeriö, 2019).

Tein tietokantaliitoksen yhdistämällä Natura-alueiden pinta-alat kuntien tietoihin ja laskin sitten suhteelliset osuudet käyttäen aluksi yleisintä ETRS-TM35FIN-projektiota. Laadin tuloksista vielä kartan (kuva 3), josta käyvät ilmi Natura-alueiden osuudet kuntien pinta-alasta. Alueita on selkeästi eniten pohjoisessa Lapissa – suurimmillaan noin 10 prosenttia koko kunnan pinta-alasta.

Kuva 3. Natura-alueiden osuus Suomen kuntien pinta-aloista (ETRS-TM35FIN)

 

Tehtävänä oli vertailla pinta-alojen vääristymistä projektion vaihtuessa, joten vaihdoin seuraavaksi Sphere Mercatoriin, joka vääristi aiemmin etenkin pohjoisia pinta-aloja. Laadin näistä tuloksista vastaavan kartan (kuva 4), josta näkyvät niin ikään Natura-alueiden osuudet. Kartta näyttää silmämääräisesti samalta: suurimmat alueet ovat Pohjois-Suomessa. Tarkemmin katsottuna legenda näyttää kuitenkin hyvin erilaiselta ja pinta-alaprosentit ovat huomattavasti pienempiä – suurinkin arvo on vain 1,4% aiempaan 10% verrattuna. Sphere Mercator suurentaa pohjoisia alueita valtavasti, jolloin myös Natura-alueiden suhteellinen osuus jää pienemmäksi.

Kuva 4. Natura-alueiden osuus kuntien pinta-aloista, projektiona Sphere Mercator

 

Kaikista kurssikerran tehtävistä jäi ainakin mieleen, ettei projektion valinta ole yhdentekevää. Jatkossa aionkin tarkistaa aina työskentelyn aluksi, että projektio on kyseiseen alueeseen ja tarkasteltaviin muuttujiin sopiva.

 

Lainatut lähteet

Sinisalo, E. (28. tammikuu 2019). Databasdjungeln och kartprojektioner. Noudettu osoitteesta https://blogs.helsinki.fi/sinisale/2019/01/25/databasorientering/

Ympäristöministeriö. (28. tammikuu 2019). Noudettu osoitteesta http://www.ym.fi/fi-FI/Luonto/Luonnon_monimuotoisuus/Luonnonsuojelualueet/Naturaalueet

1. Tutustumista QGIS:iin

Tämä blogi toimii Geoinformatiikan menetelmät 1 -kurssiblogina.

Kurssin ensimmäisellä viikolla tutustuttiin QGIS-paikkatieto-ohjelmistoon, joka perustuu avoimeen lähdekoodiin. QGIS sisältää kattavasti erilaisia työkaluja datan käsittelyyn ja visualisoimiseen, minkä lisäksi ohjelmistosta on mahdollista muokata hyvinkin ”oman näköinen” erilaisilla plugineilla eli lisäosilla.

Aluksi oli hyödyllistä käydä läpi ohjelmiston yleisimmät työkalut – olen käyttänyt QGIS:ia hieman aiemminkin, mutta pikakertaus oli pitkän tauon jälkeen tarpeen. Etenkin Field Calculatorin toiminta ja tietokantojen käsittely kaipaavat paljon toistokertoja ennen niiden käytön hallitsemista.

Aineistona kurssikerralla toimivat HELCOM-merialueen typpipäästöjä kuvaavat vektoritasot (muun muassa maakohtaiset kokonaistyppipäästöt, järvet ja merien syvyyskäyrät). Suhteellinen päästömäärä kuvaa yleensä maiden välisiä eroja paremmin kuin absoluuttiset määrät, joten attribuuttitauluun lisättiin kokonaan uusi sarake prosentuaalisille osuuksille ennen aineiston lopullista tarkastelua.

Lopputuloksena oli tarkoitus laatia mahdollisimman selkeä visualisointi typpipäästöistä Itämerellä. Kartan värimaailmat, sommittelu ja legendan sekä mittakaavan rakentaminen Print Composerissa ovat ainakin minulle joka kerta omanlaisensa haaste. Lopputuloksena syntyi siis kartta (kuva 1), johon olen jälkikäteen katsottuna ihan kohtuullisen tyytyväinen.

Kuva 1. Kartta typen maakohtaisista päästöistä Itämerellä.

 

Kartan värimaailma on mielestäni melko neutraali, eikä mikään varsinaisesti ”hyppää silmään”. Sivun sommitteluun en ole täysin tyytyväinen; ehkä kartta olisi toiminut paremmin pystysuuntaan aseteltuna. Legenda, mittakaava, maiden nimet ja pohjoisnuoli onnistuivat pienen säätämisen jälkeen hyvin. Kartan ulkoasun lisäksi on kiinnostavaa tarkastella sen välittämää tietoa typen päästöistä. Etenkin Puola nousee esiin suhteellisesti suurimpana saastuttajana, mikä ei sinänsä ole yllätys maan maatalousvaltaisuuden takia. Iina Rusanen huomauttaa blogissaan (Rusanen, 2019), että syynä voi olla myös Puolan suuri väkiluku ja pitkään jatkuneet ympäristöongelmat. Suomi näyttää selviävän melko kunniallisesti vertailusta – naapurimaista ainoastaan Viro ja Norja päästävät suhteellisesti vähemmän typpeä Itämereen.

Itämeren kokonaistilanne on jo pitkään herättänyt huolestusta, johtuen muun muassa voimakkaasta rehevöitymisestä. Itämeri on sinänsä poikkeuksellinen merialue, että sen vesi on vähäsuolaista murtovettä, syvyys keskivertoa huomattavasti matalampi ja alueen laivaliikenne hyvin vilkasta. Maatalouden, teollisuuden ja liikenteen aiheuttamia päästöjä on pyritty hillitsemään useilla eri suojeluohjelmilla ja lainsäädännön keinoin (Itämerihaaste, 2019).

Itämeri-tehtävän jälkeen oli vielä vapaamuotoisempi tehtävä, jossa tuli tarkastella Suomen eri kuntien tilastoja ja visualisoida niiden pohjalta mielenkiintoinen kartta/karttoja. Avasin kuntien vektoriaineiston, josta löytyi todella kattavasti erilaisia tilastoja. Päätin tarkastella vielä lähemmin eläkeläisten ja vuokralla asuvien suhteellisia lukumääriä eri kunnissa, koska alueiden väliset erot tulivat näillä muuttujilla hyvin ilmi.

Kuten kuvasta 2 näkyy, eläkeläisten prosentuaaliset osuudet ovat selkeästi suurimmat itäisessä ja osittain myös keskisessä Suomessa. Mielenkiintoista oli myös vertailla eläkeläisten ja työttömien määriä eri kunnissa. Saaga Laapotin blogista (Laapotti, 2019) löytyi kartta, josta kävi ilmi, että työttömiä esiintyy eniten samoilla alueilla kuin eläkeläisiäkin – toisin sanoen itäisessä Suomessa. Ilmiöön vaikuttanee ainakin kyseisten kuntien muuttotappio ja nuoremman työikäisen väestön muuttaminen eteläiseen ja läntiseen Suomeen töiden tai koulutuksen perässä.

Kuva 2. Eläkeläisten osuus kuntien väestöstä Suomessa.

 

Tarkastelin myös vuokralaisten suhteellista määrää eri kunnissa (kuva 3). Kartasta erottuvat hyvin selvästi suuret kaupungit, kuten pääkaupunkiseudun kunnat, Turku, Tampere, Jyväskylä, Kuopio, Joensuu, Oulu ja Rovaniemi. Tämä on odotettavissa, koska suurten kaupunkien asuntojen koot ovat keskimäärin pienempiä ja asuinkustannukset suurempia – toisin sanoen, mitä suurempi kaupunki, sitä enemmän vuokralla asuvia kärjistetysti on.

Kuva 3. Vuokralaisten osuus Suomen kuntien väestöstä.

 

Lainatut lähteet

Itämerihaaste. (27. tammikuu 2019). Noudettu osoitteesta http://www.itamerihaaste.net/tietoa_meista/itameren_tila/itameren_tilaan_vaikuttavat_tekijat

Laapotti, S. (27. tammikuu 2019). Hyppy QGIS:in syövereihin. Noudettu osoitteesta https://blogs.helsinki.fi/saagalaa/

Rusanen, I. (27. tammikuu 2019). QGIS tutuksi. Noudettu osoitteesta https://blogs.helsinki.fi/iinarusa/