Tietokantojen yhdistelyn ja tulvaindeksin salat

Kolmannella kurssikerralla opettelimme yksinkertaistamaan tietokantoja, liittämään niihin tietoa muista ohjelmista ja tuottamaan uutta tietoa vanhan tiedon avulla. Tätä kaikkea ryhdyttiin harjoittelemaan Afrikan valtiot sisältävällä tietokannalla, joka oli alkuun turhan yksityiskohtainen: jokainen saari tai muuten erillinen alue oli kirjattu aineistoon erikseen, mikä johti siihen, että yksi ainut valtio saattoi käsittää yli sata riviä tietokannassa. Ja jos tarkoituksena on tehdä valtiokohtaista vertailua, mainittu ominaisuus vaikeuttaa työtä huomattavasti. Alueita pystyi yhdistämään joko yksi kerrallaan tai saraketietojen pohjalta niin, että QGIS poisti kaikki valtioiden nimien kaksoiskappaleet tietokannasta, jolloin jäljelle jäi tietokanta, jossa yhtä valtiota edustaa yksi rivi – juuri kuten pitikin. Aineiston yksinkertaistaminen oli yksinkertaista. Hyvä. Seuraavaksi lisäsimme ohjelmistoon dataa excel-muotoisesta tiedostosta, jossa oli tietoa mm. Afrikan valtioiden väkiluvusta ja internetin käyttöasteesta. Saadakseen nämä tiedot QGIS:iin on tietoa muokattava niin, että datan liittäminen onnistuu. Käytännössä tämä tarkoittaa kieliasun tarkistamista kahden tietokannan välillä, jotta yhteinen rajapinta löytyy – tässä tapauksessa oli järkevää ottaa valtion nimi yhdistäväksi tekijäksi. Muutamia eroavaisuuksia löytyikin ja excel-tiedoston valtioiden nimet muutettiin vastaamaan QGIS:n valtioiden nimiä. Lisäksi oli katsottava, että data on muuten uskottavaa ja järkevää. Muutamia näppäilyvirheitä aineistosta löytyikin väkiluvun suhteen ja ne korjattiin, minkä jälkeen tallensimme aineiston csv-muodossa, jota QGIS ymmärtää. Aineistoa liittäessä saa olla tarkkana, että kaikki nappulat ja namiskuukkelit on säädetty oikein (esimerkiksi se, tulkitseeko ohjelma pilkun desimaaliksi vai sarake-erottimeksi). En ole tietääkseni koskaan yhdistänyt yhtäkään tietokantaa yhtään mihinkään ohjelmaan, mutta homma toimi kuin rasvattu, sillä asia näytettiin kädestä pitäen. Lopuksi lisäsimme karttalehdelle vielä dataa timanttikaivoksista, konflikteista ja öljyesiintymistä niiden sijainnin perusteella. Teknisesti (ja tarkkojen ohjeiden kanssa) tämä kaikki oli oikeastaan melko vaivattoman tuntuista. Tähänastisista kurssikerroista tämä tuntui jostain syystä helposti ymmärrettävimmältä.

 

Afrikan kartassani (kuva 1) on kuvattu eri vihreän sävyillä internetin käyttäjien osuus koko väestöstä valtioittain, eri kokoisilla punaisilla palloilla konfliktivuosien määrä vuosina 1947-2008 sekä turkooseina pisteinä timanttikaivosten ja keltaisella värillä öljyesiintymien sijoittuminen. Internetin käyttöaste kuvaa maan yleistä kehitysastetta tietyiltä osin ja kartasta voikin nähdä tietynlaisen korrelaation konfliktien määrässä ja matalassa internetin käyttöasteessa. Timanttikaivokset eivät näytä vaikuttavan millään lailla konflikteihin tai kehitysasteeseen – niitä esiintyy aivan sattumanvaraisesti niin rauhallisilla kuin epävakaillakin alueilla, kehitysasteesta riippumatta. Öljyesiintymiä esiintyy pääasiassa kehittyneemmissä osissa Afrikkaa, mistä voisi päätellä esim. että öljyn tuoma varallisuus jakautuu timanttikaivoksia tasaisemmin valtion asukkaille. Voisi ja voisi. Tästä kaikesta voi todellakin vetää jos jonkinlaisia johtopäätöksiä, mutta niiden kanssa on syytä olla varovainen: kartasta ei voi aivan suoraan lukea minkään siinä kuvattujen asioiden keskinäistä korrelaatiota ja parempaan analysointiin tarvittaisiin vielä ajallisesti tarkempaa tietoa oikeastaan kaikesta, minkä lisäksi huomioon täytyy toki ottaa erilaiset poliittiset ja historialliset seikat, jotka vaikuttavat valtioiden kehitysasteeseen. Kaiken kaikkiaan aineisto on melkoinen sekasotku.

 

Kuva 1. Eräiden ilmiöiden alueellinen esiintyminen Afrikassa.

 

Itsenäistyöksi (minulle nämä kaikki ovat itsenäistöitä, koska teen kaikki kurssilla tehdyt asiat uudestaan kotonani, jotta oppisin jotain) jäi tehdä tulvaindeksikartta, jossa vertaillaan Suomen vesistöalueiden valuma-alueominaisuuksia ja tulvaherkkyyttä. Idea oli siis kuvata koropleettikarttana tulvaherkkyyttä ja diagrammina järvisyyttä. Molemmat asiat löytyvät kartastani (kuva 2) enkä nähnyt syytä pitää varsinaisia vesialueita näkyvillä tässä yhteydessä, joten poistin aineistosta jokien ja järvien visualisoinnin. Näin kartasta tuli mielestäni helppolukuisempi. En kylläkään törmännyt kenenkään muun blogissa tällaiseen ratkaisuun, joten en tiedä oliko tämä sittenkään hyvä idea, mutta tässä se nyt on näytillä. Punaisella kuvasin tulvariskiä ja sinisellä järvisyyttä eli jatkoin minimalistisella linjalla. Väreistä onkin riittänyt hyvää debattia muiden kurssilaisten kesken, kuten esim. Laura Hynysen tekstistä käy ilmi. Itse yritin tehdä kartasta vain mahdollisimman yksinkertaisen ja värit sitä ainakin ovat.

 

Kuva 2. Virtaamavaihtelujen indeksi Suomessa.

 

Siellä, missä on vähäinen järvisyys, on myös suurin tulvariski, sillä jos vesi ei voi virrata järveen, se virtaa ympäröiville alueille kuten mm. Venla Moisio on blogissaan ottanut esiin. Vilma Koljonen on puolestaan huomioinut, että tulvaindeksi on korkealla rannikkoalueilla Etelä- ja Länsi-Suomessa, sillä niissä on ensinnäkin (luonnollisesti) paljon jokia ja toiseksi (etenkin Pohjanmaalla) vähän korkeuseroja, mikä lisää tulvimisen riskiä. Niin. Eipä minulla oikeastaan ole mitään järkevää lisättävää heidän kommentteihinsa. Oikeassa ovat!

 

Tulevaisuudessa Suomi tulvii ilmeisesti aiempaa pahemmin: ”Arvioiden perusteella Suomen tulvariskit kaksin- tai kolminkertaistuvat vuoteen 2100 mennessä. Useilla vesistöalueilla tulvavaara pienenee ilmastonmuutoksen seurauksena. Pitkällä aikavälillä ilmastonmuutoksen ennustetaan kuitenkin kasvattavan tulvariskiä erityisesti merenrannikolla.”, tietää Suomen ympäristökeskus kertoa. Ei yllätä, monien sään ääri-ilmiöiden kun ennustetaan kasvavan ilmastonmuutoksen seurauksena.

 

Loppuun on vielä sanottava, että pidän (täysin hölmön intuitiivisesti) varsinaista tulvaindeksiä (keskiylivirtaama / keskivirtaama) kuvaavampana tapana kuvata tulvaa kuin virtaamavaihtelujen indeksiä (keskiylivirtaama / keskialivirtaama), joka kartassani on nähtävillä. Tulva kun määritelmällisesti on keskimääräistä mittavampaa veden virtausta. Harjoitusohjeiden perusteella tulvaindeksi voidaan kuitenkin jostain syystä laskea molemmilla tavoilla, mikä on erikoista. Ehkä toisenkin tavan hienous minulle myöhemmin selviää (kunhan viisastun ensin).

 

Seuraavia gis-haasteita odotellessa,

 

Hyvää yötä.

 

Lähteet:

 

Hynynen L. Lisää elementtejä analyysiin.

Blogikirjoitus kurssikerralta 3. Luettu 7.2.2020.

https://blogs.helsinki.fi/lauravel/2020/01/29/lisaa-elementteja-analyysiin/

 

Moisio V. Viikko 3 – Tietokantojen yhdistämistä ja laskutoimitusten tekemistä.

Blogikirjoitus kurssikerralta 3. Luettu 7.2.2020.

https://blogs.helsinki.fi/moivenla/2020/01/29/viikko-3-tietokantojen-yhdistamista-ja-laskutoimitusten-tekemista/

 

Koljonen V. Tietokannoista käyttökelpoisia.

Blogikirjoitus kurssikerralta 3. Luettu 7.2.2020.

https://blogs.helsinki.fi/vilmakol/2020/01/29/tietokannoista-kayttokelpoisia/

 

SYKE.

Suomen tulvariskien ennakointia. Luettu 21.4.2020.

https://www.syke.fi/fi-FI/Ajankohtaista/Suomen_tulvariskien_ennakoidaan_kasvavan(48862)

One Reply to “Tietokantojen yhdistelyn ja tulvaindeksin salat”

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *