KK6: Pistetietoa ja interpolointia

Kumpuloidien hasardit

Poikkeuksena aiempiin kurssikertoihin teimme tällä erää hieman itsekin töitä datan keräämiseksi – pienellä kävelykierroksella saimme jo hyvänkokoisen kasan pisteitä kartalle. Pisteet sisälsivät tietoa vastauksistamme, joita Epicollect-sovelluksen projektiin oli ennalta asetettu, ja sen tiedon esittämiseen tällä erää keskityttiin. Koska pistemäinen visualisointi ei ole aina vaihtoehdoista paras, on jälleen tutustuttava muihin vaihtoehtoihin, tällä kerralla interpolointiin. Interpolointi voidaan tehdä alueelle, joka sisältää pistetietoa ja se toimii laajentaen pisteiden vaikutusalueita luoden kokonaisen, tasapintaisen visualisoinnin. Se siis todellisen maantieteilijän tapaan joutuu hieman olettamaan ja yleistämään saadakseen tiedon selkeään esitysmuotoon. Tehtävän lopputulema on miellyttävän näköinen kartta, joka kuvaa vastauksiamme Kumpulan kampusta ympäröivien alueiden turvallisuudesta (kuva 1).

Kuva 1. Pistekartan interpoloitu versio, joka kuvastaa vastauksiamme alueen turvallisuudesta. 

 

Karttaa vilkaisemallakin selviää, että turvallisimmaksi alueiksi on koettu rauhalliset kävely- ja sivutiet, kun taas turvattomimpia paikkoja ovat vilkkaiden teiden varrella. Teiden kunto ja liukkaus vaikutti varmasti myös vastauksiin paikoittain.

 

Kartta myös kertoo interpoloinnin toiminnan logiikasta, sillä se on visuaalisesti hyvin lähellä isopleettikarttaa. Sen periaate on jakaa alueet arvoihin, joista vain vierekkäiset voivat kartalla osua toisiinsa. Siis jos kahden vierekkäisen alueen arvot ovat skaalan eri päädyistä kartalla näytetään silti niiden välillä kaikki muutkin arvot kapeina osuuksina. Interpoloinnin luomien yleistysten vuoksi olisi fiksua jättää pisteitä kartalle tarpeen mukaan, kuten toinen kurssilainen Victoria Rumbin oli tehnyt ja blogissaan pohtinut.

Hasardeja maailmalla

Kumpulan maaston turvallisuustutkimuksesta voidaan siirtyä suvereenisti globaaliin kuvaan tutkimaan muita vaaranpaikkoja – erityisesti maanjäristyksiä, tulivuoria ja meteoriitteja. Tavoitteena oli luoda yllä mainituista tapahtumista karttoja, joita voitaisiin käyttää opetusmateriaalina.  Suunnittelin keskittyväni tässä tehtävässä johonkin tiettyyn, jotta voisin luoda sarjan saman tyylisiä karttoja, mutta uteliaisuus pääsi taas viemään minua hihnassaan. Toisaalta uteliaisuus on hyväksi, parhaassa tapauksessa sen johdattamana voi löytää aivan uusia näkökulmia.

Aloitin tehtävän visualisoimalla kartalle yli 7 magnitudin maanjäristyksiä 2000-luvulla, mutta huomasin tulivuoriaineistojen ajanjaksojen olevan valmiiksi rajattuja, joten päätin muokata maanjäristysten aikajakson niihin sopiviksi. Halusin valita aktiivisia tulivuoria rajaukseen ja päädyin valitsemaan ajanjaksoista viimeisimmän; vuodesta 1964 nykyhetkeen saakka ja sovelsin samaa jaksoa myös maanjäristystietokannan rajaukseen (kuva 2).

Kartta auttaa hahmottamaan näiden endogeenisten tapahtumien yhteneväisyyksiä erityisesti Tyynenmeren tulirenkaan alueella. Kaikessa yksinkertaisuudessaan se on hyvin selkeä ja kuvaava kartta, joka sopisi hyvin opetustilanteisiin. Sen ainoa amatöörimäinen virhe on mittakaavan puute, joka johtuu jostain mystisestä pohjakartan taustatiedon vääristymästä. Sen vuoksi QGIS oli sitä mieltä, että Australian itä-länsisuuntainen läpimitta olisi hieman alle 15 kilometriä. Nopeilla hoksottimillani laskin 1+1 ja päätin jättää tuon ymmärtääkseni virheellisen tiedon kartasta pois ja olettaa, että sitä tulkitseva ihminen ymmärtää katsovansa maailmankarttaa.

Kuva 2. Vuoden 1963 jälkeen tapahtuneet tulivuorenpurkaukset ja samana aikana yli seitsemän magnitudin maanjäristykset kuvattuna kartalla pisteinä.

Opetustarkoituksessa haluaisin esittää samassa tai erillisessä kartassa litosfäärilaattojen rajat selventääkseni yhteyksiä voimakkaiden maanjäristyksien ja tulivuorten sijainnissa. Luottavaisin mielin hain QuickMapServices (QMP) pluginistä valmista laattakarttaa, joka sopisi tähän työhön ja sen projektioon. Löysin vain yhden, joka ei projektionsa vuoksi sopinut, enkä saanut sitä uudelleenprojisoitua minulle sopivaksi. Kaikkeni kyllä yritin, mutta rasteriaineiston uudelleenprojisointia varten ohjelma kyseli turhan monia ja monimutkaisia kysymyksiä.

Uteliaisuuden viemänä halusin tutkia interpolointitoiminnon mahdollisuuksia tässäkin tehtävässä. Nopeasti kuitenkin ymmärsin sen tarvitsevan skaalan eri arvoja toimiakseen järkevänä visualisointityökaluna. Hain maanjäristystietokannasta ensin vuoden tilastot kaikista maailman yli 2,5 magnitudin järistyksistä, sitten viimeisen viikon ajalta. Vuoden rajauksessa ongelma oli tietokannan suuruus, sillä järistyksiä oli yksinkertaisesti liikaa. Viikon aikajana toimi hyvin, sillä tärkeintä tässä oli saada maanjäristyksiä mahdollisimman laajalla magnitudiasteikolla. Ensimmäinen visualisointi näyttää tiedot pisteinä, jotka olen kategorisoinut ja sen mukaan värittänyt (kuva 3). Tämä kartta on selkeä ja jatkaa ensimmäisen järistyskartan kanssa samoilla linjoilla havainnollistaen suurien järistysten sijaintia.

Kuva 3. Viikon aikana (17.-24.2.2022) tapahtuneet yli 2,5 magnitudin maanjäristykset.

Edellisten tietojen perusteella tein interpoloidun kartan, jolloin  koko maapallo voitaisiin luokitella maanjäristysalueisiin viimeisen viikon tietojen perusteella (kuva 4). Siistin kartan luominen haluamallani tavalla vaati tässä vaiheessa jo hieman kikkailua, erityisesti värityksen ja pohjakartan värien vuoksi. Värikäs pohjakartta hämmensi interpoloitua väriskaalaa tehokkaasti, jonka korjasin QMP:n valmiin karttapohjan avulla, joka sattui sopimaan käyttämäämme projektioon. Neutraali taustakartta piti asettaa interpolaatio-karttatason päälle ja säätää osittain läpinäkyväksi, jotta tuloksesta tulisi mahdollisimman selkeä.

Kuva 4. Viikon aikana (17.-24.2.2022) tapahtuneet yli 2,5 magnitudin maanjäristykset interpoloituna kartalla.

Lopputuloksena kartta kuvastaa selkeästi maapallon voimakkaiden järistysten alueita, mutta sitä voisi kritisoida monilla eri tavoilla. Uskon, että sekä samoilla tiedoilla rakennettua pistekarttaa ja interpoloitua karttaa voitaisiin käyttää opetuksessa yhdessä, mutta pistetietoa ei tulisi koskaan täysin erottaa tästä kartasta. Yksittäisenä interpoloitu kartta on siisti, mutta voi johtaa sen tulkitsijaa monin tavoin harhaan. Sen vuoksi pistekartan kanssa tulkiten se voisi toimia erinomaisena kriittisen analyysin opetusmetodina.

Hasardeja avaruudesta

Uteliaisuus ja inspiraatio palasivat, kun tutkailin meteoriittitietokantoja. Kuvittelin niiden olevan harvinaisempia, kun rajasin näkyviin kaikki tunnistetut meteoriitit 2000-luvulla ilman massarajoitusta. Väärässä olin, kartta peittyi nopeasti pisteiden alle mantereisilta alueiltaan. Merialueille osuneita meteoriitteja ei varmaankaan olla voitu todeta, joten niitä ei monia löytynyt. Rajasin tuloksia koon mukaan aina kymmeneen kiloon saakka, jolloin tulokset alkoivat olemaan selkeämmin luettavissa (kuva 5). Kartta herättää kysymyksiä, joita voisi opettaja oppilaidensa kanssa pohtia; onko näkyvissä selvää alueellista jakautumista? Mistä sellainen voisi johtua? Suurin kysymys mielessäni on kuitenkin Omanin tilanne – mitä ihmettä siellä tapahtuu ja miksi siellä on lähes yhtä paljon pisteitä, kuin muualla Aasiassa yhteensä? Ehkäpä joku leikkii supermagneetilla, joka vetää meteoriitteja puoleensa. Ehkä kysymyksessä on virhe tietokannoissa tai ihan vaan sattumaa – aina joku vetää lyhyimmän tikun. Tai tässä tapauksessa jäätäviä avaruuspalleroita sateen lailla puoleensa.

Kuva 5. Yli kymmenkiloisten tunnistettujen meteoriittien osumakohdat maapallolla 2000-luvulla.

Omanin meteoriittikertymää voisi todellisuudessa selittää alueella tehty laajempi tunnistus ja tutkimus sekä kulkukelpoinen maasto. Lähi-idän kohdalla alueen meteoriittien tuntemus myös varmasti liittyy sen poliittiseen tilanteeseen – sodan jaloissa kun ei paljon ulkoavaruuden uhat paina. Löysin Omanin aluetta ja aihetta kuvaavan kartan Washington Universtity of St. Louis’n sivustolta, jota on käytetty tutkimuksessa vuonna 2005  (kuva 6). Meteoriittien sijoittuminen ei siis välttämättä kerro ilmiön alueellisuudesta, vaan ennemmin tutkimuksen ja tiedon määrästä.

Kuva 6. Meteoriitteja Omansissa. (2005, Al Kathiri et al.)

Lähteet:

Al-Kathiri A., Hofmann B. A., Jull A. J. T., and Gnos E. (2005) Weathering of meteorites from Oman: Correlation of chemical and mineralogical weathering proxies with 14C terrestrial ages and the influence of soil chemistryMeteoritics & Planetary Science 40, 1215–1239.

Rumbin, V.  24.2.2022. Kurssikerta 6 – Interpolointia vai ei? Matka GIS-guruksi-blogi. https://blogs.helsinki.fi/vrumbin/ katsottu 25.2.2022.

KK5: Bufferit ja analyysit

Helppoo kunnes toisin todistetaan

Viidennellä kurssikerralla aiheena oli bufferit ja analyysit, joita varten opin jälleen käyttämään uusia työkaluja ja ehkä ymmärtämään niiden toimintaperiaatteitakin hieman. Niiden ymmärtäminen on tärkeää, sillä muuten ollaan (taas) sokkona markkinoilla ja jokaisen toiminnon kokeilemisessa kestää – QGIS tuntuu vielä olevan kaikkine lisäosineen rautakauppaa suurempi työkaluvarasto.

Uusina työkaluina käyttöön tuli nyt bufferi- eli vyöhyketyökalu, jonka avulla voidaan luoda tietyn karttakohteen ympärille halutun kokoinen alue uutena karttatasona. Sitä käytettiin nyt mittaamaan lentokentän meluhaittoja lähiseudun asukkaille sekä tutkimaan metron ja junien saavutettavuutta (taulukot 1 ja 2). Bufferin käyttäminen sujui hyvin, sillä sen luominen tapahtuu hyvin samalla tavalla, kun jo tuttujen metodien käyttäminen. Tehtäviä ratkoessani yhdistelin jo sujuvasti karttakerroksia, attribuuttitietoja ja loin uusia valikoimia tiettyjen hakukriteerien avulla. Erityisesti Join attributes by location ja Select – toiminnot ovat tulleet tutuksi ja haen niistä usein ratkaisuja.

Taulukko 1: Lentokenttien meluhaitoille altistuvat lähialueiden asukkaat.
Taulukko 2: Asukkaat, jotka asuvat 500 metrin säteellä juna- tai metroasemalta.

Tehtävissä annettiin muutamaan otteeseen vinkki käyttää Join attributes by location -toimintoa, jota en monesti nähnyt tarpeellisena. Lukujen selvittäminen onnistui mielestäni helpommin ja nopeammin statistiikkapaneelin ja valikoinnin avulla. Se onnistui erityisesti silloin, kun olin laskenut attribuuttitaulukkoon valmiiksi uuteen sarakkeeseen tiedot, joita halusin tarkastella.

Helppoo jos osaa

Ensimmäisten tehtävien onnistuttua jatkoin tietojeni soveltamista uima-altaiden ja saunojen tutkailutehtävässä. Tehtävänä oli selvittää tietokannasta missä ja miten paljon on taloja, joissa on uima-allas tai sauna. Tietoa kerätessä käytin paljon Selection- työkalua ja statistiikkapaneelia, joiden yhteistyön avulla sain nopeasti vastauksia. Tehtävä sujui lupaavasti, kunnes rakennusten attribuuttitaulukon tietoja piti saada yhdistettyä ja sidottua pienaluetietokantaan, jonka geometrian ohjelma kertoi olevan virheellinen. Virheellisen geometrian vuoksi kerrosta ei voitu yhdistää millään tähän asti oppimallani tavalla, vaan geometria tulisi joko korjata tai ohjelman herjaus tulisi ohittaa – kumpaakaan näistä en osannut tehdä. Etsin ratkaisua kurssilaisten blogeista ja löysin Eemilin Mantsablogista hyvän vinkin. Hän oli korjannut ongelman ohittamalla bugin Check Validity -toiminnolla, jota en jostain syystä saanut toimimaan. Jotain olin tehnyt eri lailla ja samalla linjalla oli jatkettava, ellen haluaisi setviä koko projektin kaikkia vaiheita uudestaan läpi. Onneksi sain toisenkin loistovinkin Eemilin blogista, jota en itse tajunnut ajatella; katso googlesta.

Voi, miten monta pitkää minuuttia olisinkin voinut säästää, jos olisin vain muistanut internetin ihmeet ja hakukoneiden maailman. Joku muu on lähes varmasti joskus käyttänyt QGISiä, joten en ehkä ole ensimmäinen tämän ongelman äärellä. Sain korjattua virheelliset geometriat toiminnolla, jonka nimi on yllättäen Fix Geometries (Ujaval Gandhi). Lopulta sain rakenneltua siistin kartan (kuva 1), joka kuvastaa pääkaupunkiseudun pienalueita ja niiden sisältämien uima-altaalla varustettujen talojen määrää. Määrä oli yllättävän korkea, kokonaisuudessaan 855 joista omakotitaloja oli huimat 345. Vähemmän yllättävää on Lauttasaaren asema tilaston kärjessä, pitäähän onnellisten saarelaisten päästä uimaan muuallekin, kuin saaren sadalle uimarannalle.

Kuva 1: Pääkaupunkiseudun pienalueet ja niiden uima-altailla varustettujen asuinrakennusten määrät.

Kartta on selkeä ja erityisen tyytyväinen olen histogrammeihin, sillä niiden rakenteluun numeroiden kera sain käyttää idean jos toisenkin. Toisaalta muutama lisäidea ei olisi pahitteeksi, sillä haluaisin vielä piilottaa nollat kartalta kokonaan. Tein erikseen myös koropleettikartan kuvaamaan uima-allastalojen määrää, jota on itsessään helpompi lukea, mutta histogrammien kanssa sen arvo tuntui laskevan roimasti.

Lähteet:

Sillankorva, E. 17.2.2022. KK5: Buffereita ja altaita. Eemilin mantsablogi. https://blogs.helsinki.fi/sillanko/ katsottu 22.2.2022.

Gandhi, U. 11.2. 2022. Handling invalid geometries. QGIS tutorials and tips. qgistutorials.com/en/docs/3/handling_invalid_geometries.html katsottu 22.2.2022.

KK4: Teemoittain juttuja

Visiitti ruutukarttojen maailmaan

Neljännellä kurssikerralla tehtiin taas paljon juttuja, joskin nyt niiden tekeminen alkaa jo tuntua kevyemmältä ainakin GIS-luokan tehokoneilla. Toista se oli kotona läppärillä, kun tein kaikki samat asiat uudestaan ihan vaan siksi, koska en ilmeisesti osaa tallentamista kovinkaan hyvin. Toisaalta ehkä tämä on jokaisen GIS-velhon salainen taustatarina, hommahan helpottuu sitä mukaa kun sitä harjoittelee.

Tällä erää tavoitteena oli esittää tietoa kartalla ruutuja käyttäen, joten ensimmäinen askel oli ruudukon luominen ja siihen tiedon sitominen. Ruutujen avulla tiedon esittäminen on erittäin yleistävää parhaassakin tapauksessa, mutta samalla se avaa uusia mahdollisuuksia erityisesti aluejakonsa ansiosta.

Tästä Siiri Kokkonen mainitsi blogissaan; ”Toisaalta ruudukkokartan avulla voidaan esimerkiksi kurssitehtävän tavoin tutkia jonkin ilmiön esiintymistä tehokkaasti yhden aluerajauksen sisällä.”. Mielestäni tämä huomio on loistava, sillä aina valmiit aluejaot eivät ole meille parhaiten toimivia, etenkään kun haluamme tutkia yhden suuremman alueen sisältöä tarkemmin.

Ruututeemakartta esimerkiksi kuvastaa hyvin kaupungin asutustiheyttä (kuva 1), erityisesti kun käytössä on suhteellisen pienet, vain sivuiltaan 1 km pitkät ruudut.

Kuva 1: Ruudukkokartta, joka kuvaa pääkaupunkiseudun asutustiheyttä.

Ruudut eivät kuitenkaan itsessään tuo tähän karttaan mielestäni riittävästi informaatiota, joten jätin karttaan esimerkiksi taustalle harmaan pääkaupunkiseudun alueen kuvaamaan niitä paikkoja, joissa asutusta tai tietoa siitä ei ole. Sen lisäksi lisäsin karttaan päätiet hahmottamaan niiden merkitystä asutuksen sijoittumiseen. Toisaalta järvet ja joet olisi voinut myös jättää ruudukon päälle, mutta turha se kai on jälkiviisastella, kun en aio enää näitä korjaillakaan.

Kuva 2: Ruotsinkielisten osuudet alueilla prosenteissa kuvattuna.

Kuvassa 2 on samoin metodein rakenneltu kartta ruotsinkielisten prosenttiosuuksista ruutujen alueella. Tässä kartassa muodostuu ongelmaksi pienten ruutujen satunnainen kohdistuminen, sillä joukossa on ruutuja, joiden alueelle sattuu vain asukas tai kaksi. Otannan kapeus ei sinänsä vääristä tulosta, mutta taustatietojen tärkeyttä se korostaa etenkin kun vain yksi ruotsinkielinen asukas yhdellä alueella nostaa prosentit sataan. Sen lisäksi, että sata prosenttia kuulostaa useammalta, kuin yhdeltä, voisi tässä kohtaa pysähtyä miettimään myös alueen asukkaiden yksityisyydensuojaa.

Kuva 3: Ulkomaan kansalaisten osuus alueilla.

Vertailin myös ruutukoon merkitystä, kun muuttujana oli ulkomaan kansalaisten osuudet eri pääkaupunkiseudun alueilla (kuva 3 ja 4). Kuvan 3 ruuduissa on kahden kilometrin mittaiset sivut ja kuvan neljä ruuduissa sivut ovat viiden kilometrin mittaiset. Tähän kuvantamiskohteeseen viiden kilometrin ruudukko on aivan liian suuri ja yleistävä, mutta kahden kilometrin ruudukolla voisi vielä tehdäkin jotain. Tai ehkä suuremmat ruudut auttavatkin aiemmankin kartan ongelmakohdassa – tässä kartassa (kuva4) ei ainakaan yksikään alue värjäänny tummimmalla värillä sen yhden ainoan asukkaan vuoksi.

Kuva 4: Ulkomaan kansalaiset alueittain ruutukartalla.

Kaikkiaan näen ruutukartoissa paljonkin potentiaalia käyttöön silloin, kun valmiit aluerajat eivät riitä tai ole jostain syystä toimivia käyttötarkoitukseen. Onhan näissäkin huonot puolensa, kuten tuo raaka rajaaminen ja yleistäminen ja erityisesti tämä kysymys yksityisyyden kannalta, jos sattumanvaraisesti asettuneen ruudun sisään jääkin vain yksi ihminen tai perhe.

Karttojen rakentelu ja niiden taustatietojen pyörittely alkaa jo sujua ja on se ihan kivaakin. Seuraavana haasteena on opetella tallentamaan tiedot oikein, ettei ihan jokaista tehtävää tarvitsisi toistaa jokaista askelta myöten.

Lähteet:

Kokkonen, S. 9.2.2022. Ruudun takaa – ruututeemakarttaharjoituksia. Leipä-blogi. https://blogs.helsinki.fi/siirikok/ viitattu 15.2.2022

KK3: Tuotosten taustoja

Tietojen hallinta ja analyysi

Kolmannella kurssikerralla tutustuttiin tarkemmin näkyvän kartan taustalla vaikuttavaan dataan ja sen hallintaan. Selkeällä ja seurattavalla ohjeistuksella monimutkainen prosessi saatiin suhteellisen vaivattomasti valmiiksi. Toisaalta koko tiedon työstämisen prosessi selkeytyi samalla, kun opin lisää yhteistyön ja tavallisen päättelyn merkityksestä kaiken sen statistiikan taustalla.

Tällä erää työstettävänä oli Afrikkaa koskevia tietokantoja, joita yhdisteltiin erilaisin keinoin saadaksemme niistä irti lisää tietoa, siis relevanttia sellaista. Tärkeäähän olisi tässä vaiheessa (myös) miettiä mitä haluamme tutkia tai esittää ja miten kyseisen ilmiön esiintuominen saattaa vaikuttaa katsojan mielikuvaan.

Työssä kaivelimme esiin tietoja Afrikan maissa tapahtuneista aseellisista konflikteista ja timanttikaivosten ja mantereisten öljynporausalueiden sijainneista, jotka kaikki näkyvät kartalla kuvassa 1. Jo tässä vaiheessa olisi helppo kuvitella niiden liittyvän erityisen vahvasti toisiinsa ja olettaa useiden konfliktien johtuvan timanteista ja öljystä. Tämä ajatus on kadotettava, tai sen olemassaolo ja syntysyy ymmärrettävä, jotta voisin tehdä järkevää analyysiä kartan antamista tiedoista ilman ennakko-olettamusta.

Kuva 1. Afrikan kartta, johon on merkitty kirjatut aseelliset konfliktit, timanttikaivokset ja öljynporausalueet mantereella.

Tässä kartassa sinisellä on merkitty timanttikaivostenpaikat, punaisella konfliktit ja oranssilla öljynporausalueet. Huomiona öljynporausalueista lisäisin vielä, että alueen koko kartalla ei kerro öljyesiintymän koosta, vaikka niin voisi helposti kuvitellakin. Tästä johtuen päätin kirjoittaa legendaankin oranssin kuvastavan nimenomaan öljynporausaluetta, ja toivon sen selkeyttävän tulkitsemista.

Kartalla konfliktit eivät näytä suoraan tai välttämättä ollenkaan korreloivan timanttikaivosten ja öljynporausalueiden kanssa, vaan niitä esiintyy runsaastikin kauempana kyseisistä alueista. Konfliktit ovat statistiikassa laskettu yksittäisinä ja erillisinä konflikteina, paitsi silloin, kun tietoja yhdistettiin niin, että saimme näkyviin uniikit konfliktit vuosittain. Se siisti tilastoa siten, että usean maan konflikteja sisältäneet vuodet olivat erittäin alhaiset ja toisissa konfliktivuosien määrä oli suuri. Silloin voitiin myös vertailla todenperäisemmin konfliktivuosia maassa sijaitsevien luonnonvarojen määriin, josta taas voitaisiin löytää jonkinasteinen yhteys. Jokunen maa, jossa on eniten öljynporausalueita ja timanttikaivoksia näkyi myös konfliktivuosien listan huipulla, näistä yksi oli Angola.

Kuten Taru Tornikoski huomauttaa oivaltavasti blogissaan, vaikuttavia tekijöitä konfliktien taustalla on paljon muitakin;

”Tällaisia ovat mm. väestön köyhyysaste, kaivostoiminnan tuottavuus, kaivokset kussakin tilanteessa omistava taho, sekä maan alueella toteutettavasta kaivostoiminnasta kansalaisille seurannut mahdollinen hyöty, mikä näkyy vaurastumisena, kuten internetkäyttäjien lisääntymisenä valtiossa.” (Geoinformatiikkaa tutkimassa- blogi, 1.2.2022)

Opitun soveltamista

Näillä datankäsittelyeväillä oli helppoa ja kivaa aloittaa muotoilemaan uutta karttaa, joka käsitteli Suomen alueen jokien valuma-alueita, niiden tulvaindeksiä ja järvisyyttä. Helppoa ja kivaa vielä, kun sitä teki opittujen asioiden ollessa vielä tuoreessa muistissa – niitä oli paljon. Tuon tietokantasokkelon muovailu on mielenkiintoista, erityisesti kun siinä onnistuu. Onnistuminen taas usein riippuu ihan pieneltä tuntuvasta asiasta tai vaan tuurista ja muistista. Erityisesti siitä, onko muistanut tallentaa työn, kun ohjelma yhtäkkisesti kaatuu.

Tein työtä luentokerralla ja vierustoverin vinkkien avulla pääsinkin aika pitkälle. Sain tehtyä kartan, jossa näkyy jokien valuma-alueet kuvattuna koropleettikartalle niiden tulvaindeksin mukaan, sain vielä siihen päälle laitettua pylväät, jotka kuvasivat kunkin alueen järvisyyttä. Pylväät eivät olleet selkeät tai hyvät, lisäksi ne olivat väärin päin. Päätin jatkaa työtä kotona, olihan pohja jo aika hyvä.

Kotona availin tiedostoja uudelleen QGIS-ohjelmassa, tai niin yritin tehdä. Se ei vaan onnistunut löytämään tiedostojen datalähteitä, joten työ ei ollut käyttö-, avaus- tai muokkauskelpoinen. Uudestaan vaan alusta ja ei kun kertaamaan opittua!

Kertaus teki hyvää sekä oppimiselleni että kartalleni, johon sain nyt jotain järkeä. Tulvaindeksin kuvaaminen valuma-alueilla oli helpompi toteutettava ja sen lopputuloskin on selkeä (kuva 2). Vaikeammaksi osuudeksi muotoutui järvisyyden kuvaaminen pylväsdiagrammina, kuten tunnillakin tehdyssä työssä. Esittämisen ongelma oli saada pylväät kuvaamaan täyttä sataa prosenttia, jotta järvisyyden todellinen osuus olisi selkeämmin luettavissa. Kuvassa 2 on tulos kartasta, jossa pylväät kuvaavat kyllä järvisyyden määrää toisiinsa verrattavissa olevassa muodossa, mutta absoluuttisesti niitä on tässä vaikeampi vertailla. Suurimman pylvään kun voisi olettaa kuvaavan sataa tai edes lähes sataa prosenttia, vaikka se on todellisuudessa hieman alle 20 %. Toisaalta kartta on melko selkeä ja tätäkin voisi jo käyttää – mikäli haluaa verrata valuma-alueiden järvisyysasteita toisiinsa nähden.

Kuva 2. Koropleettikartta, joka kuvaa Suomen alueen jokien valuma-alueita ja niiden tulvaindeksiä ja järvisyyttä.

Tämän version ongelmakohdaksi muodostui kuitenkin ainakin itseäni häiritsevä tyhjä ja loputtoman pitkä pylväs, jota en saanut korjattua. Se ilmeisesti johtuu Hirvijoen valuma-alueen järvisyysprosentista, joka on nolla (kuva 3). Tämän tietokannan tietojen mukaan se oli ainoa kunta, jossa prosentti oli pyöreä nolla, muissa se oli vähintään 0,1 %, joka ei tuottanut ongelmaa tiedon kuvaamisessa.

Kuva 3. Koropleettikartan osa, jossa näkyy keltaisella Hirvijoen valuma-alue ja sen päällä sen ongelmallinen tyhjä ja pitkä pylväs. Kartan päällä näkyy attribuuttitaulukon Hirvijoki-rivi ja sen tiedoista kenties tärkein valittuna -järvisyysprosentti (joka on 0).

Sain mielestäni hyvän idean, joka voisi ratkaista Hirvijoki-pylvään ongelman. Tekisin pylväät kaksiosaisiksi, pinotuiksi pylväiksi, jotka kaikki kokonaisuudessaan kuvaisivat sataa prosenttia, mutta josta värjätty osuus olisi todellinen järvisyysprosentti. Käytin hyväkseni valmista järvisyysprosenttitiedostoa excelissä, johon sai nopealla kaavalla laskettua kunkin valuma-alueen järvisyysprosentin erotuksen sadasta prosentista. Siitä tulisi pylväälle tausta, jonka voisi esittää mahdollisimman neutraalilla värillä tai läpinäkyvänä. Lopputuloksena sain suhteellisen siistin kartan, joka kuvastaa alueita juuri haluamallani tavalla – Hirvijoen alue mukaan luettuna (kuva 4). Edelleenkään en ole täysin tyytyväinen kartan informaatioarvoon, sillä sataprosenttiset pylväät jättävät kovin vähän visuaalista arvoa pienille järvisyysprosenteille (joista suurin oli siis alle 20 %).

Kuva 4. Koropleettikartta Suomen alueen jokien valuma-alueista niiden tulvaindeksien mukaan kuvattuina. Pylväillä on kuvattu valuma-alueen järvisyysprosentti harmaalla.

Lähteet:

Tornikoski, T. 1.2.2022. Tietokantojen yhdistely – kaatumisia ja nousuja. Geoinformatiikkaa tutkimassa 😊-blogi. https://blogs.helsinki.fi/tornitar/