Kolmas luentokerta

Heippa taas! Kolmanteen luentokertaan mennessä on jo alkanut tottua kurssilla käymiseen. Hieman myöhässä, kone käynnistyy hitaasti ja kun saan ohjelman käynnistettyä se kaatuu. Hitaasti alkaa tämänkin keskiviikko. Kun vihdoin pääsen hommiin ovat muut jo ties missä. Mutta ei se mitään tiedän, että ohjeet löytyy moodlesta. Nyt aion skarpata ja saada hommat tehtyä itse.  Ja tavoitteena on oppia yhdistelemään tiedostoja, siistimään niitä ja tuomaan ulkopuolisia tiedostoja. Tällä kertaa käsittelemme Afrikkana liittyvää tietopakettia. Tiedot ovat hajanaisesti, joten ne pitää ensiksi yhdistää join komennolla saman tekijän mukaisesti, kuten nimen. Tämän voi tehdä myös koko tietokannalle kerralla dissolve toiminnolla ja säätämällä parametrit oikein. Noniin ei mennyt kuin pari minuuttia, ja mietin missäköhän muut menevät. Yllätyn, huomatessani, että sain kaikki muut jo kiinni. Häh, eivätkö he ole päässeet pidemmälle. Tiedostoon lisätään seuraavaksi excel-tiedosto, jossa on numeerista lisädataa. Ensiksi numerotiedosto täytyy muuttaa sopivaksi tekstitiedostoksi. Tämä yhdistetään Afrikan maihin ja voidaan laskea maa kohtaisesti, esimerkiksi suhde väkiluvun ja internetin käyttäjien välillä. Lisäksi voimme tarkastella, kuinka nopeasti internetin käyttäjät ovat lisääntyneet. Seuraavaksi saimme lisäaineistona Afrikan timanttikaivokset, öljylähteet ja konfliktit. Näitä tutkimalla voimme esimerkiksi tutkia tapahtuuko timanttikaivosten lähettyvillä enemmän konflikteja, ja onko ilmaantunut uusia konflikteja, kun on löydetty uusia kaivoksia. Tiedostossa kerrotaan myös, kuinka tuottavia kaivokset ovat, sekä kuinka suuria. Tiedolla voidaan tutkia, mistä valtiosa timantteja määrällisesti löytyy eniten. Voidaan myös havaita onko mahdolliset timantti konfliktit keskittyneet juuri tuottavien kaivosten yhteyteen ja ovatko konfliktit olleet pitkäkestoisia.

Alun harjoittelun jälkeen aloimme itsenäisesti tehdä harjoitusta jokien tulvimisesta ja järvisyydestä. Aineisto oli jaettuna useampaan tiedostoon ja myös excel ja teksti tiedostoon. Nämähän pitää ensin muuttaa kaikki yhteen sopiviksi, eli cvs. tiedostomuotoon. Sitten aineistot voi yhdistää yhteisen muuttujan suhteen join komennolla. Nyt voimme field calculatorilla tehdä laskelmia ja selvittää valuma-alueiden järvisyyden ja jokien tulvaindeksin. Tulvaindeksi näkyy kartassa erivärillä, ja jää paikoin järvisyyden histogrammi palkkien alle. Onnistuin lopulta monien pikku virheiden ja pieleen menneiden laskujen jälkeen lopullisen kartan teossa ja vain noin puolituntia tuli ylitöitä.

Leave a Reply

Your email address will not be published. Required fields are marked *