Kurssikerta 5

 

Asukkaita 1km säteellä Malmin kentästä 8883
Asukkaita 2km säteellä Malmin kentästä 58 121
Asukkaita 2km säteellä Helsinki-Vantaasta 11 747
… joista 65db-melualueella 0,16 %
Asukkaita H-V:n  55db-melualueella 11 923
Vaihtoehtoisen laskeutumissuunnan 55db-alueella 13 364
Raideliikenteen asemista 500m etäisyydellä asukkaita 111 765
…osuus koko alueen asukkaista 21,70 %
…näistä työikäisiä 74 989
Taajamissa asuvien osuus koko tarkastelualueella 96,20 %
Taajamien ulkopuolella asuvia kouluikäisiä 2051
…osuus kaikista alueen kouluikäisistä 3,90 %
Taajamia, joissa yli 10% ulkomaalaisia 57
Taajamia, joissa yli 20% ulkomaalaisia 25
Taajamia, joissa yli 30% ulkomaalaisia 14

Taulukko 1: tehtävien 1 ja 2 taulukoidut vastaukset

 


Kartta 1: 1965-1970 rakennettujen kerrostalojen absoluuttinen määrä sekä prosenttiosuus koko kerrostalokannasta pienalueittain Helsingissä


Tämän kurssikerran itsenäistehtävä oli erityisen hyödyllinen ja opettavainen. Matkan varrelle mahtui teknisiä haasteita, joiden takia tehtävän palautus on hieman myöhässä, mutta niiden troubleshoottaminen ja selättäminen lopulta olivat hyvinkin opettavainen prosessi ja tekivät lopputuloksen valmistumisesta myös erityisen palkitsevan. Itse aineistoon liittyvien hämmentävien, clip-toiminnon käyttöä hankaloittanieden geometriavirheiden (??) lisäksi haasteita aiheutti ennen kaikkea käsiteltyjen tietokantojen koko: kun ensialkuun lähdin tekemään analyysiä kahta käsiteltyä tietokantaa lainkaan trimmaamatta oli prosessointi hiiiiiidasta ja myös Qgis hyvin kaatumisaltis, mikä teki työskentelystytä melko raivostuttavaa. Hetken aikaa itseäni tällä lailla turhautettuani sain arvokkaan oppitunnin työprosessin ennakkosuunnitelun ja käytetyn aineiston sopivan kokoiseksi leikkaamisen tärkeydestä. Paitsi että tietokantojen jo alkuperäisen väestötietorekisterin koko oli riittävä hidastamaan työskentelyä melkoisesti, onnistuin ensimmäisellä aggregointiyritykselläni luomaan vielä melkoisesti pahemmanlaatuisen hirviön: kun tietokannan jokaiselle n. 100:lle sarakkeelle oli laskettu kaikki mahdolliset tilastot vielä erikseen, oli lopputulos täysin käyttökelvottoman kokoinen. Aggregointia käyttäessä on siis syytä oikeati miettiä tarkkaan mitä on milloinkin tekemässä. Tietokantojen turhan sisällön höyläämisessäkin oli oma opettelunsa: Qgisin työkalut tällaiseen eivät ole kaikiltaosin ihan intuitiivismmat, mutta koska muutaman softan kaatumisen ja muiden teknisten haasteiden takia joutui tätäkin prosessia toistamaan useampaan kertaan, muodostui siihen lopulta hyvä rutiini. Yrityksen ja erehdyksen kautta tuli mm. opittua, että tietokantoja muokatessa on syytä muistaa vielä erikseen tallentaa muutokset niiden tekmisen jälkeen.

Tähän astisen kokemuksen perusteella sanoisin, että tärkeimmät opitut taidot paikkatietotyöskentelyssä liittyvät erilaiseen aineiston rajaamiseen ja valintoihin (esim. clip-työkalu sekä valintatyökalut), tietokantojen työstämiseen (erityisesti field calculator -toiminto sekä turhan datan karsiminen), aineistojen yhdistelyyn, esim. tietokantaliitoksilla ja aggregoinnilla, sekä tietysti karttavisuaalisaation tekemiseen. Näiltä osin koen taitojeni olevan pääasiassa jo kohtalaisen hyviä, eniten ehkä mietityttävät joidenkin eri työkalujen käyttöön liittyvät eri ns. geometriapredikaatit joiden yksityiskohtaisempi ymmärtäminen olisi vielä uskoakseni hyödyksi. Erityisesti tämänkertainen tehtävä tosiaan opetti paljon monivaiheisemman paikkatietotyön vaiheiden suunnittelun tärkeydestä: melko simppeliltä vaikuttavankin analyysin teossa on näemmä yllättävän helppo saada projekti hyvin tehokkaasti solmuun jos vain lähtee sokkona kokeilemaan erilaisia temppuja.

Qgis tuntuu tarjoavan hyvinkin monipuoliset ja tehokkaat työkalut analyysin tekemiseen sillä reunaehdolla, että käytettävissä on aineistoa joka sisältää luotettavan ja tarkan paikkatiedon käsiteltävistä kohteista: tämän jälkeen työkalut mahdollistavat erittäin tehokkaasti erilaisen aineiston yhdistelyn ja analyysin. Käyttäjän osaamistaso on tietysti toinen tärkeä tekijä, varsinkin kun Qgis näyttää sisältävän valtavasti erilaisia prosessointityökaluja, jotka eivät kuitenkaan läheskään aina ole erityisen intuitiivisa käyttää ja vaativat jonkinlaista ennakkoperehtymistä. Tähänastisten harjoitusten perusteella tuntuu kuitenkin siltä, että ihan hyvä perustuntuma ohjelmaan alkaa löytyä, ja haasteita alkaa osata ratkoa jo itsenäisesti. Tarjolla olevien työkalujen määrä ja kirjo tarkoittavat myös, ettei työskentelyyn usein ole tarjolla vain yhtä mahdollista ratkaisua, vaan tehokkaassa paikkatietoanalyysissä on tärkeä myös osata arvioida erityylisten ratkaisupolkujen hyötyjä ja haittoja.

Kurssikerta 4

Kartta 1: Ruotsinkielisten asukkaiden suhteellinen osuus pääkaupunkiseudulla

Laatimani kartta kuvaa ruotsinkielisten asukkaiden suhteellista osuutta 1km x 1km ruuduittain pääkaupunkiseudulla. Päädyin suhteellisten osuuksien esittämiseen absoluuttisen määrien sijaan, sillä alueen huomattavan asukastiiviyden vaihtelun vuoksi en kokenut absoluuttisen lukujen olevan kovin hyödyllistä informaatiota yhtään mistään. Suhteellisia osuuksia kuvaava kartta osoittaa, että ruotsinkielisen väestön jakautumisessa alueella on merkittävää alueellista vaihtelua ja viitteitä klusteroitumisesta, joskaan alueen luonnetta ja historiaa tuntemattomalle tarkastelijalle siitä ei suoraan ole juuri tulkittavissa tämän ilmiön syitä. Aluetta tunteva tarkastelija voisi kartasta huomata esimerkiksi merkkejä ruotsinkielisen väestön osuuden ja asuinalueen neliöhintojen välisestä korrelaatiosta. Toisaalta ruotsinkielisten selkeästi korkeampi osuus koko Espoon alueella sekä idässä Sipoosta Helsinkiin liittetyllä Östersundomin alueella viittavaat siihen että taustalla on jotakin muutakin kuin pelkät neliöhinnat: kartasta lienee nähtävissä myös paljon pitkäaikaisempi Uudenmaan asutushistorian vaikutus.

Ruutukartta on mielstäni lähtökohtaisesti hyvä formaatti varsin tarkan alueellisen tiedon esittämiseen, joskin verrattuna aiemmin tarkasteltuihin karttatyyppeihin sen kanssa voi olla vaikeampaa esittää tulosten tulkintaa tukevia muita aineistoja/karttakerroksia ja varsinkin tällaisen lisäinformaation kanssa sen nätti visualisointi voi olla haastavaa. En ole erityisen tyytyväinen oman karttani visuaalisuuteen: tällaisenaan yksittäisten ruutujen tarkka paikallistaminen pk-seudulla on monin paikoin haastavaa, mutta toisaalta esimerkiksi kaupunginosarajojen piirtäminen ruutuaineiston päälle olisi tehnyt siitä merkittävästi sotkuisemman. Taustakartat eivät ole kovin hyvän näköiset, mutta ilman niitä ruutuaineiston paikkallistamisesta olisi tullut vielä huomattavasti vaikeampaa. Näkisinkin että ruutukartta asettaa hyödyllisyydestään huolimatta rajoitteita siihen miten paljon ja minkälaista muuta materiaalia sen kanssa on mahdollista esittää.

Kurssikerta 3

Kolmannella opetuskerralla harjoiteltiin tietokantaliitoksia sekä erilaisia aineiston aggregointitekniikoita kiinnostavien Afrikan konflikteihin sekä luonnonvaroihin (öljy ja timantit) liittyvillä aineistoilla. Erityisen kiinnostavaa voisi olla jatkaa analyysiä vertailemalla konfliktien ajallista jakaumaa suhteessa eri resurssien löytymisajankohtiin. Tämä voitaisiin esimerkiksi toteuttaa suodattamalla konfliktiaineisto maakohtaisesti niin, että timantti- ja öljyresurssien löytymistä edeltävät konfliktit poistetaan kokonaan, ja sen jälkeen erotellaan toisistaan resurssien löytymisen jälkeen, mutta ennen niiden ekstraktoinnin aloittamista käynnistyneet ja vasta sen jälkeen käynnistyneet konfilktit (öljy- ja timanttiesiintymät edelleen erotellen, jotta voidaan vertailla näiden eri resurssien merkitystä ja ajallisia ulottuvuuksia). Tällainen aineisto visualisoimalla voitaisiin nähdä, onko konfilktien syttymiselle merkittävämpää pelkkä tieto arvokkaiden resurssien esiintymistä maaperässä vai vasta niiden ekstraktoinnin ympärille kehittyvä liiketoiminta ja infrastruktuuri. Toisaalta jollain tapaa voisi olla tarpeen kuitenkin myös vertailla näitä lukuja resurssiesiintymien löytöä edeltäneiden konfliktien määrään, jotta voitaisiin päätellä ovatko resurssit todella lisänneet niiden määrä. Kiintoisaa olisi myös tarkastella nähdäänkö korrelaatiota timanttikaivosten ja öljykenttien laajuuden ja tuottavuuden sekä konfliktien laajuuden välillä.

 

____________________________________________________________________________________

 

Kartta 1: Tulvaindeksit (MHQ/MQ) sekä järvisyysprosentit Suomen suurimmilla valuma-alueilla

Kartasta nähdään, että Suomessa valuma-alueen tulvaherkkyyden ja järvisyysprosentin välillä näyttäisi vallitsevan negatiivinen korrelaatio. Matalimmat tulvaindeksit (1,3-3,9) löytyvät pääasiassa Keski-Suomen suurilta valuma-alueilta, joilla myös järvisyysprosentit ovat selkeästi suurimmat (yli 10%). Lisäksi myös rannikkoalueiden pienemmillä valuma-alueilla matalimmat tulvaindeksit ovat korkeimman järvisyysprosentin alueilla, eli pelkästään valuma-alueiden pinta-ala tuskin selittää tulvaindeksin vaihtelua. Toisaalta Pohjois-Suomessa sijaitsee alaltaan suuria mutta melko vähäjärvisiä valuma-alueita, joiden tulva-indeksit jäävät suhteellisen mataliksi. Korkeimmat tulva-indeksit löytyvät hyvin pienialaisilta valuma-alueilta, mutta näistä useimmat ovat myös täysin järvettömiä. Valuma-alueen pinta-alan ja järvisyyden välillä tietysti myös vallitsee luonnollinen yhteys: hyvin pienille valuma-alueille järviä ei yksinkertaisesti juuri mahdu. Kartasta päätellen tulvaindeksiin vaikuttavat sekä järvisyysprosentti, että valuma-alueen koko.

Kurssikerta 2

 

Taulukko 1: Vertailu Qgis:ssä mitatusta pinta-alasta ja etäisyydestä eri projektioilla ja mittaustekniikoilla

Aloitettiin tunti vertailemalla projektion vaikutusta “saman” alueen tai pituuden saamiin arvoihin projektiosta (sekä valitusta “karteesiolaisesta” tai “ellipsoidisesta” mittaustekniikasta) riippuen. Tämä nopea testikin riittää osoittamaan, että projektion ymmärtäminen ja oikea valinta on aivan kriittistä onnistuneelle GIS-analyysilä. Karteesiolaisella tasolla mitattuna niin pinta-alat kuin pituudekin vääristyivät huomattavasti kaikilla valituilla projektioilla verrattuna Suomen kattavien karttaesitysten tekoon suunniteltuun ETRS TM-35FIN projektioon. Toisaalta Qgis:n tarjoama työkalu käyttää mittauksissa ellipsoidia ottaa karttaprojektioiden vääristymät huomioon, ja sillä mitattuna kaksi kolmesta projektiosta sai ETRS TM-35:n kanssa identtiset arvot. Hieman vääristymää aiheutti silti Sphere Miller Cylindrical -projektio, jossa projektiota maan pallomaisen pinnan suhteen ilmeisesti tehdään jollain hieman muista käytetyistä projektioista poikkeavalla tavalla.

Kakkostehtävää varten laadin alla näkyvät kolme projektiokuvausta, mutta tätä blogitekstiä aloittaessa tajusin laskeneeni niissä vääristymät täysin päin honkia, teen uudet laskelmat huomenna ja täydennän harjoituksen niiltä osin.

Kuva 1: Mercatorin projektion pinta-ala-vääristymä

Kuva 2: Sphere Miller Cylindrical -projektion pinta-ala-vääristymä

Kuva 3: Winkell II -projektion pinta-ala-vääristymä

Kuvista 1-3 nähdään, että kaikki kolme tarkasteluun valittua projektiota aiheuttavat Suomen pinta-alaan merkittävän vääristymän verrattuna alueen tarkasteluun optimoituun ETRS-TM35(FIN)-projektioon. Kaikilla kolmella projektiolla vääristymän gradientti on saman tyyppinen, Mercatorilla ja Sphere Miller Cylindricalilla ainakin näillä luokituksilla kuvattuna etelä-pohjois-suunnassa jyrkkenevän vääritsymän gradientti on lähes identtinen, ja Winkell II:lla hieman näitä jyrkempi. Winkell II:n kohdalla itse tapahtuva vääristymän on muita projektiota selkeästi pienempi, vain n. 1,25-kertaisesta 1,4- kertaiseen, mikä on sekin tietysti aivan liikaa mihinkään analyyttisiin tarkoituksiin. Varsinkin korkeilla leveysasteilla pahamaineisen vääristynyt Mercatorin projektio kuitenkin vääristi pinta-aloja Suomessa hulppeat 3,95-kertaisesta etelässä aina yli 8-kertaiseen pohjoisessa. Sphere Miller Cylindricalin vääristymä osui näiden kahden väliin 2,95-kertaisesta 5,09-kertaiseen.

Saman suuntainen gradientista voi päätellä, että kaikkien projektioiden taustalla vaikuttavat hyvin samankaltaiset matemaattiset periaatteet, Mercatorin ja Millerin projektioiden kohdalla lähes identtiset. Itse asiassa Miller Cylindrical, jonka variaatio Sphere Miller Cylindical on, paljastui Mercatorin modifikaatioksi, joka pyrkii korjaamaan sen äärimmäisiä korkeiden leveysasteiden vääristymiä, mutta jolla on pohjimmiltaan samat ongelmat. Winkell II on yhdistelmäprojektio, jolla nähtävästi päästää kohtalaisen hillittyihin pinta-alavääristymiin, vaikka sekään ei oikeapintainen projektio olekaan.

Kurssikerta 1

Kuva 1.1: Opetussession harjoitustyö


Viikkotehtävä 1)

Koska GIS-ohjelmistoja, mukaan lukien Qgis on tullut jo pyöriteltyä jonkin verran, ei tämä opetuskerta vielä sisältänyt juurikaan uutta opittavaa. Toisaalta edellisestä kerrasta GIS:in parissa on jo vierähtänyt sen verran aikaa, että perusteiden kertaaminen tuli ihan tarpeeseen. Oli ilahduttava huomata, että Qgisin käyttöliittymä ja toimintalogiikka ovat ilmeisesti jollain tasolla menneet selkärankaan, sillä tuntuma sen käyttöön palaili tunnilla varsin nopeasti. Ehkä tämän opetuskerran kiinnostavinta sisältöä oli aineiston histogrammin tutkiminen ja sopivan luokittelualgoritmin etsiminen sen pohjalta: tämä vaihe GIS-työssä on mietityttäntyt minua aieminkin, ja vaikka toistaiseksi jäätiinkin vielä aika yleiselle  tasolle, oli tämäkin ajatuksia herättävää, ja mielestäni oli hyvä, että näin keskeinen, mutta helposti unohdettu vaihe minkä tahansa aineiston karttaesityksen visualisaatiota nostettiin heti kurssin alussa esiin.

Viikkotehtävän tekemisen aloitin kokeilemalla aineston hakua suoraan Tilastokeskuksen WFS-palvelimelta:

Kuva 1.2: Viikkotehtävä, WFS-aineistohaku

WFS:n käytön helppous ja tarjolla olevan aineiston määrä innostivat. Kiinnostaa kaivella enemmän mm. Tilastokeskuksen aineistoja ihan omallakin ajalla. Harjoitustehtävän päädyin tekemään kuitenkin hyvin simppelin ja klassisen väestöaineiston pohjalta: kuntien 15-64 vuotiaan väestön suhteellisesta osuudesta.

Kuva 1.3: Viikkoharjoitus, histogrammin ja luokittelun tarkastelu

Aineiston valinnan jälkeen oli aika sen visualisoinnille. Tämän aloitin opetussessiossa ohjeistetusti tarkastelmalla aineistoa Qgisin tarjoaman histogrammin-näkymän avulla. Valintani oli natural breaks -algoritmi, joka tuotti aineistosta laajudeltaan hyvin tasaväliset luokat, mitkä tuntuivat aineiston kuvaamiseen sopivilta.

Karttaesitysnäkymässä yritin hioa esityksen visuaalista ilmettä parhaani mukaan. Tässä oli kuitenkin omat haasteensa: GIS-ohjemistojen pääpaino näyttäisi (sinänsä ymmärrettävästi) olevan muualla kuin karttaesityksen visuaalisuuden helpossa hienosäätämisessä. Toisaalta Qgisin visualisointityökalut päihittävät helposti ainakin parin vuoden takaisen MapInfon. Yritys muuttaa legendan fontteja ei kuitenkaan jostain syystä saanut aikaan mitään vaikutuksia:

Kuva 1.4: Viikkoharjoitus, epäonnistunut yritys vaikuttaa legendan fontteihin

Kun en saanut legendaa reagoimaan muutoksiin, menin lopulta oletusasetusten mukaisella, hyvin perinteisellä tyylillä:

Kuva 1.5: Viikkoharjoitus, valmis karttaesitys.

Kartalla siis esitetään kuntien 15-64 vuotiaiden asukkaiden prosenttiosuus koko kunnan väkiluvusta. Se siis kertoo kuntien demografiasta sekä huoltosuhteesta: työikäisen väestön suhteellisesti korkeampi osuus vastaa pienempää huoltosuhdetta ja täten indikoi vahvampia kuntatalouden näkymiä. Kartalta on helppo nähdä ainakin kaksi trendiä. Ensinnäkin työikäisen väestön osuus pienenee pohjoiseen ja itään päin. Poikkeuksen tästä trendistä tekee pohjoisin Lappi, jossa työikäisiä kartan perusteella vaikuttaa olevan kohtalaisen suuri osuus, toisaalta tällä alueella erityisen matalat väestötiheydet ja suuret tilastointialueet saattavat johtaa tilastoharhoihin jotka tekevät ainestosta huonosti muuhun Suomeen vertautuvaa. Toinen selkeä havainto (Suomen maantiedettä ja yhdyskuntarakennetta tuntevalla) on yliopistokaupunkien valtava merkitys: kaikki korkeimman luokan kunnat ovat yliopistokaupunkeja. Suoraa kausaatiota korkeakoulujen läsnäolon välillä tästä ei tietenkään voida vetää: korkeakoulut on historiallisesti perustettu jo valmiiksi alueellisesti merkittäviin ja suuriin keskuksiin, ja suuri osa näistä taitaa olla nykäänkin maakuntansa hallintokaupunkeja. Näiden keskuspaikkojen näin selvä erottautuminen aineistosta oli itselleni kuitenkin yllätys. Lisäksi on syytä huomata, että tämän havainnon tekeminen vaatii tosiaan pohjatietoja suomen kaupunkimaantieteestä. Olisi voinut olla hyödyllistä lisätä karttaan vielä tieto Suomen suurimpien kaupunkien sijainneista ja väkiluvuista, sekä korkeakoulujen sijoittumisesta, jolloin tämä trendi olisi näkyvillä myös esim. ulkomaiselle tarkastelijalle.