Round VII: The Processing Force Awakens

Viimeinen kurssikerta

 

Viimeisen kurssikerran ennakkotehtävänä oli hankkia itsenäisesti paikkatietoaineistoja, ja laatia niiden pohjalta jotain julkaistavaa. Toisin sanoen, vapaat kädet. Koska internet on pullollaan mielenkiintoista dataa, oli ennakkotehtävä varsin haastava. Ideoita syntyi monia, ja kävinkin muutaman viranomaisen sivuilla ennen lopullisen päätöksen tekemistä. Tutustuin muun muassa argentiinalaisviranomaisten keräämään dataan, mutta .shp-muotoinen tarjonta oli kohtalaisen niukkaa ainakin viranomaisten omilla sivustoilla. Laajin valikoima oli Argentiinan puolustusministeriön alaisuudessa toimivalla valtion maantieteellisellä instituutilla.

Kohtuullisen internetissä seikkailun jälkeen päädyin takaisin pohjoiselle pallonpuoliskolle Yhdysvaltain itärannikolle. Esimerkiksi New Yorkin kaupunkisuunnitteluviraston Bytes of The Big Apple-projekti tarjoaa suuren määrän avointa dataa. New Yorkin osavaltion terveysviranomaisen alaisuudessa toimiva Department of Mental Health (toim. huom. Nimi oli ennen Department of Mental Health and Mental Hygiene) ylläpitää lemmikkikoirarekisteriä. Vapaasti ladattava tietokanta sisältää noin 122 000 riviä ja 16 saraketta, mikä on omiaan pistämään QGISin julmasti polvilleen. 122 000 rekisteröityä koiraa lähes yhdeksän miljoonan asukkaan kaupungille tuntuu aluksi melko pieneltä määrältä (noin 0,01 koiraa/asukas). Esimerkiksi Helsingissä on arviolta jopa 30 000 koiraa (Helsingin Uutiset 26.8.2017). Vaikka osavaltion lain mukaan koiran rekisteröimättä jättämisestä voidaan tuomita sakkorangaistukseen, vain noin 20% koirista rekisteröidään (lähde). Tiiviillä kaupunkirakenteella ja kerrostalovaltaisuudella voidaan toki olettaa olevan vaikutusta ihmisten intoon hankkia lemmikkejä, jotka vaativat päivittäistä ulkoilutusta.

Aineistoon suhtautuminen on hankalaa, koska sitä ei voi pitää kovin edustavana otoksena kaikista New Yorkin koirista. Se voi kuitenkin antaa suuntaa: tiedetään, että New Yorkissa on yhteensä arviolta noin 425 000 koiraa. Tämä voidaan ottaa huomioon laskuissa, esimerkiksi suhteutettaessa väestöön. Koirat on rekisterissä sidottu sijaintiin usealla tavalla. Itse valitsemani postinumeroalueisiin (Zip code) perustuva aluejako osoittautui jälkikäteen hankalaksi vaihtoehdoksi, Yhdysvaltain postiviranomainen kun ei julkaise tarkkoja postinumeroalueita. Näppärä tapa olisi ollut käyttää niin sanottua Neighbourhood Tabulation Area -järjestelmää, joka on edellämainitun kapunkisuunnitteluviraston kehittämä pienaluejako. Zip-alueista löytyy kuitenkin lähes todellisuutta vastaavia shapefileja, joten vaihtaminen kesken projektin ei tuntunut järkevältä, varsinkaan kun olimme jo Artun kanssa pyöräyttäneet koko aineiston Mapinfo-ohjelman kautta järkevään muotoon. (Kiitos Arttu)

Loubie on 5-vuotias kultainennoutaja New Yorkin Chelsean kaupunginosasta. Kuva: Chona Kasinger.

 

Ensimmäinen visualisointi

 

Ensimmäinen onnistunut visualisointi kertoo suuntaa antavan koirien määrän asukasta kohden postinumeroalueittain. Karttaan tulee suhtautua äärimmäistä kriittisyyttä noudattaen: alueelliset erot koirien rekisteröimisen yleisyydessä on muuttuja, joka vaikuttaa tietoon huomattavasti.

Näin kartta syntyi (aineiston valmistelun eli mapinfolla geokoodaamisen jälkeen):

  • Yhdistin postinumeroalueet yhtenäisiksi alueiksi Dissolve-toiminnolla.
  • Seuraavaksi Count points in polygon -toimintoa käyttäen selvitin postinumeroalueiden koiramäärät
  • Loin uuden kentän nimeltä “laskpop”, eli laskennallinen asukasluku, jossa asukasluku on suhteutettu suurin piirtein vastaamaan koirien otosta (Kuva 2)
  • Käyttämällä kaavaa “(KOIRAT/LASKPOP)*1000” sain visualisoitavaa dataa: koiria/1000 as.
  • Koska kyseessä on suhdeluku, käytän Jenksin luokittelua

 

Kuva 2. Laskennallisen väkiluvun luominen.

 

Painotan vielä, että tähän karttaan ei pidä luottaa sokeasti, koska sen luomiseksi on täytynyt tehdä melko rankkoja oletuksia. (!!!)

Kuva 3. New York Cityn koirat suhteutettuna asukaslukuun. Suhteuttamista varten oikea asukasluku muunnettiin vastaamaan rekisteröityjen koirien osuutta kaikista koirista. Laskelmat perustuvat arvioihin.

 

Alun perin minua kiinnosti ajatus siitä, mitä koirat voivat kertoa väestöstä: voisiko koirista kerätyn tiedon perusteella päätellä jotain myös niiden omistajista? Näkyykö säännöllinen lenkittäminen terveystilastoissa, tai voisiko rotujen perusteella päätellä jotain asuinalueista? Esimerkiksi noutajat ovat suosittuja lapsiperheiden keskuudessa: muodostaisivatko noutajien määrä suhteutettuna väestöön samanlaisen karttakuvion kuin lasten osuus kokonaisväestöstä?

Vastaus ensimmäiseen kysymykseen: tätä on tutkittu, ja on näyttöä siitä, että koiran omistamisella on vaikutusta niin fyysiseen (Ham & Epping, 2006) kuin psyykkiseenkin (Knight & Edwards, 2008) terveyteen. Vastaus toiseen kysymykseen: selvitetään.

Vaan eipäs selvitetäkään: kokonaisen illan etsimisen jälkeen kulttuurierot realisoituvat. Verrattuna Suomeen väestöä koskeva avoin data on rapakon takana todella heikkolaatuista. Koska alkuperäinen suunnitelma ei toteutunutkaan, päätin muuttaa selvityksen suuntaa. New Yorkin kaupunkisuunnitteluviraston ylläpitämä puisto- ja virkistysaluetietokanta(Kuva 4) on erittäin tarkka, ja vapaasti ladattavissa.

 

Kuva 4. New Yorkin puisto- ja virkistysalueet. Tietokannassa on noin 12 000 kohdetta.

 

Tämän tietokannan alueella halusin selvittää, missä koirilla (ja miksei heidän omistajillaankin) on parhaat oltavat.( Yksi mielenkiintoinen vaihtoehto olisi ollut lisätä päälle toinen tietokanta paloposteista ja lyhtypylväistä, jotka varmasti ainakin koirien näkökulmasta lisäävät ympäristön viihtyisyyttä.) Oheinen kartta (Kuva 5) on toteutettu samalla idealla kuin kurssikerta 3:n valuma-aluekartta (Eveliina Sirolan valuma-aluekartta), joskin tällä kertaa visualisoitavaa muuttujaa (eli viheralueiden osuutta pinta-alasta) ei visualisoida diagrammein, vaan perinteisenä koropleettikarttana.

Kuva 5. Viheralueiden (puistot ja virkistysalueet) osuus postinumeroalueiden pinta-alasta. Huomaa laaja vaihteluväli (0-98). Central Parkilla on oma postinumero, ja toisaalta esimerkiksi New York Cityn luoteisnurkan satama-alue muodostaa itsenäisen ei-niin-vihreän postinumeroalueen.

 

Tarkoituksenani oli laatia myös tilasto, jossa olisi visualisoituna kunkin alueen suosituin koirarotu. Tämä osoittautui kuitenkin tietokantateknisistä syistä suhteellisen haastavaksi (vaikka keksinkin, että tekstimuotoisen rotusarakkeen olisi voinut SPSS-ohjelmalla muuttaa numeeriseksi). Suurin osa tietokantaan rekisteröidystä koirista oli kuitenkin saanut arvon “Mixed/Other”, joten päätin lopuksi avata eri koirarotujen suosiota sanallisesti. New Yorkissa erityisen suosittuja ovat pienikokoiset koirarodut, kuten yorkshirenterrieri, maltankoira ja chihuahua. Tämä on ymmärrettävää: pienikokoiset koirat ovat huomattavasti yksiö- ja metroyhteensopivampia kuin esimerkiksi alaskanmalamuutit tai tanskandoggit. Toisaalta myös perinteisesti suositut koirarodut, kuten labradorinnoutajat, kultaisetnoutajat ja saksanpaimenkoirat ovat tilastossa vahvasti edustettuina. Rotukoirien kysyntä on alueella kovaa, ja pentujen hinnat nousevat helposti useisiin tuhansiin dollareihin. Tämä on murheellisella tavalla paradoksaalista, sillä kaupungin eläinsuojelujärjestelmä on ylikuormittunut, ja etenkin sekarotuisia kodittomia koiria on paljon.

 

P.S. Lähetin sähköpostia New Yorkin avoimen datan portaaliin. En ole vielä saanut vastausta, enkä täten voi kertoa portaalin periaatteista/anteliaisuudesta. Mutta jos alueen tarkastelu kiinnostaa, täältä voi pyytää käyttöönsä kaupungin viranomaisten keräämää dataa (vaatii perustelun).

 

Lähteet:

Argentiinan maantieteellinen instituutti (Instituto Geográfico Nacional): http://www.ign.gob.ar/content/datos-abiertos

Bytes of The Big Apple-projektin verkkosivut: http://www1.nyc.gov/site/planning/data-maps/open-data/bytes-archive.page?sorts[year]=0

Eveliina Sirola – Kurssikerta 3: https://blogs.helsinki.fi/evsirola/2018/01/31/kolmas-kurssikerta-afrikan-valtioita-ja-tulvaindekseja/

Ham, S. & Epping, J. (2006): Dog walking and physical activity in the United States. Preventing Chronic Disease, 2006 Apr;3(2):A47. verkkojulkaisu, 15.3.2006. https://www.ncbi.nlm.nih.gov/pubmed/16539788?report=docsum

Helsingin Uutiset (26.8.2017) https://www.helsinginuutiset.fi/artikkeli/553666-koirien-maara-kasvaa-helsingissa-jopa-asukaslukua-enemman-naissa-kaupunginosissa

Knight, S. & Edwards, V. (2008): In the Company of Wolves – The Physical, Social and Psychologial Benefits of Dog Ownership. Journal of Aging and Health. Vol. 20/4 s. 437-455  http://journals.sagepub.com/doi/abs/10.1177/0898264308315875

New York City Economic Development Corp (21.7.2017): New York City’s Dog Population (blogikirjoitus) https://www.nycedc.com/blog-entry/new-york-citys-dog-population

Kasinger, C. (2017) Meet The NYC Dog Who Stands on the Corner Offering Hugs. Rover Daily Treat, 2017.  https://www.rover.com/blog/louboutina-hugging-dog-manhattan-nyc/

 

Leave a Reply

Your email address will not be published. Required fields are marked *