Kurssikerta 7 – Viimeiset datanrutistukset Yhdysvalloista

 

Melko nopeasti ne seitsemän viikkoa vierähtivät ja tässä sitä ollaan. Viimeinen tehtävänanto. Tarkoituksena oli tuottaa itse tehty kartta, joka esittää itse valittua tietoa itse valitulta alueelta. Näin ollen tein kartan Yhdysvalloista.

Tavoitteena oli löytää tai olla löytämättä korrelaatiota kahden puhuttavan aiheen pohjalta. Halusin siis tutkia, onko Yhdysvaltain viranomaisten keräämän aineiston pohjalta mahdollista vetää suoraa janaa viranomaisten kokeman väkivallan ja osavaltioiden köyhyysprosentin välillä.

Loin Yhdysvaltain liittovaltion poliisin (Federal Bureau of Investigation) keräämän LEOKA – Summaries of Officers Assaulted 2020 -aineiston pohjalta koropleettikartan esityksen pohjalle. Kyseinen aineisto sisältää dataa eri viranomaisten kokemasta väkivallasta, tekotavasta ja -välineestä, sijainnista, ajankohdasta ja monesta muusta muuttujasta vuodelta 2020, mutta tässä kartassa keskitytään yleisiin väkivallan havaintoihin. Kyseinen aineisto sisälsi puolipisteitä eikä ollut suoraan vietävissä QGIS:iin, joten muunsin sen CSV-tiedostoksi ja selvensin QGIS:ssä puolipisteiden toimivan erottajina. Pohjalle latasin Natural Earthista shapefile-tiedoston, jossa näkyi Yhdysvaltojen osavaltiot. Viimeisenä tehtävänä oli liittää taulukkotiedosto shapefile-tiedostoon osavaltioiden nimien perusteella, joka onnistui join by atrribute -toiminnolla QGIS:ssä. Harjoitus ei siis mennyt hukkaan!

Tämän jälkeen toin projektiin Yhdysvaltain väestönlaskentaviraston (United States Census Bureau) Income and Poverty in the United States: 2020 -aineiston, joka sisältää muun muassa osavaltioiden eritellyt köyhyysprosentit vuodelta 2020. Sama homma kuin äsken, muunsin taulukon CSV-tiedostoksi, toin sen QGIS:iin, liitin join by attribute -toiminnolla pohjakarttaan osavaltioiden nimen perusteella ja ta-daa! Kaikki löytyi nyt kätevästi yhden tason attribuuttitaulukosta. Loin köyhyysprosentin pohjalta tekstidiagrammin jokaiseen osavaltioon, joiden koko skaalaantuu köyhyysprosentin mukaan sen lisäksi, että köyhyysprosentti lukee itse diagrammissa. Enää jäljellä oli pientä hienosäätöä sekä itse kartan asettelu. Lopputulos näkyy alla olevassa kuvassa 1.

Kuva 1. Väkivaltaa kokeneet viranomaiset per 100 viranomaista sekä osavaltioiden köyhyysprosentit. Lähteet: census.gov & FBI Crime Data Explorer / LEOKA 2020

Sitten perehdytään itse tulokseen. Yllätyksekseni kartta on hyvin punertava. New Mexicon sekä Alaskan osavaltioissa jopa arviolta joka toinen viranomainen on kokenut perusteetonta väkivaltaa vuonna 2020. Luvut vaikuttavat jokseenkin epätodellisilta, mutta data harvakseltaan valehtelee. New Mexicon tapauksessa osasyynä korkeaan lukemaan voi olla muun muassa osavaltion valitettavan tunnettu korkea huumerikoslukema. Muita osavaltioita, joissa viranomaisiin kohdistuva väkivalta on koholla, ovat muun muassa Arizona, Idaho, Montana, Etelä-Dakota ja Illinois. Sekä New Mexicossa että Alaskassa köyhyysprosentti on myös keskivertoa korkeampi. Väkivalta viranomaisia kohtaan painottuu myös enemmän keski- sekä läntiseen Yhdysvaltoihin, kun taas esimerkiksi koillisessa Lake Erien ja Lake Ontarion maastossa Kanadan rajalla luku on paljon alhaisempi.

Mainittavan arvoinen seikka on myös Missisippin ja Louisianan korkeat köyhyysprosentit, mutta alhaiset viranomaisiin kohdistuvan väkivallan tapaukset. Osavaltiot Louisianasta Georgiaan länsi-itä-akselilla muodostavat vyöhykkeen johon kuuluvilla osavaltioilla on verrattain korkea köyhyysprosentti, mutta jokaisessa osavaltiossa vain keskimäärin alle viisi viranomaista sadasta vuonna 2020 kokivat perusteetonta väkivaltaa.

Varsinaisia johtopäätöksiä köyhyysprosentin ja viranomaisten kokeman perusteettoman väkivallan välillä ei voida tehdä. Oli kuitenkin jälleen avartavaa analysoida dataa ja tuottaa karttoja etenkin vapaavalintaisesta aiheesta mahdollistaen myös itseään kiinnostaviin aineistoihin perehtymisen. Palaten vielä valitsemiini aineistoihin, toinen hyvä vaihtoehto köyhyystilastojen tilalle olisi ollut huumerikos- ja käyttötilastot. Näin oltaisiin voitu vertailla viranomaisiin kohdistuvan väkivallan ja huumeiden – sekä käyttäjien että välittäjien – korrelaatiota.

Vielä viimeiset sanat ennen kurssin paketointia: Tämä kurssi oli sekä sisällöltään että opetusmenetelmiltään ehkä mukavin ja mielenkiintoisin tähän mennessä. Tykkään yleisestikin puuhastella tietokoneiden parissa sekä ohjelmisto- että laitteistopuolella, joten tuntui myös osittain luonnolliselta puuhastella QGIS:n parissa, vaikkei ohjelmisto loppujen lopuksi ollutkaan kovin tuttu minulle. Valitettavasti tein omalta osaltani (jälleen) virheen ja jätin blogikirjoitukset viime tinkaan, prokrastinointi kun tuntuu olevan minulle elämäntapa. Siitä huolimatta olihan tämä ihan kivaa ja blogimuotoinen työskentely oli mukavaa vaihtelua perinteisiin palautusmenetelmiin. Ja ennen kaikkea, kiitos rempseästä kurssista Arttu!

Lähteet:

U.S. Department of Justice—Federal Bureau of Investigation Crime Data Explorer, LEOKA Summaries of Officers Assaulted 2020 (syksy 2021). Lainattu 25.3.2022. https://crime-data-explorer.app.cloud.gov/pages/le/leoka

United States Census Bureau, Income and Poverty in the United States: 2020 (14.8.2021). Lainattu 25.3.2022. https://www.census.gov/library/publications/2021/demo/p60-273.html

Natural Earth Data, States & Provinces v5.0.0. (7.12.2021). Lainattu 25.3.2022. https://www.naturalearthdata.com/downloads/10m-cultural-vectors/

Leave a Reply

Your email address will not be published. Required fields are marked *