Viikko 7: oma työ

Vikalla viikolla korona-altistumisen takia jäin varmuuden vuoksi kotiin tekemään hommia, mutta toivottavasti Moodlesta löytyneet ohjeet olivat riittävät enkä missannut mitään olennaista ohjeistusta.

Päätin tehdä muutaman kartan sarjan Counter Strike: Global Offensiven pelaajakannasta maittain. Etsin tarvittavat palapelin osat eri lähteistä netistä, ja koostin niistä haluamani .cvs-tiedostot. Maailman valtioiden kokonaisväestömäärät taisin lopulta kopioida suomenkielisestä Wikipediasta, sillä moni muu löytämäni taulukko käytti pilkkua tuhaterottimena. Ammattilaispelaajien lähtömaat poimin itse kasaamaani taulukkoon hltv.org-sivustolta. Kyseessä on Counter Striken ammattilaispuoleen keskittyvä uutis- ja tilastointisivu, jonka top-listat ovat piireissä kaikkein arvostetuimpia. Maailmankarttapohjan shapefilen latasin joltakin sivulta, jota google sattui minulle tarjoamaan ensiksi. 

Tiimissä on 5 pelaajan lisäksi valmentaja, ja osa organisaatioista pitää palkkalistoillaan myös varapelaajia. Listasin kuitenkin omaan Exceliini vain 28.2.2022 rankingin mukaisten top 20-listan tiimien vakituiset pelaajat. 

Yksi tyhmä moka, joka toistui tässä työn varrella oli se, että olin sotkenut jotenkin taulukoissani lukuarvoiksi tarkoittamani sarakkeet merkkijonoiksi. Ongelma on kuitenkin sekä helppo huomata että korjata, mutta ärsytti kuitenkin kun tekeminen takkusi noin hölmön asian takia.

 

Kuva 1. Hltv.org-sivuston CSGO-tiimien listauksen 20 parhaan tiimin pelaajien kotimaat. (28.2.2022)

 

Seuraavaksi vertasin ammattilaispelaajien lukumäärää kotimaidensa väestömäärään. Ilmaisin suhteen maittain pro-pelaajien määränä per miljoona asukasta. Tämä onnistui helposti laskemalla osuudet omiin sarakkeisiinsa calculatorilla. 

 

Kuvat 2 ja 3. Aiemman listauksen pelaajien määrä suhteessa kotimaidensa kokonaisväestöön.

Lisäksi tarkoituksenani oli tehdä kartta ei vain ammattilaispelaajista, vaan CSGO:n kokonaispelaajamääristä maittain, mutta jostain syystä siihen tarvittava data oli aikalailla maksu- tai rekisteröintimuurien takana. Sen sijaan tein kartan internetin saavutettavuudesta maailmalla. Löysin datan tätä karttaa varten data.worldbank.org -sivustolta. Sieltä lataamani taulukon valtioiden nimet olivat kirjattu hieman eriävällä tavalla maailmankartta-shapefileni kanssa, mikä tuotti päänvaivaa. Esimerkiksi Kongon demokraattisen tasavallan nimi oli toisessa taulukossa kirjattu nimellä Congo, Dem. Rep. ja toisessa Congo DR. Onneksi tällaisia tapauksia oli aika vähän ja korjasin ne manuaalisesti siten, että tietokantaliitos onnistui saumattomasti. 

Myöhemmin valittaessani tästä ongelmasta fiksummille kavereilleni sain kuulla, että tällaisten tilanteiden varalta kannattaisi tutustua Levensteinin etäisyyteen eli editointietäisyyteen. En itse ymmärrä juuri mitään merkkijonometriikasta ylipäänsä saati sitten sitä, miten Levenstainin etäisyyden algoritmi toimii, mutta konseptina asia kuitenkin vaikuttaa oikein kiehtovalta. Kyseessä on siis menetelmä, jossa vertaillaan eri merkkijonojen välisiä eroja sillä perusteella, miten monta merkkiä joudutaan poistamaan, lisäämään tai korvaamaan, jotta merkkijono saadaan muutettua toiseksi. Luonnollisesti mitä vähemmän muutoksia tehdään, sitä lähempänä jonot ovat toisiaan eli sitä lyhyempi niiden välinen etäisyys on. Tästä olisi ollut itselleni iloa valtionnimien kanssa tuskaillessa, sillä algoritmi olisi osannut puolestani etsiä mahdollisimman samankaltaiset nimet kummastakin taulukosta ja yhdistää ne pariksi. Mutta kuten sanottua, en ole matemaatikko enkä ymmärrä tätäkään menetelmää kuin erittäin pintapuolisesti.

Kuva 4. Internetin käyttöaste maailmalla, prosenttiosuutena valtioiden väestöstä. Vuodelta 2017.

 

Siinä tämä kurssi sitten oli! Voin viime vuoden etägimmi-veteraanina sanoa, että lähiopetuksena kurssia oli todella mukavaa työstää läpi, kun taas etänä tehtävien läpi kahlaaminen oli yksinäistä ja tuskallista touhua. Siksi kurssi jäikin viimeksi minulta kesken, mutta onneksi tänä vuonna päästiin jo palaamaan rakkaille Kumpulan tiluksille.  Se todella piristi pakkasten ja kaamoksen keskellä.

 

Lähteet:

https://data.worldbank.org/indicator/IT.NET.USER.ZS

https://www.hltv.org/ranking/teams/2022/february/28

https://xlinux.nist.gov/dads/HTML/Levenshtein.html

https://en.wikipedia.org/wiki/Levenshtein_distance