Big data kulkee kannoillasi

piuhatMietitkö koskaan verkossa iloisesti surffatessasi, Google-hakua tehdessäsi tai Twitter-postausta julkaistessasi, minkälainen jälki verkkoon jälkeesi jää? Ehkä pitäisi.

Palmenian Sosiaalisen median seminaarisarjan ”Big data ja avoin data” -päivä valotti monilta osin, mitä paljon pyöritelty big data käytännössä tarkoittaa. Big datan määritelmää voi lähestyä Seminaarissa puhuneen Antti Ukkosen mukaan vertaamalla sitä pieneen dataan. Pieni data on tiettyä tarkoitusta varten kerättyä, yrittää olla ikään kuin täydellinen otos. Sen koko on ennalta tiedossa tai muuten hallittavissa, ja muuttujia on korkeintaan joitakin kymmeniä. Perinteisessä kvantitatiivisessa tutkimuksessa käyttävää aineistoa voisi kutsua pieneksi dataksi. Sitä vastoin big data on rakenteetonta, kasvaa arvaamattomasti ja se voi koostua sadoista tuhansista muuttujista. Yksinkertaistettuna big data on siis järkyttävän paljon tietoa, jota tallentuu koko ajan eri tietokantoihin. Esimerkkinä ovat asiakastietokannat, palvelun sisältämät aineistot, kuten Instagram-kuvat tai asiakkaiden käyttäytymistä kuvaavat lokitiedostot. Big data on kuitenkin lähtökohtaisesti ilmiö, jonka digitalisaatio on mahdollistanut: tallennusjärjestelmien kehittyminen, pilvipalvelujen syntyminen ja näiden ansiosta kokonaisuudessaan tallennusjärjestelmien kustannusten lasku.

Mitä big data mahdollistaa?
Klassikkoesimerkkinä lienee mainonnan kohdistus: verkossa tekemiemme hakujen ja verkko-ostosten jälkeen esimerkiksi omaan Facebook-tiliin ilmestyy googletettujen lentolippujen hintoja tai verkosta ostamiemme tuotteiden tarjouksia. Tekemistämme sivulatauksista kerätyn datan avulla ennustetaan, mitä mainonnan sisältöjä meille kannattaa näyttää.

Esimerkiksi Google myy keräämäänsä dataa, kuten suosituimpia hakusanoja. Data onkin haluttua kauppatavaraa, vaikka se ei lähtökohtaisesti ole aina maksullista tai jonkun yrityksen hallussa. Palveluntarjoajat, mainostajat ja kaiken maailman markkinoijat janoavat kuitenkin tietoa siitä, missä liikut, mihin aikaan, milloin selaat Facebookia ja mitkä tuotteet sinua milloinkin kiinnostaa. Jokainen voi sitten miettiä, mitä itselle kohdennettu mainonta kertoo omasta verkkokäyttäytymisestä sekä tietenkin yksityisyydensuojasta ja sen rajoista.

Big dataa hyödynnetään paitsi kohdennettuun mainontaan ja uusien palvelujen kehittämiseen, myös tieteen tekemiseen ja esimerkiksi datajournalismissa: journalistien ulottuvilla on yhä etenevissä määrin valtavia data-aineistoja, etenkin avoimen datan periaatteen mahdollistama helposti saatavilla olevat tiedot. Tällaista dataa ovat esimerkiksi ihmisten verotustiedot, joista tehdään vuosittain lehtijuttuja ja väännetään myyviä otsikoita.

Analysointi avainasemassa
Tärkeää on muistaa, että itse data ei vielä mahdollista paljoakaan, vaan sitä pitää osata analysoida ja hyödyntää. Sen jälkeen ollaan uusien palvelujen luomisen keitaalla. Big datan aineistot ovatkin nyt hyvin kiinnostavaa ja kuumaa raaka-ainemateriaalia taottavaksi. Muun muassa Helsingin kaupunki on avannut ikkunan tietojärjestelmiinsä. Sieltä koodarivelhot saavat käsiinsä yli 800 tietojärjestelmää, joista kehittää uusia palveluja. Esimerkiksi Reittioppaan datan avaamisen ansiosta kehittäjät ovat voineet koodata erilaisia, uusia mobiilipalveluja joukkoliikennematkustajien käytettäväksi.

Hyvästi yksityisyys?
Datan keräämiseen ja tallentamiseen liittyy väistämättä huoli yksityisyydestä ja yksityisyydensuojasta. Lainsäädäntö laahaa toistaiseksi ketterien koodaajien ja yritysten jäljessä, ja käyttäjät toimivat ikään kuin omalla vastuullaan, mutta harva ehkä jaksaa olla huolissaan oman verkkokäyttäytymisen jälkien ja tietojen tallentumisesta. Tieto lisää tuskaa, vai miten se taas menikään. Big data on mielestäni hyvin mielenkiintoinen ilmiö, joka luo mahdollisuuksia ja uusia palveluja etenkin meille markkinointialan ammattilaisille, mutta se saattaa myös ihan vähän huolestuttaa. Medialukutaidon ohella nykyään pitäisikin tarjota helposti, jokaisen saatavilla olevaa opetusta somelukutaidosta ja datalukutaidosta!

Teksti: Hanna Päivärinta