Big data muuttaa maailmaa

Käsite big data on ollut minulle tähän saakka melko tuntematon. Englanninkielisestä nimestä olen toki päätellyt, että jotain tekemistä sillä täytyy olla tietomäärien kanssa. ”Big data – tiedon käsittelyn seuraava mullistus?” Tämä Positio-lehden (1/2014) raflaavalta kuulostava jutun otsikko sai minut todella uteliaaksi. Niinpä päätin käyttää pienen tovin selvittääkseni ainakin pintapuolisesti, mitä tämä big data oikein tarkoittaa, mitä se mahdollistaa ja minkälaisia ongelmia sen käyttöön liittyy.Norsukuva

Big data on valtavien tietomassojen keräämistä, säilyttämistä ja analysointia

Erään määritelmän mukaan big data tarkoittaa käsittämättömän suurten ja järjestämättömien tietomassojen keräämistä, säilyttämistä ja ennen kaikkea analysointia tietoteknisten ratkaisujen avulla. Big datalle on ominaista, että tietoa on paljon, sen määrä kasvaa ja se on muodoltaan yhä vaihtelevampaa. Big dataa ovat esimerkiksi hakukoneiden lokitiedot, verkkokauppojen ostotapahtumat, Twitter- ja Facebook-viestivirrat, sensoreiden tallentama mittausdata, puhelinten paikannustiedot. Vuoden 2020 lopulla digitaalista tietoa on arvioitu olevan 50 kertaa enemmän kuin vuonna 2010.

Big datasta tulee älykästä tietoa uusien sovellusten ja ihmisten avulla

Eri lähteistä kertyvää jäsentymätöntä entistä monimuotoisempaa tietoa on vaikea hallita perinteisillä tietojärjestelmillä. Markkinoille onkin syntynyt suurten tietomassojen käsittelyyn tarkoitettuja sovelluksia ja palveluja, kuten avoimen lähdekoodiin perustuva Hadoop, jota mm. Facebook ja Yahoo käyttävät palveluissaan. Pilvipalvelut puolestaan tarjoavat joustavan tavan suurten tietomäärien tallentamiseen ja jakeluun.

Datan määrän kasvaessa korostuu tiedon organisoinnin ja analysoinnin merkitys. Esimerkiksi puhelinten sensori- ja paikannusdatasta, tietokannoissa olevasta biopankki- ja rekisteridatasta tai sosiaalisen median sisältö- ja videotallennedatasta syntyy todellista älykästä tietoa vasta asiantuntevien ihmisten avulla. Toimintaa ohjaavat monimutkaiset ohjelmistot, laskentamallit tai ratkaisut edellyttävät laajaa osaamista: koodaajaa, datamatemaatikkoa, tilastoasiantuntijaa, kehittäjää, liiketoiminta-analyytikkoa, käyttäytymistieteilijää ja trendien ennakoijaa.

Monet paikkatiedot ja sosiaalisen median palvelut, joihin liittyy tieto sijainnista, ovat luonteeltaan big dataa. Matkapuhelinten sijaintietoja on mahdollista hyödyntää esimerkiksi liikennesuunnittelussa.

Tarvitaan menetelmiä yksityisyyden suojan kehittämiseksi

Meistä jää verkkoon jälkiä mm. käyttäessämme hakupalveluja ja maksaessamme ostoksia. Toisaalta jaamme tietoja itsestämme myös vapaaehtoisesti erilaisissa sosiaalisen median palveluissa. Kiinnostuksen kohteistamme tai elämästämme pystytään tekemään entistä tarkempia päätelmiä. Tarpeellista tietoa jää hyödyntämättä tietosuojan takia samaan aikaan, kun tietojamme jaellaan ilman, että pystymme puuttumaan siihen. Tarvetta on menetelmille, joilla tiedon voi anonymisoida luotettavasti ja jakaa edelleen.

Terveisin Juha Kokkonen