Big data ja ihmistieteet

Big data viittaa modernin teknologian mahdollistamaan uskomattoman suureen määrään kaikenlaista tietoa, jota ihmisistä kerätään tietokoneiden, puhelimien ja muun muassa sosiaalisen median kautta. Big Dataan kuuluvat myös digitalisoidut kirjat, Google mapsin luoma maantieteellienn data ja kaikki uu siltä väliltä. 2015 Frederic Kaplan julkaisi Frontiers in Digital Humanities -lehdessä artikkelin, jossa hän hahmottelee kartan ihmistieiden ja big datan tutkimukselle.

Koska big data on merkittävä osa nykyistä tutkimuskenttää, meidänkin on syytä Digiloikassa vilkaista mitä Kaplan on asiasta kirjoittanut. Kaplan jakaa big datan tutkimuskentän lukijaystävällisesti kolmeen aspektiin, jotka on helppo muistaa myöhempiä coctailkutsuja varten. Nämä kolme isoa kokonaisuutta, joilla jokaisella on omat haasteensa ja kysymyksenasettelunsa ovat Kaplanin mukaan digitaalinen data, digitaalinen kulttuuri ja digitaaliset kokemukset.

Digitaalinen data

Kaplan kertoo artikkelissaan kuinka massiivista tietomäärää on mahdoton enää käsitellä perinteisessä mielessä, jossa yksi akateemikko lukee yhtä paperia. Uudet massiiviset tietomäärät vaativat uusia käsittelyn tapoja. Tähän Kaplan tarjoaa toisiaan seuraavista osista koostuvaa prosessia, jossa jokaisella osalla on omat tiedontuottoon liittyvät haasteensa. Näitä ovat: digitalisaatio, transkriptio, pattern recognition, simulaatio/inferenssit, säilyttäminen, and kuraatio. Digitaalisten kirjojen tapauksessa kirja ensin skannattaisiin kuviksi(digitalisaatio), minkä jälkeen muutettaisiin tekstiksi(transkriptio). Pattern recognition ja simulaatio vaiheissa haluttu tieto etsitään joko suoraan algoritmeilla pintatasolla tai sitten se päätellään epäsuorasti aineiston pohjalta. Säilyttäminen ja kuratointi viittaa datan säilyttämiseen liittyviin kysymyksiin.

Kun kirja kuvataan ja muutetaan pelkäksi tekstiksi, sen aikaisempi fyysinen ulottuvuus muuttuu, muuttaen sen luonnetta. Jotkin ihmistieteiden näkökulmat ja kysymyksenasettelut, jotka painottavat materiaalista todellisuutta, eivät enää ole yhtä hedelmällisiä kun kirja objektina häviää. Kirja muuttuu pelkiksi sanoiksi, ja yhdeksi sanojen kokoelmaksi tuhansien joukossa, jolloin monet sen aspektit jäävät pimentoon. Tämän lisäksi digitaalinen data on helpommin muokattavissa kuin fyysinen objekti, mikä tarkoittaa, että tulokset ovat myös helpommin muovattavissa, joten niiden kanssa täytyy olla erityisen tarkka.

Digitaalinen kulttuuri ja digitaaliset kokemukset

Digitaalisella kulttuurilla Kaplan viittaa siihen laajempaan ympäristöön, jossa isoja datasettejä tutkitaan. Tämä tarkoittaa esimerkiksi viestintävälineitä, sosiaalisen median alustoja ja mitä vain muuta alustoja, jotka tuottavat digitaalista dataa joidenkin tietynlaisten päämäärien ja algoritmien mukaan. Tämän laajemman ympäristön tutkiminen ja ymmärtäminen on tärkeää, koska sillä on suoran yhteys tuotetun datan luonteeseen. Kysymyksiä tästä piiristä voivat oll esimerkiksi miten digitaaliset lähteet vaikuttavat akateemiseen työhön? Voiko interaktiivisia presentaatiota pitää uudenlaisena pätevänä tiedon muotona, kun digitalisaatio tarjoaa uusia mahdollisuuksia tutkijoille?

Digitaalisillä kokemuksilla taas viitataan siihen tosiasiaan, että kerätty tieto koetaan erilaisten päätteiden tietokoneiden ja nettisivujen kautta, jotka luovat kokemuksia. Jotkut digitaaliset ympäristöt voivat olla täysin immersiivisia siinä, että ne tarjoavat 3D jäljennöksen oikeasta maailmasta kun taas toiset voivat toimia tekstillä(hakukoneet) tai äänellä(Siri, Alexa, Cortana). Jokainen näistä voi vaatia omanlaisensa lähestymistapaa, ja jokaisella ympäristöllä on oma vaikutuksensa tuotettuun tietoon.

Ihmistieteiden uusi aika
Big data tulee olemaan koko ajan enemmässä määrin merkittävä, kun digitalisaatio kiihtyy. Kaplanin hahmottelema rakennelma tarjoaa jonkinlaisen käsityksen siitä, mitä alueita ja ongelmia big datan tutkimuksessa on, mutta kenttä tulee luultavasti muuttumaan ja kysymykset sekä ongelmat sen mukana. Muutos ei kuitenkaan voi olla este jatkuvalle pyrkimyksille ymmärtää ja digitalisaatio on luultavasti tullut jäädäkseen.

Roope Rouvali