Digitalian kuuma kesäkoulu

Digitaalisen tiedonhallinnan tutkimus- ja kehityskeskus Digitalia järjesti 22.8-24.8. kesäkoulun noin 50:lle hengelle, joista noin 30 suoritti koko kurssin ja muut osallistuivat luennoille. Kurssi järjestettiin Kansalliskirjaston auditoriossa, Helsingissä, jossa loppukesän aurinkoisina päivinä oli kuuma tunnelma.

Luennot

Luennoijat olivat monipuolinen kattaus professoreita ja kokeneita tutkijoita, jotka toimivat digitaalisuuden eri puolien parissa. 1. päivänä teema oli Digitaalisuus ja etiikka. Itä-Suomen yliopistosta (UEF) paikalla oli professori Tomi Voutilainen ja HTK Denis Galkin, joiden molempien esitykset pohtivat tietosuoja- ja tekijänoikeuskulmilta erilaisten aineistojen käyttöä. Professori Voutilainen kertoi kertoi suomalaisen oikeusrakenteen taustoista, joka on johtunut siihen, että lait viittaavat toisiinsa ja sieltä löytyy myös paljon toistuvia fraaseja, joilla “halutaan varmistaa, että varmasti on asiasta säädetty”. Saa nähdä nostaako EU:n tietosuoja-asetus, jonka vaikutuksia kulttuuriperintöaineistoille on pohdittu myös Kansalliskirjaston Aviisi-projektissa, keskustelua laajemminkin.

https://twitter.com/TuulaP/status/767611890969247744

Varmaankaan toistuvat säädökset ja entisaikojen hallintorakenteiden aiheuttamat lakikiemurat eivät aivan suoraan olisi näkyvissä Aalto-yliopiston Seco-tutkimusryhmän 2016 avaamasta semanttisesta Finlexistä , mutta kiinnostavaa olisi voisiko 2. päivänä puhutusta toistuvien uutisten/tekstikappaleiden tapahtuvasta uutisvirtojen seuraamisesta, menetelmiä, joita voisi käyttää muuallakin.

UEF:lla oli myös juuri tehty kyselyä asiantuntijoille suhteessa lainsäädännön nykytilaan, jota koettiin ainakin osittain sekavaksi ja uutta tiedonhallintakaarta pidettiin mahdollisuutena selkeyttää tilannetta.

Eräs digitaalisen tiedonhallinnan ongelmista nostetuista käytännön esimerkki oli että esimerkiksi verotiedot saa sähköpostilla, mutta ei ns. “teknisen väylän” kautta, jossa jopa määrittely vielä puuttuu.  Oikeus 2/2016 -lehdestä löytyy aiheesta artikkeli. Digitalisaatio on kuitenkin yksi hallituksen kärkihankkeista http://vm.fi/digitalisaatio, tai esimerkiksi http://digisuomi.fi -avaukset joten toivoisi, että sekä uuden EU:n tietosuojadirektiivin että em. tutkimuksen asiantuntijoiden vastauksissa toivottu tiedonhallintakaari olisi mahdollisuus saada tätä puolta eteenpäin.

Denis Galkin käsitteli henkilön omien tietoaineistojen käyttöä, joka on nykyään mydata ja erinäisten kauppojen keräämien tietojen takia monella tuoreessa muistissa. Käytiin läpi tiedollinen itsemääräämisoikeus, mitä kaikkea henkilötiedolla tarkoitetaan, rekisterinpitäjän velvollisuudet ja pohdittiin myös erityisesti sähköpostiaineistoja.

Vaikka joku olisi salassapidettävän aineiston julkaissutkin, niin se ei oikeuta levittämään sitä eteenpäin. Tutkijoilla voisi joskus olla mahdollisuuksia käyttää joitakin aineistoja historialliseen tai tilastolliseen käyttöön ja kuten päivän keskusteluissa pohdittiinkin aina on mietittävä eettiset kysymykset myös, koska aineisto(i)ssa voi olla henkilötietoja, jne. Kuitenkin esimerkiksi toimittajilla voi olla laajemmat oikeudet joissakin tapauksissa johtuen heidän roolistaan tiedon jakajina – ehkäpä siksi tuoreiden tapausten uutisointi tapahtuukin mediatalojen toimesta. Toisaalta, joskus taas aineistoja voi hyödyntää yksityiseen käyttöön, mutta ei taas muutoin. Kuitenkin luulisi olevan mahdollista luoda yleiskäyttöisä menetelmiä sähköpostiaineistojen käsittelyyn, mitä Digitaliassa MAMK:lla  tutkitaan – kuinka sähköpostiaineistoja selataan, käsitellään ja säilytetään.

Tampereen yliopistosta Tuija Kautto nosti tärkeän näkökulman eettisyydestä asiakirjahallinnassa:

Tuija kertoi että eettisiä säännöstöjä on useita, mutta organisaation tulisi pohtia omat käyttötarkoituksensa ja tarkentaa ja prosessoida, kun eettisen säännöstön haluaa ottaa käyttöön. Kuten myös aiemmin mainituissa tietovuototapauksissa, “jokaisen ammattilaisen tulisi pohtia omaa eettistä moraalipohjaansa”. http://digitalethics.org/

Avoin tiede ja tutkimus-hankkeessa on kerätty mm. datapolitiikkoja eri organisaatioilta, joissa saatetaan käydä läpi myös eettisiä kysymyksiä.  MAMK:n tutkimusjohtaja Noora Talsi pohti eettisyyttä taas tutkimusaineistojen puolelta, hyvä tieteellinen käytäntö ohjaa, sidonnaisuudet tulisi mainita, ja tutkija on itse vastuussa myös tutkimusprosessinsa eettisyydestä.

Kulttuuriperintöaineistot ja digitaalinen tiedonhallinta

Toinen päivä lähti vauhdikkaasti liikkeelle digitaalisen humanismin keinoin. Perusteista alkaen professori Mikko Tolonen esitti eri tapoja määritellä digitaalisen humanismin, perinteisestä, Suomen Akatemian käyttämiin, edeten työpaikkailmoituksiin, joita sekä HY:ltä , että Aallolta on ilmestynyt.

Paneelissa pohdittiin mm. että jossakin kohtaa pitää luopua “uuden teknologian käytöstä” DH:n määritelmässä tai kun aika kehittyy lisää, ehkä myös digitaalisuus sanasta tippuu sanasta, kunhan kulttuurimuutos etenee vuosien myötä. Digitalian tutkimuskoordinaattori Kimmo Kettunen muisteli tutkimusdatan käsittelyn vaihtoa aiemmin data pidettiin itsellä, nykyään pyritään avaamaan:

https://twitter.com/TuulaP/status/767972463028400128

Paneeli pohti myös, että nykyään haaste voi olla, että data on jollakin hallussa, mutta tutkijoiden käyttötarve olisi saada se aineistopakettina itselleen, jotta aineistoa voidaan pyöritellä omassa ympäristössä. Kehitettävät menetelmät kuitenkin voivat luoda yhteistä hyvää sekä alkuperäiselle organisaatiolle, kuten myös koko tutkijayhteisölle.

Digihistorian historiasta Suomessa kertoi professori Hannu Salmi, käyden läpi mm. Historiallisesta aikakauskirjasta löytyneitä artikkeleita aiheen kehityksestä kautta vuosien. Aiemmin oli mm. kuvattu tekstin editointiprosessin eroja tietokoneella tai käsin kirjoittaen, mitä ei ehkä nykypäivänä tule eri tekstinkäsittelyohjelmia käyttäessä edes pohtittuakaan. Jaakko Suominen muisteli,  että ennen digitointia, aineistoja käytiin läpi käsin – ilman kokotekstihakua tai edes listauksia lehdistä löytyvistä artikkeleista.

Kansalliskirjaston Digitalian osaprojektissa kohdeaineistona ovat digitoidut sanomalehdet, jotka ovat jo aiemmin paljon käytettyä aineistoa, mutta uudet menetelmät antavat vielä lisää mahdollisuuksia. Tutkijakoordinaattori Kimmo Kettunen kertoi digitoinnin jälkikäsittelyn haasteista, koska monet asiat tekevät tekstintunnistuksesta (OCR – Optical Character Recognition) vaikeaa, joka luo esteitä aineistojen löydettävyydelle ja käytettävyydelle. Kimmo puhuikin siitä, kuinka eri käyttötarkoituksiin on erilaisia tapoja käyttää, esimerkiksi digin peruskäyttöliittymänä, raakadata (josta on ensimmäinen kokeilupaketti saatu Comhis-projektin käyttöön) ja Kielipankin Korp-palvelu, jonka kautta pääsee aineistoja analysoimaan. Jälkikeskusteluissa kuulosti, että myös digitointia voitaisiin pohtia laajemmin yhdessä – miten aineisto valitaan digitointiin ja kuinka hallita tekniset pulmat tekstintunnistus, aina kasvava levytilan tarve, pitkäaikaissäilytys jne.

Digitaalisen tiedonhallinan kesäkoulu 23.8.2016

Digitaalisen tiedonhallinan kesäkoulu 23.8.2016

Professori Mikko Tolonen, puhui digitaalisten aineistojen käytöstä tutkimuksesta, korostaen, että oleellista on lähteä tutkimuskysymyksestä, joka luo pohjan käytetyille menetelmille ja työkaluvalinnoille. Mm. vuoden 2016 DHH16-hackathonissa yksi ryhmistä lähtikin analysoimaan siirtolaisuuden viestintää sanomalehdissä suhteessa siihen mitä reaalimaailmassa tapahtui. Comhis-projektista Hannu Salmi kertoi puolestaan tekstien uudelleenkäytön tunnistamisesta. Pyritään löytää keinoja löytää mm. klustereita toistuvista teksteistä , kuitenkin siten, että mahdollisesti eri paikoissa olevat OCR-virheet eivät tätä prosessia huonontaisi. Joitakin näitä esimerkkejä siirtyneistä artikkeleista löytyy aina sattumalta aineistoja selatessa, mutta hauskaa olisi jos voisimme tehdä linkkauksia muihinkin digitaalisiin aineistoihin.

Pearson's Magazine vs. NykyaikaPäivässä pohdittiin myös sähköisenä syntyneitä aineistoja, lähtien Suomi24-aineistosta, jonka professori Jaakko Suominen mainitsi olevan tunnetuin keskustelupalstana, mutta ensimmäisinä vuosinaan se toimi yleisportaalina. Aineisto on laaja: 53 miljoonaa kommenttia 6,8 miljoonassa eri ketjussa aina vuodesta 2001 lähtien. Aineistosta lisää löytyy “Suomi24 – muodonantoa aineistolle” raportista joka tehtiin Citizen Mindscapes-projektissa keväällä.

 

Summa summarum

On digitaalisia aineistoja, on laajoja digitaalisia aineistoja, on laajoja aineistoja jotka vaativat paljon esikäsittelyä, on sähköisesti syntynyttä aineistoa, on ns. analogisia aineistoja, joita ei koskaan digitoida, on digitaalisia aineistoja joihin ei ole käyttölupaa (tekijänoikeudet, tietosuoja, maksumuuri …) tai vain rajoitetusti, on dataa joka on kadoksissa tai väärässä muodossa, jolla on puutteellinen metadata tai aineistoa , jonka käsittelyyn ei ole keinoja tai prosesseja. Tällaista listaa pystyisi luonnostelemaan, kun pohti eri puolella toimivien ihmisten tutkimusaihioita. Eikä tässä vielä kaikki, tutkimusaineiston hallinta koko sen elinkaaren ajan, tiedonhallinta, prosessien kuvaaminen,  tietojärjestelmäprojektit (mistä niitä järjestelmiä oikein tuleekaan…), asiakaslähtöisyys ja aineistojen saatavuus tutkijoille mainittiin myös. Hyvää oli se, että kehityskohteita oli löydetty ja innostusta oli lähteä niitä selvittelemään – työtä kyllä digitaalisen tiedonhallinan tutkimukselle ja kehitykselle tuntuu kyllä riittävän jatkossakin.

Digital data, source http://xkcd.com/1683/

“digital data” – lähde: http://xkcd.com/1683/

Joitakin linkkejä päivien lomasta:

 

Lisää kokemuksia päivistä löytyy jo “Sukututkijan loppuvuosi”-blogista:  http://sukututkijanloppuvuosi.blogspot.fi/2016/08/digitaalisen-tiedon-kesakoulussa-mati.html  ja  http://sukututkijanloppuvuosi.blogspot.fi/2016/08/arkistoasiaa-ja-kirjallisuushistoriaa.html ja lisäksi twitteristä aihetunnisteella #Digitaliafi , voi selata päivien twiittejä ja mitä Digitaliassa tapahtuu jatkossa.

 

Tallenna

Tallenna

Tallenna

Tallenna

Tallenna

Tallenna

Tallenna

Tallenna

Engelin helmi


Kuvan alkuperäislähde rakennusselvitys 2011

Eteläsali Pohjoissali sali4

Avajaisista

 

Ohjeet esteettömään kulkuun ja video

Peruskorjauksesta

 

 Perustietoa

  • Kansalliskirjaston päärakennus on valmistunut vuonna 1840.
  • Arkkitehti on Carl Ludvig Engel  jonka töitä myös mm. Valtioneuvoston linna ja Tuomiokirkko.
  • Suurissa saleissa on yli 600 m kirjahyllykköjä (Rungot kunnosti Vanalinna ehitus OÜ , ja hyllylevyt (1700 kpl) Wooden Oy [4]

 

Eteläsali
* Severin Falkman on maalannut saleihin eri tieteiden allegoriset kuvat.[3]
* 20 tutkijapaikkaa
* Lukusali

Pohjoissali

* Magnus Enckellin maalaus Kulta-aika (1904)
* Lukusali


Kupolisali

* Kattomaalauksissa arkkitehti Frans Sjöströmin suunnittelemat hyveitä edustavat linnut [3]
* Paikoin on näkyvissä esiinotettua värikerrosta 1880-luvulta

Takaisin ylös

 

Suomen rakennustaide meidän päivinämme (Valvoja, 01.01.1903, nr. 1, s. 23-26)
Engelin muistelun 50-vuotisjuhla / Päivälehti, 14.05.1890, nro 110, s. 1

Takaisin perustietoihin

Lisätietoja/lähteitä

[1] Kansalliskirjaston rakennusselvitys 2011 https://www.kansalliskirjasto.fi/extra/Rakennushistoriaselvitys_220911.pdf

[2] Kansalliskirjaston aikajana / Arkkitehtuuri https://www.kansalliskirjasto.fi/extra/aikajana/tl_win1845ark.html

[3] “On muitakin sanoja”-Taidetta Kansalliskirjastossa https://blogs.helsinki.fi/verkkari-lehti/on-muitakin-sanoja-taidetta-kansalliskirjastossa

[4] Kansalliskirjasto-lehti 1/2016, https://issuu.com/kansalliskirjasto/docs/kansalliskirjasto_lehti_1_2016

Takaisin ylös

Tallenna

Trial use : British Library Newspapers

For August, University of Helsinki has opportunity to experiment with British Library Newspapers. From the years 1732-1950, there are five different parts, which cover different areas and newspapers.

You can find the link to the database via Finna.  More info about the collection at Gale Cengage. The original news item from the National Library, where there is request to send feedback or comments of the service to the information services of the NLF.

Number of documents containing keyword, example of visualization that can be get from the service

 

Tallenna

Tallenna

Tallenna

Digital Humanities at Liber2016

During this week in Helsinki there has been Liber 2016 conference, which is the main network for research libraries in Europe. This year it was orgPaasitorni 1908anized in Helsinki at Paasitorni, by co-operation of the National Library of Helsinki, Helsinki University Library and Finnish Research Libraries. There was record number of attendees, proposals  submitted and also a great variety in countries where the attendees came. The theme of the conference was “Libraries Opening Paths to Knowledge”, which both gave possibilities for wide range of talks, while still keeping all presentations in linked to each other.

Digital humanities, eh?

Digital humanities was visible also in Liber, as an recognized field, which requires libraries all over to adjust their services towards those who want to utilize materials via algorithms in addition to close reading. It also came about in the discussions after sessions, and also via side discussions during the breaks. Especially on Thursday there were sessions that talked about service design, where there was conscious effort to the respond to the new needs of clients of the libraries via service design, service modeling, net promoter score metrics, which might appear more in private sector. But this shows that libraries are, opening new ways to information, as the conference tagline goes, in whatever ways are available — even small things, like having people to guide students can have huge impact to the daily high and low points of an individual researcher.

Plenary: Digital Humanities in and of the Library

The plenary session of Yale University Library / Digital Humanities Lab by Peter Leonard was particularly interesting, as he went through both in theory and practice how a library can help in digital humanities. He went through the collections but also research projects, which utilize the data.

One of the aspects discussed were the special collections & DH, where the user engagement, which some might call, crowdsourcing, is a way to both enrich the data, but also to get awareness of the materials increased.  This first example talked mainly about the fascinating Transcribe-project , where Cherokee language could be transcribed via unique font set by the volunteers, who know the language. As mentioned in Twitter, this approach of targeted crowdsourcing, is similar to the well-known Fenno-Ugrica project.


Enriching options

The second case of enriching was done via kinds of crowdsourcing tagging of original materials. From the digital materials, for example from books, volunteers draw bounding boxes to surround significant terms, e.g.  the characters, writers, or titles. One of the demos shown had then a network analysis of works, artists and their content.

Analyzing materials

Then for a different kind of example, the final example was about Vogue journal, where the content itself was restricted, but the lab had sought ways to still utilize the materials in an image-based analysis. For example we saw how the front page of the journal changed over the years and how the hue and brightness varies. From the vogue materials there was also made “frequency counts” of terms which were visualized in a timeline. Via topic modelling it was then also possible to let the content to speak to the researchers, as that created groups of terms which seem to appear close to themselves and thusly created groupings of terms, themes, which then researchers can dig deeper. The access controls were utilized as the system provides also the full text of articles for those who have access to the restricted content, others have to work on the aggregate level. This is bit similar to the NLF’s Aviisi-project goals, where access control has been a key thing to develop, in order to increase availability to the more recent materials.

Programming

It was understood by library people that “writing software” is one of the key skills, which a researcher might need. Actually in the discussion of the Yale’s plenary session there were considerations that how goal-oriented those skills should be? The comparison given was related to e.g. language courses, they might be taken at some point, but even if the learner doesn’t have passable language skills for everyday discussion, it still can be seen as valid learning as e.g. culture and other knowledge is got.

Especially in programming the software stacks, languages,  different toolings, arise and fall quite rapidly and one of the core skills could be just to juggle with many possible programming language, in the selection of the most suitable tool for a job. As mentioned in Liber2015 in prof. Tolonen and Dr Leo Lahti, there should be reproducible workflows from data, to code and to results.

For example in the open science portal there just came text reminding of citing software, computer programs should be done, which is talked more, for example in the Force11 software citation principles . Personally, I’ve always liked if a github repository contains also the citing instructions directly, because then it is relatively convenient to just copy the given format. For example, Mike Jackson lists examples how to get citation from various tools, e.g.  from R modules via citation(‘modulename’) and finally the recommendation to do a own command line option for citation, is actually very implementable suggestion. In a way generating an URN to a blog post would be possible, but would it be useful?  Especially if using github for blogging it could be possible to just get an URN to a post automatically – then it would happen behind the scenes but anyhow be available.

Training DH

On Friday there were talks about training DH, where e.g. Maija Paavolainen from University of Helsinki told about the current digital humanities course in Digital Humanities Helsinki and what students, content providers, and trainers had learnt throughout the way. National Library of Netherlands also talked about the library role in DH, it all starts with data (digitized), but there was also good reminder to be critical towards all tools, and to the digital sources in general.

National Library of NetherlandsAll data, tools and methods have their usages, so knowing what suits where is also one field, where new competences need to be built. It is also constant work, as field evolves all the time.

Presentation materials, posters of the Liber2016 can be found via the conference website , and discussions during the  conference can be found via #liber2016 hashtag .

 

Tallenna

Tallenna

Tallenna

Kulttuuriperintöaineistojen tutkimuskäytöstä

myrskylyhty

Primus myrskylyhty. http://digi.kansalliskirjasto.fi/pienpainate/binding/358156/articles/1856661

Eri kulttuuperintöorganisaatioiden aineistojen käyttöä on tutkittu tietyin aikavälein, ja näkökulmana on yleensä tietty aineistotyyppi tai sisällöntarjoajan näkökulma. Tampereen yliopistossa Tiina Hölttä teki pro gradunaan yhden viimeisimmistä, otsikolla: “Digitoitujen kulttuuriperintöaineistojen tutkimuskäyttö ja tutkijat”.  Gradun aihe oli erittäin kiinnostava ja ajankohtainen, koska tutkimuskäyttö on yksi Kansalliskirjaston valitsemista strategisista kehitysalueista, joiden puitteissa on kehitetty pian saatavilla olevat “Digitaalisten ihmistieteiden”-politiikka ja hyötyjä tutkijoille on löydettävissä myös tulossa olevasta “Avoin Kansalliskirjasto”-politiikasta.

 

 

 

 

Kulttuuriperintöaineistojen tutkimuskäyttö

“Kaikenlainen tiedonhankinta arkisto- ja kirjastoaineistoja, eli kulttuuriperintöaineistoja, käyttäen voidaan laskea tutkimukseksi. ”  Hölttä (2016, 96).

Tieteellisen tutkimuksen osalta Hölttä raportoi, että 80% tutkimuskäytöstä liittyi humanistisiin tieteisiin ja 20% muihin tieteenaloihin. Hän jatkaa, että niin sanottua viihdekäyttöä aineistoista olisi 10% ja muu käyttö on tutkimusorientoitunutta, oli se sitten sukututkimusta, paikallishistoriaa tai akateemista tai opetuskäyttöä tai asiantuntijatehtävissä tarvittavaa. Tätä voi selittää myös yleinen koulutustason nousu (Witting, 2014), jossa potentiaalisella asiakaskunnalla on entistä vaativampia harrastuksia ja tietotarpeita, ja odotukset “kaiken” saamiselle digitaalisena kasvavat. Säilytettyjä analogisia aineistojahan riittää, joten yksistään sen valinta mitä voidaan digitoida, vaatii jo pohdintaa ja kriittisten valintojen tekoa.

 

Tiedosta ja tiedon järjestämisestä

Alkuperäinen digi, joka oli ensimmäisiä sanomalehtien digitaalisia verkkopalveluja  maailmassa, avattiin vuoden 2001 lokakuussa kirjamessujen yhteydessä. Osa käyttäjistä onkin tottunut järjestelmään joka jo silloin avattiin, joten ei olekaan ihme, että vuonna 2014 perusteellisesti uusitusta käyttöliittymästä, sivuston tiedon järjestämisestä ja hakutoiminnallisuuksista on tullut palautetta laidasta laitaan, mikä on nähtävissä sekä digiin saamissamme käyttäjäpalautteissa, että Höltän tutkimuksen vastauksissa. Eri kehitysprojekteissa suunnitelluille haun parannuksille näyttäisi olevan kysyntää. Tavoite on tehdä tiettyjä asioita selkeämmäksi, mutta samalla lisätään tehokäyttäjille mahdollisuuksia päästä entistä syvemmälle aineistoihin.

Pääsivujen tekstejä on korjattu vaiheittain, ohjetekstejä on selkeytetty ja siirretty niitä itse toimintojen yhteyteen. Lisäksi onkin toivottavaa, että Kansalliskirjaston vuoden 2016 helmikuussa tekemä merkittävä verkkosivustouudistus auttaa myös historiallisen sanomalehtikirjaston löytämisessä, jotta asiakkaat löytävät etsimänsä tiedon. Juuri nyt onkin vastattavissa uusi kysely, jossa löydettävyyttä pohditaan, vaikka tutkimuksen pääalue onkin aineistojen käyttömahdollisuudet mm. opetuksessa.

 

Tutkijakäyttö ja digitaalisuus

Kiintoisa yhden vastaajan kommentti Höltän (2016) tutkimuksessa oli myös se, että julkista laitosta sinällään, kuten Kansallisarkistoa ja Kansalliskirjastoa, pidettiin digitoinnissa laadun takeena. Tämä johtaakin juurensa siihen, että näillä laitoksilla on jo ydintehtävissään säilyttäminen, joka luo oman uniikin vaatimustasonsa digitoinneille, koska aineiston pitäisi olla saatavissa ikuisesti. Kansalliskirjaston digitointi- ja konservointikeskuksessa vierailleet näkevätkin kaikki eri työvaiheet ja vierailulla myös esitysjärjestelmien takana oleva työ konkretisoituu, kun digitaalisen ketjun työvaiheiden eri osien merkitys avautuu.

Alkuperäinen vai digitaalinen? Digitaalista surrogaattia kukin tutkija pitää useimmissa tapauksissa yhtä hyvänä kuin alkuperäistä, mutta kiintoisasti julkaisujen lähdeviitteissä viitataankin useimmiten (55%) alkuperäiseen aineistoihin, vaikka osa käyttää myös viittaamista joko digitaaliseen ainestoon tai molempiin, Hölttä (2016).  Aiemmassa “Tutkijan ääni”-tutkimuksessa (2012) pidettiin myös sähköiseen aineistoon viittaamista ongelmallisena, ja jos vakiintuneita käytänteitä ei ole,  valitaan alkuperäisaineisto (riippumatta mitä aineistoa on käytetty); lisäksi käyttäjät tiedostavat myös sähköisten versioiden ongelmat (Hupaniitty 2012, 38-39). Olemmepa kuulleet, että joissakin tapauksissa tutkija on tulostanut talteen kaikki käyttämänsä artikkelit, jotta tarvittaessa voi palata alkuperäisiin lähteisiin.

Viittaamiskynnystä helpottamaan, digistä voi myös aiemman leikkeeseen viittaamisen lisäksi, viitata pian myös yksittäiseen sivuun, mm. RefWorks- ja BibTex-muodossa. Jos tutkimuksessa tai verkkosivulla käytettäisiin suoria verkkosivustoviitteitä, niin tällöin eri mediaseurantavälineillä löytäisi käyttätavat paremmin. Näin esimerkiksi Kansalliskirjasto saisi paremmin analytiikkaa siitä, missä kaikkialla aineistoja käytetään, esimerkiksi seuraamalla mistä viittauksia aineistoihin tulee.

Data käyttäjille

Loppupäätelmissään Hölttä toteaa

”Kysy käyttäjiltä, miten palveluja tulee kehittää!”  (Hölttä 2016, 106).

Käyttäjäkuntamme voikin siis varautua, että myös jatkossa kyselemme palautteita ja pohdimme muitakin tapoja luoda yhteistyötä eri käyttäjäryhmien kanssa. Vaikka joihinkin asioihin on jo reagoida, niin tarvetta voisi olla tiiviimpään yhteistyöhön, jotta keskustelupohja laajenee. Tutkija- ja käyttäjäkenttä ylipäätään on monimuotoinen, eri käyttäjät odottavat erilaisia asioita, ja toimintoja ja kuitenkaan kaikkea ei voida tehdä. Digitaalisten ihmistieteiden tutkimuksen myötä ja eri tapahtumat ovatkin avanneet silmiä siitä miten ja mihin aineistoja käytetään. Aineistojen laatua ja määrää ja myös  tietojärjestelmäkehitystä pyritään tekemään jatkuvasti ja täten tarjoamaan sisältöjä paremmassa muodossa.

 

Lähteet

Hupaniitty, O. (2012). Tutkijoiden ääni ja sähköiset aineistot. Saatavilla: http://www.sls.fi/sites/default/files/forskarnas_rost_slutrapport_28112011_fi.pdf

Hölttä, T. (2016), Digitoitujen kulttuuriperintöaineistojen tutkimuskäyttö ja tutkijat. Saatavilla : http://urn.fi/URN:NBN:fi:uta-201603171337

Witting, M. (2014). Tilastokeskus – Suomen sijoittuminen kansainvälisessä koulutusvertailussa riippuu tarkastelutavasta. Saatavilla: http://www.stat.fi/artikkelit/2014/art_2014-09-29_001.html?s=0