Digitaalisten aineistojen tutkimusta tehdään enimmäkseen perinteisin menetelmin

Vuosisatojen ajan Kansalliskirjasto on ollut tärkeä tutkimuksen kumppani. Se tarjoaa runsaasti  tutkimusaineistoksi kelpaavaa aineistoa – myös digitaalista aineistoa ja kirjallisuutta. Digitaalinen avoin muisti (DAM) -hankkeessa tehtiin keväällä kysely Kansalliskirjaston digitaalisista aineistoista ja palveluista, koska hankkeen tavoitteena on kehittää Kansalliskirjaston digitaalisten aineistojen ja tutkijoiden kohtaamista.

Kysely sai yhteensä 130 vastausta suomen-, ruotsin- ja englanninkielisiltä vastaajilta. Tutkijaorientoituneen viestinnän voi todeta onnistuneen melko hyvin.  84 prosenttia vastaajista oli affilioitunut johonkin yliopistoon ja suurin osa lopuista vastaajista edusti  yrityksiä ja ammattikorkeakouluja. He kuitenkin kertoivat tarkentavissa vastauksissa toimivansa ensisijaisesti tutkimustehtävissä.

Kansalliskirjaston moninaiset digitaaliset aineistot

Kansalliskirjasto tarjoaa käyttäjilleen hyvin monipuolisesti digitaalisia aineistoja, joista osa on sähkösyntyisiä ja osa digitoituja. Osa digitaalisista aineistoista on käytössä kotikoneelta kaikille kiinnostuneille. Esimerkiksi osoitteesta digi.kansalliskirjasto.fi löytyvät kotimaiset sanomalehtiaineistot vuoteen 1929 asti sekä laaja valikoima kirjoja. Tutkain-sopimuksen solmineiden korkeakoulujen tutkijat pääsevät Haka-kirjautumisella lukemaan lehtiä aina vuoteen 2018 asti. Kaikkia lehtiä ei ole digitoitu koko ajanjaksolta, mutta digitointi etenee noin kahden miljoonan sivun vuosivauhtia sekä takautuvana että vapaakappaleina luovutetun uutuuskartunnan digitointina. Digi.kansalliskirjasto.fi sisältää tällä hetkellä yhteensä melkein 19 miljoonaa sivua aineistoa ja muodostaa Kansalliskirjaston käytetyimmän digitaalisen kokoelman.

Useimmille kyselyyn vastaajille Kansalliskirjaston digitaaliset aineistot tarkoittivat nimenomaan historiallisia sanomalehtiaineistoja (Kuva 1). Avovastauksissa korostui aineistojen käyttömahdollisuudet kotoa käsin.

Kuva 1: Käytetyt aineistolajit ja -palvelut, vastaajia 122, valintoja 282, prosentit suhteessa kaikkiin vastaajiin

Kuva 1: Käytetyt aineistolajit ja -palvelut, vastaajia 122, valintoja 282, prosentit suhteessa kaikkiin vastaajiin

Osa digitaalisesta aineistosta on käytössä vain kirjaston omissa tiloissa tai vapaakappalekirjastoissa, mikä vaikuttaa niiden käyttöpotentiaaliin tutkimuksessa. Vapaakappalekirjastoja ovat Kansalliskirjasto, Turun yliopiston kirjasto, Jyväskylän yliopiston kirjasto, Åbo Akademin kirjasto, Oulun yliopiston kirjasto ja Itä-Suomen yliopiston kirjasto. Vapaakappaletyöasemilla on käytössä myös verkkoarkisto ja sähkösyntyiset vapaakappaleet. Muita Kansalliskirjaston digitaalisia aineistoja löytyy kirjaston julkaisuarkistosta doria.fi. Lisäksi Kansalliskirjaston hakupalvelu kansalliskirjasto.finna.fi tarjoaa pääsyn sekä digitaalisiin että painettuihin aineistoihin.

Tyypillinen käyttäjä ja käyttötapa

Kyselyaineiston perustella digitaalisten aineiston tyypillinen tutkijakäyttäjä on suomenkielinen historia-alan väitöskirjan tekijä Helsingin yliopistosta. Useimmiten hän on käyttänyt aineistoja selaten, lueskellen ja metodisesti lähilukien. Hieman yli puolet kaikista vastaajista oli käyttänyt metodinaan lähilukua, ja muutamat vastaajat erittelivät vielä tarkemmin menetelmäkseen sisällönanalyysin ja sisällön erittelyn, jotka ovat molemmat tyypillisiä laadullisen tutkimuksen analyysitapoja. Noin neljännes vastaajista oli tehnyt tiedonlouhintaa, jonka mahdollisuudet kasvavat vähitellen aineistokokoelman digitoinnin ja louhintaan tarvittavien teknisten edellytysten kehittyessä.

Vaikka vastaajat olivat lähtökohtaisesti tutkijoita, moni heistä käytti digitaalisia aineistoja vain selailuun ja lueskeluun. Avovastauksien perusteella moni tutkija kuitenkin koki selailun ja lueskelun tärkeäksi osaksi tutkimusaineiston muodostamisprosessia. Niiden avulla he tietäisivät, minkälaista aineistoa kussakin palvelussa on käytettävissä ja miten sitä voisi hyödyntää omien tutkimusintressien taustalla.

On huomattava, että useimmat tutkijat tarvitsivat Kansalliskirjaston digitaalisten aineistojen rinnalle myös muuta aineistoa. Usein se oli kyselyn vastausten mukaan digitoimatonta Kansalliskirjaston aineistoa tai erilaisista arkistoista saatavaa digitaalista ja digitoimatonta aineistoa. Tutkijat vastasivat myös lukuisia muita tutkimusaineistojen lähteitä taiteesta sosiaaliseen mediaan, joten Kansalliskirjaston tutkijakäyttäjät näyttävät tekevän monipuolista tutkimusta erilaisiin aineistoihin tukeutuen.

Käyttäjiensä keskuudessa tunnetut aineistot palvelut

Kansalliskirjaston digitaalisten aineistojen ja palveluiden tunnettavuudelle annettiin vastaajien keskuudessa hyvät arvosanat. Aineistot tunnettiin keskiarvolla 3,35 ja palvelut keskiarvolla 3,48, kun asteikko oli 1-5). Mediaanitunnettavuus oli molemmissa kategorioissa neljä. Seuraavassa kuvassa nähdään vastausten jakautuminen eri vastausvaihtoehtojen kesken (Kuva 2).

Kuvassa kaksi havainnollistetaan aineistojen ja palvelujen tunnettavuutta 130 vastaajan kesken

Kuva 2: Aineistojen ja palvelujen tunnettavuus, 130 vastaajaa

Erikielisiä vastauksia tarkasteltaessa löytyi pientä eroavaisuutta. Suomenkielisissä vastauksissa aineistot (ka. 3,44) voittivat tunnettavuudessaan niukasti palvelut (ka. 3,42), mutta kokonaistuloksissa aineistot (ka. 3,35) tunnettiin alle kymmenyksen heikommin kuin palvelut (ka. 3,48). Ero on merkityksetön, mutta huomattavaa on, että noin 20 prosenttia suomenkielisistä kyselyyn vastaajista valitsi molemmissa väittämissä vaihtoehdot yksi ja kaksi (täysin eri mieltä ja eri mieltä), kun taas englanniksi vastaava prosenttiosuus ensimmäisten vaihtoehtojen kohdalla oli melkein puolet. Ruotsinkielisiä vastaajia oli vain kolme, eikä heidän vastauksiaan ole mielekästä verrata tässä erikseen.

Noin puolet kyselyyn vastanneista edusti Helsingin yliopistoa ja toinen puolisko jakautui ympäri Suomea edustaviin organisaatioihin. Vastaajissa ei ollut edustusta kaikista yliopistoista ja monissa organisaatioissa edustus jäi vain yksittäisiin vastauksiin. Helsinki-keskeisyyttä on helppo selittää Kansalliskirjaston sijoittumisella Helsinkiin ja kiinteistä yhteyksistä Helsingin yliopistoon, mutta verkon yli käytettävien digitaalisten aineistojen tai vapaakappalekirjastokaupunkien vuoksi Helsinki-sidonnaisuus ei olisi täysin välttämätöntä kuin pelkkiä analogisia aineistoja käytettäessä. Paikkaan sidonnaisuus koettiin kyselyssä jopa rasitteena, koska kysely toteutettiin pahimpaan koronakaranteeniaikaan, jolloin mihinkään ei päässyt tekemään tutkimusta paikan päälle. Kyselyyn vastanneille tutkijoille se tarkoitti sitä, että tutkimuksen teko vaikeutui.

Tilanne heijastelee digitaalisten aineistojen kehittämistarvetta vastaamaan nykypäivän digitaalisen maailman vaatimuksiin. Vaikka kehittämisnopeus ei aina ylläkään nopeaan digiloikkaan, DAM-hanke ottaa osaa digitaalisten aineistojen kehittämisprosessiin erityisesti digi.kansalliskirjasto.fi -palvelun osalta. Kehittäminen palvelee myös muita kuin tutkijakäyttäjiä ja suuri yleisö pääsee hyötymään digitaalisiin aineistoihin tehtävistä parannuksista.

Tutkijalähtöisten palveluiden kehittäminen

Kansalliskirjasto pyrkii vahvistamaan asemaansa sekä digitaalisten aineistojen tarjoajana ja tutkimusyhteistyön partnerina suunnitteilla olevissa uusissa tutkimuksen palveluissa. Tutkijoita haastatellaan syksyn aikana ja meneillään olevaa tutkimusyhteistyötä havainnoidaan, jotta palveluita voitaisiin kehittää tutkijoiden todellisten tarpeiden suuntaan. Tavoitteena on käyttäjälähtöinen palveluiden kehittäminen.

Hanketta rahoittaa EAKR

DAM-hanke on Euroopan aluekehitysrahaston rahoittama hanke, jota toteutetaan yhdessä Kaakkois-Suomen ammattikorkeakoulun (Xamk) kanssa. Hanke käynnistyi syksyllä 2019 ja jatkuu syyskuun 2021 loppuun asti.

Lisätietoa hankkeesta ja kyselystä

Liisa Näpärä
Suunnittelija
Digitaalinen avoin muisti -hanke
liisa.napara@helsinki.fi

 

 

Digitaalisten aineistojen sanomalehtihakemiston historiasta

Kirjoittajana Heikki Kokko, FT, Tutkijatohtori Tampereen yliopisto

“Kirjoittaminen pääkaupungin lehtien tavattoman isoista nidoksista edellyttää kirjoittajattarelle paitsi ennen tarpeellisiksi huomattuja ominaisuuksia lisäksi määrän ruumiillista voimanponnistusta. ”

Näin kertoi vuonna 1902 Suomen sanomalehtihakemiston alkuperäistä kokoamistyöstä hankkeen työnjohtajana toiminut maisteri H. J. Heikel. Suomen sanomalehdistöä vuodesta 1771 vuoteen 1890 jäsentänyt projekti oli tuolloin ollut käynnissä jo kaksitoista vuotta ja edennyt kronologisesti 1770-luvulta 1880-luvulle. Hankkeen käytännön työn tekivät projektiin palkatut naiset, jotka kävivät sanomalehtien vuosikertoja läpi kirjoittaen jokaisesta löytämästään artikkelista pahvikortin, jossa oli sanomalehden viittaustiedot ja selitettiin kirjoituksen sisällys. Heikelin sitaatti kuvaa siirtymää 1870-luvulta 1880-luvulle, jolloin sanomalehtivuosikertojen kokonaismäärä ja fyysinen koko kasvoivat nopeasti. Painoteknisistä syistä sanomalehtien sivumäärää ei juuri voitu lisätä, joten kasvu toteutettiin lehtien ilmestymistä tihentämällä sekä sivujen kokoa suurentamalla. Raskaiden vuosikertaniteiden päivästä toiseen jatkunut kääntely teki Heikelin kuvauksen mukaisesti jo ennestään henkistä tarkkaavaisuutta vaativasta työstä myös ruumiillisesti rasittavaa.

Kortistolaatikko (kuvaaja Ilona Fors)

Nyt 2000-luvulla suuria nidoksia käännelleiden ja niistä tietoja käsin kirjoittaneiden avustajien työ on osittain kaikkien saatavissa Kansalliskirjaston digitaalisten aineistoista kohdasta Artikkelihakemisto [https://digi.kansalliskirjasto.fi/sanomalehti/directory], joka tarjoaa portin niin 1800-luvun suomalaisen yhteiskunnan menneisyyteen kuin eri alueiden paikallishistoriaan. Nykyisessä muodossaan hakemisto myös sisältää suorat linkit Kansalliskirjaston digitaalisten aineistojen sanomalehtiin, joissa artikkeleita voi lukea alkuperäisessä asussaan.

Artikkelihakemistolla on pitkä ja moninainen historiansa, jonka ymmärtäminen auttaa myös käsittämään sen sisältämiä valintoja ja luokitteluja. Sen kokoaminen alkoi vuonna 1890 Svenska litteratursällskapetin aloitteesta. Mukaan lähti Suomen tiedeseura, Suomen Kirjallisuuden Seura, Suomen Historiallinen Seura, Suomen Maantieteellinen Seura, Societas pro Fauna & Flora Fennica, Suomalais-Ugrilainen Seura ja Suomen muinaismuistoyhdistys. Näiden seurojen ja yhdistysten jäsenistöjen keskuudesta valittiin Sanomalehtikirjallisuuden neuvottelukunta, joka ohjasi projektia.

Valtionarkistonhoitaja, filosofian tohtori Reinhold Hausen (Museoviraston kuvakokoelmat)

Hakemiston alkuperäinen esikuva oli saksalaisen historioitsija Eduard Winkelmannin 1800-luvun loppupuolella kokoama Bibliotheca Livoniae historica, joka oli Baltiaa koskeva järjestelmällinen hakemisto painetuista lähteistä. Winkelmanin hakemisto oli historiallis-maantieteellinen, mutta suomalaisen hakemiston oli tarkoitus kattaa kaikki tieteenalat. Hakemiston tarkoitus oli alun perin kerätä 1. kaikki Suomessa painetut itsenäiset kirjoitukset, 2. kaikki suomalaisten henkilöiden ulkomailla painamat kirjoitukset ja 3.  ulkomailla painetut Suomea koskevat kirjoitukset. Hankkeen kuluessa tähän tehtävään tehtiin rajauksia niin, että lopputuloksena oli suomalaista, niin suomen- kuin ruotsinkielistä lehdistöä koskeva hakemisto. Sanomalehtihakemistosta jätettiin ulos erilaisia sen luokitteluun kuulumattomiksi katsottuja kirjoituksia.  Pois jäivät esimerkiksi monet 1800-luvun lehdistössä suositut dialogimuotoiset asia-aiheita käsitelleet kertomukset kuten myös ulkomaanuutiset sekä erilaiset pikku-uutiset.

Käsinkirjoitettu kortti (kuvaaja Ilona Fors)

Hakemiston kokoamisen urakka oli valtava ja lehdistön läpikäymisessä vuodesta 1770 vuoteen 1890 meni lopulta kaikkiaan miltei kaksikymmentä vuotta. Hankkeen onnistumisessa auttoi se, että mukana oli merkkimiehiä eri tieteellisten seurojen kautta. Hankkeen johtoryhmässä mukana olivat eri vaiheissa muun muassa eri tiedealojen edustajina mm. J. R. Aspelin, E. N. Setälä, V. Vasenius, J. J. Tikkanen ja K. Grotenfelt. Eri tieteellisten seurojen ja niiden akateemisesti meritoituneiden miesten mukanaolo epäilemättä oli avuksi siinä, että Suomen valtion ja Helsingin yliopisto rahoittivat pitkän hankkeen alusta loppuun.

Hankkeen käytännön työ oli oman aikansa tavalla voimakkaasti sukupuolittunut, sillä itse projektin suurimman työn tehneet palkatut avustajat olivat kaikki naisia. Mukana olivat eri aikoina rouvat Zelma Lindh ja T. Swahn sekä neidit M. Casen, Aina Gebhard, T. Gripenberg, Fredrika Heikel, M. Heikel, D. Holm, Thyra von Knorring, Hilja Kumlin, Agda Nordström ja Elsa Palmroth. Useat heistä olivat varhaisia naisyliopisto-opiskelijoita.

Zelma Lindh, Merimiehen ystäwä : Suomen merimieslähetystoimen lehti, 01.12.1914, nro 12, s. 5 http://digi.kansalliskirjasto.fi/aikakausi/binding/992007/articles/2251617?page=5 Kansalliskirjaston Digitoidut aineistot

Hankkeen työtä johtivat työnjohtajat, jotka olivat vapaaherra T. Carpelan, maisterit Z. Castrén, H. J. Heikel, A. Hästesko sekä avustavana työnjohtajana rouva Agda Nordström. Heidän tehtävänsä oli pitää silmällä hakemiston luokittelua ja jäsennystä. Työ ei ollut yksinkertainen, sillä lehdistön kokonaismäärä nousi voimakkaasti 1800-luvun loppupuolella. Tämän vuoksi hakemiston jäsennystä muutettiin moneen kertaan miltei kahdenkymmenen vuoden työn aikana.

Lopulta vuonna 1909 työ oli valmis. Koossa oli tuolloin yli 600 000 lipuketta, jotka olivat järjestettyinä 156: een kortistolaatikkoon. Hakemiston lopullinen jäsennys jakautui kahteen pääluokkaan, yleiseen osaan, jossa oli 70 laatikkoa ja noin 220 000 lipuketta sekä topografiseen osaan, jossa oli luetteloitu artikkelit niihin liittyvien paikkakuntien tai maakuntien mukaan, 86 laatikkoa ja noin 380 000 lipuketta. Kortisto sijoitettiin Helsingin yliopiston kirjastoon eli nykyiseen Kansalliskirjastoon.

Vuonna 1910 hankkeen loppuraportin kirjoittanut johtoryhmän jäsen, historioitsija ja valtionarkistonhoitaja Reinhold Hausen toivoi, että projekti saisi jossain muodossa jatkoa, koska aikakaudella vuodesta 1890 eteenpäin oli hänen mielestään ollut Suomelle tavattoman suuri merkitys. Samaa toivottiin myös yleisesti ajan lehdistössä.

Sanomalehtihakemiston kortistolappujen määrä aikakausittain

Hakemiston kehittäminen sai kuin saikin jatkoa, mutta ei ehkä tavalla, jota Hausen olisi voinut aavistaa. Alun perin käsin kirjoitettua kortistoa on kirjoitettu kirjoituskoneella puhtaaksi vuosikymmenien ajan kuitenkin niin, että vuonna 1990 siitä oli vielä osa kirjoittamatta. Puhtaaksi kirjoitettuja lipukkeita puolestaan on mikrokuvattu korteille vuonna 1975. Vuonna 1990 puhtaaksi kirjoitetusta hakemistosta julkaistiin sen mikrofilmattuja osioita koskeva asiasanahakemisto Suomen sanomalehtihakemisto.  Tässä muodossaan Sanomalehtihakemisto toimi pitkään lähes ainoana porttina 1800-luvun suomalaiseen lehdistöön, sillä itse vuosikerrat olivat tämän vuosituhannen alkuun saakka olemassa suurina alkuperäisniteinä tai hankalasti selattavina mikrofilmeinä. Sanomalehtihakemiston ansiosta oli mahdollista jäsentää tätä laajaa aineistoa.

2000-luvulla puolestaan puhtaaksi kirjoitettuja kortteja on digitoitu internetiin nykyiseen Artikkelihakemisto -palveluun, jonka myötä se ja digitaalinen sanomalehtikirjasto toimivat saumattomasti yhdessä. Aikaisemmin tutkijan oli etsittävä hakemistosta ensin haluamansa ja siirtyä sitten yleensä mikrofilmattujen sanomalehtivuosikertojen pariin. Nyt tätä hankalaa siirtymää ei tarvitse tehdä, vaan tie alkuperäislähteille käy suoraan digitaalisen hakemiston kautta.

Digi.kansalliskirjasto.fi artikkelihakemisto

Eri aikojen erilaiset tiedon tallennusmuodot käsikirjoituksesta konekirjoitukseen sekä mikrofilmauksesta digitointiin ovat kuitenkin jättäneet jälkensä Artikkelihakemiston koostumukseen ja myös sen jäsennystapaan. Nykyinen verkossa oleva hakemisto ei sisällä koko vuosina 1890–1909 koottua 600 000 lipukkeen kortistoa. Tämä johtuu todennäköisesti siitä, että alkuperäistä kortistoa ei ole kokonaan puhtaaksikirjoitettu muotoon, josta se voitaisiin digitoida. Alun perin myös hakemiston jäsennys jakaantui kahteen haaraan: Yleiseen ja Topografiseen pääosioihin. Vuoden 1990 asiasanahakemistossa näiden kahden rinnalle oli nostettu kolmanneksi päähaaraksi henkilöihin viitteitä sisältävä Biographica, joka aikaisemmin oli osa hakemiston yleistä osiota. 2000-luvun digitaalisessa versiossa alkuperäisen jäsennyksen tilalla päähakemistossa on kaksikymmentä eri osiota.

Artikkelihakemisto ei ole alun perinkään ollut täydellinen luettelo sanomalehdissä julkaistuista teksteistä, mutta sellaisenaankin se on yhä ainutlaatuinen portti historiallisten sanomalehtiaineistojen pariin. Erityisen tärkeä artikkelihakemisto on ollut historiantutkimukselle. Ennen digitaalista aikaa se oli miltei ainoa keino sanomalehdistöaineiston löytämiseksi ja jäsentämiseksi. Nykyään artikkelihakemisto puolestaan toimii digitoidun lehdistöaineiston hakuominaisuuksien tärkeänä tukena. Tämän vuoksi olisi erittäin suotavaa, että alkuperäinen kortisto saataisiin kokonaisuudessaan digitaaliseen muotoon ja verkkoon kaikkien ulottuville. Samalla kortiston jäsennys tulisi palauttaa alkuperäiseen muotoonsa, sillä itsessään se on vähintään yhtä paljon Suomen 1800-lukua koskeva tiedonlähde kuin kuva sen syntyhetken tavasta ajatella ja luokitella asioita eri kategorioihin. Hakemisto pitäisi esittää oman aikansa luokitusten kontekstissa, sillä silloin sen välittämä tietokin asettuisi omaan historialliseen kontekstiinsa. Tällöin hakemiston kortteja käsin kirjoittaneiden naisten henkiset ja fyysiset ponnistukset valtavien lehtinidosten ääressä sekä työnjohtajien hakemiston luokituksia koskeva jäsennystyö olisivat omalla tavallaan läsnä myös tässä digitaalisessa ajassa.

 

Lähteitä

Autio Veli-Matti, Ylioppilasmatrikkeli 1853-1899. Verkkojulkaisu [https://ylioppilasmatrikkeli.helsinki.fi/1853-1899/]. Luettu 26.6.2017.

Hausen, Reinhold: Återblick på arbetet vidkommande ”Uppslagsverket” över den sedan äldsta tid intill år 1891 i Finland utkomna tidningslitteratur. Förhandlingar och Uppsatser 29 1909. Helsingfors 1910. 221–229.

Hästesko, Albert: Till Delegationen för Uppslagsverket. Förhandlingar och Uppsatser 29 1909. Helsingfors 1910. 230–231.

Kansalliskirjaston digitoitujen aineistojen artikkelihakemisto [https://digi.kansalliskirjasto.fi/sanomalehti/directory]

Suomea koskevan kirjallisuuden hakemisto. Päivälehti no. 19, 24.1.1902 [https://digi.kansalliskirjasto.fi/sanomalehti/binding/673659?page=3]

Suomen sanomalehtihakemisto = Finsk tidningsindex : 1771-1890. Filmikorttien hakemistot = Index på mikrofiche. Helsingin yliopisto 1990.