Digitalia’s and OKF’s microhistory project were happy to hear that our workshop concept was accepted to the Digital Humanities i Norden 2018 seminar. The workshop is titled: “Miniature histories – Digitized newspapers and cultural heritage assets as source for the local history” . The workshops are organized before the conference, so this session is on 6.3.2018 in Helsinki. Please reserve your calendar.

Details about the session will be shared at the beginning of next year. Do note that also workshop participants need to register themselves to the seminar.  Things we will can try hands-on, based on participant interest, for example:

  • searching and creating clippings from
  • utilizing page texts and capturing named entities from texts (for example using Finer tool) or tag clouds
  • adding data to WikiMedia with correct attributions
  • utilizing WikiMedia data in other systems (API, queries)

Let me know if you would like to do something specific with the digitized newspapers or if there are local history topics, which you are interested about. All ideas are welcomed – even if we cannot do everything in the workshop, we can work with them later on. We can think about some practical application prototypes that could be of interest for researchers and all.

Happy holidays for all, and see you in next year. 🙂

Mietteitä Joulukuusesta. Lähde: Joululehti, 01.01.1887, s. 1 Kansalliskirjaston Digitoidut aineistot


DH, collaborations, London

Also Digitalia researcher were present on seminar in London about digital humanism to refresh information across different parties of all the currently ongoing projects. Finnish Academy report of the event here . The Heldig centre of University of Helsinki was also well presented by presentations of professor Eero Hyvönen, but also the Citizen mindscapes, which research material is the suomi24 (online discussion forum) was presented. From the materials which use newspapers professor Hannu Salmi from University of Turku presented the COMHIS-project, about how news and their changes on 1640-1910.  In comparison, it was quite interesting to hear about King’s Digital Laboratory project, where the aim is to introduce children to history via a game.  Just now e.g. YLE just launched the Olivia17 game, where the idea is the same – to bring people of history closer to modern media consumers and maybe illustrate that some things are still the same.

Interesting were also the merges between the expert fields, e.g. conservation mixed with  3D imaging. This can be a way to gently manipulate the originals in severe format by taking digital images from several angles from the target materials.  IFLA also noted the digital preservation needs – the bits are also in danger and requires collaboration all around to get long-term solutions. Digital Preservation Society launched an international digital preservation day to be on 30.11. to be noted for first time this year.

All in all collaboration is needed both at the present and the future between digital humanities projects to find common solutions, which can be used all around. Platforms with open data and tools are useful, because they can be taken into use, and kick-start own development; and even if the tool is not directly suitable there might be parts that are.

KDK-hanke arvioitu vaikuttavaksi

Opetus- ja kulttuuriministeriön KDK (Kansallinen Digitaalinen Kirjasto)-hanke on saanut perusteellisen arvion, ja hanketta kaikkinensa arvioitsija piti onnistuneena laajojen haastattelujen ja käyttäjäkyselyjen myötä. Tiivistelmä tiedotteesta löytyy, OKM:n sivulta [2], josta löytyy myös koko raportti.

Ulkoisessa arvioinnissa tarkasteltiin hankkeen konkreettisia ja ei-aineellisia tuloksia ja verrattiin niitä eri kulttuurisektoreiden toiveisiin.Oltiinkin toiveikkaita että pitkällä tähtäimellä hyödyt voivat vielä kertautua, ja raportissa kommentointiinkin

“Kulttuurisen muistin” turvaaminen tuottaa kulttuurillia, sosiaalisia, toiminnallisia, toiminnallisia ja taloudellisia hyötyjä (s. 1)

kun lähdettiin siitä, kulttuuriperinnöön merkitys kuitenkin ajan myötä kasvaa yhteiskunnan eri alueilla, opetuksesta eteenpäin. Aina tutkimukseen edetessä onkin mahdollista löytää hyviä tutkimuskohteita tai sovellutuksia joilla voidaan luoda uutta.

Otava, 01.02.1917, nro 2, s. 22 Kansalliskirjaston Digitoidut aineistot


Avoin data ja tulevaisuus

Vasta julkaistussa vuoden 2016 digipuntarissa [1], jossa kyseltiin Mikkelin alueen yritysten avoimen datan käyttöä, olikin kiinnostavaa huomata, että noin 40% yrityksistä ei nähneetkään avointa dataa itselleen liiketoimintaa kasvattavaksi tai ylläpitäväksi. Tämänkin voi nähdä mahdollisuutena, sillä tällöin voi lähteä kehittämään palveluja ensin kiinnostuneiden kanssa ja miettiä mikä avoin data toimisi missäkin tilanteessa. Soveltuisiko kulttuuriperintödata tai olisiko parempi käyttää jotakin muuta julkisen sektorin data, josta visualisoinnit tai datan rikastaminen uniikein tavoin voisi kasvattaa käyttäjäkuntaa.


Vuosi 2018 on Euroopan laajuinen kulttuuriperinnön teemavuosi, jossa tavoitteena on saada eurooppalaiset arvostamaan kulttuuriperintöä ja näkemään sen voimavarana. Museovirasto kertoo teemavuoden kansalliseksi tavoitteeksi:

“Vuoden kansallisena tavoitteena on paitsi edistää osallisuutta ja osallistumista myös lisätä kulttuuriperinnön saavutettavuutta, saatavuutta (mukaan lukien digitaalista) sekä kulttuuriperinnön kestävää käyttöä.”

EU:n kulttuuriperintövuoden etusivulta onkin nähtävissä hankkeen yhteistyökumppanina mm. Europeana, joka aggregoi usean eri maan aineistoja, sieltä voi löytää mm. sanomalehtiaineistoa eri maista ja sieltä löytää mm. Kansalliskirjaston sanomalehtiä osana suurempaa eurooppalaista kulttuuriperintöä.



[1] Rajahonka M., (2017). Digipuntari 2016 : Raportti. , In: Xamk Kehittää 19, Kaakkois-Suomen ammattikorkeakoulu. URN:ISBN:978-952-344-032-6

[2] OKM (2017). KDK-hanke arvioitu onnistuneeksi ja vaikuttavaksi.


Heldig 2017 Summit

Also Digitalia was presented at the Heldig Summit on 18.10.2017 , where there was 85 presentations and bit over 230 participants from universities and cultural heritage organizations.

“Developing the Digital World Together”

Heldig director, professor Eero Hyvönen opens the summit by explaining Heldig basis and the growth both in personnel and the facebook group. A Digital Humanism forum is also formed for the life-long learning for the researchers, where online learning materials and MOOCs is being developed and if there is short tutorials to be shared they would be interested.

Session 1 was about researhcer use. Professor Hannu Toivonen explains the data science and how the master science master’s programme is focused. There is also Helsinki center for data science, as a multi-displinary field, which is coordinated by the Kumpula (more info at Data Science Msc->”Contact”). University of Helsinki has lots of interesting research like web-scale surveillance of the news media ( ) or , which is generating for eample R-environment for analysing text-based Suomi24 discussion forum data. Also everyone might have already about Citizen mindscapes, which was presented by telling about the unique interests of the researchers working in the collective. The future generation of digital humanists get onwards by learning, where one example is the introduction to open data science , which professor Hyvönen feels are important for DH and UH at large. Also the legal issues were taken presented by the LegalTechLab and  Growing Mind project, which has just got Academy of Finland funding (2018-2023) with regard to digitization of schools. FIN-CLARIN was there to describe its infrastructure for DH mentioning e.g. FIN-CLARIN corpora, 18 GW data in > 650 databases, which can be found via KieliPankki (both the corpora and the tools). The Bank of Finnish terminology in arts and science is also a unique research infrastructure, to be a continuous database for all research done in Finland.

The cultural heritage institutions role

After the 1st break National Library of Finland presented their services Finna (in a way as a metadata aggregator of several cultural heritage institutes), about ontologies and finally with the extensive newspaper collection, which is being used e.g. in Digitalia and Comhis projects. National Archives talked about (and mentioned about a seminar on 24.11.)

Kotus presented its materials via video, which is available online:

Then SKS presents the scholarly open access monographs at , to offer open access research books as well as Codices Fennici  . Elias Lönnrot letters online offers XML, and service as a whole aims for total shareability, so that anyone can use tools developed by the digital humanists, data can be downloaded by collection or as a whole.

On afternoon the rapid fire of presentations continued with CSC and Ministry of Finance presentation, where focus was in building up a common infrastructure, which also researchers could use. The senior researcher Toni Ryynänen from the Ruralia institute presented how the digitized newspapers from their full timeline can give insight on how specific discussions have evolved.


The Helsinki University library talk is about linked data, where demo was also available during the evening session. Https:// was mentioned as a data source, which was used as  , to create parallel corpora of having same text available in multiple languages, which in a way also visualizes differences, but also points where different language translations agree. Depart of Modern Languages of UH also showed examples how they had utilized Tensorflow for analyzing datasets, ending with result that speech and DH are a perfect match.

Researcher world

One theme of the summit was also the concern how to make complex world easier for the researchers. Mietta Liennes presented and the Mill , which take care of tool environment, and just with the CSC account it is possible to login and access to the resources, so that you can select data, and pick the tool, which can be run and after a while the results appear and can be viewed either in the user interface or downloaded to an excel file or shared to a colleague. Based on the brief run-through on the summit, definitely something a researchers should take a look!

Professor Timo Honkela was also present, talking about various fields, which digital humanities combine. His new book is now in printing and will be available soon, the hope is that the peace machine activities will lead to better lives onwards and even until  2117.

In digital Russia studies from the Aleksanteri Institute talked about Digi-Pravda and various ways digitalisation is visible. Daria Gritsenko also asked to anyone who is interested about Women in Tech, to check out their website at (Studies in Russian, Eurasian and Central European New Media). Professor Parvinen told about the mixed reality user laboratory. Next topics talked about networks of different types, talking about Aalto work with family research or social networks – what do the networks tell and why they have formed in such a way. Digital cultural history, Warsampo were also part of the presentation pool.

Besides Digitalia , also Comhis project was mentioned as one of the research cases who use digitized newspapers as source material.

Final thoughts

All in all, it seems that the digital humanism in Finland has a good network of people and let’s hope that there are possibilities to collaborate later on, too , at least when some initial glimpse to each others work has been got. Unique materials, unique methods and also unique ideas,  that will help current research but also work as an start for the next wave of data scientists or so called digihumanists, for whom there are own training programs also forming.

All of the materials presented can be found from the Heldig pages, and even more can be found via publications of each research team. Let’s see maybe next year if the summit reappears, it could beat its record of 85 presentations and aim higher to the even 100, there seem to be so much happening all around.







Kirjamessuilla digitaalisista aineistoista kertomassa

Kansalliskirjastolaisia kutsuttiin Turun kirjamessuille puhumaan digitalisaatiosta ja aineistojen avaamisen mahdollisuuksista. Paikalla oli yhteyspäällikkö Pirjo Karppinen ja allekirjoittanut. Yleisössä osallistujia oli noin 30, ja Jukola-salissa näytti olevan sekä kirjastojen ammattilaisia että muita messuvieraita.

Kyseisen osion ja myös Kansalliskirjaston esityksen voi löytää Kirjastokaistalta

Digitalia-projekti tuli esityksessä myös esille yhtenä luonnollisena osana digitaalisten aineistojen kehittämistä. Ja kuten Aart de Heer kysyikin lopussa, kuinka aineistojen käytettävyys varmistetaan, kun niitä tulee lisää ja lisää ja halutaan yhä helppokäyttöisempiä tapoja saada suuria aineistomääriä helposti käyttöön. Digitalia-projektihan on tässä yksi ratkaisu, sillä aineistojen laadun osalta, pohditaan myös kuinka aineistojen hakukäyttöä saisi paremmaksi. Jos Sinulla on ideoita, niin otathan toki yhteyttä esimerkiksi digin palautteen välityksellä ja kerrot ehdotuksesi.

Kiinnostavaa oli kuulla myös Varsinais-Suomen muisti hankkeesta, jossa oli muutamassa kirjastosta valikoitu ja digitoitu aineistoa, jotka sitten oli kuvailtu ja laitettu -palveluun. Yhteistä näytti olevan kaikille, että valitseminen oli vaikeaa, ja kirjastolaiset olivatkin joutuneet miettimään oman paikkakuntansa ydintä ja ylipäätään sitä mitä paikkakunnasta saisi uudenlaista kuvaa kiinnostuneille. Käyttäjämäärät digitaalisille aineistoille olivat olleet hyvät, johon kirjastoissa oltiin tyytyväisiä. Lisäksi kiinnostavia olivat kuulla tarinoita esineiden takaa, kuten esimerkiksi Turun kaupungin lainaajaluettelo vuodelta 1917, jossa lainaajan nimen ja osoitteen lisäksi löytyy myös henkilön ammatti.

Lähde: ( , s. 3)

Kirjamessut näytti olevan todella aktiiviset ja kävijöitä ehkä jopa enemmän kuin WorldConissa aiemmin syksyllä.

Kuten Suomen kirjastoseuran esityksen yhteydessä havaittiinkin, kirjasto on monien elämässä tärkeä tekijä, myös siksi on hyvä päästä juttusille erilaisten aineistojen tarvitsijoiden kanssa, koska antaa myös ajatuksia kuinka aineistoja voisi kehittää eteenpäin.