Theodor Mommsen ja datan vallankumous

Theodor Mommsen (1817 – 1903) voi olla humanisteille tutumpi kuin monille muille. Mommsen nappasi Nobelin kirjallisuuspalkinnon vuonna 1902 magnum opuksellaan Römische Geschichte. 

Mutta miten 1800-luvun historiapainotteinen yleisnero liittyy digitaalisen tutkkimusdatan säilyttämisen ja jakamisen haasteisiin? Continue reading

Tutkimusdatan hallintaa Kööpenhaminassa

Kööpenhaminassa on meneillään Nordbibin* järjestämä konferenssi “Structural Frameworks for Open, Digital Research – Strategy, Policy, Infrastructure.” Allekirjoittaneen tilaisuuteen vei ennen kaikkea Tutkimuksen tietoaineistot -hanke, josta pian toivottavasti lisää.

Tutkimusdatan hyödyt ja kustannukset

Päivä alkoi Knowledge Exchangen seminaarilla, jossa käsiteltiin “aihetta, joita kaikki vihaavat”: tutkimusdatan kustannus- ja hyötylaskentaa. Viime aikoina asian parissa kylläkin on työskennelty vireästi. Kätevä lähtökohta eri projekteihin on täällä: wiki.opf-labs.org/display/CDP. Itse asiassa nyt heräisikin kysymys, onko erilaisia hankkeita jo liikaa – Kööpenhaminan lisäksi parin viikon sisällä on kaksikin muuta asiaa käsittelevää kokousta.  Continue reading

Verkkoarkistot hyötykäyttöön

Kansalliskirjasto on jo usean vuoden ajan kerännyt talteen suomalaisia verkkoaineistoja. Monet muut kansalliskirjastot – mutta eivät suinkaan kaikki – toimivat samoin. Siellä, missä tekijänoikeuslainsäädäntö, erityisesti fair use -ajattelu sen sallii, myös muut organisaatiot arkistoivat verkkosisältöjä eri tarkoituksiin. Kansainvälisen yhteistyön foorumi on International Internet Preservation Consortium IIPC, jonka yleiskokous on parhaillaan menossa Kongressin kirjastossa Washingtonissa. Ensimmäisenä päivänä pidettiin seminaari, jossa esiteltiin verkkoarkistojen erilaisia käyttötapoja. Continue reading

Julkisen hallinnon datan avoimuus: VVM:n työryhmä ehdottaa konkreettisia toimenpiteitä

Valtiovarainministeriö on julkaissut työryhmäraportin “Julkishallinnon tietoluovutusten periaatteet ja käytännöt“.  Asiasta on myös ministeriön tiedote.

Muun ohella raportti sisältää luonnoksen reksteritietojen yleisiksi käyttöehdoiksi. Siinä on myös ehdotus avoimen datan mallilisenssiksi. Se perustuu Creative Commons -lisenssiin.

Maksupolitiikasta raportti ehdottaa, että tiedoista perittäisiin korkeintaan nk. PSI-direktiivin mukaiset maksut. Direktiivi määrää, että maksujen tulee olla selkeitä ja  kustannuslähtöisiä; ne saavat kattaa ainoastaan tietojen tuottamisen ja jakelun kustannuksia sekä investoinnelle laskettavaa “kohtuullista tuottoa”.

Datan avoimuuden edistämiseksi työryhmä ehdottaa tietovarantojen parempaa kartoittamista ja arviointia. Lisäksi eri virastoilta edellytetään ennen kaikkea teknisiä kehittämistoimenpiteitä. Näitä olisivat mm. rajapintojen, aineistojen kuvailun ja käytön hallinnan parantaminen.

 

METS-formaatin sovellusohje valmistunut

Kansallinen digitaalinen kirjasto -hanke on määritellyt pitkäaikaissäilytykseen siirrettävän aineiston paketointi- eli niputustavan. Paketoinnissa käytetään METS-formaattia (http://www.loc.gov/standards/mets/). METSiin kyllä kannattaa tutustua, vaikkei KDK-hankkeessa olisikaan mukana. Se on saanut verraten hyvin ilmaa siipiensä alle ja saattaa muodostua tärkeäksi nimenomaan digitaalisten objektien siirtämisessä käytettävänä vaihtomuotona.

KDK-määritys on saatavilla sivulta http://www.kdk.fi/fi/pitkaaikaissailytys/maeaerittely-ja-dokumentit/145-kdkn-hallinnolliset-ja-rakenteelliset-metatiedot-ja-aineiston-paketointi. Tekninen mutta gelposti lähestyttävä METSin esittely on esim. Karin Bredenbergin esityksessä http://www.loc.gov/standards/mets/presentations/METS.ppt

Mikä on METS?

METS on XML:ään pohjautuva “rakenteisen nippuformaatin” standardi. Sen avulla listataan digitaalisen objektin osat eli erilliset tiedostot sekä  määritellään niiden keskinäiset suhteet. Suhde voi olla esimerkiksi digitoidun kirjan sivujen oikea järjestys; tallennetun www-sivuston tiedostojen linkitysten esitys; tai jotakin muuta.

Sen lisäksi METS-paketti sisältää sisällönkuvailun sekä muuta metadataa. Muu metadata on esimerkiksi teknistä ja hallinnollista (tiedostojen tekniset ominaisuudet, niiden omistussuhteet, käyttöoikeudet ja -rajoitukset jne.) METS ei itse määrittele mitään uusia metadatafromaatteja. Sen sijaan METSissä voi joko viitata olemassa olevien formaattien muoton puettuun metadataan; tai sisällyttää metadata itse XML-tiedostoon.

Continue reading

Säilytyskelpoiset tiedostomuodot määritelty

Kansallinen digitaalinen kirjasto -hankkeen pitkäaikaissäilytystyö on tuottanut tärkeän dokumentin: listan tiedostomuodoista, jotka soveltuvat pitkäaikaisesti säilytettäviksi. Dokumentti on osoitteessa http://www.kdk.fi/fi/pitkaaikaissailytys/maeaerittely-ja-dokumentit . Dokumentti määrittelee myös nk. siirtokelpoiset tiedostoformaatit. Ne ovat yleensä erittäin paljon käytettyjä formaatteja, joiden muuntamiseen säilytyskelpoiseen muotoon voidaan ajatella kehitettävän rutiiniprosesseja. Continue reading

Avoimuus on in

Brages Pressarkiv (Suomen ruotsinkielinen sanomalehtiarkisto) piti 26.10. seminaarin aiheesta “Digitala spår“. Puheenvuoron pitivät dosentti Isto Huvila, toimittajat Jens Finnäs ja Sofia Mirjamsdotter, blogien arkistoinnista lopputyön tehnyt Emil Sandin. Kiitos Yleisradion ja nykyaikaisen tekniikan, seminaari nähtiin suorana netissä ja on edelleen siellä katsottavissa: http://arenan.yle.fi/video/1320160023233. Nopean tiivistelmän aiheista voi katsoa tästä: http://prezi.com/1xsze-u9qjb5/digitala-spar-en-sammanfattning-av-m11i/.

Continue reading

Tutkijoille kysely elektronisten julkaisujen tarjonnasta

Linkki kyselyyn Kansallinen elektroninen kirjasto FinELib kyselee tutkijoilta tieteellisten julkaisujen tarjonnasta ja sen puutteista sekä elektronisten julkaisujen käyttöön liittyvistä ongelmista. Kysely on suunnattu FinELibin jäsenorganisaatioissa työskenteleville; FinELib-konsortio muodostuu suomalaisista yliopistoista, ammattikorkeakouluista, tutkimuslaitoksista ja yleisistä kirjastoista.

Kyselyn tuloksia käytetään sekä konsortiossa että sen jäsenorganisaatioissa parempien e-aineistopalvelujen kehittämisessä. Vastausaika päättyy 16.10.2011.

Lisätietoja: http://www.kansalliskirjasto.fi/kirjastoala/finelib/finelib_konsortio/hankkeet/kayttajakysely.html sekä Facebookista

eScience-konferenssi Helsingissä 29.-30.9.2011

Konferenssissa on kaksi rinnakkaisohjelmaa, joista toinen käsittelee vihreää tietotekniikkaa ja toinen tieteenteon tieto- ja viestinäteknologiaa eli eScienceä; viime mainittuun saadaan eri tieteenalojen näkökulmia, hankkeiden esittelyjä sekä tulevaisuuden haasteiden analyysia. Pääpuhujana on professori Carole Goble Manchesterin yliopistosta.

Tapahtuman järjestävät opetus- ja kulttuuriministeriö, liikenne- ja viestintäministeriö, CSC, Nordforsk ja Pohjoismaiden ministerineuvosto. Tapahtuman rekisteröitymisaika päättyy 16.9.2011. Lisätietoja ja rekisteröityminen: http://www.csc.fi/english/pages/escience/