2.12. – luukku 2, vuosi 1772

On 23.12.1772 Tidningar utgifne af et Sällskap i Åbo publishes a translation of  poem from Jonathan Swift on its front page, about instructions for old age:

Click the image the read the whole thing in Digi.

The original note page can be found here . To pick a couple :

6. Icke 20 gångor uprepa samma historie för samma personer

13. Tala litet, och aldrig om sig sielf . = = = Åter en swår Artickel.

original : Not to talk much, nor of my self.

16. Icke vara egensinnig och enwis. / Not to be positive or opiniative.

 

1.12. – luukku 1, vuosi 1771

30.11.1771

Ett experiment för textigenkänning

“Man kunde dubbel soktnad sparat,

Til Tempel, och til Håst och Magn,

Frörbudet skulle blott litet långre warat.

Roms fluga Råd ej kännes här igen;

Om det fin sak ståndaktigt drifwit,

Så hade hwar och en snart hemma sedt sin wånn, “

Aineistojen tallennus tutkimusdataksi

Huomioiden käyttötarkoituksen, tekijänoikeusasiat, aineistokohtaiset käyttöehdot ja digin yleiset käyttöehdot, on muutamia keinoja, miten digi.kansalliskirjasto.fi -palvelusta erilaisia aineistoja voi ottaa talteen, kun aineisto on käytettävissä yleisessä verkkokäytössä. Jos aineiston käyttöoikeus lakkaa, aineisto on käytettävissä vapaakappalekirjastojen kulttuuriperintötyöasemilla.

Perustoimintoina tarjolla

Jos tarve on yksittäiselle sivulle, voit tallentaa niteestä sivun omalle koneelle, tai ladata pdf-tiedoston koko niteestä. Tulostaa voi myös, huomaathan sivutoiminnosta ‘tulostus’ toiminnon.

Huomaathan, jos käytät tuoreempia aineistoja vapaakappaletyöasemilta ei saa digitaalisia kopioita, vaan siellä tulostus on tallennuksen tapa.

Digi näyttää myös jokaisesta sivusta sivukuvan, ja digitoinnin jälkikäsittelyssä automaattisesti tehdyn tekstin ja rakenteen tunnistuksen, jotka ovat saatavissa teksti- ja ALTO XML -muodossa.

Aineistopaketeissa suuret aineistomäärät

Avoimen datan hengessä digin sanoma- ja aikakauslehdistä on luotu myös valmiita laajoja aineistoja, kattaen kaikki kielet. Aineistopaketeissa käytössä on räätälöity XML tiedostomuoto, jossa sivukohtaisesti on lisätty tarvittava perusmetatieto, itse sivun rakenne ja vielä koko teksti yhdessä lohkossa.

Lisää tietoa aineistopaketeista löytyy Comhis-wikin puolelta.

Leikemerkinnät muistiinpanojen keräämiseen

Leikkeitä voi myös käyttää aineistojen valikoimiseksi ja tallentamiseksi. Leikkeet luotua niitä voi hakea ja katsoa omassa leikekirjassa ja perustiedot leikkeistä saa talletettua myös Exceliin.

Hakujen tallennukset

Digin hakutuloksista saa myös Excel-muotoisen tiedoston, maksimissaan 5000 hakutulosta, joten jos hakutuloksia haluaa tallentaa enemmän, tällöin kannattaa käyttää vuosiväliä auttamaan hakujoukon rajoituksessa.

 

Hakutulosten visualisointi (nk. graafinäkymä)

Hakutuloksista saa myös graafinäkymän joka suhteuttaa omaa etsittyä hakusanaa koko aineiston määrään.

kun graafinäkymä on valittu ja jokin hakusana annettu, ja graafinäkymän sanafrekvenssit on myös ladattavissa exceliin. Excelissä voi sitten kukin luoda haluamansa näköisiä visualisointeja.

Lisäksi on muutamia muita keinoja joista lisää myöhemmin. Kommentoi alle tai laita viestiä digin palautteisiin, jos olet löytänyt käteviä tapoja pitää löytöjä tallessa (selaimen kirjanmerkit, erityiset selaimen lisäosat (esim. Zotero)  jne.?  Missä muodossa haluaisit tallentaa aineistot ja mitä niillä tekisit?

Tekoäly Mikkeli-iltapäiväseminaari

Mikkelin tekoälyseminaarissa 11.10.2018  pääajatuksena oli näyttää alueelta olevia yrityksiä ja muita esimerkkejä, joilla havainnollistettiin kuinka tekoäly tai keinoäly on jo täällä. Näin Mikko Lampi avasi tapahtuman ja totta olikin, että mukanaolevissa yrityksissä oli jo valmiita käyttökohteita tekoälylle kuten esimerkiksi suositteluissa tai yksinkertaisessa chatbotissa, joka vastailee käyttäjän kysymyksiin verkkosivustolla. Valtionvarainministeriön esittelemässä esimerkissä taas kansalainen voisi saada vinkkejä arjen pulmiin, kuten vaikka kesätyöpaikan löytämiselle tai terveyssuosituksia tekoälyltä ennen ihmislääkärille menoa.

Tapahtumassa oli myös hyvää avauspuheenvuoro jossa käytiin läpi koneoppimisen eri lajeja ja kuinka tekniikka taustalla toimii. Perinteistä koneoppimisen kytkinanalogian avulla esitettiin, kuinka tekoälyssä pyrkimys on saada arvio, ennuste siitä kuinka todennäköisesti esimerkiksi kuvassa on tomaatti Vai kurpitsa. Tausta-algoritmin säätimillä tai piirteillä malli oppii kuinka oikeassa se on suhteessa annettuun validointiaineistoon. Kuitenkin hyvä on muistaa myös realiteetit, sillä kuten yhdessä esityksessä mainittiinkin, lähtödatan valinta muokkaaminen, saaminen oikeaan muotoon on työläin vaihe ja sillä on myös suurimmat seuraukset. Esimerkiksi voitaisiin arvailla, onko yksi viimeisimmästä nousseista tapauksista, eli Amazonin tekoälyratkaisu työnhakijoiden esivalintaan, opetettu puutteellisella datalla, vai onko kyse algoritmin säätimistä, joka johti siihen, että vanhoja päätöksiä toistettiin ja algoritmistä tulikin syrjivä. Tutkimuspuolella myös huoli mahdollisten kuinka koneoppimisessakin voi olla vikoja tai niitä voidaan aiheuttaakin, mikä johtaa vääriin lopputuloksiin.

Nuotti vai väliviiva sanomalehdessä?