Näin tarkastelet Suomi24-sisältöjä Korp-kielipankissa

Jos haluat helposti ja nopeasti tarkastella Suomi24-aineiston sisältöjä, onnistuu se CSC:n Korp-kielipankissa olevaa osa-aineistoa käyttäen. Tässä Krista Laguksen kirjoittamat ohjeet Korp-käyttöliittymän käyttöön:

1. Valitaan jokin sana tai sanan osa tarkastelun kohteeksi, esim. ”yksinäi” (+ rastitin näytä alkuosa, eli tilanteet jossa tuo on sanan alkuosa). Tuli reilut 10 000 osumaa.

Näkyvissä on nyt ”konkordanssimuoto” eli keskellä sana ja ympärillä pätkät sen lausekontekstia.

2. Pidemmän kontekstin (kappaletaso) saan näkyviin klikkaamalla oikealla ylhäällä olevaa ”Näytä konteksti”-linkkiä. Esim:

https://korp.csc.fi/#corpus=s24&page=0&search=word|yksin%C3%A4i&reading_mode=true

Näkyvissä on nyt ”kontekstimuoto”.

3. Seuraavat sivut osumatuloksia löytyvät ylhällä olevan sivunumeroinnin mukaisesti.

4. Voin ladata näkyvissä olevat osumat, eli sanat + niiden kieliopillisen analyysin, tai kunkin sanan lausekontekstin omalle koneelleni oikean alakulman linkistä ”Lataa tiedostona muodossa”.Siellä on valittavana useita eri vaihtoehtoja.

5. Jos haluan ladata itselleni kaikki nuo osumat, joudun tällä hetkellä käymään käsin läpi jokaisen noista sivuista erikseen klikkaamalla ja lataamalla. Tämä on työlästä mutta mahdollista. Samaten on mahdollista ohjelmoida skripti joka käy lataamassa kaikki nuo yksi kerrallaan.

6. Sanojen lukumääriä korpuksessa näkyy painonapista ”Tilasto”. Sen takaa löytyy linkki ”Näytä Trendikuvaajana” josta saa aikasarjakuvan osumista eri vuosina.

7. Lauserakenteiden (dependenssipuu) katselu. Voin katsoa kunkin yksittäisen sanaesiintymän lauseen rakennetta, eli missä suhteissa ja rooleissa sanat ovat toisiinsa. Klikkaan ensin valitsemani lauseen/sanan. Oikean puolen sivupalkissa alimpana on ”näytä dependenssipuu”, klikkaan tätä.