Tiedonhaun tekniikat

Tiedonhaussa hakusanoja yhdistetään hakulauseiksi. Tiedonhakutekniikan hallinta edellyttää, että tunnet:

  • hakulauseet ja Boolen operaattorit
  • hakusanan katkaisemisen
  • fraasihaun
  • hakualueen rajaamisen.

Hakulauseet ja Boolen operaattorit

Voit yhdistellä löytämiäsi hakusanoja hakulauseiksi, jos et pysty kuvaamaan hakuaihetta yhdellä sanalla. Yhdistäminen tapahtuu Boolen operaattoreilla AND, OR ja NOT. Operaattorit kannattaa kirjoittaa isoilla kirjaimilla, sillä kaikki tietokannat eivät tunnista pienillä kirjaimilla kirjoitettuja operaattoreita.

AND-operaattoria käytetään kun halutaan, että kaikki käytetyt hakusanat esiintyvät hakutuloksessa. Operaattorilla on siten hakutulosta rajaava vaikutus.

Esimerkki: Tarvitset julkaisuja, joissa käsitellään suklaan terveysvaikutuksia. Hakulause ”suklaa AND terveys” tuottaa tulokseksi kaikki ne julkaisut, joissa esiintyy sana ”suklaa” sekä sana ”terveys”. Tämä voidaan esittää kuvana:

AND-operaattori (suklaa AND terveys)

  • Suklaa-sanalla merkitty ympyrä (keltainen ja vihreä) sisältää se julkaisut, joissa on sana ”suklaa”.
  • Terveys-sanalla merkitty ympyrä (sininen ja vihreä) sisältää ne julkaisut, joissa on sana ”terveys”.
  • ”Suklaa AND terveys” haun hakutulokseen saadaan AND-sanalla merkitty vihreä alue.
  • AND-operaattorin voi jättää usein myös kirjoittamatta, jos  tietokannassa AND on oletusoperaattorina. Tällöin esimerkiksi hakusuklaa terveysvastaa hakuasuklaa AND terveys”.

OR-operaattoria käytetään, kun halutaan, että joku käytetyistä hakusanoista esiintyy hakutuloksessa. Operaattorilla on hakutulosta laajentava vaikutus.

Esimerkki: Tarvitset lisää tietoa suklaan terveysvaikutuksista ja edellisen esimerkin hakulauseella löytyi liian vähän julkaisuja. Voisi siis olla hyödyllistä etsiä julkaisuja myös muilla kielillä. Sellaisia löydät haulla ”suklaa OR chocolate”. Hakutulos sisältää kaikki ne julkaisut, joissa esiintyy joko sana ”suklaa” tai sana ”chocolate” – joukossa on tietysti myös niitä, joissa on molemmat. Sama kuvana:

OR-operaattori (suklaa OR chocolate)

  • Suklaa-sanalla merkitty ympyrä sisältää ne julkaisut, joissa on sana ”suklaa”.
  • Chocolate-sanalla merkitty ympyrä sisältää ne julkaisut, joissa on sana ”chocolate”.
  • ”Suklaa OR chocolate” haun hakutulokseen saadaan sanoilla suklaa, OR ja chocolate merkityt alueet.

NOT-operaattoria käytetään, kun halutaan, että tietty sana ei esiinny hakutuloksessa. Operaattorin käytössä on oltava varovainen, sillä samalla voi sulkea pois paljon käyttökelpoista aineistoa.

Esimerkki: Tarvitset edelleen tietoa suklaan terveysvaikutuksista, mutta olet jo löytänyt tarpeeksi painonnousua käsitteleviä artikkeleita. Haku ”terveys NOT painonnousu” tuottaa tulokseksi kaikki ne julkaisut, joissa esiintyy sana ”terveys” mutta ei sanaa ”painonnousu”. Sama kuvana:

NOT-operaattori (terveys NOT painonnousu)

  • Terveys-sanalla merkitty alue (vihreä ympyrä ja siitä pois leikattu sininen pala) sisältävät ne julkaisut, joissa on sana ”terveys”.
  • Painonnousu-sanalla merkitty ympyrä (sininen) sisältää ne julkaisut, joissa on sana ”painonnousu”.
  • ”Terveys NOT painonnousu” haun hakutulokseen saadaan vihreä osa terveys-sanalla merkitystä ympyrästä (vihreä).

Operaattoreiden käyttö

Voit käyttää operaattoreita erityyppisissä tietokannoissa: kirjastojen kokoelmatietokannoissa, erilaisissa viitetieto- ja kokotekstitietokannoissa ja verkon hakupalveluissa. Eri hakuohjelmissa saatetaan käyttää operaattoreista eri nimityksiä: loogiset operaattorit, Boolen logiikka tai hakukomennot. Operaattorit voidaan myös ilmaista eri tavoin: luonnollisen kielen sanoin (esimerkiksi JA, AND), tai erilaisin merkein (esimerkiksi +, &).

Hakulauseessa on syytä käyttää sulkumerkkejä () selventämään hakuehtoa mm. silloin, kun haussa käytetään useampaa eri operaattoria. Hakuohjelma hakee ensin sulkujen sisällä olevat hakulauseet ja yhdistää vasta tämän jälkeen sulkulauseet toisiinsa.

Esimerkki: Tarvitset tietoa suklaan terveysvaikutuksista. Haku

(suklaa OR chocolate) AND (terveys OR health)

tuottaa tulokseksi julkaisuja, joissa esiintyy vähintään yksi sanoista ”suklaa” tai ”chocolate” ja sen lisäksi ainakin yksi sanoista ”terveys” tai ”health”.

Hakusanan katkaiseminen

Hakusanoista kannattaa jättää pois ainakin sanojen taivutuspäätteet: tätä tekniikkaa kutsutaan hakusanojen katkaisemiseksi. Ilman katkaisua hakutuloksesta voi jäädä osa pois, koska valtaosa hakuohjelmista etsii hakusanoja täsmälleen kirjoittamassasi muodossa. Hakusanojen katkaisu on tärkeää mm. haettaessa tietoa suomen kielellä, jossa on runsaasti taivutusmuotoja.

Katkaisu merkitään nk. katkaisumerkillä. Yleisimmin katkaisumerkkinä käytetään *-merkkiä (myös ?, # tai $). Yhden tai useamman merkin korvaus on usein mahdollista myös hakusanan keskellä erilaisten kirjoitusmuotojen vuoksi. Koska eri tietokannoissa käytetään eri katkaisu- ja korvausmerkkejä, tarkista käytössäsi olevat merkit ja niiden käyttötavat ao. tietokannasta: esimerkiksi Helkan haussa katkaisuun käytetään *-merkkiä.

Yleisiä esimerkkejä katkaisumerkkien käytöstä:

  • markkin* (saat hakuun mukaan mm. sanat: markkinat, markkinointi, markkinoinnin, markkinoinnista)
  • organi$ation (organisation tai organization)
  • ?liäänikone (aliäänikone, yliäänikone)

Harkitse aina, mistä kohdasta katkaiset hakusanan. Vaarana on, että sana lyhenee liikaa, jolloin kysely tavoittaa sellaisiakin sanoja, joita et halua mukaan. Esimerkiksi hakusana emu* tuottaa seuraavia hakutuloksia: ”emun”, ”emuun”, ”emulaatio”, ”emulsio” jne. Huomaa lisäksi, että esimerkiksi Google-hakuohjelmassa hakusanojen katkaisu ei ole lainkaan käytössä!

Fraasihaku

Kun käytät useampia hakusanoja tavanomaisessa sanahaussa, hakusanojen esiintymispaikalla ei ole merkitystä: esimerkiksi hakulause

aku ankka

voisi löytää viitteen tai sivun, jossa Aku Pizarro -niminen henkilö kertoo herkullisen Canneton à l’Orange -ankkareseptinsä.

Fraasihaussa hakuohjelma sen sijaan etsii hakulauseen merkkijonoa juuri siinä järjestyksessä, kuin sinä sen kirjoitat. Fraasi kirjoitetaan tavallisesti lainausmerkkeihin, jolloin esimerkiksi

”tieteellinen kirjoittaminen”
”gekkojen lisääntyminen”
”Seitsemän veljestä”

tuottavat hakufraasia vastaavan hakutuloksen. Fraasihaku on käyttökelpoinen etenkin kokotekstitietokannoissa ja verkkohauissa.

Esimerkki fraasihausta Eric-tietokannassa: Kun etsit esimerkiksi kirjaa Positive education, käytä haussa lainausmerkkejä.

Eric-tietokannan hakulaatikko. Fraasihaussa käytät lainausmerkkejä positive psychology ympärillä.

Hakualueen rajaaminen

Voit tarkentaa hakuehtoa myös rajaamalla hakualuetta. Tällöin osumatarkkuus kasvaa, koska julkaisut, jotka eivät täytä rajausehtoa, jäävät pois hakutuloksesta. Tavallisimmin hakua rajataan määrätylle aikavälille, kielen tai aineistotyypin mukaan.

Hakualue rajataan yleensä hakulomakkeella tai hakutulossivulla, jossa voit valita esimerkiksi sen, mihin tietokannan kenttään rajaus kohdistetaan.

Katso video hakulauseiden muodostamisesta ja Boolen operaattoreista. Videon kesto 1 min 52 s.