Tiedonhaun tekniikat

Tiedonhaussa hakusanoja yhdistetään hakulauseiksi. Tiedonhakutekniikan hallinta edellyttää, että tunnet:

  • hakulauseet ja Boolen operaattorit
  • hakusanan katkaisemisen
  • fraasihaun
  • hakualueen rajaamisen.

Hakulauseet ja Boolen operaattorit

Voit yhdistellä löytämiäsi hakusanoja hakulauseiksi, jos et pysty kuvaamaan hakuaihetta yhdellä sanalla. Yhdistäminen tapahtuu Boolen operaattoreilla AND, OR ja NOT.

AND -operaattori

AND -operaattoria käytetään kun halutaan, että kaikki käytetyt hakusanat esiintyvät hakutuloksessa. Operaattorilla on siten hakutulosta rajaava vaikutus.

Esimerkki: Tarvitset julkaisuja, joissa käsitellään suklaan terveysvaikutuksia. Hakulause “suklaa AND terveys” tuottaa tulokseksi kaikki ne julkaisut, joissa esiintyy sana “suklaa” sekä sana “terveys”. Tämä voidaan esittää kuvana:

4.2 AND

  • Suklaa-sanalla merkitty ympyrä (keltainen ja vihreä) sisältää se julkaisut, joissa on sana “suklaa”.
  • Terveys-sanalla merkitty ympyrä (sininen ja vihreä) sisältää ne julkaisut, joissa on sana “terveys”.
  • “Suklaa AND terveys” haun hakutulokseen saadaan AND-sanalla merkitty vihreä alue.

OR -operaattori

OR -operaattoria käytetään, kun halutaan, että joku käytetyistä hakusanoista esiintyy hakutuloksessa. Operaattorilla on hakutulosta laajentava vaikutus.

Esimerkki: Tarvitset lisää tietoa suklaan terveysvaikutuksista ja edellisen esimerkin hakulauseella löytyi liian vähän julkaisuja. Voisi siis olla hyödyllistä etsiä julkaisuja myös muilla kielillä. Sellaisia löydät haulla ”suklaa OR chocolate”. Hakutulos sisältää kaikki ne julkaisut, joissa esiintyy joko sana ”suklaa” tai sana ”chocolate” – joukossa on tietysti myös niitä, joissa on molemmat. Sama kuvana:

4.2 OR

  • Suklaa-sanalla merkitty ympyrä sisältää ne julkaisut, joissa on sana ”suklaa”.
  • Chocolate-sanalla merkitty ympyrä sisältää ne julkaisut, joissa on sana ”chocolate”.
  • ”Suklaa OR chocolate” haun hakutulokseen saadaan sanoilla suklaa, OR ja chocolate merkityt alueet.

NOT -operaattori

NOT -operaattoria käytetään, kun halutaan, että tietty sana ei esiinny hakutuloksessa. Operaattorin käytössä on oltava varovainen, sillä samalla voi sulkea pois paljon käyttökelpoista aineistoa.

Esimerkki: Tarvitset edelleen tietoa suklaan terveysvaikutuksista, mutta olet jo löytänyt tarpeeksi painonnousua käsitteleviä artikkeleita. Haku ”terveys NOT painonnousu” tuottaa tulokseksi kaikki ne julkaisut, joissa esiintyy sana ”terveys” mutta ei sanaa ”painonnousu”. Sama kuvana:

4.2 NOT

  • Terveys-sanalla merkitty alue (vihreä ympyrä ja siitä pois leikattu sininen pala) sisältävät ne julkaisut, joissa on sana ”terveys”.
  • Painonnousu-sanalla merkitty ympyrä (sininen) sisältää ne julkaisut, joissa on sana ”painonnousu”.
  • ”Terveys NOT painonnousu” haun hakutulokseen saadaan vihreä osa terveys-sanalla merkitystä ympyrästä (vihreä).

Operaattoreiden käyttö

Voit käyttää operaattoreita erityyppisissä tietokannoissa: kirjastojen kokoelmatietokannoissa, erilaisissa viitetieto- ja kokotekstitietokannoissa ja verkon hakupalveluissa. Eri hakuohjelmissa saatetaan käyttää operaattoreista eri nimityksiä: loogiset operaattorit, Boolen logiikka tai hakukomennot. Operaattorit voidaan myös ilmaista eri tavoin: luonnollisen kielen sanoin (esimerkiksi JA, AND), tai erilaisin merkein (esimerkiksi +, &).

Hakulauseessa on syytä käyttää sulkumerkkejä () selventämään hakuehtoa mm. silloin, kun haussa käytetään useampaa eri operaattoria. Hakuohjelma hakee ensin sulkujen sisällä olevat hakulauseet ja yhdistää vasta tämän jälkeen sulkulauseet toisiinsa.

Esimerkki: Tarvitset tietoa suklaan terveysvaikutuksista. Haku

(suklaa OR chocolate) AND (terveys OR health)

tuottaa tulokseksi julkaisuja, joissa esiintyy vähintään yksi sanoista “suklaa” tai “chocolate” ja sen lisäksi ainakin yksi sanoita “terveys” tai “health”.

Hakusanan katkaiseminen

Hakusanoista kannattaa jättää pois ainakin sanojen taivutuspäätteet: tätä tekniikkaa kutsutaan hakusanojen katkaisemiseksi. Ilman katkaisua hakutuloksesta voi jäädä osa pois, koska valtaosa hakuohjelmista etsii hakusanoja täsmälleen kirjoittamassasi muodossa. Hakusanojen katkaisu on tärkeää mm. haettaessa tietoa suomen kielellä, jossa on runsaasti taivutusmuotoja.

Katkaisu merkitään nk. katkaisumerkillä. Yleisimmin katkaisumerkkinä käytetään *-merkkiä (myös ?, # tai $). Yhden tai useamman merkin korvaus on usein mahdollista myös hakusanan keskellä erilaisten kirjoitusmuotojen vuoksi. Koska eri tietokannoissa käytetään eri katkaisu- ja korvausmerkkejä, tarkista käytössäsi olevat merkit ja niiden käyttötavat ao. tietokannasta: esimerkiksi Helkan haussa katkaisuun käytetään *-merkkiä.

Yleisiä esimerkkejä katkaisumerkkien käytöstä:

  • markkin* (saat hakuun mukaan mm. sanat: markkinat, markkinointi, markkinoinnin, markkinoinnista)
  • organi$ation (organisation tai organization)
  • ?liäänikone (aliäänikone, yliäänikone)

Harkitse aina, mistä kohdasta katkaiset hakusanan. Vaarana on, että sana lyhenee liikaa, jolloin kysely tavoittaa sellaisiakin sanoja, joita et halua mukaan. Esimerkiksi hakusana emu* tuottaa seuraavia hakutuloksia: ”emun”, ”emuun”, ”emulaatio”, ”emulsio” jne. Huomaa lisäksi, että esimerkiksi Google-hakuohjelmassa hakusanojen katkaisu ei ole lainkaan käytössä!

Fraasihaku

Kun käytät useampia hakusanoja tavanomaisessa sanahaussa, hakusanojen esiintymispaikalla ei ole merkitystä: esimerkiksi hakulause

aku ankka

voisi löytää viitteen tai sivun, jossa Aku Pizarro -niminen henkilö kertoo herkullisen Canneton à l’Orange -ankkareseptinsä.

Fraasihaussa hakuohjelma sen sijaan etsii hakulauseen merkkijonoa juuri siinä järjestyksessä, kuin sinä sen kirjoitat. Fraasi kirjoitetaan tavallisesti lainausmerkkeihin, jolloin esimerkiksi

”tieteellinen kirjoittaminen”
”gekkojen lisääntyminen”
”Seitsemän veljestä”

tuottavat hakufraasia vastaavan hakutuloksen. Fraasihaku on käyttökelpoinen etenkin kokotekstitietokannoissa ja verkkohauissa.

Esimerkki fraasihausta Helkan haussa: Kun etsit esimerkiksi kirjaa Positive psychology, käytä haussa lainausmerkkejä.

Helkan hakulaatikko

Hakualueen rajaaminen

Voit tarkentaa hakuehtoa myös rajaamalla hakualuetta. Tällöin osumatarkkuus kasvaa, koska julkaisut, jotka eivät täytä rajausehtoa, jäävät pois hakutuloksesta. Tavallisimmin hakua rajataan määrätylle aikavälille, kielen tai aineistotyypin mukaan.

Hakualue rajataan yleensä hakulomakkeella tai hakutulossivulla, jossa voit valita esimerkiksi sen, mihin tietokannan kenttään rajaus kohdistetaan.

Katso video: Tiedonhaun tekniikat