Asiasanat: tiedonhaku, tiedonhakujärjestelmät, atk-ohjelmat, hakuohjelmat, Boolen algebra, ohjeet, Windows


Boolen hakujen rautalankamalli: Windowsin Find -toiminto


Mitä tehdä jos suuresta dokumenttijoukosta pitäisi tehdä haku, etsiä "juuri ne tietyt", mutta käytettävissä olevassa PC:ssä ei olekaan erillistä dokumentinhallinta- tai hakusovellusta? Yksi ratkaisu on imuroida ja asentaa jokin kätevän Shareware -ohjelma. Mutta entä jos kyseisellä koneella ei pääsekään Internetiin, tai koneelle ei saa, tai voi, asentaa mitään uusia sovelluksia? Ainoaksi mahdollisuudeksi jää tällöin Windowsin oma Find -toiminto, joka sentään on kaikissa Windows -koneissa.



Mitä Find-työkalulla voi etsiä


Windowsin Find -työkalulla voidaan tehdä hakuja kaikista Windows-dokumenteista (.doc, .rtf, .html jne.). Find:n avulla voidaan etsiä ne dokumentit joiden sisällössä (tekstissä) on haluttu merkkijono.


Find-työkalu käy yksitellen läpi kaikki halutut dokumentit ja tarkistaa onko dokumentissa etsittyä merkkijonoa. Käytännössä hakuja voi tehdä yli kolmen merkin pituisilla merkkijonoilla ja Boolen operaattorit AND ja OR saadaan käyttöön alihakemistojen avulla.

Find-työkalun avulla voidaan etsiä myös tiedostoja ja hakemistoja niiden nimen perusteella, mutta sitä ominaisuutta ei käsitellä tässä artikkelissa.



Find-työkalun sijainti


Find-työkalu sijaitsee kaikkien Windows -koneiden aloitusvalikossa:

Start - Find - Files or Folders...

Windows 2000 -koneissa se on nimellä Search, mutta se toimii samalla tavalla kuin Windows 95/98 -koneissa.



Hakujoukon määritteleminen


Ensimmäiseksi määritellään mihin hakemistoon haku kohdistetaan. Helpoimmin se käy hakemalla asianomainen hakemisto esiin Browse -painikkeen avulla. Muista laittaa tarvittaessa rasti kohtaan Include subfolders (tämä on myös oletusarvo).



Etsittävä merkkijono


Ota esiin Advanced -välilehti ja kirjoita etsittävä merkkijono Containing text -laatikkoon. Huomaa että katkaisumerkkiä ei ole, eikä tarvita, sillä merkkijono löytyy vaikka se olisi sanan sisällä!



Haun käynnistämien


Haku käynnistetään klikkaamalla Find now -painiketta. Haun ollessa käynnissä ikkunassa oleva suurennuslasin kuva liikkuu. Kun haku on valmis, kuva pysähtyy ja Find now -painikkeen väri muuttuu harmaasta takaisin mustaksi. Koska Find käy läpi kaikkien dokumenttien sisällön, haku voi kestää jopa kymmeniä minuutteja.



Hakutulosten katselu



Kuvan esimerkissä on etsitty dokumentit joissa esiintyy merkkijono "toimintasuunn".
Haun tuloksena saatuja tiedostoja voi käsitellä samalla tavalla kuin tiedostoja ikkunassa, joka aukeaa klikkaamalla My Computer -kuvaketta. Yksittäisen dokumentin saat avattua suoraan hakutulosluettelosta kaksoisklikkaamalla sitä. Voit myös tulostaa dokumentit suoraan paperille, vaikka kaikki kerralla:


Edit - Select All

File - Print


Huomaa: jos hakutuloslistassa on enemmän kuin kymmenkunta dokumenttia, kannattaa tulostus tehdä erissä jottei PC "jumiudu":


Klikkaa
ensimmäistä dokumenttia

Pidä Shift -näppäin pohjassa ja klikkaa tulostuserän viimeistä dokumenttia (10-15 dokumenttia on sopiva tulostuserän suuruus)

File - Print

Toista edelliset kohdat kunnes kaikki dokumentit on tulostettu.


Huomaa: kannattaa kirjoittaa vaikkapa paperilapulle tulostuserän viimeisen dokumentin nimi ennen tulostuksen käynnistämistä (Print:n klikkaamista). Tämä on varotoimenpide, josta on hyötyä jos tulostuksessa esiintyy jokin häiriö, ja joudut tulostamaan jonkin erän uudelleen.



Boolen "AND" -operaattorin käyttö


Boolen logiikan "AND" on helppo toteuttaa. Ensin luodaan apuhakemisto, tehdään haku ensimmäisellä hakusanalla ja kopioidaan kaikki dokumentit hakutulosikkunasta apuhakemistoon. Kaikkien dokumenttien kopiointi (
Varoitus: ole tarkkana että kopioit (Copy), etkä leikkaa (Cut) dokumentteja apuhakemistoon !):

(Find -ikkunassa) Edit - Select All

(Find -ikkunassa) Edit - Copy

(apuhakemistoikkunassa, esimerkiksi C:\apu-ikkunassa) Edit - Paste

Tämän jälkeen tehdään uusi haku toisella hakusanalla, sillä, joka halutaan yhdistää "AND":llä. Tällä kertaa haku kohdistetaan apuhakemiston sisältöön! Nyt saatu tulosjoukko sisältää dokumentit, joiden tekstissä esiintyy sekä ensimmäinen että toinen hakusana.



Boolen "OR" -operaattorin käyttö


"OR" -operaattori saadaan käyttöön samantyyppisellä operaatiolla: luodaan apuhakemisto, tehdään haku ensimmäisellä hakusanalla ja kopioidaan kaikki dokumentit hakutulosikkunasta apuhakemistoon.
Ja tälläkin kertaa: ole tarkkana että kopioit (Copy), etkä leikkaa (Cut) dokumentteja apuhakemistoon !
Tämän jälkeen tehdään haku toisella hakusanalla ja kopioidaan jälleen dokumentit hakutulosikkunasta apuhakemistoon (siis samaan apuhakemistoon kuin ensimmäisellä kerralla). Nyt apuhakemistossa olevat dokumentit sisältävät joko ensimmäisen tai toisen hakusanan.



Vinkkejä


- Tietoturvan takia on syytä muistaa seuraava: kun olet saanut haut tehtyä ja tulokset käsiteltyä, muista tuhota apuhakemistot sisältöineen. Muista sen jälkeen myös tyhjentää koneesi roskakori. Windowsin salasana ei suojaa koneesi kovalevyä, vaan sen sisältöön pääsee käsiksi kuka tahansa joka pääsee koneen äärelle!
- Hakujen tekeminen Find:lla vie järjestelmältä paljon resursseja. Pahimmassa tapauksessa saat lähiverkkonne palvelimen "tukkoon". Jos teet monta hakua tai hakusi ovat monimutkaisia (paljon hakusanoja), kannattaa harkita haun kohteena olevien dokumenttien kopioimista koneesi omalle kovalevylle (C:) sopivaan apuhakemistoon, ja hakujen kohdistamista siihen. Windows 2000:ssa tämä on mahdollista automatisoida (Advanced options - Search slow files) Ja taas: muista tuhota dokumentit hakujen tekemisen jälkeen.
- Jos käytät "AND"-operaatiota, tee haku ensin harvinaisemmalla sanalla - tämä säästää aikaa myöhemmissä vaiheissa.
Suurten ja pienten kirjaimien merkityksen eron haettavassa merkkijonossa saat kytkettyä päälle valitsemalla Options-valikosta kohdan Case sensitive.


Jaakko Anttila

Kirjoittaja toimii Information Managerina johdon suorahaku -yhtiössä


Artikkeli on alunperin julkaistu Tietopalvelu -lehden numerossa 1/2002, s.58. Työkalupakki -palstalla. Kyseisellä palstalla julkaistaan artikkeleita, joissa tietoammattilaiset esittelevät omia suosikkityökalujaan. Uudelleenjulkaistu Jaakko Anttilan kotisivuilla (http://koti.welho.com/janttil4/Index.html) 5.10.2003.

<<< TAKAISIN