
Betrachtet man die Typen von Suchwerkzeugen im WWW, so lassen sich prinzipiell
zwei Formen unterscheiden: einerseits die manuell erstellten Verzeichnisse,
andererseits die algorithmischen Suchmaschinen in unterschiedlichen Ausprägungen.
Die algorithmischen Suchmaschinen lassen sich nach thematischen Gesichtspunkten
weiter in Universalsuchmaschinen, Spezialsuchmaschinen und Archivsuchmaschinen
unterteilen.
Universalsuchmaschinen kennen keine thematischen, geographischen oder sprachlichen
Grenzen. Ihr Ziel ist es - soweit möglich - das gesamte WWW zu erfassen.
Spezialsuchmaschinen hingegeben beschränken sich bewusst auf eine geographische
Region, auf einen Sprachraum oder ein einzelnes Thema bzw. Themengebiet (vgl.
Gelernter 2003). So durchsucht beispielsweise die Suchmaschine Scirus nur das
wissenschaftliche Web und die Inhalte des Verlags Elsevier (vgl. Medeiros 2002).
Bekannt geworden sind vor allem eigene Nachrichten-Suchmaschinen (Machill, Lewandowski
u. Karzauninkat 2005), die einen eigenen aktuellen Nachrichtenindex aus vorher
ausgewählten Websites erstellen.
Das Beispiel der Nachrichtensuchmaschinen verdeutlicht auch die zunehmende Integration
verschiedener Spezial-Indizes innerhalb einer (dem Nutzer bekannten) Suchoberfläche.
Suchmaschinen wie Google oder Yahoo bieten über sog. tabs („Reiter")
die Auswahl verschiedener Datenbestände wie eben Nachrichten, Verzeichnistreffern
oder Produkte an (vgl. Hock 2002).

Abb. 2.3. Übersicht gespeicherter Versionen einer Website auf www.archive.org
Weiterhin existieren Spezialsuchmaschinen, die sich auf einen oder mehrere
Dateitypen beschränken, beispielsweise auf die Suche nach Graphiken und
Bildern oder nach Videodateien.
Archivsuchmaschinen speichern gefundene Web-Seiten auf eigenen Rechnern ab,
um diese dauerhaft verfügbar zu machen. Ihr Ziel ist es im Gegensatz zu
den Universal- und Spezialsuchmaschinen nicht, ein Abbild des aktuellen WWW
zu liefern, sondern vielmehr dem Verschwinden von Dokumenten durch Veränderung
oder Löschung der URL entgegenzutreten (Kahle 1997). Neben verschiedenen
Projekten, die es sich zur Aufgabe gemacht haben, bestimmte Bereiche des Web
zu archivieren, gibt es mit dem Internet Archive eine Initiative, die potentiell
alle Web-Inhalte konservieren will. Webseiten werden in regelmäßigen
Abständen von den Crawlern abgesucht und können über die „Wayback
Machine“ in unterschiedlichen Versionen abgefragt werden. Dazu ist allerdings
die Eingabe einer bekannten URL erforderlich; eine umfassende Suchfunktion wie
bei anderen Suchmaschinen wird (bislang) nicht angeboten. Abbildung 2.3 zeigt
die Zugriffsmöglichkeiten auf unterschiedliche Versionen einer Webseite
am Beispiel der Startseite der Informationswissenschaft der Heinrich-Heine-Universität
Düsseldorf.
Wählt man eine Unterscheidung der Typen algorithmischer Suchmaschinen auf
technologischer Ebene, erfolgt die Unterscheidung in „klassische"
algorithmische Suchmaschinen, Meta-Suchmaschinen und Suchagenten.
„Klassische" algorithmische Suchmaschinen (im Folgenden schlicht
als „algorithmische Suchmaschinen" oder nur „Suchmaschinen"
bezeichnet) durchsuchen das Web automatisch und erfassen die gefundenen Dokumente
in einer eigenen Datenbank. Wird eine Suchanfrage an die Suchmaschine gestellt,
werden die Ergebnisse aus dieser Datenbank gewonnen und mittels eines Ranking-Algorithmus
in einer bestimmten Reihenfolge ausgegeben.
Meta-Suchmaschinen besitzen keine eigene Datenbank. Beim Abschicken einer Suchanfrage
wird diese an verschiedene andere Suchdienste (in der Regel algorithmische Suchmaschinen)
weitergeleitet. Die Ergebnisse, die von diesen Suchmaschinen zurückgegeben
werden, werden mittels eines eigenen Ranking-Algorithmus gelistet. Während
Meta-Suchmaschinen vor einigen Jahren noch zum Erreichen von Vollständigkeit
und zur Erhöhung des Recall als sinnvoll angesehen werden konnten (vgl.
Lawrence u. Giles 1998, 100; Lawrence u. Giles 1999, 108), können diese
Ziele heute eher von einzelnen algorithmischen Suchmaschinen oder der manuellen
Suche in mehreren Suchmaschinen nacheinander erreicht werden. Meta-Suchmaschinen
werten in der Regel nur die ersten von den Suchmaschinen zurückgegebenen
Trefferseiten aus, so dass die beiden oben genannten Ziele nicht erreicht werden.
Vielmehr dient diese Form der Suchmaschinen mittlerweile eher dem Zweck der
Demonstration neuer Suchmaschinen-Technologie. Da der Aufbau und die Pflege
einer eigenen Datenbank aufwendig und teuer sind, stellt sich die Frage, ob
es überhaupt lohnenswert ist, einen eigenen Index bereitzustellen (Seuss
2004). Insbesondere neue Anbieter gehen zunehmend dazu über, ihre Lösungen
als Meta-Suchmaschine aufzusetzen.
Suchagenten verfolgen einen anderen Ansatz als die anderen beiden bereits genannten
Typen. Hierbei handelt es sich um Programme, die der Nutzer auf seinem eigenen
Rechner installieren muss. Sie können Suchanfragen entweder wie Suchmaschinen
auf Anfrage hin (ad hoc) ausführen, wobei die abzufragende Suchmaschine
bzw. die abzufragenden Suchmaschinen ausgewählt werden können. Andererseits
ist es aber auch möglich, die Agenten mit regelmäßigen Suchanfragen
zu beauftragen, die in bestimmten Intervallen ausgeführt werden. Neue Ergebnisse
werden dem Nutzer angezeigt, die bereits bekannten Ergebnisse werden ausgeblendet.
Während algorithmische Suchmaschinen in der Regel also nur den Pull-Ansatz
bedienen, gehen die Agenten darüber hinaus und befriedigen auch den wiederkehrenden
Informationsbedarf (Push-Ansatz). Mittlerweile findet wenigstens zu einem Teil
eine Vermischung der beiden Ansätze bei Suchmaschinen statt, indem zum
Beispiel Google einen Alert-Service anbietet.
Als Sonderform der Suchwerkzeuge werden Portale betrachtet (Rösch 2001a,
Rösch 2001b). Dies ist darauf zurückzuführen, dass sich die heute
bestehenden (Such-)Portale teils aus Suchmaschinen oder Verzeichnissen entwickelt
haben (wie etwa Lycos und Yahoo) bzw. viele Suchmaschinen eine Zeit lang die
Strategie verfolgten, sich zum Portal zu wandeln, dies aber inzwischen wieder
aufgegeben haben (wie z.B. AltaVista). Heute populäre Portale besitzen
zwar durchweg eine Suchfunktion, diese fragt jedoch in der Regel keine eigene
Datenbank ab. Vielmehr werden die Suchanfragen von einem der großen Anbieter
bedient.