Sie sind hier: www.durchdenken.de > Dirk Lewandowski > Publikationen > Web Information Retrieval > 2.2 Formen der Suche im WWW
< 2.1 Suchmaschinen-Markt  |  Inhaltsverzeichnis  |  2.3 Aufbau algorithmischer Suchmaschinen >
2.2 Formen der Suche im WWW

Formen der Suche im WWW

Betrachtet man die Typen von Suchwerkzeugen im WWW, so lassen sich prinzipiell zwei Formen unterscheiden: einerseits die manuell erstellten Verzeichnisse, andererseits die algorithmischen Suchmaschinen in unterschiedlichen Ausprägungen.
Die algorithmischen Suchmaschinen lassen sich nach thematischen Gesichtspunkten weiter in Universalsuchmaschinen, Spezialsuchmaschinen und Archivsuchmaschinen unterteilen.
Universalsuchmaschinen kennen keine thematischen, geographischen oder sprachlichen Grenzen. Ihr Ziel ist es - soweit möglich - das gesamte WWW zu erfassen. Spezialsuchmaschinen hingegeben beschränken sich bewusst auf eine geographische Region, auf einen Sprachraum oder ein einzelnes Thema bzw. Themengebiet (vgl. Gelernter 2003). So durchsucht beispielsweise die Suchmaschine Scirus nur das wissenschaftliche Web und die Inhalte des Verlags Elsevier (vgl. Medeiros 2002). Bekannt geworden sind vor allem eigene Nachrichten-Suchmaschinen (Machill, Lewandowski u. Karzauninkat 2005), die einen eigenen aktuellen Nachrichtenindex aus vorher ausgewählten Websites erstellen.
Das Beispiel der Nachrichtensuchmaschinen verdeutlicht auch die zunehmende Integration verschiedener Spezial-Indizes innerhalb einer (dem Nutzer bekannten) Suchoberfläche. Suchmaschinen wie Google oder Yahoo bieten über sog. tabs („Reiter") die Auswahl verschiedener Datenbestände wie eben Nachrichten, Verzeichnistreffern oder Produkte an (vgl. Hock 2002).


Abb. 2.3. Übersicht gespeicherter Versionen einer Website auf www.archive.org

Weiterhin existieren Spezialsuchmaschinen, die sich auf einen oder mehrere Dateitypen beschränken, beispielsweise auf die Suche nach Graphiken und Bildern oder nach Videodateien.
Archivsuchmaschinen speichern gefundene Web-Seiten auf eigenen Rechnern ab, um diese dauerhaft verfügbar zu machen. Ihr Ziel ist es im Gegensatz zu den Universal- und Spezialsuchmaschinen nicht, ein Abbild des aktuellen WWW zu liefern, sondern vielmehr dem Verschwinden von Dokumenten durch Veränderung oder Löschung der URL entgegenzutreten (Kahle 1997). Neben verschiedenen Projekten, die es sich zur Aufgabe gemacht haben, bestimmte Bereiche des Web zu archivieren, gibt es mit dem Internet Archive eine Initiative, die potentiell alle Web-Inhalte konservieren will. Webseiten werden in regelmäßigen Abständen von den Crawlern abgesucht und können über die „Wayback Machine“ in unterschiedlichen Versionen abgefragt werden. Dazu ist allerdings die Eingabe einer bekannten URL erforderlich; eine umfassende Suchfunktion wie bei anderen Suchmaschinen wird (bislang) nicht angeboten. Abbildung 2.3 zeigt die Zugriffsmöglichkeiten auf unterschiedliche Versionen einer Webseite am Beispiel der Startseite der Informationswissenschaft der Heinrich-Heine-Universität Düsseldorf.
Wählt man eine Unterscheidung der Typen algorithmischer Suchmaschinen auf technologischer Ebene, erfolgt die Unterscheidung in „klassische" algorithmische Suchmaschinen, Meta-Suchmaschinen und Suchagenten.
„Klassische" algorithmische Suchmaschinen (im Folgenden schlicht als „algorithmische Suchmaschinen" oder nur „Suchmaschinen" bezeichnet) durchsuchen das Web automatisch und erfassen die gefundenen Dokumente in einer eigenen Datenbank. Wird eine Suchanfrage an die Suchmaschine gestellt, werden die Ergebnisse aus dieser Datenbank gewonnen und mittels eines Ranking-Algorithmus in einer bestimmten Reihenfolge ausgegeben.
Meta-Suchmaschinen besitzen keine eigene Datenbank. Beim Abschicken einer Suchanfrage wird diese an verschiedene andere Suchdienste (in der Regel algorithmische Suchmaschinen) weitergeleitet. Die Ergebnisse, die von diesen Suchmaschinen zurückgegeben werden, werden mittels eines eigenen Ranking-Algorithmus gelistet. Während Meta-Suchmaschinen vor einigen Jahren noch zum Erreichen von Vollständigkeit und zur Erhöhung des Recall als sinnvoll angesehen werden konnten (vgl. Lawrence u. Giles 1998, 100; Lawrence u. Giles 1999, 108), können diese Ziele heute eher von einzelnen algorithmischen Suchmaschinen oder der manuellen Suche in mehreren Suchmaschinen nacheinander erreicht werden. Meta-Suchmaschinen werten in der Regel nur die ersten von den Suchmaschinen zurückgegebenen Trefferseiten aus, so dass die beiden oben genannten Ziele nicht erreicht werden. Vielmehr dient diese Form der Suchmaschinen mittlerweile eher dem Zweck der Demonstration neuer Suchmaschinen-Technologie. Da der Aufbau und die Pflege einer eigenen Datenbank aufwendig und teuer sind, stellt sich die Frage, ob es überhaupt lohnenswert ist, einen eigenen Index bereitzustellen (Seuss 2004). Insbesondere neue Anbieter gehen zunehmend dazu über, ihre Lösungen als Meta-Suchmaschine aufzusetzen.
Suchagenten verfolgen einen anderen Ansatz als die anderen beiden bereits genannten Typen. Hierbei handelt es sich um Programme, die der Nutzer auf seinem eigenen Rechner installieren muss. Sie können Suchanfragen entweder wie Suchmaschinen auf Anfrage hin (ad hoc) ausführen, wobei die abzufragende Suchmaschine bzw. die abzufragenden Suchmaschinen ausgewählt werden können. Andererseits ist es aber auch möglich, die Agenten mit regelmäßigen Suchanfragen zu beauftragen, die in bestimmten Intervallen ausgeführt werden. Neue Ergebnisse werden dem Nutzer angezeigt, die bereits bekannten Ergebnisse werden ausgeblendet. Während algorithmische Suchmaschinen in der Regel also nur den Pull-Ansatz bedienen, gehen die Agenten darüber hinaus und befriedigen auch den wiederkehrenden Informationsbedarf (Push-Ansatz). Mittlerweile findet wenigstens zu einem Teil eine Vermischung der beiden Ansätze bei Suchmaschinen statt, indem zum Beispiel Google einen Alert-Service anbietet.
Als Sonderform der Suchwerkzeuge werden Portale betrachtet (Rösch 2001a, Rösch 2001b). Dies ist darauf zurückzuführen, dass sich die heute bestehenden (Such-)Portale teils aus Suchmaschinen oder Verzeichnissen entwickelt haben (wie etwa Lycos und Yahoo) bzw. viele Suchmaschinen eine Zeit lang die Strategie verfolgten, sich zum Portal zu wandeln, dies aber inzwischen wieder aufgegeben haben (wie z.B. AltaVista). Heute populäre Portale besitzen zwar durchweg eine Suchfunktion, diese fragt jedoch in der Regel keine eigene Datenbank ab. Vielmehr werden die Suchanfragen von einem der großen Anbieter bedient.

< 2.1 Suchmaschinen-Markt  |  Inhaltsverzeichnis  |  2.3 Aufbau algorithmischer Suchmaschinen >