
In Kapitel 2.3 wurde bereits auf die typischen Angaben zu jedem Treffer, die
in der Trefferliste angezeigt werden, eingegangen. In der Regel sind dies der
Titel der Seite (<title>-Tag), eine Kurzbeschreibung, die Größe
in Kilobytes, ein Hinweis auf zwischengespeicherte Kopie und ähnliche Seiten
und ggf. das Datum der letzten Indexierung.
Mit den in den letzten Abschnitten beschriebenen Verfahren lassen sich die Dokumentbeschreibungen
in den Trefferlisten um weitere Angaben wie dem tatsächlichen Titel, Größe
in Wörtern und der Anzahl der im Text enthaltenen Abbildungen und Tabellen
ergänzen.
Zuletzt bleibt noch die Frage nach der bestmöglichen Zusammenfassung der
Dokumente in den Trefferlisten zu beantworten. Die Aufgabe der Ergebnisseiten
liegt auch in der Informationsverdichtung. Dem Nutzer soll es möglich sein,
schon aufgrund der in der Trefferliste enthaltenen Informationen die für
ihn passenden Treffer auswählen zu können. In den Trefferlisten ist
daher im Regelfall schon eine Zusammenfassung der gefundenen Dokumente enthalten.
Diese wird allerdings nicht – wie dies bei konventionellen Systemen üblich
ist – aus den bereits von den Autoren der Dokumente geschriebenen Abstracts
gewonnen, sondern kommt je nach Suchmaschine und Dokument auf unterschiedliche
Art zustande:
• Keywords in Context (KWIC): Die eingegebenen Suchbegriffe werden im
Kontext ihres Vorkommens im Dokument angezeigt. Dabei werden in der Regel einige
Wörter rund um das erste Vorkommen des Suchbegriffs angezeigt. In Abbildung
13.5 ist beim zweiten Treffer eine solche automatisch generierte „Beschreibung“
zu sehen. Der Vorteil dieser Anzeigeart liegt in der direkten Einsicht in das
Umfeld des Suchbegriffs. Allerdings wird die Anzeige mit einer zunehmenden Zahl
von Suchbegriffen unübersichtlicher. Außerdem geben die KWIC keine
Beschreibung des gesamten Inhalts des Dokuments ab, sondern präsentieren
nur einen kleinen Ausschnitt.
• Beschreibung aus den Metatags (META Description): Von vielen Suchmaschinen
wird zur Anzeige in den Trefferlisten die Beschreibung aus dem Metatag description
verwendet. Da diese Information vom Autor der Seite selbst kommt, ist jedoch
eine zusätzliche Überprüfung der Zuverlässigkeit nötig.
Beim ersten Treffer in Abb. 13.5 wird die Beschreibung aus dem Metatag verwendet.
• Beschreibung aus dritter Quelle: Beschreibungen aus externen Quellen,
vor allem aus Webverzeichnissen, werden für die Dokumentbeschreibung in
den Trefferlisten verwendet. Oft bieten sie eine prägnante Beschreibung;
der Nachteil liegt allerdings darin, dass sie in der Regel nur für Sites
erstellt werden und nicht für jedes einzelne Dokument verfügbar sind.
Die Verwendung dieser Beschreibungsmöglichkeiten wird von den Suchmaschinen
verschieden gehandhabt. Generell kann gesagt werden, dass die Beschreibung in
der Meta-Description bevorzugt wird, da sie in der Regel von Menschen erstellt
wurde und den Inhalt prägnant wiedergibt. Unzuverlässige Beschreibungen
lassen sich ausschließen, indem die Länge der Beschreibung und ihre
Struktur (Komplette Sätze vs. Aneinanderreihung von Keywords) berücksichtigt
wird.
Abb. 13.5. Typische Trefferanzeige innerhalb der Trefferliste
Eine weitere Verbesserung der Informationen in den Trefferlisten ließe
sich durch die (optionale) Anzeige von Strukturinformationen erreichen. Bei
längeren Dokumenten könnte eine Gliederungsansicht verwendet werden,
die ein Inhaltsverzeichnis des Dokuments auf Basis der Zwischenüberschriften
anzeigt, auch wenn das Dokument selbst kein Inhaltsverzeichnis hat.
Es bleibt festzuhalten, dass mit der Verbesserung der Trefferlisten sich zwar
keine direkte Verbesserung der Relevanz der Dokumente erreichen lässt,
sie aber sehr wohl zu einer schnelleren und kompetenteren Beurteilung der Relevanz
der Treffer beitragen kann.