Sie sind hier: www.durchdenken.de > Dirk Lewandowski > Publikationen > Web Information Retrieval > 13.4 Aufbereitung der Suchergebnisse in den Trefferlisten
< 13.3 Ersatz für die Nicht-Verwendbarkeit generischer Top-Level-Domains  |  Inhaltsverzeichnis  |  14 Fazit und Ausblick >
13.4 Aufbereitung der Suchergebnisse in den Trefferlisten

Aufbereitung der Suchergebnisse in den Trefferlisten

In Kapitel 2.3 wurde bereits auf die typischen Angaben zu jedem Treffer, die in der Trefferliste angezeigt werden, eingegangen. In der Regel sind dies der Titel der Seite (<title>-Tag), eine Kurzbeschreibung, die Größe in Kilobytes, ein Hinweis auf zwischengespeicherte Kopie und ähnliche Seiten und ggf. das Datum der letzten Indexierung.
Mit den in den letzten Abschnitten beschriebenen Verfahren lassen sich die Dokumentbeschreibungen in den Trefferlisten um weitere Angaben wie dem tatsächlichen Titel, Größe in Wörtern und der Anzahl der im Text enthaltenen Abbildungen und Tabellen ergänzen.
Zuletzt bleibt noch die Frage nach der bestmöglichen Zusammenfassung der Dokumente in den Trefferlisten zu beantworten. Die Aufgabe der Ergebnisseiten liegt auch in der Informationsverdichtung. Dem Nutzer soll es möglich sein, schon aufgrund der in der Trefferliste enthaltenen Informationen die für ihn passenden Treffer auswählen zu können. In den Trefferlisten ist daher im Regelfall schon eine Zusammenfassung der gefundenen Dokumente enthalten. Diese wird allerdings nicht – wie dies bei konventionellen Systemen üblich ist – aus den bereits von den Autoren der Dokumente geschriebenen Abstracts gewonnen, sondern kommt je nach Suchmaschine und Dokument auf unterschiedliche Art zustande:
• Keywords in Context (KWIC): Die eingegebenen Suchbegriffe werden im Kontext ihres Vorkommens im Dokument angezeigt. Dabei werden in der Regel einige Wörter rund um das erste Vorkommen des Suchbegriffs angezeigt. In Abbildung 13.5 ist beim zweiten Treffer eine solche automatisch generierte „Beschreibung“ zu sehen. Der Vorteil dieser Anzeigeart liegt in der direkten Einsicht in das Umfeld des Suchbegriffs. Allerdings wird die Anzeige mit einer zunehmenden Zahl von Suchbegriffen unübersichtlicher. Außerdem geben die KWIC keine Beschreibung des gesamten Inhalts des Dokuments ab, sondern präsentieren nur einen kleinen Ausschnitt.
• Beschreibung aus den Metatags (META Description): Von vielen Suchmaschinen wird zur Anzeige in den Trefferlisten die Beschreibung aus dem Metatag description verwendet. Da diese Information vom Autor der Seite selbst kommt, ist jedoch eine zusätzliche Überprüfung der Zuverlässigkeit nötig. Beim ersten Treffer in Abb. 13.5 wird die Beschreibung aus dem Metatag verwendet.
• Beschreibung aus dritter Quelle: Beschreibungen aus externen Quellen, vor allem aus Webverzeichnissen, werden für die Dokumentbeschreibung in den Trefferlisten verwendet. Oft bieten sie eine prägnante Beschreibung; der Nachteil liegt allerdings darin, dass sie in der Regel nur für Sites erstellt werden und nicht für jedes einzelne Dokument verfügbar sind.
Die Verwendung dieser Beschreibungsmöglichkeiten wird von den Suchmaschinen verschieden gehandhabt. Generell kann gesagt werden, dass die Beschreibung in der Meta-Description bevorzugt wird, da sie in der Regel von Menschen erstellt wurde und den Inhalt prägnant wiedergibt. Unzuverlässige Beschreibungen lassen sich ausschließen, indem die Länge der Beschreibung und ihre Struktur (Komplette Sätze vs. Aneinanderreihung von Keywords) berücksichtigt wird.

Abb. 13.5. Typische Trefferanzeige innerhalb der Trefferliste


Eine weitere Verbesserung der Informationen in den Trefferlisten ließe sich durch die (optionale) Anzeige von Strukturinformationen erreichen. Bei längeren Dokumenten könnte eine Gliederungsansicht verwendet werden, die ein Inhaltsverzeichnis des Dokuments auf Basis der Zwischenüberschriften anzeigt, auch wenn das Dokument selbst kein Inhaltsverzeichnis hat.
Es bleibt festzuhalten, dass mit der Verbesserung der Trefferlisten sich zwar keine direkte Verbesserung der Relevanz der Dokumente erreichen lässt, sie aber sehr wohl zu einer schnelleren und kompetenteren Beurteilung der Relevanz der Treffer beitragen kann.

< 13.3 Ersatz für die Nicht-Verwendbarkeit generischer Top-Level-Domains  |  Inhaltsverzeichnis  |  14 Fazit und Ausblick >