Sie sind hier: www.durchdenken.de > Dirk Lewandowski > Publikationen > Web Information Retrieval > 11.6 Auswahl der gewünschten Aktualität durch den Nutzer
< 11.5 Spezialisierte Suchmaschinen für Nachrichten  |  Inhaltsverzeichnis  |  12 Qualität >
11.6 Auswahl der gewünschten Aktualität durch den Nutzer

Auswahl der gewünschten Aktualität durch den Nutzer

Nach der Diskussion von Aktualitätsmaßen als Rankingkriterium und von Nachrichtensuchmaschinen als Teillösung des Aktualitätsproblems liegt der Schluss nahe, dass über die bei einer Anfrage gewünschte Aktualität letztlich nur der Nutzer selbst entscheiden kann.
Zusammenfassend sind drei Typen von Dokumenten hinsichtlich ihrer Dynamik zu unterscheiden:
• Statische Dokumente: Diese wurden nach ihrer Erstellung entweder nicht mehr verändert oder wurden nach einer oder mehreren Änderungen über einen längeren Zeitraum hinweg nicht mehr verändert. Es ist also nur noch in Ausnahmefällen mit Änderungen zu rechnen. Einerseits kann es sich also um Dokumente handeln, die ihre endgültige Form gefunden haben, beispielsweise wissenschaftliche Aufsätze, die nach der Publikation nicht mehr verändert werden oder Volltexte von belletristischen Werken. Auf der anderen Seite kann es sich bei solchen Dokumenten aber auch um inaktuelle Dokumente handeln, die inhaltlich überholt sind und zu denen vergleichbare Inhalte vorhanden sind, die den gleichen Sachverhalt in aktueller Form darstellen. Im Extremfall kann es sich sogar um „vergessene Dokumente“ handeln, die zwar noch auf einem Server abgelegt sind, jedoch längst durch andere Dokumente unter einer anderen URL ersetzt wurden.
• Tatsächlich veränderte Dokumente: Der tatsächliche Inhalt des Dokuments wird aktualisiert und wird von der Suchmaschine auch als Aktualisierung erkannt.
• Scheinbare Aktualisierung: Es erfolgt nur eine Aktualisierung des Layouts, der automatischen Datumsangabe oder des Serverdatums. Solche Veränderungen sollen von der Suchmaschine als Nicht-Aktualisierung des Inhalts erkannt werden. Die Trennung der Dokumente in ihre Bestandteile wird in Kap. 13 ausführlicher behandelt.
• Weiterhin fallen unter diesen Punkt Dokumente, die „umgezogen“ sind, also unter einer neuen URL erreichbar sind. Kann die Suchmaschine nicht durch eine automatische Weiterleitung erkennen, dass das Dokument nur umgezogen ist, so wird sie das Dokument unter neuer URL auch als inhaltlich neu betrachten.
Wenn es gelingt, scheinbare und tatsächliche Aktualisierung zu unterscheiden, so ist ein wesentlicher Teil der Datumsproblematik gelöst. Die Frage, inwieweit die Aktualität in das Ranking eingehen soll, bleibt dabei aber weiter ungeklärt. Hier sind Bewertungen für unterschiedliche Arten von Dokumenten zu finden; eine Unterteilung erscheint hier entweder nach thematischen oder formalen Punkten sinnvoll.
Letztendlich sollte die Datumsbeschränkung dem Nutzer einerseits (wie bisher üblich) als Suchoption innerhalb erweiterter Suchformulare zur Verfügung stehen, andererseits sollte sie im Rahmen von Verfahren der intuitiven Benutzerführung in die Trefferlisten eingebaut werden. So ist hier an eine Clusterung nach Aktualität zu denken. Die angezeigten Cluster sollen dabei das in der tatsächlichen Treffermenge vorhandene Spektrum darstellen, so dass etwa bei Anfragen, die bevorzugt Nachrichtentreffer ergeben, eine feinere Clusterung erfolgt als bei Anfragen, bei denen sich die Ergebnisse eher gleichmäßig über die Jahre hinweg verteilen.

< 11.5 Spezialisierte Suchmaschinen für Nachrichten  |  Inhaltsverzeichnis  |  12 Qualität >