
Nach der Diskussion von Aktualitätsmaßen als Rankingkriterium und
von Nachrichtensuchmaschinen als Teillösung des Aktualitätsproblems
liegt der Schluss nahe, dass über die bei einer Anfrage gewünschte
Aktualität letztlich nur der Nutzer selbst entscheiden kann.
Zusammenfassend sind drei Typen von Dokumenten hinsichtlich ihrer Dynamik zu
unterscheiden:
• Statische Dokumente: Diese wurden nach ihrer Erstellung entweder nicht
mehr verändert oder wurden nach einer oder mehreren Änderungen über
einen längeren Zeitraum hinweg nicht mehr verändert. Es ist also nur
noch in Ausnahmefällen mit Änderungen zu rechnen. Einerseits kann
es sich also um Dokumente handeln, die ihre endgültige Form gefunden haben,
beispielsweise wissenschaftliche Aufsätze, die nach der Publikation nicht
mehr verändert werden oder Volltexte von belletristischen Werken. Auf der
anderen Seite kann es sich bei solchen Dokumenten aber auch um inaktuelle Dokumente
handeln, die inhaltlich überholt sind und zu denen vergleichbare Inhalte
vorhanden sind, die den gleichen Sachverhalt in aktueller Form darstellen. Im
Extremfall kann es sich sogar um „vergessene Dokumente“ handeln,
die zwar noch auf einem Server abgelegt sind, jedoch längst durch andere
Dokumente unter einer anderen URL ersetzt wurden.
• Tatsächlich veränderte Dokumente: Der tatsächliche Inhalt
des Dokuments wird aktualisiert und wird von der Suchmaschine auch als Aktualisierung
erkannt.
• Scheinbare Aktualisierung: Es erfolgt nur eine Aktualisierung des Layouts,
der automatischen Datumsangabe oder des Serverdatums. Solche Veränderungen
sollen von der Suchmaschine als Nicht-Aktualisierung des Inhalts erkannt werden.
Die Trennung der Dokumente in ihre Bestandteile wird in Kap. 13 ausführlicher
behandelt.
• Weiterhin fallen unter diesen Punkt Dokumente, die „umgezogen“
sind, also unter einer neuen URL erreichbar sind. Kann die Suchmaschine nicht
durch eine automatische Weiterleitung erkennen, dass das Dokument nur umgezogen
ist, so wird sie das Dokument unter neuer URL auch als inhaltlich neu betrachten.
Wenn es gelingt, scheinbare und tatsächliche Aktualisierung zu unterscheiden,
so ist ein wesentlicher Teil der Datumsproblematik gelöst. Die Frage, inwieweit
die Aktualität in das Ranking eingehen soll, bleibt dabei aber weiter ungeklärt.
Hier sind Bewertungen für unterschiedliche Arten von Dokumenten zu finden;
eine Unterteilung erscheint hier entweder nach thematischen oder formalen Punkten
sinnvoll.
Letztendlich sollte die Datumsbeschränkung dem Nutzer einerseits (wie bisher
üblich) als Suchoption innerhalb erweiterter Suchformulare zur Verfügung
stehen, andererseits sollte sie im Rahmen von Verfahren der intuitiven Benutzerführung
in die Trefferlisten eingebaut werden. So ist hier an eine Clusterung nach Aktualität
zu denken. Die angezeigten Cluster sollen dabei das in der tatsächlichen
Treffermenge vorhandene Spektrum darstellen, so dass etwa bei Anfragen, die
bevorzugt Nachrichtentreffer ergeben, eine feinere Clusterung erfolgt als bei
Anfragen, bei denen sich die Ergebnisse eher gleichmäßig über
die Jahre hinweg verteilen.