
Klassische Verfahren des Information Retrieval und des Rankings bewerten die
indexierten Dokumente nicht nach ihrer Qualität. Eine solche Qualitätsbewertung
jedes einzelnen Dokuments war auch nicht nötig, da schon in der Konzeption
der Datenbank bzw. des zu erfassenden Bestands festgelegt war, welche Dokumente
überhaupt erfasst werden sollten. Damit war auch ein Urteil über die
Qualität gefällt: sollten nur Dokumente aus Wirtschaftszeitungen erfasst
werden, war die Qualität der Dokumente schon durch deren vorherige Auswahl
durch die Redaktionen der einzelnen Zeitungen bestimmt und musste nicht vom
Information-Retrieval-System ermittelt werden. Erst durch die anzunehmende Unzuverlässigkeit
von Web-Dokumenten mussten Maße für die automatische Ermittlung der
Qualität von Dokumenten gefunden werden. Diese werden von den Suchmaschinen
als anfrageunabhängige Rankingkriterien eingesetzt (s. Kap. 6.1).
Die Qualität von Dokumenten kann - je nach dem zugrunde liegenden Qualitätsbegriff
- auf unterschiedliche Weise gemessen werden. Die Bewertung der Dokumente hängt
letztlich stark vom Benutzerbedürfnis ab. Mandl (2003, [4]) sieht die entscheidende
Frage darin, welche Eigenschaften ermittelt werden, die die Qualität der
Dokumente bestimmen sollen. Die im momentanen Einsatz wichtigsten Verfahren
bewerten die Qualität bzw. Autorität von Dokumenten aufgrund ihrer
Verlinkung durch andere Dokumente. Die wichtigsten dieser linktopologischen
Verfahren sollen in diesem Kapitel vorgestellt und bewertet werden. Weitergehende
Übersichten linktopologischer Algorithmen finden sich unter anderem in
Narsingh u. Gupta (2001) und Borodin et al. (2004).
Ausgangspunkt aller dieser Verfahren ist die Linkstruktur des Web und die Annahme,
dass sich aus dieser Annahmen für die Bewertung von Dokumenten ableiten
lassen. Links werden keineswegs zufällig gesetzt, sondern können als
Stimme für das Dokument, auf welches verwiesen wird, gewertet werden. Die
bei diesem Ansatz auftauchenden Probleme werden im nächsten Abschnitt diskutiert.
Die grundlegenden Begriffe im Zusammenhang mit den linktopologischen Verfahren
sind In-Links und Out-Links. Ein Dokument kann durch beide Linkformen mit weiteren
Dokumenten verbunden sein. Mit In-Links werden alle Links bezeichnet, die auf
ein bestimmtes Dokument d verweisen, während die Out-Links alle Links sind,
die von demselben Dokument d aus auf andere Dokumente verweisen (Abb. 8.1).

Abb. 8.1. Darstellung eines Dokuments mit seinen In-Links und Out-Links