Sie sind hier: www.durchdenken.de > Dirk Lewandowski > Publikationen > Web Information Retrieval > 8 Linktopologische Rankingverfahren
< 7.3 Informationslinguistische Verfahren  |  Inhaltsverzeichnis  |  8.1 Grundlagen linktopologischer Rankingverfahren: Science Citation Indexing >
8 Linktopologische Rankingverfahren

Linktopologische Rankingverfahren

Klassische Verfahren des Information Retrieval und des Rankings bewerten die indexierten Dokumente nicht nach ihrer Qualität. Eine solche Qualitätsbewertung jedes einzelnen Dokuments war auch nicht nötig, da schon in der Konzeption der Datenbank bzw. des zu erfassenden Bestands festgelegt war, welche Dokumente überhaupt erfasst werden sollten. Damit war auch ein Urteil über die Qualität gefällt: sollten nur Dokumente aus Wirtschaftszeitungen erfasst werden, war die Qualität der Dokumente schon durch deren vorherige Auswahl durch die Redaktionen der einzelnen Zeitungen bestimmt und musste nicht vom Information-Retrieval-System ermittelt werden. Erst durch die anzunehmende Unzuverlässigkeit von Web-Dokumenten mussten Maße für die automatische Ermittlung der Qualität von Dokumenten gefunden werden. Diese werden von den Suchmaschinen als anfrageunabhängige Rankingkriterien eingesetzt (s. Kap. 6.1).
Die Qualität von Dokumenten kann - je nach dem zugrunde liegenden Qualitätsbegriff - auf unterschiedliche Weise gemessen werden. Die Bewertung der Dokumente hängt letztlich stark vom Benutzerbedürfnis ab. Mandl (2003, [4]) sieht die entscheidende Frage darin, welche Eigenschaften ermittelt werden, die die Qualität der Dokumente bestimmen sollen. Die im momentanen Einsatz wichtigsten Verfahren bewerten die Qualität bzw. Autorität von Dokumenten aufgrund ihrer Verlinkung durch andere Dokumente. Die wichtigsten dieser linktopologischen Verfahren sollen in diesem Kapitel vorgestellt und bewertet werden. Weitergehende Übersichten linktopologischer Algorithmen finden sich unter anderem in Narsingh u. Gupta (2001) und Borodin et al. (2004).
Ausgangspunkt aller dieser Verfahren ist die Linkstruktur des Web und die Annahme, dass sich aus dieser Annahmen für die Bewertung von Dokumenten ableiten lassen. Links werden keineswegs zufällig gesetzt, sondern können als Stimme für das Dokument, auf welches verwiesen wird, gewertet werden. Die bei diesem Ansatz auftauchenden Probleme werden im nächsten Abschnitt diskutiert.
Die grundlegenden Begriffe im Zusammenhang mit den linktopologischen Verfahren sind In-Links und Out-Links. Ein Dokument kann durch beide Linkformen mit weiteren Dokumenten verbunden sein. Mit In-Links werden alle Links bezeichnet, die auf ein bestimmtes Dokument d verweisen, während die Out-Links alle Links sind, die von demselben Dokument d aus auf andere Dokumente verweisen (Abb. 8.1).



Abb. 8.1. Darstellung eines Dokuments mit seinen In-Links und Out-Links

< 7.3 Informationslinguistische Verfahren  |  Inhaltsverzeichnis  |  8.1 Grundlagen linktopologischer Rankingverfahren: Science Citation Indexing >