Sie sind hier: www.durchdenken.de > Dirk Lewandowski > Publikationen > Web Information Retrieval > 13 Verbesserung der Dokumentrepräsentation
< 12.6 Einbindung von Web-Verzeichnissen in Suchmaschinen  |  Inhaltsverzeichnis  |  13.1 Beschränkung auf den Inhaltsteil der Dokumente >
13 Verbesserung der Dokumentrepräsentation

Verbesserung der Dokumentrepräsentation

Eine Verbesserung der Repräsentation der von den Suchmaschinen indexierten Dokumenten kann auf zwei Ebenen erfolgen: Einerseits lässt sich die teils mangelnde Zuverlässigkeit der Zuordnung der Werte verbessern (wie dies am Beispiel in Kapitel 11.3 gezeigt wurde), andererseits können weitere Attribute für die Repräsentation der Dokumente gefunden werden. Um den letzteren Fall soll es in diesem Kapitel gehen. Es sollen Erweiterungen vorgestellt werden, die eine bessere Repräsentation und damit eine genauere Recherche möglich machen. Letztlich können durch eine verbesserte Repräsentation auch die Trefferlisten in ihrer Aussagekraft verbessert werden.
In Kapitel 4.4 wurde die in den Suchmaschinen übliche Dokumentrepräsentation diskutiert. Dabei wurde der Schluss gezogen, dass für die Verbesserung der Qualität der Treffer auch die Repräsentation der Dokumente verbessert werden müsse.
Zusätzliche Attribute in der Dokumentrepräsentation wurden in den vorangegangenen Kapiteln diskutiert: In Kapitel 11.4 wurden aktualitätsbezogene Attribute vorgestellt, in Kapitel 12 ging es unter anderem um den möglichen Einsatz von Qualitätsattributen. Während diese Art von Attributen aus den Eigenschaften der Dokumente und weniger aus deren Inhalt selbst gewonnen werden können, soll es in diesem Kapitel nun um weitere Attribute gehen, die aus dem Inhalt der Dokumente gewonnen werden können.

< 12.6 Einbindung von Web-Verzeichnissen in Suchmaschinen  |  Inhaltsverzeichnis  |  13.1 Beschränkung auf den Inhaltsteil der Dokumente >