
Eine Verbesserung der Repräsentation der von den Suchmaschinen indexierten
Dokumenten kann auf zwei Ebenen erfolgen: Einerseits lässt sich die teils
mangelnde Zuverlässigkeit der Zuordnung der Werte verbessern (wie dies
am Beispiel in Kapitel 11.3 gezeigt wurde), andererseits können weitere
Attribute für die Repräsentation der Dokumente gefunden werden. Um
den letzteren Fall soll es in diesem Kapitel gehen. Es sollen Erweiterungen
vorgestellt werden, die eine bessere Repräsentation und damit eine genauere
Recherche möglich machen. Letztlich können durch eine verbesserte
Repräsentation auch die Trefferlisten in ihrer Aussagekraft verbessert
werden.
In Kapitel 4.4 wurde die in den Suchmaschinen übliche Dokumentrepräsentation
diskutiert. Dabei wurde der Schluss gezogen, dass für die Verbesserung
der Qualität der Treffer auch die Repräsentation der Dokumente verbessert
werden müsse.
Zusätzliche Attribute in der Dokumentrepräsentation wurden in den
vorangegangenen Kapiteln diskutiert: In Kapitel 11.4 wurden aktualitätsbezogene
Attribute vorgestellt, in Kapitel 12 ging es unter anderem um den möglichen
Einsatz von Qualitätsattributen. Während diese Art von Attributen
aus den Eigenschaften der Dokumente und weniger aus deren Inhalt selbst gewonnen
werden können, soll es in diesem Kapitel nun um weitere Attribute gehen,
die aus dem Inhalt der Dokumente gewonnen werden können.