
In diesem Kapitel werden informationslinguistische und -statistische Verfahren
beschrieben. Die statistischen Verfahren werden dabei in die Bereiche textstatistische
Verfahren und nutzungsstatistische Verfahren unterteilt. Während textstatistische
Verfahren dem klassischen Information Retrieval zuzuordnen sind (und Faktoren
verwenden, wie sie im letzten Kapitel bereits beschrieben wurden), werden nutzungsstatistische
Verfahren nur bei Suchmaschinen eingesetzt. Sie dienen der Ermittlung populärer
Dokumente und schließen von dieser Popularität auf die Qualität
der Dokumente.
Informationslinguistische Verfahren dienen einerseits dazu, das Dokument auf
die Indexierung „vorzubereiten", indem enthaltene Wörter auf
ihre Stammformen reduziert werden oder Phrasen erkannt und entsprechend markiert
werden. Andererseits können linguistische Verfahren im Rechercheprozess
eingesetzt werden. Hier bearbeiten sie analog die eingegebenen Suchanfragen,
indem diese so umgearbeitet werden, dass sie mit den Dokumenten abgeglichen
werden können.
Nach der Beschreibung der genannten Verfahren erfolgt eine Bewertung ihres praktischen
Einsatzes und damit ihrer Tauglichkeit bzw. ihrer realistischen Möglichkeiten
in Suchmaschinen.