Sie sind hier: www.durchdenken.de > Dirk Lewandowski > Publikationen > Web Information Retrieval > 11.5 Spezialisierte Suchmaschinen für Nachrichten
< 11.4 Aktualitätsfaktoren im Ranking  |  Inhaltsverzeichnis  |  11.6 Auswahl der gewünschten Aktualität durch den Nutzer >
11.5 Spezialisierte Suchmaschinen für Nachrichten

Spezialisierte Suchmaschinen für Nachrichten

Die einerseits aus den Problemen der korrekten Datumsermittlung und andererseits aus der Problematik der Index-Aktualität erwachsenden Schwierigkeiten wurden von den Suchmaschinen (wenigstens zum Teil) pragmatisch gelöst, indem gesonderte Datenbestände mit Nachrichten aufgebaut und mit entsprechenden Suchoberflächen versehen wurden. Besonders deutlich wurde die Schwäche der konventionellen Suchmaschinen, mit aktuellen Ereignissen mitzuhalten, nach dem 11. September 2001. Als hilflose Versuche, den Suchmaschinen-Nutzern aktuelle Nachrichten zu bieten, sind manuelle Verweise von den Suchseiten auf die Seiten von Nachrichtensendern und Zeitungen zu werten (vgl. Wiggins 2001). Zu dieser Zeit bestanden gesonderte Nachrichten-Suchmaschinen noch nicht wie heute als integraler Bestandteil aller größeren Suchmaschinen. Diesen wiederum war die schnelle Integration der aktuellen Meldungen in ihre Indizes nicht möglich. In der Folge wurden von allen wichtigen Suchmaschinen eigene Nachrichtenbestände aufgebaut (vgl. Machill, Lewandowski u. Karzauninkat 2005). Die Verwendung eines gesonderten Index ermöglicht es dabei, auf diesen andere Regeln anzuwenden als auf den regulären Web-Index: So werden die Nachrichten-Sites wesentlich öfter von den Suchmaschinen besucht als andere Sites im Index; die Erschließung kann wesentlich genauer erfolgen, da der in der Regel einheitliche Aufbau aller Unterseiten eines Webangebots ausgenutzt werden kann. Probleme mit Spam bestehen nicht, da die zu durchsuchenden Sites manuell ausgewählt werden und entsprechend nur vertrauenswürdige Quellen verwendet werden.
Die Problematik der Datumsermittlung bei aktuellen Nachrichten ist weniger schwierig als bei regulären Web-Dokumenten, hat jedoch selbst einige Besonderheiten, die von den Suchmaschinen berücksichtigt werden müssen. Die zu unterscheidenden Datumsangaben sind hier das redaktionelle Datum, das technische Datum, das Datum in den Metaangaben sowie das Änderungsdatum (Machill, Lewandowski u. Karzauninkat 2005): Nachrichten werden auf Websites oft nicht in einer endgültigen Form veröffentlicht, sondern nach dem ersten Erscheinen entsprechend der aktuellen Ereignisse weiter überarbeitet.
Warum bauen die Suchmaschinen nun zwei verschiedene Datenbestände auf, anstatt einen einzigen Index zu führen und nur bei der Suche über die Nachrichtenquellen einen Filter anzuwenden? Dies ist schlicht mit technischen Problemen zu erklären: Die Suchmaschinen sind nicht in der Lage, ihre sehr umfangreichen Web-Indizes „on the fly“ zu aktualisieren. Die Nachrichten-Meldungen würden erst mit einer gewissen Verzögerung im Index auftauchen, was den Sinn der News-Suche konterkarieren würde.
Die News-Suche bietet dem Nutzer allerdings keine Möglichkeit, generell nach jüngst aktualisierten Dokumenten zu suchen. Vielmehr ist er auf die Quellenauswahl angewiesen, die von den Suchmaschinen vorgegeben wird. Aktuelle Informationen von Seiten, die von den Suchmaschinen nicht explizit als Nachrichtenseiten angesehen werden, können so nicht gefunden werden.
Zusammenfassend lässt sich festhalten, dass die News-Suche durchaus ihre Berechtigung hat, das Problem der Suche nach aktuellen Dokumenten aber nicht vollständig lösen kann.

< 11.4 Aktualitätsfaktoren im Ranking  |  Inhaltsverzeichnis  |  11.6 Auswahl der gewünschten Aktualität durch den Nutzer >