Sie sind hier: www.durchdenken.de > Dirk Lewandowski > Publikationen > Web Information Retrieval > 12.4 Manuelle Einbindung von Top-Quellen
< 12.3 Identifizierung von Top-Quellen im WWW  |  Inhaltsverzeichnis  |  11.5 Automatisierte Einbindung von Invisible-Web-Quellen >
12.4 Manuelle Einbindung von Top-Quellen

Manuelle Einbindung von Top-Quellen

In den letzten Jahren sind die großen Suchmaschinenbetreiber dazu übergegangen, neben den regulären, gecrawlten Web-Ergebnissen auch Hinweise auf Informationsressourcen anzuzeigen. Dabei handelt es sich um wenige Quellen, die als unangefochtene Autoritäten auf ihrem Gebiet gelten dürfen. Neben Quellen, zu denen es keine echte Alternative gibt (wie dem Fahrplan der Deutschen Bahn) werden auch Quellen eingebunden, zu denen Alternativen vorhanden sind (wie der Columbia Encyclopedia, welche bei Yahoo eingebunden ist). Die grundlegende Idee ist es jedenfalls, auf unangefochtene Autoritäten hinzuweisen. Dies kann als Zeichen dafür gesehen, dass die Suchmaschinen ihren eigenen automatischen Qualitätsbewertungen misstrauen, die ja dafür sorgen sollen, dass das beste Ergebnis zur Suchanfrage an erster Stelle der Trefferliste angezeigt wird.
Teils ist auch zu sehen, dass Quellen als Empfehlungen angezeigt werden, die auch den ersten Treffer der regulären Trefferliste stellen. Abb. 12.2 zeigt als Beispiel die Suche nach einem bestimmten Patent bei Google. Als erster regulärer Treffer erscheint das Patent auf der offiziellen Seite des US-Patentamts, darüber findet sich ein Hinweis auf die Suche in der gleichen Patentdatenbank, aus der der Treffer stammt. Beide angezeigten Treffer führen zur gleichen Seite auf dem Server des Patentamts. Das Dokument ist in diesem Fall für die Suchmaschine nicht invisible, sondern der Hinweis auf die Patentdatenbank wurde schlicht eingefügt, weil die Suchmaschine nicht sicherstellen kann, dass der sehr umfangreiche Datenbestand des Patentamts vollständig gecrawlt wird. Dazu kommt, dass die Treffer aus diesem Bestand stets an erster Stelle stehen sollen, dies aber anscheinend allein aufgrund des Rankings nicht gewährleistet werden kann.

Abb. 12.2. Beispiel einer Patentsuche in Google


Abb. 12.3. Integration von Wetterinformationen in die Ergebnisdarstellung bei Yahoo

Bei der manuellen Einbindung von Informationsressourcen wird auf zwei Arten verfahren: Einerseits werden, wie in Abb. 12.2 gezeigt, Hinweise auf eine Quelle gegeben. Erst wenn die Quelle angeklickt wird, wird die entsprechende Suchanfrage an die Quelle geschickt und dort beantwortet. D.h. der Nutzer verlässt, wie beim Anklicken regulärer Treffer auch üblich, das Angebot der Suchmaschine. Die zweite Variante beantwortet Suchanfragen direkt. In Abb. 12.3 ist eine Anfrage nach dem Wetter in Düsseldorf bei der Suchmaschine Yahoo zu sehen. Die Frage wird in einem Kasten oberhalb der regulären Trefferliste direkt beantwortet; um ausführlichere Informationen zu erhalten, kann ein weiterer Link angeklickt werden.
Eine Kombination unterschiedlicher Quellen setzt die Suchmaschine Ask Jeeves bei der Suche nach Prominenten ein. Je nach Verfügbarkeit werden in einem Kasten oberhalb der Trefferliste Hinweise auf verschiedene Quellen angezeigt. In Abbildung 12.4 ist die Zusammenstellung von Informationsressourcen zur Person David Bowie zu sehen. Neben einer Biographie werden Hinweise auf Bilder, Nachrichten, Produkte, auf eine Filmographie sowie eine Diskographie gegeben. In der Abbildung ist auch ersichtlich, dass die hinter den Links stehenden Informationen aus unterschiedlichen Quellen kommen. So kann die Internet Movie Database (IMDB) sicherlich die besten Informationen zu den Filmen Bowies geben, zu seiner Musik ist sie sicher nicht die erste Quelle.
Neben der nützlichen Zusammenstellung wichtiger Quellen zur Suchanfrage erfüllt die Ask-Jeeves-Lösung noch eine andere Funktion: Der Nutzer wird zu den Informationen geleitet, die ihn interessieren, die er aber vielleicht mit seiner ursprünglichen, unspezifischen Anfrage nicht erreicht hätte. Es liegt also eine Mischung aus der prominenten Platzierung von hochwertigen Quellen und dem Einsatz von Verfahren der intuitiven Beutzerführung vor.
Die manuelle Einbindung von Top-Quellen stellt eine gute Möglichkeit dar, Quellen von besonderer Bedeutung prominent zu platzieren. Speziell die Möglichkeit, Invisible-Web-Quellen einzubinden und verschiedene hochwertige Quellen zu kombinieren, erscheinen zukunftsträchtig. Allerdings müssen die Quellen stets von Hand ausgewählt werden und auch die passenden Suchanfragen bestimmt werden, bei denen die entsprechenden Quellen angezeigt werden sollen. Für manche Fälle ist dies einfach durch einen fokussierenden Suchbegriff (wie etwa Patent) zu lösen, in anderen Fällen sind exakte Suchanfragen zu hinterlegen (wie im gezeigten Beispiel der Suche nach Prominenten).

Abb. 12.4. Einbindung unterschiedlicher Informationsressourcen bei Ask Jeeves


Wenn man das System der manuellen Integration der Quellen ausweitet, so landet man schließlich bei einer (umfassenderen) Zusammenstellung von qualitätsgeprüften Ressourcen und steht damit dem Anliegen der Web-Verzeichnisse nahe. Der Unterschied liegt einerseits darin, dass keine hierarchische Ordnung vorliegt, andererseits in der Form der Integration der Quellen. Während Verzeichnisse nur die Quellen selbst nachweisen, wird mit der Einbindung von Informationsressourcen direkt auf eine Suchanfrage reagiert und diese im Bedarfsfall an die dahinter liegende Datenbank weitergeleitet. Der Nutzer muss seine Suchanfrage also nicht nochmals stellen.
Als ein Nachteil der manuellen Einbindung von Informationsressourcen ist die Aufteilung der Ergebnisseiten in verschiedene Bereiche zu sehen. Die Trefferliste „zerfällt“ und wird unübersichtlich, da die Informationsressourcen ja nicht in die Trefferliste selbst eingebunden sind, sondern abseits von diesen als besondere Empfehlung stehen. Eine echte Integration findet also nicht statt.

< 12.3 Identifizierung von Top-Quellen im WWW  |  Inhaltsverzeichnis  |  11.5 Automatisierte Einbindung von Invisible-Web-Quellen >