
Für alle Information-Retrieval-Systeme gilt, dass sich diese zentral an
den Bedürfnissen ihrer Nutzer orientieren sollten. Korfhage (1997, 15)
etwa konstatiert: „The user is central to the success of an information
retrieval system." Für Suchmaschinen gilt diese Feststellung in noch
erhöhtem Maß: Sie bedienen die Informationsbedürfnisse von in
der Regel ungeschulten Nutzern und müssen sich auf diese spezielle Nutzergruppe
einstellen. Erst in den letzten Jahren wurde allerdings klar erkannt, dass sich
die Suchmaschinen-Nutzer von den Nutzern klassischer Information-Retrieval-Systeme
nicht nur unterscheiden, sondern auch eigene Strategien bei der Informationsbeschaffung
entwickelt haben, die es bei zukünftigen Suchmaschinen-Entwicklungen zu
berücksichtigen gilt.
Methoden der Nutzerforschung
Für die Untersuchung des Verhaltens der Suchmaschinen-Nutzer kommen unterschiedliche
Methoden in Frage. Dies sind die Nutzerbefragung, das Laborexperiment und die
Logfile-Analyse.
Nutzerbefragungen arbeiten mittels Fragebögen oder Telefoninterviews
und stellen eine standardisierte Methode der - in aller Regel quantitativen
- Erfassung des Nutzerverhaltens dar. Der Vorteil dieser Methode liegt in der
Möglichkeit, eine relativ hohe Anzahl von Nutzern zu befragen, da die Fragen
in der Regel geschlossen gestellt werden, wodurch der Aufwand der Befragung
und der Auswertung im Vergleich zu anderen Methoden gering ausfällt. Der
Nachteil dieser Methode ist in der mangelnden Interaktivität zwischen Befragtem
und Fragendem sowie in der Genauigkeit bzw. Ehrlichkeit der Angaben der Nutzer
zu sehen. Werden Nutzer nach ihren Informationsbedürfnissen gefragt, so
werden sie etwa in der Regel ein eventuell vorhandenes Interesse an pornographischen
Inhalten verschweigen.
Im Folgenden werden Ergebnisse aus der Untersuchung von Machill et al. (2003)
vorgestellt. Im Rahmen ihrer Nutzerbefragung werteten sie das Verhalten von
1.000 deutschen Internetnutzern aus, die telefonisch befragt wurden. Diese Untersuchung
stellt die bisher umfangreichste Nutzerbefragung im deutschsprachigen Raum dar.
Laborexperimente dienen dazu, den Nutzer bei der Recherche
direkt zu beobachten. In der Regel werden den Nutzern Aufgaben gestellt, die
zu bewältigen sind. Der Untersuchungsleiter beobachtet den Nutzer und protokolliert
die Schritte, die zur Befriedigung des Informationsbedürfnisses führen.
Diese Methode bietet den Vorteil, den Nutzer direkt beobachten zu können
und zumindest in Hinblick auf die gestellten Aufgaben sein tatsächliches
Vorgehen erfassen zu können. Der Nachteil liegt im relativ hohen Aufwand
und der Künstlichkeit der Laborsituation. Außerdem werden auch in
dieser Untersuchungsform die realen Informationsbedürfnisse nicht in Gänze
erfasst.
Die Studie von Machill et al. (2003) enthält ebenfalls ein Laborexperiment,
bei dem 160 Versuchspersonen teilnehmen. Die Arbeit von Hölscher (2003)
enthält zwei Laboruntersuchungen, in denen jeweils das Verhalten von Laien
und Experten verglichen wird. Die Teilnehmerzahl der Untersuchungen liegt allerdings
mit 19 bzw. 47 Personen relativ niedrig.
Logfile-Analysen bieten die Möglichkeit, eine hohe Anzahl
von Anfragen zu untersuchen, da sie die tatsächlich von einer Suchmaschine
bearbeiteten Anfragen auswerten; die Anzahl der ausgewerteten Anfragen liegt
dabei oft in Millionenhöhe. Der Vorteil dieser Methode liegt neben der
Datenmenge in der Abbildung des tatsächlichen Nutzerverhaltens. Die Daten
können kostengünstig erhoben werden und die Datenerhebung beeinflusst
den Nutzer nicht in seinem Verhalten. Nachteile sind das Fehlen von Informationen
über die einzelnen Nutzer sowie technische Beschränkungen wie etwa
die Unmöglichkeit, weitere Schritte des Nutzers, die nicht in direkter
Interaktion mit der Suchmaschine stehen, zu protokollieren.
Als die wichtigsten Logfile-Analysen sind die Untersuchungen von Spink u. Jansen
(2004) anzusehen. Seit 1997 wurden Logfiles unterschiedlicher populärer
Suchmaschinen mit der gleichen Methode ausgewertet, so dass sich erstmals das
Nutzerverhalten über einen längeren Zeitraum beobachten lässt.
Suchmaschinen bedienen eine heterogene Nutzerschaft. Neben Laien werden sie
auch von Profis verwendet, seien dies Information Professionals (als „Recherche-Profis")
oder Experten ihres jeweiligen Fachgebiets. Neben Untersuchungen zum allgemeinen
Nutzerverhalten wurden auch Studien über bestimmte Nutzergruppen durchgeführt
(s. Spink u. Jansen 2004, 21ff. für eine Übersicht) oder auch über
Experten, die sich im Rahmen eines Hobbys eine gewisse Expertise angeeignet
haben (Amento et al. 2000). Diesen Untersuchungen ist leider zum großen
Teil gemein, dass sie einen Experten bereits durch relativ geringe Kenntnisse
im Bereich der Recherche auszeichnen. So spielt etwa für die Auswahl als
Experte in der Untersuchung von Hölscher die formale Ausbildung keine Rolle:
„Bezüglich ihrer Web-Kenntnisse sind die Teilnehmer als Autodidakten
zu beschreiben, die sich ihr Wissen über die Jahre eigenständig, zum
Teil als Hobby, insbesondere aber im Rahmen eines training-on-the-job selbst
angeeignet haben" (Hölscher 2003, 102).
Untersuchungen zur Nutzung von Suchmaschinen durch tatsächliche Recherche-Profis
beispielsweise in den Informationsabteilungen von Großunternehmen oder
Unternehmensberatungen liegen bislang nicht vor.
Die meisten Untersuchungen konzentrieren sich auf die typischen Laien-Nutzer,
welche den Großteil der Suchmaschinen-Nutzer ausmachen. Im Folgenden sollen
die wichtigsten Erkenntnisse aus den Nutzerstudien systematisch vorgestellt
werden. Die Ergebnisse bilden die Grundlage für die weiteren Überlegungen
zum Aufbau und der Verbesserung von Suchmaschinen, wobei stets der Nutzer, wie
er durch die Nutzerstudien beschrieben wird, im Vordergrund steht. Wo dies sinnvoll
erscheint, wird allerdings auch auf die Bedürfnisse von Profinutzern eingegangen.
Operatoren. Boolesche Operatoren werden nur bei etwa jeder zehnten Anfrage
verwendet (Spink u. Jansen 2004, 184), während etwa 20 Prozent der Nutzer
angeben, diese öfter zu verwenden (Machill et al. 2003, 167). Eine Untersuchung
aus dem Jahr 2000 (Jansen, Spink, Saracevic 2000) fand heraus, dass etwa die
Hälfte der Booleschen Anfragen zudem Fehler enthalten; bei den von den
Nutzern an Stelle der Booleschen Operatoren bevorzugten Plus- und Minuszeichen
(die die selben Funktionen ausdrücken) lag die Fehlerquote sogar bei zwei
Dritteln.
Der Anteil der Anfragen mit Booleschen Operatoren erscheint sehr gering; zu
bedenken ist allerdings, dass die Eingabe dieser Verknüpfungen bei Suchmaschinen
im Gegensatz zu anderen Recherchesystemen nicht zwingend notwendig ist. In der
Regel werden mehrere eingegebene Begriffe automatisch mit AND verbunden, so
dass zumindest einfache Anfragen ohne die Eingabe von Operatoren gestellt werden
können.
Erweiterte Suchformulare. Während die Booleschen Operatoren
nach der Befragung von Machill et al. (2003) nur etwa der Hälfte der Nutzer
bekannt sind, erreichen die erweiterten Suchformulare („Profisuche")
mit 59 Prozent eine etwas höhere Bekanntheit. Allerdings zeigt sich, dass
sie noch seltener genutzt werden als die Operatoren: Nur 14 Prozent der Nutzer
geben an, die erweiterte Suche öfter zu nutzen (Machill et al. 2003, 168).
In der angeschlossenen Laboruntersuchung lag deren Nutzung noch einmal deutlich
darunter.
Zeitliche Entwicklungen. In Hinblick auf die Nutzung von Operatoren
kann keine Entwicklung festgestellt werden; ihre Nutzung hat sich im Lauf der
Jahre nicht verändert (Spink u. Jansen 2004, 79). Allerdings nimmt die
Länge der Suchanfragen langsam zu und liegt mittlerweile bei durchschnittlich
etwa 2,6 Termen je Anfrage. Spink u. Jansen (2004, 80) sehen darin ein Anzeichen
für die zunehmende Komplexität der Web-Suchen. Hier ist allerdings
anzumerken, dass die größere Länge wenig über die Komplexität
der Anfragen aussagt; diese würde sich vielmehr in der Nutzung von Operatoren
oder anderen Möglichkeiten der Rechercheeinschränkung zeigen. Letztlich
bleibt nur der Schluss zu ziehen, dass sich die Entwicklung bzw. Verbesserung
von Suchmaschinen an dem geringen Kenntnisstand der Nutzer zu orientieren hat,
wobei keine größeren Veränderungen des Nutzerverhaltens erwartet
werden dürfen.
Zu den verwendeten Suchbegriffen bietet allein die Untersuchung von Spink u.
Jansen (2004) konkrete Aussagen. Hier ist besonders interessant, dass die Spannbreite
der Informationsbedürfnisse im Lauf der Jahre deutlich zugenommen hat.
Zwar werden 20 Prozent aller eingegebenen Suchbegriffe regelmäßig
verwendet, zehn Prozent kamen allerdings nur ein einziges Mal vor.
Die thematischen Interessen der Suchmaschinen-Nutzer haben sich im Lauf der
letzten Jahre ebenfalls gewandelt. Während in den Anfangsjahren viele Anfragen
aus den beiden Themenfeldern Sex und Technologie kamen, gehen diese mittlerweile
zurück. Dafür nehmen Anfragen im Bereich E-Commerce zu. Weiterhin
zugenommen haben nicht-englischsprachige Begriffe sowie Zahlen und Akronyme.
Die Popularität von Suchbegriffen ist auch saisonabhängig und wird
durch aktuelle Nachrichten beeinflusst (Spink u. Jansen 2004, 183f.).
Von allen Untersuchungen wird übereinstimmend festgestellt, dass Nutzer
in der Regel nur die ersten Treffer aus den Ergebnislisten überhaupt ansehen.
Etwas 80 Prozent der Nutzer sehen sich nur die ersten zehn Treffer in der Ergebnisliste
an, also in der Regel die erste Seite der Trefferliste (Hölscher u. Strube
2000; Jansen et al. 2000; Silverstein et al. 1999; Spink u. Jansen 2004). Nach
den Studien von Spink u. Jansen hat die Anzahl der angesehenen Ergebnisseiten
im Lauf der Zeit abgenommen; dies könnte allerdings auch darauf zurückzuführen
sein, dass es den Suchmaschinen im Lauf der Zeit gelungen ist, die Suchanfragen
besser zu beantworten, so dass sich brauchbare Ergebnisse öfter bereits
auf der ersten Ergebnisseite finden. Allerdings wird auch immer wieder darauf
hingewiesen, dass in erster Linie die Treffer auf den ersten Listenplätzen,
welche ohne vorheriges Scrollen am Bildschirm sichtbar sind, angeklickt werden
(Singhal 2004).
Im Rahmen einer Recherche sichten die Nutzer im Durchschnitt nur etwa fünf
Dokumente (Spink u. Jansen 2004, 101), wobei jedes Dokument nur kurz geprüft
wird, ob es die gewünschte Information enthält. Die Recherche wird
meist abgebrochen, sobald ein Dokument gefunden wurde, welches geeignet erscheint,
das Informationsbedürfnis zu befriedigen. Eine gesamte Such-Session inklusive
der Sichtung der Dokumente dauert in der großen Mehrheit nur etwa 15 Minuten
(Spink u. Jansen 2004, 101).