Sie sind hier: www.durchdenken.de > Dirk Lewandowski > Publikationen > Web Information Retrieval > 2.6 Nutzerstudien
< 2.5 Arten von Suchanfragen  |  Inhaltsverzeichnis  |  2.7 Forschungsbereiche >
2.6 Nutzerstudien

Nutzerstudien


Für alle Information-Retrieval-Systeme gilt, dass sich diese zentral an den Bedürfnissen ihrer Nutzer orientieren sollten. Korfhage (1997, 15) etwa konstatiert: „The user is central to the success of an information retrieval system." Für Suchmaschinen gilt diese Feststellung in noch erhöhtem Maß: Sie bedienen die Informationsbedürfnisse von in der Regel ungeschulten Nutzern und müssen sich auf diese spezielle Nutzergruppe einstellen. Erst in den letzten Jahren wurde allerdings klar erkannt, dass sich die Suchmaschinen-Nutzer von den Nutzern klassischer Information-Retrieval-Systeme nicht nur unterscheiden, sondern auch eigene Strategien bei der Informationsbeschaffung entwickelt haben, die es bei zukünftigen Suchmaschinen-Entwicklungen zu berücksichtigen gilt.
Methoden der Nutzerforschung
Für die Untersuchung des Verhaltens der Suchmaschinen-Nutzer kommen unterschiedliche Methoden in Frage. Dies sind die Nutzerbefragung, das Laborexperiment und die Logfile-Analyse.
Nutzerbefragungen arbeiten mittels Fragebögen oder Telefoninterviews und stellen eine standardisierte Methode der - in aller Regel quantitativen - Erfassung des Nutzerverhaltens dar. Der Vorteil dieser Methode liegt in der Möglichkeit, eine relativ hohe Anzahl von Nutzern zu befragen, da die Fragen in der Regel geschlossen gestellt werden, wodurch der Aufwand der Befragung und der Auswertung im Vergleich zu anderen Methoden gering ausfällt. Der Nachteil dieser Methode ist in der mangelnden Interaktivität zwischen Befragtem und Fragendem sowie in der Genauigkeit bzw. Ehrlichkeit der Angaben der Nutzer zu sehen. Werden Nutzer nach ihren Informationsbedürfnissen gefragt, so werden sie etwa in der Regel ein eventuell vorhandenes Interesse an pornographischen Inhalten verschweigen.
Im Folgenden werden Ergebnisse aus der Untersuchung von Machill et al. (2003) vorgestellt. Im Rahmen ihrer Nutzerbefragung werteten sie das Verhalten von 1.000 deutschen Internetnutzern aus, die telefonisch befragt wurden. Diese Untersuchung stellt die bisher umfangreichste Nutzerbefragung im deutschsprachigen Raum dar.
Laborexperimente dienen dazu, den Nutzer bei der Recherche direkt zu beobachten. In der Regel werden den Nutzern Aufgaben gestellt, die zu bewältigen sind. Der Untersuchungsleiter beobachtet den Nutzer und protokolliert die Schritte, die zur Befriedigung des Informationsbedürfnisses führen. Diese Methode bietet den Vorteil, den Nutzer direkt beobachten zu können und zumindest in Hinblick auf die gestellten Aufgaben sein tatsächliches Vorgehen erfassen zu können. Der Nachteil liegt im relativ hohen Aufwand und der Künstlichkeit der Laborsituation. Außerdem werden auch in dieser Untersuchungsform die realen Informationsbedürfnisse nicht in Gänze erfasst.
Die Studie von Machill et al. (2003) enthält ebenfalls ein Laborexperiment, bei dem 160 Versuchspersonen teilnehmen. Die Arbeit von Hölscher (2003) enthält zwei Laboruntersuchungen, in denen jeweils das Verhalten von Laien und Experten verglichen wird. Die Teilnehmerzahl der Untersuchungen liegt allerdings mit 19 bzw. 47 Personen relativ niedrig.
Logfile-Analysen bieten die Möglichkeit, eine hohe Anzahl von Anfragen zu untersuchen, da sie die tatsächlich von einer Suchmaschine bearbeiteten Anfragen auswerten; die Anzahl der ausgewerteten Anfragen liegt dabei oft in Millionenhöhe. Der Vorteil dieser Methode liegt neben der Datenmenge in der Abbildung des tatsächlichen Nutzerverhaltens. Die Daten können kostengünstig erhoben werden und die Datenerhebung beeinflusst den Nutzer nicht in seinem Verhalten. Nachteile sind das Fehlen von Informationen über die einzelnen Nutzer sowie technische Beschränkungen wie etwa die Unmöglichkeit, weitere Schritte des Nutzers, die nicht in direkter Interaktion mit der Suchmaschine stehen, zu protokollieren.
Als die wichtigsten Logfile-Analysen sind die Untersuchungen von Spink u. Jansen (2004) anzusehen. Seit 1997 wurden Logfiles unterschiedlicher populärer Suchmaschinen mit der gleichen Methode ausgewertet, so dass sich erstmals das Nutzerverhalten über einen längeren Zeitraum beobachten lässt.

Nutzergruppen

Suchmaschinen bedienen eine heterogene Nutzerschaft. Neben Laien werden sie auch von Profis verwendet, seien dies Information Professionals (als „Recherche-Profis") oder Experten ihres jeweiligen Fachgebiets. Neben Untersuchungen zum allgemeinen Nutzerverhalten wurden auch Studien über bestimmte Nutzergruppen durchgeführt (s. Spink u. Jansen 2004, 21ff. für eine Übersicht) oder auch über Experten, die sich im Rahmen eines Hobbys eine gewisse Expertise angeeignet haben (Amento et al. 2000). Diesen Untersuchungen ist leider zum großen Teil gemein, dass sie einen Experten bereits durch relativ geringe Kenntnisse im Bereich der Recherche auszeichnen. So spielt etwa für die Auswahl als Experte in der Untersuchung von Hölscher die formale Ausbildung keine Rolle: „Bezüglich ihrer Web-Kenntnisse sind die Teilnehmer als Autodidakten zu beschreiben, die sich ihr Wissen über die Jahre eigenständig, zum Teil als Hobby, insbesondere aber im Rahmen eines training-on-the-job selbst angeeignet haben" (Hölscher 2003, 102).
Untersuchungen zur Nutzung von Suchmaschinen durch tatsächliche Recherche-Profis beispielsweise in den Informationsabteilungen von Großunternehmen oder Unternehmensberatungen liegen bislang nicht vor.
Die meisten Untersuchungen konzentrieren sich auf die typischen Laien-Nutzer, welche den Großteil der Suchmaschinen-Nutzer ausmachen. Im Folgenden sollen die wichtigsten Erkenntnisse aus den Nutzerstudien systematisch vorgestellt werden. Die Ergebnisse bilden die Grundlage für die weiteren Überlegungen zum Aufbau und der Verbesserung von Suchmaschinen, wobei stets der Nutzer, wie er durch die Nutzerstudien beschrieben wird, im Vordergrund steht. Wo dies sinnvoll erscheint, wird allerdings auch auf die Bedürfnisse von Profinutzern eingegangen.

Recherchekenntnisse und -strategien

Operatoren. Boolesche Operatoren werden nur bei etwa jeder zehnten Anfrage verwendet (Spink u. Jansen 2004, 184), während etwa 20 Prozent der Nutzer angeben, diese öfter zu verwenden (Machill et al. 2003, 167). Eine Untersuchung aus dem Jahr 2000 (Jansen, Spink, Saracevic 2000) fand heraus, dass etwa die Hälfte der Booleschen Anfragen zudem Fehler enthalten; bei den von den Nutzern an Stelle der Booleschen Operatoren bevorzugten Plus- und Minuszeichen (die die selben Funktionen ausdrücken) lag die Fehlerquote sogar bei zwei Dritteln.
Der Anteil der Anfragen mit Booleschen Operatoren erscheint sehr gering; zu bedenken ist allerdings, dass die Eingabe dieser Verknüpfungen bei Suchmaschinen im Gegensatz zu anderen Recherchesystemen nicht zwingend notwendig ist. In der Regel werden mehrere eingegebene Begriffe automatisch mit AND verbunden, so dass zumindest einfache Anfragen ohne die Eingabe von Operatoren gestellt werden können.
Erweiterte Suchformulare. Während die Booleschen Operatoren nach der Befragung von Machill et al. (2003) nur etwa der Hälfte der Nutzer bekannt sind, erreichen die erweiterten Suchformulare („Profisuche") mit 59 Prozent eine etwas höhere Bekanntheit. Allerdings zeigt sich, dass sie noch seltener genutzt werden als die Operatoren: Nur 14 Prozent der Nutzer geben an, die erweiterte Suche öfter zu nutzen (Machill et al. 2003, 168). In der angeschlossenen Laboruntersuchung lag deren Nutzung noch einmal deutlich darunter.
Zeitliche Entwicklungen. In Hinblick auf die Nutzung von Operatoren kann keine Entwicklung festgestellt werden; ihre Nutzung hat sich im Lauf der Jahre nicht verändert (Spink u. Jansen 2004, 79). Allerdings nimmt die Länge der Suchanfragen langsam zu und liegt mittlerweile bei durchschnittlich etwa 2,6 Termen je Anfrage. Spink u. Jansen (2004, 80) sehen darin ein Anzeichen für die zunehmende Komplexität der Web-Suchen. Hier ist allerdings anzumerken, dass die größere Länge wenig über die Komplexität der Anfragen aussagt; diese würde sich vielmehr in der Nutzung von Operatoren oder anderen Möglichkeiten der Rechercheeinschränkung zeigen. Letztlich bleibt nur der Schluss zu ziehen, dass sich die Entwicklung bzw. Verbesserung von Suchmaschinen an dem geringen Kenntnisstand der Nutzer zu orientieren hat, wobei keine größeren Veränderungen des Nutzerverhaltens erwartet werden dürfen.

Themen und Auswahl der Suchbegriffe

Zu den verwendeten Suchbegriffen bietet allein die Untersuchung von Spink u. Jansen (2004) konkrete Aussagen. Hier ist besonders interessant, dass die Spannbreite der Informationsbedürfnisse im Lauf der Jahre deutlich zugenommen hat. Zwar werden 20 Prozent aller eingegebenen Suchbegriffe regelmäßig verwendet, zehn Prozent kamen allerdings nur ein einziges Mal vor.
Die thematischen Interessen der Suchmaschinen-Nutzer haben sich im Lauf der letzten Jahre ebenfalls gewandelt. Während in den Anfangsjahren viele Anfragen aus den beiden Themenfeldern Sex und Technologie kamen, gehen diese mittlerweile zurück. Dafür nehmen Anfragen im Bereich E-Commerce zu. Weiterhin zugenommen haben nicht-englischsprachige Begriffe sowie Zahlen und Akronyme. Die Popularität von Suchbegriffen ist auch saisonabhängig und wird durch aktuelle Nachrichten beeinflusst (Spink u. Jansen 2004, 183f.).

Sichten der Treffer

Von allen Untersuchungen wird übereinstimmend festgestellt, dass Nutzer in der Regel nur die ersten Treffer aus den Ergebnislisten überhaupt ansehen. Etwas 80 Prozent der Nutzer sehen sich nur die ersten zehn Treffer in der Ergebnisliste an, also in der Regel die erste Seite der Trefferliste (Hölscher u. Strube 2000; Jansen et al. 2000; Silverstein et al. 1999; Spink u. Jansen 2004). Nach den Studien von Spink u. Jansen hat die Anzahl der angesehenen Ergebnisseiten im Lauf der Zeit abgenommen; dies könnte allerdings auch darauf zurückzuführen sein, dass es den Suchmaschinen im Lauf der Zeit gelungen ist, die Suchanfragen besser zu beantworten, so dass sich brauchbare Ergebnisse öfter bereits auf der ersten Ergebnisseite finden. Allerdings wird auch immer wieder darauf hingewiesen, dass in erster Linie die Treffer auf den ersten Listenplätzen, welche ohne vorheriges Scrollen am Bildschirm sichtbar sind, angeklickt werden (Singhal 2004).
Im Rahmen einer Recherche sichten die Nutzer im Durchschnitt nur etwa fünf Dokumente (Spink u. Jansen 2004, 101), wobei jedes Dokument nur kurz geprüft wird, ob es die gewünschte Information enthält. Die Recherche wird meist abgebrochen, sobald ein Dokument gefunden wurde, welches geeignet erscheint, das Informationsbedürfnis zu befriedigen. Eine gesamte Such-Session inklusive der Sichtung der Dokumente dauert in der großen Mehrheit nur etwa 15 Minuten (Spink u. Jansen 2004, 101).

Wissen über Suchmaschinen und deren Finanzierung

In der Nutzerbefragung von Machill et al. werden die Nutzer danach gefragt, wie viele Suchmaschinen sie kennen. Nur 16 Prozent der Nutzer können die Namen von vier oder mehr Suchmaschinen nennen; ein Viertel der Befragten kennt nur eine einzige Suchmaschine.
Hinsichtlich der Finanzierung von Suchmaschinen herrscht bei den Nutzern weitgehende Unkenntnis: In der Befragung von Machill et al. (2003, 190) können nur neun Prozent der Befragten Werbeeinblendungen und Sponsoren als Finanzquelle der Suchmaschinen nennen, während über die Hälfte der Befragten (irrtümlich) annimmt, dass sich Suchmaschinen durch den Weiterverkauf von Nutzerdaten finanzieren. Eine amerikanische Laborstudie aus dem Jahr 2003 (Marable et al. 2003) zeigt, dass durchschnittliche Suchmaschinennutzer über die Finanzierung der Suchmaschinen im Unklaren sind und verwundert reagieren, wenn ihnen gezeigt wird, dass sich oberhalb der regulären Trefferlisten bezahlte Treffer befinden. Im Laborexperiment hatten die Nutzer zu 41 Prozent solche Treffer in der Annahme angeklickt, dass es sich um reguläre Ergebnisse handeln würde. Die Untersuchung wird durch die geringe Teilnehmerzahl von nur 17 Personen in ihrer Aussagekraft geschwächt; die Ergebnisse können allerdings durchaus als Indikator für das mangelnde Wissen der Laiennutzer gewertet werden.

< 2.5 Arten von Suchanfragen  |  Inhaltsverzeichnis  |  2.7 Forschungsbereiche >