Wissenschaftsjahr 2014 - Die Digitale Gesellschaft

So wird das Web für jeden erschlossen

Der Funktionsweise von Suchmaschinen auf der Spur

Sich im Dschungel des Internets zurechtzufinden, kann mitunter ein schwieriges Unterfangen sein. Verlässliche Hilfe leistet die Websuche: Mit Google, Bing oder Yahoo werden Begriffe und Personen in Sekundenbruchteilen gefunden, Fakten blitzschnell überprüft und Urlaube oder Anschaffungen geplant. Doch trotz dieser essentiellen Bedeutung weiß kaum jemand, wie die Mechanismen hinter den Suchfeld-Oberflächen funktionieren. Eine kurze Einführung.

Ist das Internet ein Ort des Chaos?
(©Banana Republic images/Shutterstock)

Man stelle sich nur für einen Moment eine Welt ohne Suchmaschinen vor. Das Web wäre ein riesiges Labyrinth aus Hyperlinks, in dem das Aufspüren hilfreicher Informationen nahezu unmöglich wäre. Glücklicherweise hat sich die Forschung schon lange vor der Entstehung des World Wide Webs Gedanken über sinnvolle Suchmechanismen gemacht. Ein Blick in die Historie zeigt: Erste Suchalgorithmen haben sich bereits in den 1960er und 1970er Jahren daran orientiert, ob und wie häufig die Begriffe aus einer Anfrage in den durchsuchten Dokumenten vorkommen.

Ein solches sogenanntes Signal ist auch heute noch Grundlage vieler Suchverfahren. Seiten und Dateien, die Schlüsselwörter häufig und prominent enthalten, sind meist relevanter als andere. Aktuelle Suchalgorithmen kombinieren aber noch viele weitere Anhaltspunkte - beispielsweise Autor, Länge sowie das Alter des Dokuments und die Anzahl und Art der Webseiten, die darauf verlinken.

Wenn Nutzer zu Signalen werden

Zu einem der wichtigsten Signale ist mittlerweile aber das Nutzerverhalten selbst geworden. Suchmaschinen beobachten, welche Treffer die Suchenden tatsächlich anklicken und lernen daraus, die Ergebnisse besser zu sortieren. Wird etwa von vielen Nutzern nicht der erste Treffer in einer Suchergebnisliste angeklickt, sondern der zweite, so ist das ein deutliches Zeichen, dass die Reihenfolge vertauscht werden sollte.

Die Macht der großen Suchmaschinen entsteht gerade daraus, dass sie aus mehreren Milliarden Anfragen und Klicks pro Tag lernen können, immer passgenauere Treffer zu liefern. Aber sie gehen noch einen Schritt weiter: Um die passendsten Suchergebnisse anbieten zu können, speichern und verknüpfen die Suchmaschinen auch das Verhalten der einzelnen Nutzer in den verschiedensten Situationen. Dies hat zunächst einen sehr nützlichen Effekt. Zeigt die Suchmaschine sofort die Treffer an, die andere Anwender unter ähnlichen Umständen erst nach einigen Minuten gefunden haben, spart das viel Zeit. Nach und nach kann so aus den Anfragen aber auch ein sehr genaues Persönlichkeitsprofil entstehen - inklusive gesundheitlicher oder finanzieller Probleme. Das gefällt natürlich nicht jedem.

Suchmaschinen sorgen für Licht im Internet-Dschungel
(©soft light/shutterstock)

Das Wichtigste am Schluss

Kleinere Anbieter treten daher auf dem Suchmaschinenmarkt mittlerweile mit dem Versprechen an, wenig und vor allem nicht personalisiert zu speichern. DuckDuckGo ist ein Beispiel für eine Suchmaschine, die nach eigenen Angaben keine persönlichen Informationen sammelt und dadurch auch sogenannte Filterblasen verhindern könnte - also den Effekt, das bestimmte Ergebnisse aufgrund eines entstandenen Nutzerprofils und den daraus abgeleiteten Vorlieben gar nicht mehr angezeigt werden.

Welche Ansätze und Lösungsmöglichkeiten sich für die Datenschutz- und Privatsphäreproblematik im Umfeld der Websuche noch ergeben und schließlich durchsetzen werden, ist nicht wirklich absehbar. Klar ist: Die rasante Entwicklung der Suchmaschinen dauert mit den Möglichkeiten der Auswertung von Nutzerverhalten im Big-Data-Format erst einmal weiter an. Und trotzdem wird auch zukünftig gelten, was mein Kollege Prof. Benno Stein mit einem Augenzwinkern treffend festhält: "Das was man sucht, findet man immer erst zum Schluss."

Matthias Hagen ist Juniorprofessor für Big Data Analytics an der Bauhaus-Universität Weimar und leitet dort auch eine gleichnamige Nachwuchsforschergruppe, die vom Bundesministerium für Bildung und Forschung (BMBF) finanziert wird. Sein Forschungsschwerpunkt ist die Algorithmenentwicklung zur Analyse von Big Data beispielsweise für die Bereiche Information Retrieval, Websuche und Web Mining.