Suchmaschinen

Neben der Benutzeroberfläche zur Eingabe der Suchworte wird eine Suchmaschine durch drei Komponenten charakterisiert - die Datengewinnung, die Datenanalyse und -verwaltung sowie die Verarbeitung der Anfragen.
Stand 30.05.2011

Inhaltsübersicht:

  1. Komponenten einer Suchmaschine
  2. Vorteile und Nachteile von Suchmaschinen

Komponenten einer Suchmaschine

Suchmaschinen werden charakterisiert durch das automatische Sammeln und Auswerten von Webseiten. Die bekanntesten Suchmaschinen sind Google (externer Verweis: http://www.google.de), Yahoo (externer Verweis: http://de.yahoo.com) und Lycos (externer Verweis: http://www.lycos.de). Im Alltagsgebrauch beschreibt der Begriff Suchmaschine das User-Interface eines Suchdienst-Anbieters mit einer Eingabemaske für die Suchanfrage, i.d.R. umgeben von Werbung, Verweisen und Themenblöcken. Die meisten Suchmaschinen bieten eine erweiterte Suche mit zusätzlichen Optionen an. Alle gängigen Suchmaschinen gestatten durch die zugrunde liegende Boolesche Algebra, Suchbegriffe durch Plus-, Minus- und Oder-Zeichen logisch miteinander in Verbindung zu setzen.

Die ausgegebenen Suchergebnisse sind jedoch keine Live-Ergebnisse. Neben dem User-Interface können einer Suchmaschine typischerweise drei Komponenten mit ihren jeweiligen Funktionen zugeschrieben werden: Das Webrobot-System (auch: Webcrawler-System) sammelt die Dokumente aus dem Web, das IR-System baut eine durchsuchbare Datenstruktur auf, der Query-Prozessor (auch: Searcher) stellt die von einer Suchmaschine erwartete Funktionalität her (siehe nachfolgendes Bild).

Systemkomponenten einer Suchmaschine

Bildbeschreibung "Systemkomponenten einer Suchmaschine": Webrobot-System (Datengewinnung), Information Retrieval-System (Datenanalyse und -verwaltung), Query-Prozessor (Verarbeitung der Anfragen).

Die Systemkomponenten sind wie folgt zu beschreiben:

Webrobot-System (Datengewinnung)

Das Webrobot-System ruft die Website auf, lädt sie herunter und überprüft die Existenz bzw. Veränderung von bereits im Datenbestand vorhandenen Dokumenten.

IR-System (Datenanalyse und -verwaltung)

Das Information Retrieval-System reduziert die Texte auf das Wesentliche und wandelt so die Dokumente in eine zur Verarbeitung günstigere Form um (Dokumentenrepräsentation). Es vergibt Gewichte und damit Relevanzwerte in Bezug auf bestimmte Stichwörter (Indizierung).

Query-Prozessor (Verarbeitung der Anfragen)

Der Query-Prozessor stellt über die Eingabeoberfläche des Webinterface die Schnittstelle zum Nutzer dar und erzeugt anhand der angefragten Stichwörter aus dem Index des IR-Systems eine gewichtete, sortierte Liste von Einträgen. Er ergänzt diese Liste mit weiteren Informationen, bspw. das Datum der Indizierung und stellt die Listenansicht als Suchergebnisliste für den Nutzer bereit.

Seitenanfang

Vorteile und Nachteile von Suchmaschinen

Nach erfolgreicher Suche erhält der Nutzer eine oder mehrere Ergebnisseiten passend zu seinen Suchbegriffen. Jedes gefundene Dokument ist bei den Suchmaschinen mit einem als Verweis gestalteten Titel, einem Beschreibungstext und spezifischen Eigenschaften wie bspw. Dateiname oder Dateigröße versehen. Dabei wird die Relevanz der Suchbegriffe als absteigendes Sortierungsmerkmal verwendet. Suchmaschinen unterscheiden sich in der Anwendung einzelner Algorithmen und der dadurch entstehenden Gewichtung. Eben diese Gewichtung führt zu teilweise unbefriedigenden Listungen auf der ersten Ergebnisseite. Jeder Nutzer kennt das Problem, unter den ersten angezeigten Treffern nicht das gewünschte Ergebnis zu finden.

Auch die zunehmende Kommerzialisierung von Suchmaschinen ist von Nachteil. Die an erster Stelle aufgeführten Ergebnisse sind nicht mehr zwingend die zutreffendsten, sondern möglicherweise die am Besten bezahlten (siehe Payed-Inclusion). Noch werden solche Verweise zusätzlich hervorgehoben und sind, auch wenn sehr unauffällig und kaum wahrnehmbar, vom Nutzer von den restlichen Einträgen unterscheidbar.

Eine Suchmaschine behandelt prinzipiell jede Website gleich. Sind die beeinflussenden Faktoren zur Gewichtung und Relevanzeinschätzung bekannt, können diese optimal für die eigene Website-Optimierung genutzt werden. Um einen Missbrauch bestmöglich einzuschränken, werden die verwendeten Algorithmen und Feineinstellungen von den Suchmaschinen-Betreiber so geheim wie möglich gehalten. Diese Faktoren werden regelmäßig verändert - einerseits aus Verbesserungsgründen, andererseits jedoch auch, um solche gezielten Optimierungen zu verhindern.

Weiterführende Literatur:

Erlhofer, Sebastian:
Buchdeckel Suchmaschinen-Optimierung
Suchmaschinen-Optimierung, Seite 21 ff.,
Galileo Computing, Bonn, 1. Auflage 2005 (Galileo Press),
ISBN 3898426203
Glöggler, Michael:
Buchdeckel Suchmaschinen im Internet
Suchmaschinen im Internet. Funktionsweisen, Ranking-Methoden, Top-Positionen, Seite 6-7,
Springer Verlag, Berlin, 1. Auflage 2003 (Xpert.press),
ISBN 354000212X

Seitenanfang