Funktionsweise von Suchmaschinen

Suchmaschinen erfassen stetig neue und veränderte Informationen im World Wide Web. Dies geschieht durch sogenannte Crawler.

Es ist nicht für jeden einfach, sich im Dschungel des Internets zurecht zu finden und die Funktionsweise von Suchmaschinen zu verstehen. Täglich werden Suchanfragen an Suchmaschinen gestellt und auf Milliarden von Websites gesurft. Die Suchmaschinen helfen dem Nutzer, gezielt nach etwas zu suchen oder einfach nur zu stöbern. Mit Hilfe von Suchbegriffen zeigen die Suchmaschine die Ergebnislisten von Websites, Bilder, Nachrichten etc. an. Natürlich haben sich die Suchmaschinen immer weiterentwickelt und bieten mittlerweile Filterfunktionen an, um die Suche weiter einschränken zu können.

Folgende Aufgaben übernehmen Suchmaschinen:
  • Websites werden gesucht und indexiert,
  • Informationen werden gespeichert und katalogisiert,
  • Bereitstellung der gesammelten Informationen für die Anfrage.

Bei einer Suchanfrage an die Suchmaschinen wird „nur“ das World Wide Web durchforstet. Die Suchmaschinen funktionieren wie eine Art Computerprogramm, welches nach den angefragten Inhalten auf dem Suchmaschinen-Index (Katalog mit indexierten Inhalten) im Internet Browser sucht. Der Suchbegriff (Keyword) wird in der Suchmaschinenmaske eingegeben und dann wird mittels Webcrawlern dieser Begriff nach einem bestimmten Algorithmus gesucht. Diese Daten werden in einem Verzeichnis indexiert und innerhalb von Sekundenbruchteilen in der Suchergebnisliste (SERP-Search Engine Result Page) angezeigt. Die Ergebnisse, die von der Suchmaschine als relevant gesehen werden, befinden sich am Anfang der Ergebnisliste.

Die Kriterien, nach denen sich das Ranking innerhalb der Suchmaschinen zusammensetzt, werden ständig aktualisiert. Eine bestimmte Position auf der Suchergebnisliste ist keinesfalls für ständig die gleiche, denn die Suchmaschinen wollen dem Suchenden immer das beste Ergebnis liefern. Durch die Suchmaschinenoptimierungen einiger Seiten und Anpassungen der Inhalte, besteht die eigentliche Aufgabe der Suchmaschinen darin, immer wieder zu erkennen, welche Websites für den eingegebenen Suchbegriff relevant sind.

Arbeitsweise von Suchmaschinen
Wie funktionieren die Suchmaschinen?

Eine Suchmaschine besteht im Wesentlichen aus:
  • URL-Server,
  • mehreren Crawlern (Bots, Robots, Spider),
  • Parser,
  • Store-Server und
  • dem Index.
Der URL-Server einer Suchmaschine verwaltet Internetadressen, die entweder noch nicht im Index der Suchmaschine aufgenommen wurden oder zur Aktualisierung erneut untersucht werden sollen. Der Server der Suchmaschine gibt die gesammelten Daten an die Crawler weiter, die die Websites besuchen und die Informationen sammeln. Der Parser hat die Aufgabe, eine vereinfachte Form jeder einzelnen HTML Seite zu erstellen und diese dem sogenannten Store-Server zu übergeben. Die Extrahierung der Informationen wird durch den Store-Server übernommen und noch nicht im Index der Suchmaschinen enthaltener Text oder Begriffe werden in den Index aufgenommen.
Der Suchmaschinen-Index beinhaltet mehrere Bereiche:
  • Lexikon - Sammlung von Begriffen, die im Netz gefunden worden,
  • Hit Lists - jeder Begriff und deren Bedeutung wird auf Hit Lists vermerkt zuzüglich Verweise auf entsprechende Websites im Repository,
  • Repository - Speicherung der Websites.

Suchmaschinen Arten
Welche Arten von Suchmaschinen gibt es?

In der fortschreitenden Entwicklung des World Wide Web haben sich unterschiedliche Arten von Suchmaschinen etabliert, wobei nur eine Art der Suchmaschinen für Nutzer wirklich relevant ist - die Volltext-Suchmaschine.
Suchmaschinen Arten:
  • Volltext-Suchmaschine - Eingrenzung der Suche möglich und Nutzung von Crawlern,
  • Meta-Suchmaschine - andere Suchmaschinen und Indexe werden als Quellen genutzt, nicht das gesamte indexierte Internet wird genutzt,
  • Webverzeichnisse - Webkatalog, Datenbank, meist manuelle Suche.

Alle Suchmaschinen funktionieren mehr oder weniger berechenbar. Kriterien wie Meta Tags, Link Popularity, Page Ranking usw. verlieren immer mehr an Bedeutung, das bedeutet, dass sich mehr auf den Content (Text) konzentriert werden muss, um Top Rankings (Top Positionen) in den wichtigsten Suchmaschinen zu erhalten.