2.3 Ranfolge und Bewertung --

Sinn und Funktion von einem Information Retrieval System in Webrobot-Suchmaschinen


Um die von Crawlern eingelesenen, und in einer Datenbank gespeicherten Daten, auf Anfrage ausgeben zu können und in eine (für den Besucher nützliche) Reihenfolge zu bringen verwenden Suchmaschinen ein sogenanntes Information Retrieval System.

Information Retrieval Systeme bewerten Dokumente bezüglich Ihrer Relevanz zu einer Suchanfrage und ordnen Sie in eine Rangfolge. Sie benutzen bestimmte Methoden um ein Textdokument (oder dessen Daten) zu untersuchen und es
Aufgrund des Inhaltes des Textes zu bewerten. Je besser die Bewertung eines Textdokuments ist umso höher ist die Relevanz dieses Dokuments zu einem bestimmten Suchwort / Suchanfrage. Unter Berücksichtigung bestimmter Kriterien wird so eine Ordnung in Rangfolge möglich.

Ein Information Retrieval System erkennt die im Text eines Indexierten Dokuments enthaltenen Buchstaben/Zeichen und verarbeitet diese als Wörter. Die Fähigkeit Wörter zu erkennen ist die Grundvorraussetzung einer Information Retrieval System Software.

Dabei erkennen Information Retrieval Systeme von Webrobot-Suchmaschinen nur echte Wörter (im semantischen Sinn) und keine sinnlosen Zeichenfolgen. Die vom Information Retrieval System erkannten Wörter werden alphabetisch in einer Datenbank abgelegt. Diese Datenbank bildet den Grundstock für jede Suchanfrage.
Bei einer Suchanfrage wird überprüft ob das Suchwort in der vom Information Retrieval System erstellten Datenbank vorhanden ist. Falls ja, verweist das Wort in der Datenbank auf alle Dokumente welche das gesuchte Wort enthalten.

Alle Dokumente die das gesuchte Wort enthalten werden nun dem Suchenden in einer Rangfolge präsentiert. Die Rangfolge ergibt sich anhand der Relevanz der Dokumente zum Suchbegriff. Um zu ermitteln ob ein Dokument mehr oder weniger Relevant zu einem Suchbegriff ist setzen Suchmaschinen verschiedene Verfahren ein um die Dokumente entsprechend bewerten zu können.

Erfolg (also möglichst weit oben gelistet zu sein) bei Suchanfragen zu haben bedeutet demnach nichts anderes als seine Webseite auf die entsprechenden Kriterien hin zu optimieren welche Suchmaschinen für eine positive Bewertung der Relevanz als wichtig erachten.



weiterführende Links

Nächstes Thema - Keyword Stemming
Relevanz - Methoden zur Verbesserung
Stichwortverzeichnis
Inhaltsverzeichnis




Zur Startseite: Suchmaschinen-Webrobots