2.2 Website indexierung -- Wie man ins Suchmaschinen Listing kommt



Indexierung von Websites in Suchmaschinen. So listen Suchmaschinen Content Angebote in Ihrem Index



Zum Listen eines Webangebots im Index müssen die eingelesenen Texte von der Suchmaschine bewertet werden. Diese Bewertung erfolgt anhand einer Analyse und Bewertung des Textes (also der Daten) der eingelesenen Website.

Solch eine Analyse und Bewertung eines Dokuments gehört zu den wichtigsten Verfahrensoperationen bei Suchmaschinen. Hierbei werden die Daten eines Dokuments z.B. interpretiert, geordnet, überprüft und gefiltert. Dazu gehört z.B. festzustellen wie viele Wörter ein Dokument enthält, wie häufig ein Wort vorkommt oder in welcher Relation es zu anderen Wörtern des Dokumentes steht sowie eine Analyse der Syntax, um nur einige Beispiele zu nennen. Jede Suchmaschine verwendet ähnliche Grundprinzipien um die eingelesenen Daten zu analysieren, zu ordnen und in einer Datenbank verfügbar zu machen.

Nach welchen Verfahren allerdings genau ein Suchmaschine diese Daten bearbeitet und als Information speichert ist nicht bekannt und von Suchmaschine zu Suchmaschine unterschiedlich. Schliesslich ist das ablegen dieser Daten einer der wichtigsten Schritte bei Suchmaschinen, denn je intelligenter man diese Daten abspeichert umso besser und schneller kann man daraus wieder eine Information gewinnen bzw., wenn Semantik mit ins Spiel kommt, Wissen extrahieren.



Ob Suchmaschinen nun wirklich "Wissen" präsentieren wenn man eine Suchphrase in den Suchschlitz eintippt, mag jeder für sich selbst interpretieren. Meist ist wohl besser von "extrahierter Information" zu sprechen, wenn man sich die Suchergebnisse der aktuellen Suchmaschinen anschaut.

Wie aber kommt man nun zu den Informationen, die aus einer Datenbank extrahiert werden müssen?
Und wie bringen Suchmaschinen diese in eine sinnvolle Reihenfolge die dem Benutzer einen Mehrwert darstellt?

Ermöglicht wird dies durch Information Retrieval Systeme. Dies ist eine Softwarekompontente der Suchmaschine. Sie ermittelt für jede einzelne HTML Seite die relevanten Schlüsselwörter/Suchbegriffe. Anhand dieser ermittelten Suchbegriffe wird das jeweilige Domument einem bestimmten Themengebiet zugeordnet.

Wird nun eine Suchanfrage gestartet, so kann die Suchmaschine aus allen Themengebieten die dem eingegebenen Suchwort zugeordnet werden, die Web-Angebote ermitteln welche die höchste Relevanz zum Suchbegriff aufweisen. Das heisst Sie sollten mit Ihrem Webangebot auf jedenfall viele der Suchbegriffe abdecken die mit dem Thema Ihrer Homepage assoziiert werden können. So stellen Sie sicher das Ihre Homepage dem richtigen Themengebiet zugeordnet wird.

Diese Einteilung der Inhalte im Index in Themengebiete hat zwei Hintergründe.

Vorrangig werden pro Suchanfrage weniger Ergebnisse geliefert. Dies hat den Vorteil das der Suchende eine leichtere Suche hat, da alle Angebote die mit dem gesuchten Thema nichts zu tun haben von vornherein von der Suche ausgeschlossen werden. Stellen Sie sich vor man würde den gesamten Datenbestand einer Suchmaschine (und dies sind mehrere Milliarden Webseiten) als Suchergebniss ausgegeben bekommen.....viel Spass beim stöbern.

Die ressourcensparende Speicherung der Daten ist der zweite Grund. Da Suchmaschinen ein möglichst schnelles Ergebniss liefern wollen durchsuchen Sie auch wirklich nur den Teil Ihrer Datenbank, welcher für die Suche auch genügend Relevanz aufweist. Dies spart der Suchmaschine unheimlich an Rechenkapazität und der suchende Kunde hat noch einen Vorteil durch die schnellere Bearbeitungszeit der Suchanfrage.



Weiterführende Links:


Nächstes Thema: Bewertung und Rangfolge - Information Retrieval Systeme
Inhaltsverzeichnis
Stichwortverzeichnis




Zur Startseite: Suchmaschinen-Indexierung