2.5 Blacklisten -- Wie Suchmaschinen Inhalte auschliessen

Wie Suchmaschinen unzulässige Begriffe mit Blacklisten ausschliessen

Manche Suchmaschinen führen Listen mit Worten welche die Suchmaschinen nicht indexieren möchten da diese Begriffe für die jeweilige Suchmaschine als unzulässig gelten. So genannte Blacklists.
So werden vor dem Speichern eines (durch Crawler) eingelesenen Dokuments, dessen Daten mit den Wörtern einer Blacklist verglichen. Sind auf der eingelesenen Seite Wörter vorhanden die in der Blacklist stehen wird das Dokument nicht zur Aufnahme in den Index der Suchmaschine freigegeben. So versuchen Suchmaschinen unerwünscht Inhalte aus Ihrem Datenbestand fernzuhalten.

Eine abgeschwächte Version einer Blacklist benutzen Suchmaschinen um die Treffergenauigkeit zu erhöhen. Bei dieser Version werden die Wörter welche im Text einer eingelesenen Seite sind ebenfalls mit einer Wortliste verglichen.
Bei Übereinstimmungen mit Wörtern in der Liste, werden allerdings nur die einzelnen Wörter aus dem Datenbestand der Suchmaschine gelöscht und nicht gleich das ganze Dokument. So können z.B. Wörter ausgeschlossen werden, die Inhaltlich nicht zum Thema eines Dokuments passen.

Auf diese Weise können Suchmaschinen auch sehr einfach unwichtige Worte beim einlesen erkennen. Dies wird zum Beispiel oft bei Bindeworten oder Artikeln (bestimmt und unbestimmt) von angewandt. Dieses System erhöht die Treffergenauigkeit der Suchmaschine und hält den Index der Suchmaschine klein. Das spart Suchmaschinen Rechenressourcen und Speicherplatz.



weiterführende Links

nächstes Thema - Relevanz
Stichwortverzeichnis
Inhaltsverzeichnis




Zur Startseite: Suchmaschinen