888554

Google erfasst mehr Seiten als erwünscht

27.11.2001 | 00:00 Uhr |

München/Macwelt - Seit kurzem kann die beliebte Suchmaschine von Google auch auf Dokumente der Formate PDF, Excel und Word zugreifen. Offenbar erfasst die Suchmaschine dabei auch Dokumente oder HTML-Seiten, die sie eigentlich nichts angehen. Wie ein Artikel bei Cnet feststellt, tauchen gelegentlich in den Suchergebnissen Dokumente auf, die von ihren Verfassern nicht für weltweite Publikation vorgesehen sind. Dabei kann es sich etwa um firmeninterne Daten handeln, die nur für Mitarbeiter vorgesehen sind, in seltenen Fällen auch um Passwörter. Manchmal reicht ein einzelner Link auf eine "geheime" Seite, um die Aufmerksamkeit der Suchmaschine zu erregen.
Auf diese Probleme angesprochen verweist das Unternehmen Google darauf, sie würden alle Dateien als öffentlich betrachten, die nicht durch spezielle HTML-Befehle oder eine robots.txt-Datei für Suchmaschinen gesperrt sind. Dabei handelt es sich um spezielle HTML-Befehle oder Dateien, die einer Suchmaschine den Zugriff auf die Seiteninhalte verbieten. Das Unternehmen verspricht aber auch, seine Suchtechnik zu überarbeiten. Schließlich haben diese speziellen Robot-Tags einen großen Nachteil: Sie markieren Seiten mit dem Hinweis, hier würden vertrauliche Informationen aufbewahrt. Eine gute Methode, um die Aufmerksamkeit von Hackern zu erregen. sw

Info: Google Internet www.google.com/webmasters

0 Kommentare zu diesem Artikel
888554