886478

Mini-Google für die Homepage

26.07.2001 | 00:00 Uhr |

Suchmaschine im Eigenbau: Wem seine private Homepage aus den Fugen gerät, kann ihr mit einigen wenigen Kniffen eine komfortable Suchfunktion spendieren.

Für die Installation einer Suchmaschine auf einer kleineren Website genügt ein kleines Perl Skript. Dazu sind nicht einmal Programmierkenntnisse nötig. Es reicht aus, einige technische Angaben über seine Website zu haben, ein FTP-Programm und ein Texteditor. Grundlegende Voraussetzung ist allerdings ein eigener Server oder ein Provider, der Zugriff auf das CGI- Verzeichnis der Website erlaubt - eine Website mit CGI-Zugang kostet etwa bei Netbeat 5 Mark im Monat.

Suchmaschinen-Skripts gibt es kostenlos oder als Shareware. Eines davon ist das Perl-Skript Fluffy, das für eine mittlere Website mit einigen hundert HTML-Seiten völlig ausreicht. Hat man die Datei von der WebsiteFluffy.co.uk heruntergeladen, erhält man einen Ordner mit sieben Dateien. Zwei davon tragen den Namen config. Läuft die Website auf einem Unix-Server, wozu auch Mac-OS X zählt, verwendet man die Datei mit der Endung .unix, bei einem NT-Server die auf -nt endende Datei. Diese benennt man nun in fluffysearch.config um. An drei Stellen ändert man dann den Code des Skripts, um es an die eigene Homepage anzupassen. Für die Änderung des Codes genügt Simple Text, stilvoller gelingt dies natürlich mit einem Programm wie BBedit oder Alpha. Als erstes Angabe benötigt das Skript die Angabe, wo auf dem Webserver die Website zu finden ist. Diese so genannte Pfadangabe ist nicht die Internetadresse sondern die Dateiadresse auf dem Webserver des Providers. Das ist eine Adresse, die so ähnlich wie /home/web/public_html/produkte oder auch /home/lieschenmueller/ klingt. Die Adresse schreibt man in der Zeile

# document root on disc $docroot_disc = 'Adresse';

dorthin, wo jetzt das Wort Adresse steht.

$docroot_disc = '/home/lieschenmueller/';

Nun hat das Perlscript eine Art Ausgangsadresse. Als nächstes legt man für das Suchmaschinenskript einen Ordner an, in den es einen Index, eine Art Inhaltsverzeichnis der Homepage, legen kann. Diesen Ordner nennen wir fcs-index. Dazu benötigt man ein FTP-Programm wie Fetch oder Rbrowser. Am besten legt man fcs-index in den gleichen Ordner, in dem auch die index.html liegt, also die oberste Ebene. Auch um diesen Ordner zu finden, braucht die Datei fluffysearch.config eine Pfadangabe:

# directory to store index files $index_loc = '/home/lieschenmueller/fcs-index';

Eine weiter Anpassung betrifft die Datei, welche die Indizierung startet. Hier findet man im Quelltext die Zeile

Password for indexer?<br><form method=POST><input type=password name="pass"><input type=submit value="Run"><p></form></body></html>

Anstelle des Wortes "pass" legt man ein eigenes Passwort fest, das zugleich auch dem Startkommando für die Indizierung der Website dienen wird.

Es gibt noch eine Reihe weiterer Konfigurationsmöglichkeiten, etwa für Frames, oder für die Anzahl der wiedergegebenen Treffer, aber für eine einfache Suchmaschine können Webmaster privater Sites die Voeinstellungen ohne Probleme übernehmen.

Die einzelnen Dateien lädt man nun mit dem FTP-Programm in das cgi- Verzeichnis der Website. Wichtig ist nun, den Programmen die richtigen Zugriffsrechte zuzuweisen. Auf einem Unix-Server erhalten jede Datei und jeder Ordner Rechte - so dürfen etwa bestimmte Nutzer eine Datei lesen und verändern, andere nur lesen.Unix verwendet hierfür einen Zahlencode mit 9 Möglichkeiten. Unsere Fluffy-Dateien erhalten alle die Rechte 755, in einem grafischen FTP- Programm wie Fetch sieht das folgendermaßen aus:

Nicht zu vergessen der Ordner fcs-index. Damit das Skript in dem Ordner das Indexverzeichnis schreiben darf, bekommt der Ordner die Rechte 777. Das macht man indem man ihn im FTP-Programm auswählt und alle 9 Kästchen ankreuzt.

Jetzt kann man mit der Indizierung der Seite beginnen. Hierfür ruft man mit einem beliebigen Browser das für die Indizieren benötigte Skript, fluffyindex.pl auf. Man tippt die Adresse www.lieschenmueller.de/cgi-bin/fluffyindex.pl ein und im Browserfenster erscheint ein Formular, das nach unsererem Passwort verlangt. Gibt man das richtige Passwort ein und hat auch sonst alles richtig gemacht, passiert einige Sekunden gar nichts, bis auf der Seite eine Erfolgsmeldung mit der Anzahl der indizierten Seiten erscheint.

Indexing complete. 261 indexed errors reading 0 files took 24 seconds.

Das Suchfenster für die Besucher der Website besteht aus folgendem HTML-Code:

<form method="get" action="/cgi-bin/fluffysearch.pl">
<b>Suche:</b><br />
<input type="text" name="words" size="15">
<input type="submit" value="Suche starten">
</form>


Die indexbasierte Suchmaschine ist zugleich schnell und einfach. Allerdings hat der Indexer bei Datenmengen über 6 MB Probleme. Bei größeren Mengen an HTML-Seiten empfiehlt sich deshalb die Suchmaschine Perlfect Search, die allerdings auch etwas aufwendiger zu konfigurieren ist.
Stephan Wiesend

0 Kommentare zu diesem Artikel
886478