Das CGI-Script ice2-for.pl

Ein Script zur Volltextsuche in HTML-Dokumenten
Das Perl-Script ice2-for.pl dient zur Suche nach Stichwörtern in HTML-Dokumenten. Dahinter verbirgt sich die Suchengine Ice von Christian Neuss, die leicht modifiziert wurde. Für den gesamten WWW-Server gibt es einen anderen Volltext-Index, der die Harvest-Engine verwendet. Das CGI-Programm ICE kann man dafür zum Suchen in eigenen Indizies benutzten.

Einen Index generiert man mit Hilfe des Perlscriptes ice2-idx.pl unter /vol/omega-vol3/etc/scripts/db/. Da die Pfade dort noch eingebrannt sind, muß man die Datei noch kopieren und die Variablen @SEARCHDIRS und $INDEXFILE ändern. Den Index muß man dabei dort ablegen, wo die indizierten Dokumente liegen.


Beispiel

Einen Index für den Nutzer ~ftpsoft kann man erstellen, indem man
@SEARCHDIRS=(
  "/vol/delta-vol11/unixsoft/ftpsoft/.public_html",
);
$INDEXFILE='/vol/delta-vol11/unixsoft/ftpsoft/.public_html/index.idx';
in ice2-idx.pl setzt. Einbinden kann man das CGI-Script durch die Zeile
    <A HREF=/cgi-bin/ice2-for.pl/~ftpsoft/> Suche in
    Dokumenten von Ftpsoft </A>
und erhält die Ausgabe Suche in Dokumenten von Ftpsoft

Dabei wird hinter den Namen des CGI-Scriptes der HTML-Pfad für den Suchbereich angegeben, wo auch der Index liegt.


Weitere Optionen

Ein Suchstring kann dabei einfach als Parameter für das CGI-Script übergeben werden.
    <A HREF="/cgi-bin/ice2-for.pl/~ftpsoft/
    	?KEYWORDS=%28elefant%29"> Elefant</A>
Liefert alles zum Stichwort Elefant. Ebenso sind Verknüfungen durch 'Und' und 'Oder' möglich.
    <A HREF="/cgi-bin/ice2-for.pl/~ftpsoft/
    	?KEYWORDS=%28cgi+or+shtml%29"> CGI oder SHTML</A>
Neben einen Thesaurus, der zur Zeit leider nicht funktioniert, bietet Ice noch einen alphabetischen Index und die Möglichkeit nur aktuelle Dokumente zu suchen.
    <A HREF="/cgi-bin/ice2-for.pl/~ftpsoft/?DAYS=30">
    	Diesen Monat aktuell</A>
Diesen Monat Aktuell sucht die Dokumente, die in letzter Zeit geändert wurden.

Einige der Funktionen von Ice, wie die Definierung von Bereichen/Kontexten oder Aliase stehen normalen Nutzern nicht zur Verfügung, da diese nur im Script selbst editierbar sind.


Letzte Änderung: Thursday, 17-Sep-1998 16:27:09 CEST
(wwwadmin@informatik.hu-berlin.de)
(ftpsoft@informatik.hu-berlin.de)