[Thread Prev][Thread Next]   >Date Index >Thread Index

Re: Schöne Grüße aus dem Systemhaus der Telekom

Harald Joerg - Fri Jun 21 10:14:39 2002

> 	es gibt noch Perl-Interessierte, die (noch) nicht in Eurem
> 	Club sind. Ich habe eine (Windows-2000)-Frage an die Profis:

Ich bin weder Windows- noch Perl-Profi, aber....
> 
> 	Da mir die Suchmaschine Google so gefällt, habe ich vor,
> 	ein Äquivalent dazu selber zu machen mit folgender Idee:
> 
> 	- soll Begriffe nur auf der eigenen Festplatte oder im hauseigenen
>         Netzwerk suchen
> 	- soll PDF und alle MS-Office-Formate scannen können

Würg.  Da hast Du was vor.

Ich vermute, das geht nur, wenn Du diese Formate mit
"handelsüblichen", nicht unbedingt in Perl geschriebenen Konvertern
traktierst, um an den Text zu kommen.  Office-Formate und PDF machen
die Beurteilung von "besten Hits" nicht ganz einfach.

> 	- Plaintext natürlich auch
> 	- soll auf die Dauer durch handgeschriebene Perl-Algorithmen an
>         private Suchbedürfnisse angepaßt werden
> 	- soll insgesamt in Perl geschrieben sein
> 	- soll Ergebnisse im Google-Style anzeigen, beste Hits ganz oben.
> 
> 	Das habe ich vor. Bevor ich jedoch das Rad ganz von Neuem erfinde:
> 	gibt's da schon was, was man verwenden kann?

Ein brauchbarer Anfang ist
<http://www.searchtools.com/tools/tools-perl.html>

Die Kandidaten sind aber von unterschiedlicher Qualität.  Vor Jahren
habe ich mal ICE eingesetzt, das ist aber wirklich nur für kleine
Datenmengen brauchbar (Flat File statt Datenbank, der Code riecht nach
Perl4-Erbstück, nur HTML).  YMMV!
-- 
Cheers,
haj



Next: