[Thread Prev][Thread Next]   >Date Index >Thread Index

Re: Sch?ne Gr??e aus dem Systemhaus der Telekom

Rainer Jung - Fri Jun 21 21:59:10 2002

On Fri, Jun 21, 2002 at 09:04:49AM +0200, Jacob, Walter wrote:
| Da mir die Suchmaschine Google so gefällt, habe ich vor,
| ein Äquivalent dazu selber zu machen mit folgender Idee:
| - soll Begriffe nur auf der eigenen Festplatte oder im
|   hauseigenen Netzwerk suchen
| - soll PDF und alle MS-Office-Formate scannen können
| - Plaintext natürlich auch
| - soll auf die Dauer durch handgeschriebene Perl-Algorithmen
|   an private Suchbedürfnisse angepa?t werden
| - soll insgesamt in Perl geschrieben sein
| - soll Ergebnisse im Google-Style anzeigen, beste Hits ganz oben.
| [...]
| gibt's da schon was, was man verwenden kann?

Klar, gibts da schon einiges. Das Problem ist, dass du zwei verschiedene
Dinge auf einmal loesen moechtest, die Suche im Intranet _und_ auf
deinem Rechner, bzw. allen Rechnern eines Konzerns.
Dafuer gibt es zwei Moeglichkeiten. Einmal ein zentraler Server, der
alles Indiziert. Dieser hat das Problem auf alle einzelnen Rechner
zugreifen zu muessen. Die andere Moeglichkeit waere, das auf allen
Rechnern einzeln zu installieren. Tolle Idee.

Ich wuerde das trennen. 
Was spricht dagegen, die lokale Suche, die Windows bereits anbietet zu
verwenden? Natuerlich indiziert sie nicht alle Dokumente, sondern
durchsucht diese bei Anfrage. Auch eine Sortierung gibt es hier nicht,
lediglich Treffer werden gezeigt.
Fuer das Indizieren eines Intranets gibt es ebenfalls einige freie
Tools, die allerdings nicht alle in Perl geschrieben sind. Eine Suche
bei freshmeat.net sollte da auch schnell helfen.

Nur zur Information, die Entscheidung, was am Besten trifft ist nicht
einfach zu entscheiden. Genau das macht ja eine gute Suchmaschine aus.
Google analysiert beispielsweise ueber die Google-Bar, auf welchen
Seiten viele Leute herumsurfen, um eine gute Seite an der Frequentierung
der Zugriffe zu erkennen. Bei Google laufen mehrere Rechner parallel an
einer Anfrage, das ist nicht trivial.

Moeglich ist es, nur zu welchem Preis, und wozu.

Gruesse, Rainer
-- 
  A diplomat thinks twice before saying nothing.


Next: