From: Christian Weisgerber (naddy_at_mips.rhein-neckar.de)
Date: 07. Nov 1999
Markus Demleitner <msdemlei_at_head-cfa.harvard.edu> wrote:
[Suchdienst auslagern]
> Dieser Ansatz hat zwei Probleme: Einerseits indizieren die meisten
> Suchmaschinen nur bis zu einer bestimmten Zahl von Seiten auf einer
> Site
Was man ja für konkrete Suchmaschinen und eigene Webangebote abklären
kann.
Wenn ich mich so mit dem Verwalter von kochbuch.unix-ag.uni-kl.de
unterhalte, dann ignorieren Suchmaschinen nicht nur robots.txt,
sondern rufen auch gerne mal ein paar zehn- oder hundertausend
virtuelle Seiten aus der Robotfalle ab. Mag sein, dass sie die
nicht speichern.
> und zweitens indizieren die meisten Suchmaschinen nur alle
> Jubeljahre mal.
Etwa monatlich, wenn ich das Log meiner Homepage überfliege.
> Vor drei Jahren sind zwischen dem submitten der URL an Altavista
> und der Indizierung der Seite 8 Monate vergangen,
Meine Seiten werden innerhalb kürzerer Zeit automatisch gefunden.
> Moeglich, dass das mittlerweile besser ist -- andererseits ist
> glimpse und ein kleines cgi dann auch nicht *soo* viel Arbeit.
Wenn man seine Seiten bei einem Provider hat, wo man nicht beliebige
Dinge installieren kann, dann geht das schon mal gar nicht. Ob
"glimpse und ein kleines CGI" überhaupt eine adäquate Lösung für
eine Suchmaschine ist (minimal: HTML parsen, unterschiedliche
Gewichtung verschiedener Elemente), weiß ich nicht, da ich mir
glimpse noch nicht genauer angeschaut habe. Hatte glimpse auch
nicht einmal eine ziemlich restriktive Lizenz?
-- Christian "naddy" Weisgerber naddy_at_mips.rhein-neckar.de
Dieses Archiv wurde generiert von hypermail 2.1.2 : 11. Mar 2002 CET