On Mon, Jul 30, 2007 at 01:00:48AM +0200, Raphael Becker wrote: > Gibt es da was fertgies, vielleicht auch generische Schnittstellen, mit > der man entsprechende Daten irgendwo rein"pipe"n kann? Viel einfacher, im Grunde habe ich genau das beschrieben, was ein Cache ausmacht. Wenn man erstmal weiss, wonach mal eigentlich sucht, wird vieles einfacher. Siehe: * http://httpd.apache.org/docs/2.2/caching.html * http://httpd.apache.org/docs/2.2/mod/mod_disk_cache.html * http://httpd.apache.org/docs/2.2/mod/mod_cache.html Für www.uugrn.org ergibt das: ------------------------------------------------------------ <IfModule mod_disk_cache.c> # Disk-Caching aktivieren CacheEnable disk / CacheRoot /data/www/www.uugrn.org/cache/ CacheMinFileSize 1 CacheMaxFileSize 1000000 CacheDirLength 1 CacheDirLevels 3 </IfModule> ------------------------------------------------------------ # find /data/www/www.uugrn.org/cache/ /data/www/www.uugrn.org/cache/ /data/www/www.uugrn.org/cache/M /data/www/www.uugrn.org/cache/M/n /data/www/www.uugrn.org/cache/M/n/p /data/www/www.uugrn.org/cache/M/n/p/6V_8UuyEbtr_at_pgUdaoA.header /data/www/www.uugrn.org/cache/M/n/p/6V_8UuyEbtr_at_pgUdaoA.data /data/www/www.uugrn.org/cache/h /data/www/www.uugrn.org/cache/h/H /data/www/www.uugrn.org/cache/h/H/G /data/www/www.uugrn.org/cache/h/H/G/dSNqzL5HKGErOaANrEQ.header /data/www/www.uugrn.org/cache/h/H/G/dSNqzL5HKGErOaANrEQ.data /data/www/www.uugrn.org/cache/D /data/www/www.uugrn.org/cache/D/l /data/www/www.uugrn.org/cache/D/l/e /data/www/www.uugrn.org/cache/D/l/e/aO7xgwxKQhmFQG6Hw8w.header /data/www/www.uugrn.org/cache/D/l/e/aO7xgwxKQhmFQG6Hw8w.data # head -n 100 ./M/n/p/6V_8UuyEbtr_at_pgUdaoA.header [Binärmüll]http://www.uugrn.org:80/uug-styles.css?Last-Modified: Sun, 26 Feb 2006 16:08:21 GMT ETag: "1814bd5-56c-cd91c740" Accept-Ranges: bytes Content-Length: 1388 Date: Mon, 30 Jul 2007 01:32:11 GMT Expires: Tue, 31 Jul 2007 01:32:11 GMT Content-Type: text/css Host: www.uugrn.org User-Agent: Mozilla/5.0 (X11; U; FreeBSD i386; en-US; rv:1.8.0.1) Gecko/20060208 Firefox/1.5.0.1 Accept: text/css,*/*;q=0.1 Accept-Language: de-de,en-us;q=0.7,en;q=0.3 Accept-Encoding: gzip,deflate Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7 Referer: http://www.uugrn.org/verein.php Pragma: no-cache Via: 1.1 proxy.local.net:3128 (squid/2.5.STABLE12) X-Forwarded-For: 127.0.0.1 Cache-Control: no-cache, max-age=259200 Das korrespondierende .data-File enthält exakt das, was der Browser als "Content" bekommen hat. Restproblemmenge: In der aktuellen Einstellung wird kein "php"-Content gecached, vermutlich weil es eben nicht als "cachebar" markiert ist. Sobald ich das gelöst habe, schau ich mir an, wie man mit diesen Daten einen Spider füttern kann. Gruß Raphael -- http://mailman.uugrn.org/mailman/listinfo/uugrn
Dieses Archiv wurde generiert von hypermail 2.2.0 : 30.07.2007 CEST