Re: [OT] Spaß mit Google?!?

Autor: Raphael H. Becker <Raphael.Becker_at_gmx.de>
Datum: 04.01.2007
Hallo Hans-Hermann,

On Wed, Jan 03, 2007 at 12:14:17AM +0100, HH Schafft wrote:
> hallo
> 
> zuerst mal allen die hier mitlesen ein gutes und erfolgreiches 2007 mit 
> vielen schönen Tuxies und Beasties
> 
> Und jetzt meine Frage an Raphael :
> wie sieht es denn aus mit den anderen Suchmaschinen ?
> gibt es da auch schon eine Auswertung ?

Folgende Spider haben wir im Wiki-Log:

65754 "htdig/3.1.6 (admin_at_uugrn.org)"
38746 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.go***REMOVE***ogle.com/bot.html)"
19293 "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.ya***REMOVE***hoo.com/help/us/ysearch/slurp)"
2642 "sogou spider"
 903 "MJ12bot/v1.0.8 (http://majestic12.co***REMOVE***.uk/bot.php?+)"
 741 "msnbot/1.0 (+http://search.m***REMOVE**sn.com/msnbot.htm)"
 663 "msnbot-media/1.0 (+http://search.m***REMOVE**sn.com/msnbot.htm)"
 519 "Seekbot/1.0 (http://www.see***REMOVE***kbot.net/bot.html) HTTPFetcher/2.2"
 512 "Mozilla/2.0 (compatible; Ask Jeeves/Teoma; +http://about.ask***REMOVE*.com/en/docs/about/webmasters.shtml)"
 208 "NewsFire/66"
 156 "Mozilla/4.0 (compatible; DepSpid/5.03; +http://about.dep***REMOVE***spid.net)"

Man sieht eine deutliche Dominanz von google und yahoo, lässt man mal
unseren eigenen Spider außen vor. Mir ist nicht klar ob/woher altavista
sein Wissen über UUGRN bezieht, d.h. über welchen Bot die suchen. Wer
weiss das?

Die intensiven Zugriffe von google und yahoo erkläre ich mir dadurch,
dass die praktisch "real-time" das indizieren, was sich bei uns bewegt,
da sie regelmäßig die RSS-Feeds pollen.

MSN will sich mit Google messen. Zu mindest mit unserem Themenbereich
sind wir damit aber nicht besonders gut vertreten. Ich kann damit leben ;)

Mit der Mailingliste (lists.uugrn.org), sehr viel statischer Content 
seit einigen Jahren, sieht das Bild etwas anders aus:

51554 "Mozilla/4.0 (compatible; MSIE 5.0; Windows 95) VoilaBot BETA 1.2 (http://www.voi***REMOVE***la.com/)"
30548 "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.ya***REMOVE***hoo.com/help/us/ysearch/slurp)"
22509 "msnbot/1.0 (+http://search.m***REMOVE***sn.com/msnbot.htm)"
14565 "Mozilla/2.0 (compatible; Ask Jeeves/Teoma; +http://about.a***REMOVE***sk.com/en/docs/about/webmasters.shtml)"
14152 "Microsoft URL Control - 6.00.8862"
6844 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.goo***REMOVE***gle.com/bot.html)"
5009 "e-SocietyRobot(http://www.ya***REMOVE***ma.info.waseda.ac.jp/~yamana/es/)"
4277 "htdig/3.1.6 (admin_at_uugrn.org)"
4089 "msnbot-media/1.0 (+http://search.m***REMOVE***sn.com/msnbot.htm)"
 736 "ia_archiver"
 733 "psbot/0.1 (+http://www.pic***REMOVE***search.com/bot.html)"
 409 "Mozilla/4.0 (compatible; DepSpid/5.03; +http://about.dep***REMOVE***spid.net)"

Auch hier sieht man keine Zugriffe von z.B. Altavista-Spidern. Woher
beziehen die ihre Daten? Unter welchem Namen sieht man deren Spieder?
Wenn/wo crawlt web.de? Unter welcher UA-Kennung? wiki.uugrn.org ist mit
Stand 29.12.2006 dort gelistet, ich habe keinen Zugriff gesehen.

Oder kaufen die einfach nur Daten bei yahoo oder google ein?

Denn sie haben alle Content, wie man bspw. bei der Suche nach UUGRN auf
www.metager.de sehen kann. Haben die ihre Spider alle mit
08/15-IE6-Kennungen laufen? 

Wenn irgendwann alle ihre Daten bei google einkaufen .... 

Gruß
Raphael 

-- 
Raphael Becker                                    http://rabe.uugrn.org/
                      http://schnitzelmitkartoffelsalat.und.rahmspin.at/
.........|.........|.........|.........|.........|.........|.........|..


-- 
http://mailman.uugrn.org/mailman/listinfo/uugrn


Received on Thu Jan 4 01:36:27 2007

Dieses Archiv wurde generiert von hypermail 2.1.8.

Weitere Links: