amnoob 發表於 2014-2-19 23:35 $ S0 o9 J2 O3 k& W: \! d2 K7 c
看了好幾遍才看懂了老兄的意思哇
* W+ S* v0 ^: L: u6 B$ j# f
8 y* e h% C; p6 H: _: O我查了一下statcounter的記錄,發現蜘蛛每天都要來呆上半小時 ... , W' d/ _9 f; O' F/ e! J
其實我更傾向於這些ip段不是google bot, 這些ip段 66.249.8x.xxx, hostname是 google-proxy-66-249-8x-xxx.google.com, 而google bot 應該是 crawl-66-249-xx-xxx.googlebot.com這樣的, 像是人工查站一樣,反正它們來了我的採集站必K光, 直接清0。有興趣的歡迎討論一下。
4 S3 V& _4 i/ k' y! I8 O$ G: A, `, [6 I( R! M3 V
有個有趣的現象是,我針對這些ip設置了一下,這些ip來的時候就顯示404,結果這些站都只是降權了,沒有清0,每天還有少量訪問; 而沒有設置的,都清0了。
9 ?; d2 o/ ^4 B4 S- X+ E
& X+ _ q# Z6 I搞採集很累的,樓主不搞是明智之舉。4 D; f2 S. c: Y* t. ^
3 U3 U. O8 Q3 w5 ?
PS: 今天掛了一個amazon jp的號, 是amazon.com的來查崗了,我還以為會是日本那邊負責查的呢,損失20多W日元,不多也不少,採集的說掛就掛 & R) T8 d7 U6 ~8 c" q* o
$ K: r, `" e4 y& g( C. i
U1 j0 ~! [9 j( f
各位遠離採集遠離採集遠離採集。。。6 ]" o2 \0 P) G5 O: ?4 {. L3 z" N
5 a4 d( U2 W( m
|