amnoob 發表於 2014-2-19 23:35 & t) z6 @, d& e& \/ i8 r
看了好幾遍才看懂了老兄的意思哇 3 i& o. p* V: W. b, u
/ U; T) d6 u0 g2 r! T: I
我查了一下statcounter的記錄,發現蜘蛛每天都要來呆上半小時 ... 2 x+ r+ X8 @) ~
其實我更傾向於這些ip段不是google bot, 這些ip段 66.249.8x.xxx, hostname是 google-proxy-66-249-8x-xxx.google.com, 而google bot 應該是 crawl-66-249-xx-xxx.googlebot.com這樣的, 像是人工查站一樣,反正它們來了我的採集站必K光, 直接清0。有興趣的歡迎討論一下。
6 l7 a2 K- J0 t0 L& z1 E7 S4 w- T
. L; w- O) p" G e' I1 z9 E有個有趣的現象是,我針對這些ip設置了一下,這些ip來的時候就顯示404,結果這些站都只是降權了,沒有清0,每天還有少量訪問; 而沒有設置的,都清0了。+ G( v8 g6 _. t. G1 I% O- k
4 O: c2 f% y! {- O7 I9 M M搞採集很累的,樓主不搞是明智之舉。
0 S" h: p# G; ?+ Z) k4 T. S1 a
! v* `& f* c% I2 |( e1 yPS: 今天掛了一個amazon jp的號, 是amazon.com的來查崗了,我還以為會是日本那邊負責查的呢,損失20多W日元,不多也不少,採集的說掛就掛 2 y' K& W c' _, V6 [& p
6 ]' O4 @( v9 I5 g3 t
4 b9 c+ E# D! ]; v8 @1 h! _7 t. o3 [
各位遠離採集遠離採集遠離採集。。。. @" k# Y7 k* v. I N& F' |
: M& U6 X# y8 E" [
|