amnoob 發表於 2014-2-19 23:35 6 S' T% z: ^$ k* @+ q( i3 w8 L) E( `
看了好幾遍才看懂了老兄的意思哇
Q$ A7 |1 o6 h* F9 H1 d9 w6 [
. N- x% J' u2 A6 h3 A0 n我查了一下statcounter的記錄,發現蜘蛛每天都要來呆上半小時 ...
! @$ }/ F% r2 T1 U2 @' K其實我更傾向於這些ip段不是google bot, 這些ip段 66.249.8x.xxx, hostname是 google-proxy-66-249-8x-xxx.google.com, 而google bot 應該是 crawl-66-249-xx-xxx.googlebot.com這樣的, 像是人工查站一樣,反正它們來了我的採集站必K光, 直接清0。有興趣的歡迎討論一下。3 q; o7 V2 ?2 c: X
( c C5 w2 I5 u) b% c有個有趣的現象是,我針對這些ip設置了一下,這些ip來的時候就顯示404,結果這些站都只是降權了,沒有清0,每天還有少量訪問; 而沒有設置的,都清0了。
& N# p7 u" l( E; K; D6 Y
' a' j2 W2 ?+ r$ X/ `3 `4 v搞採集很累的,樓主不搞是明智之舉。
# g7 n3 ^. r r$ _# W9 J8 z$ a7 T- J' V6 K; ~
PS: 今天掛了一個amazon jp的號, 是amazon.com的來查崗了,我還以為會是日本那邊負責查的呢,損失20多W日元,不多也不少,採集的說掛就掛 3 l8 L* H2 c- r! ]# l+ M ~- A9 A
9 }# w1 @9 R3 \7 l4 V+ j" U
* S* h& I3 P: j, ]7 B各位遠離採集遠離採集遠離採集。。。; w2 B4 ^! F# e$ o* V1 J9 f
7 ^0 T/ ^' r( Q( f1 {% I% x. D
|