amnoob 發表於 2014-2-19 23:35 ' Q2 U. o) g- v1 z/ s
看了好幾遍才看懂了老兄的意思哇
' E/ h; G$ k' b- I' I
, u- B ~2 p' ~4 s2 r( A我查了一下statcounter的記錄,發現蜘蛛每天都要來呆上半小時 ...
3 c2 z8 h4 f% O; O0 a" w其實我更傾向於這些ip段不是google bot, 這些ip段 66.249.8x.xxx, hostname是 google-proxy-66-249-8x-xxx.google.com, 而google bot 應該是 crawl-66-249-xx-xxx.googlebot.com這樣的, 像是人工查站一樣,反正它們來了我的採集站必K光, 直接清0。有興趣的歡迎討論一下。
; X9 `% t( Q8 e8 O; T# F8 u% q' w2 r
+ l6 e/ S0 t! C3 S, Y* Z有個有趣的現象是,我針對這些ip設置了一下,這些ip來的時候就顯示404,結果這些站都只是降權了,沒有清0,每天還有少量訪問; 而沒有設置的,都清0了。
$ p& ^0 J" u' n" a* Q% u. m8 D+ W4 \& x: O5 L8 K% P$ u+ w, Z
搞採集很累的,樓主不搞是明智之舉。# [! _ w) A l5 y: W' S
$ `% ^1 g4 S6 ^
PS: 今天掛了一個amazon jp的號, 是amazon.com的來查崗了,我還以為會是日本那邊負責查的呢,損失20多W日元,不多也不少,採集的說掛就掛 ( n$ e" K0 c; J6 U" k" z/ n
! e& A V! O& D" |; o
0 c+ v. [% c, P. Q0 e' P& J- ]
各位遠離採集遠離採集遠離採集。。。& w, I/ X s5 T" ~+ U" g
- V; C P+ W- r, H
|