amnoob 發表於 2014-2-19 23:35 
7 p$ ^1 P3 y9 M7 E) w看了好幾遍才看懂了老兄的意思哇 , d) m* {9 ]5 a5 o, J
9 ~" W0 K( @0 P7 v: H8 {, g我查了一下statcounter的記錄,發現蜘蛛每天都要來呆上半小時 ... % B5 l" j7 m1 U# @; W
其實我更傾向於這些ip段不是google bot, 這些ip段 66.249.8x.xxx, hostname是 google-proxy-66-249-8x-xxx.google.com, 而google bot 應該是 crawl-66-249-xx-xxx.googlebot.com這樣的, 像是人工查站一樣,反正它們來了我的採集站必K光, 直接清0。有興趣的歡迎討論一下。
, g0 f+ S1 Q% R1 q' r! Y2 z3 _: r+ G( {' u ^$ R# ]
有個有趣的現象是,我針對這些ip設置了一下,這些ip來的時候就顯示404,結果這些站都只是降權了,沒有清0,每天還有少量訪問; 而沒有設置的,都清0了。
# k5 G: z5 R r$ u# [; t0 a+ N" N; h# H& m# k" V! T
搞採集很累的,樓主不搞是明智之舉。
: t6 z3 w8 k2 n, H# d/ L- q& Q: X
+ M6 f& v# z o# x6 PPS: 今天掛了一個amazon jp的號, 是amazon.com的來查崗了,我還以為會是日本那邊負責查的呢,損失20多W日元,不多也不少,採集的說掛就掛
3 Y2 ~" U s" [
. f; A7 b" G2 Z3 G% a# @/ P# `) d$ Q5 H$ S, T, _
各位遠離採集遠離採集遠離採集。。。1 R: ]; I8 f: I9 e0 ^5 P
7 x1 Z. J2 ~! W2 g# ]
|