amnoob 發表於 2014-2-19 23:35 * w! Z, X+ L' |1 ^
看了好幾遍才看懂了老兄的意思哇 2 j& o8 p8 a- `# y
# s6 c; [- ]. Z我查了一下statcounter的記錄,發現蜘蛛每天都要來呆上半小時 ...
2 u9 o: [0 H, A( r S& `, ~; R其實我更傾向於這些ip段不是google bot, 這些ip段 66.249.8x.xxx, hostname是 google-proxy-66-249-8x-xxx.google.com, 而google bot 應該是 crawl-66-249-xx-xxx.googlebot.com這樣的, 像是人工查站一樣,反正它們來了我的採集站必K光, 直接清0。有興趣的歡迎討論一下。! G3 c# ?& t8 {, o5 d6 C
5 G# o3 K; p. b. K5 f2 I1 z有個有趣的現象是,我針對這些ip設置了一下,這些ip來的時候就顯示404,結果這些站都只是降權了,沒有清0,每天還有少量訪問; 而沒有設置的,都清0了。
9 b0 u0 b9 W4 L) ]# ^& M+ e$ r
/ f0 a7 L+ W1 ]. y* `* e4 ~搞採集很累的,樓主不搞是明智之舉。
: C# ?* U! H4 B) f4 q2 a/ a7 ]& Y# Y; t- N
PS: 今天掛了一個amazon jp的號, 是amazon.com的來查崗了,我還以為會是日本那邊負責查的呢,損失20多W日元,不多也不少,採集的說掛就掛
( Y6 P& K9 E) v7 L
5 ^2 ~! \# A, E/ f/ J6 y! ]# o9 L5 }1 m: ]- Z0 n
各位遠離採集遠離採集遠離採集。。。6 \3 [7 T$ ?! s6 N' G
$ s% t( F$ T) z; w |