本帖最後由 hardrock 於 2013-11-22 14:34 編輯
# v" t4 c: }- ^9 x( C( ~$ O- |% I8 U7 q' k7 J( m- e
robots.txt文件要放在網站根目錄下,最基本的檢查方法就是用你的域名後面直接跟上robots.txt訪問,如果能訪問,那放置的位置就對了。/ G: H6 A* L) f i. x% U3 c6 t
0 N: ]9 ?, X: l找到份代碼,- User-agent: *
) y p9 o4 X& G' z5 D1 a3 ^ - Disallow: /cgi-bin/2 {# ?, R* o) h, T" ~
- Disallow: /wp-admin/: V: f7 ~, U" [2 |4 d- t: _: x' b& b
- Disallow: /wp-content/cache/
2 w9 ?. b4 N- F3 n) A3 ^ - Disallow: /wp-content/languages/
0 N) q" b5 T, T" T/ ] - Disallow: /wp-content/plugins/
) C% c0 p1 L, I( R" @' R k - Disallow: /wp-content/themes/
8 ?7 {/ _: I3 o; @ - Disallow: /wp-content/upgrade/
/ i# M2 u3 m5 y$ C* @% t/ t+ U$ E( \ - Disallow: /wp-includes/
! @- _+ o7 M/ K- s/ h - Disallow: /comments// z9 F( A+ j% R6 ^6 v5 N
- Disallow: /category/& O! f1 }* h8 X7 \( {2 D- i+ P" X
- Disallow: /tag/
" c: B; @. w- N# A9 O$ n+ r2 O, H - Disallow: /page/5 `! j6 k$ p- |$ x) V
- Disallow: /feed/
8 y# N9 i# o. d4 q4 U - Disallow: /author/
) h3 y$ Z; Y$ B( I# }) l2 P6 n - Disallow: /trackback/
; e5 o7 c* M" L3 I- A* x) o - Disallow: /2010/
: E1 |' N/ G' K0 s* |0 e2 F) ~ - Disallow: /2011/
. p8 G8 i9 j6 v3 S; Q/ P - Disallow: /2012/
& e* w2 |9 A* z" Q6 T& I; C - Disallow: /2013/; k( j( p- n/ @% H- k2 v
- Disallow: /*/feed/
: h9 }8 ~% C: R1 Y* n! ]: X B0 B - Disallow: /*/trackback/
& e M! j" n4 p9 s' K - Disallow: /*?# ?! j U& I$ {; V" T* h6 H. w# t! W
- Disallow: /*/*?
! b! s% E# X8 m0 j h* ]2 p - Disallow: /*/*/*?
; I4 k' E2 s5 t' i! e5 G - Disallow: /*.php$
- H! [' f: g+ i/ n+ C+ d4 H! ~ - Disallow: /*.js$5 c( m' c) D7 v$ V2 B0 z
- Disallow: /*.inc$) v/ B$ t9 h; O1 u% A6 a3 d ]
- Disallow: /*.css$( O* T# J! j' h$ ` {6 B h. N; M
-
2 g E' Z5 }" o [4 N3 f - # Google Image3 \7 }9 K3 d8 D
- User-agent: Googlebot-Image4 P0 l7 e$ ]5 Z, ?3 a4 M
- Disallow:
/ G; h+ ]( J" x8 V7 e8 k - Allow: /
+ K# I( i( `' |* _8 o0 A; n0 _) m -
" H4 I0 x; p- T* Q# @* M - # Google AdSense
! ]; A8 X# T# j0 N- { - User-agent: Mediapartners-Google*$ ^+ ^0 Y% r) J& Q! m
- Disallow:0 m& D+ z2 d& M
- Allow: /
. G, a+ i [9 Z3 [6 r0 t" [3 ` -
! t$ |: P* X! w) f- V$ ^8 V# m - # digg mirror, u7 m- i' _' s) U Q' S \
- User-agent: duggmirror
A( q, M8 L! f. |2 N5 D8 q3 V, X f - Disallow: /, ^1 r" V! L- F% o v `2 i! Y
-
) K; ~& x ~* s; ~( D: f - # Alexa archiver6 ]- e* U# z1 o) ?
- User-agent: ia_archiver
+ X3 @/ p. j; }3 p' S3 F! g - Disallow: /
8 Z9 t/ d. l" F" K3 X1 o -
/ X9 ~8 e$ R$ g - Sitemap:http://www.xxx.com/sitemap.xml" X9 }8 b6 r: K
- Sitemap:http://www.xxx.com/sitemap_baidu.xml
複製代碼 問題是這份代碼適用於中文站用於百度,我是做英文站要適用於google, 以上代碼怎樣改成適用英文站的?
_; G* s; {/ ^& h5 U+ y) W( T對於代碼 一竅不通...5 r; p# t( ^& s% [; r& t
) o- |8 x$ @% Q# c9 \0 _
主要疑問是31----47行的代碼,既然是英文站,這幾行代碼應該是允許的吧?中文站才禁止抓取?5 y9 k1 A0 y3 Y* q
7 ~) j7 u6 M( V* ^1 C( C5 p
+ r" Z+ r8 i! T3 l7 Q
/ g3 t/ x3 C, ]! \8 g/ f
" e6 J; U2 i$ p: h補充內容 (2013-12-22 17:43):5 A% T5 b" h" ~8 H9 y ]
沒這麼複雜,下面的就可以了* D' }- b" M6 n1 Q
Sitemap: hxxp://www.xxx.com/sitemap.xml
& R, t$ U. v- AUser-agent: *( H0 P2 x6 B# r5 k# a
Disallow: /cgi-bin/# |5 D7 e1 J( q- a( g: o
Disallow: /wp-*2 s! ]$ q6 ^" i x0 o1 j U
4 s/ ]5 ^/ c# M0 [4 a) _2 [
補充內容 (2013-12-27 17:17):7 [, A4 ~! _, l5 I& E
http://blog.csdn.net/wallacer/article/details/654289 |