过期域名预定抢注

 找回密碼
 免费注册

如何寫好WordPress網站的robots.txt文件?

[複製鏈接]
發表於 2013-11-22 14:23:30 | 顯示全部樓層 |閱讀模式
本帖最後由 hardrock 於 2013-11-22 14:34 編輯
# v" t4 c: }- ^9 x( C( ~$ O- |% I8 U7 q' k7 J( m- e
robots.txt文件要放在網站根目錄下,最基本的檢查方法就是用你的域名後面直接跟上robots.txt訪問,如果能訪問,那放置的位置就對了。/ G: H6 A* L) f  i. x% U3 c6 t

0 N: ]9 ?, X: l找到份代碼,
  1. User-agent: *
    ) y  p9 o4 X& G' z5 D1 a3 ^
  2. Disallow: /cgi-bin/2 {# ?, R* o) h, T" ~
  3. Disallow: /wp-admin/: V: f7 ~, U" [2 |4 d- t: _: x' b& b
  4. Disallow: /wp-content/cache/
    2 w9 ?. b4 N- F3 n) A3 ^
  5. Disallow: /wp-content/languages/
    0 N) q" b5 T, T" T/ ]
  6. Disallow: /wp-content/plugins/
    ) C% c0 p1 L, I( R" @' R  k
  7. Disallow: /wp-content/themes/
    8 ?7 {/ _: I3 o; @
  8. Disallow: /wp-content/upgrade/
    / i# M2 u3 m5 y$ C* @% t/ t+ U$ E( \
  9. Disallow: /wp-includes/
    ! @- _+ o7 M/ K- s/ h
  10. Disallow: /comments// z9 F( A+ j% R6 ^6 v5 N
  11. Disallow: /category/& O! f1 }* h8 X7 \( {2 D- i+ P" X
  12. Disallow: /tag/
    " c: B; @. w- N# A9 O$ n+ r2 O, H
  13. Disallow: /page/5 `! j6 k$ p- |$ x) V
  14. Disallow: /feed/
    8 y# N9 i# o. d4 q4 U
  15. Disallow: /author/
    ) h3 y$ Z; Y$ B( I# }) l2 P6 n
  16. Disallow: /trackback/
    ; e5 o7 c* M" L3 I- A* x) o
  17. Disallow: /2010/
    : E1 |' N/ G' K0 s* |0 e2 F) ~
  18. Disallow: /2011/
    . p8 G8 i9 j6 v3 S; Q/ P
  19. Disallow: /2012/
    & e* w2 |9 A* z" Q6 T& I; C
  20. Disallow: /2013/; k( j( p- n/ @% H- k2 v
  21. Disallow: /*/feed/
    : h9 }8 ~% C: R1 Y* n! ]: X  B0 B
  22. Disallow: /*/trackback/
    & e  M! j" n4 p9 s' K
  23. Disallow: /*?# ?! j  U& I$ {; V" T* h6 H. w# t! W
  24. Disallow: /*/*?
    ! b! s% E# X8 m0 j  h* ]2 p
  25. Disallow: /*/*/*?
    ; I4 k' E2 s5 t' i! e5 G
  26. Disallow: /*.php$
    - H! [' f: g+ i/ n+ C+ d4 H! ~
  27. Disallow: /*.js$5 c( m' c) D7 v$ V2 B0 z
  28. Disallow: /*.inc$) v/ B$ t9 h; O1 u% A6 a3 d  ]
  29. Disallow: /*.css$( O* T# J! j' h$ `  {6 B  h. N; M

  30. 2 g  E' Z5 }" o  [4 N3 f
  31. # Google Image3 \7 }9 K3 d8 D
  32. User-agent: Googlebot-Image4 P0 l7 e$ ]5 Z, ?3 a4 M
  33. Disallow:
    / G; h+ ]( J" x8 V7 e8 k
  34. Allow: /
    + K# I( i( `' |* _8 o0 A; n0 _) m

  35. " H4 I0 x; p- T* Q# @* M
  36. # Google AdSense
    ! ]; A8 X# T# j0 N- {
  37. User-agent: Mediapartners-Google*$ ^+ ^0 Y% r) J& Q! m
  38. Disallow:0 m& D+ z2 d& M
  39. Allow: /
    . G, a+ i  [9 Z3 [6 r0 t" [3 `

  40. ! t$ |: P* X! w) f- V$ ^8 V# m
  41. # digg mirror, u7 m- i' _' s) U  Q' S  \
  42. User-agent: duggmirror
      A( q, M8 L! f. |2 N5 D8 q3 V, X  f
  43. Disallow: /, ^1 r" V! L- F% o  v  `2 i! Y

  44. ) K; ~& x  ~* s; ~( D: f
  45. # Alexa archiver6 ]- e* U# z1 o) ?
  46. User-agent: ia_archiver
    + X3 @/ p. j; }3 p' S3 F! g
  47. Disallow: /
    8 Z9 t/ d. l" F" K3 X1 o

  48. / X9 ~8 e$ R$ g
  49. Sitemap:http://www.xxx.com/sitemap.xml" X9 }8 b6 r: K
  50. Sitemap:http://www.xxx.com/sitemap_baidu.xml
複製代碼
問題是這份代碼適用於中文站用於百度,我是做英文站要適用於google, 以上代碼怎樣改成適用英文站的?
  _; G* s; {/ ^& h5 U+ y) W( T對於代碼 一竅不通...5 r; p# t( ^& s% [; r& t
) o- |8 x$ @% Q# c9 \0 _
主要疑問是31----47行的代碼,既然是英文站,這幾行代碼應該是允許的吧?中文站才禁止抓取?5 y9 k1 A0 y3 Y* q
7 ~) j7 u6 M( V* ^1 C( C5 p
+ r" Z+ r8 i! T3 l7 Q
/ g3 t/ x3 C, ]! \8 g/ f

" e6 J; U2 i$ p: h補充內容 (2013-12-22 17:43):5 A% T5 b" h" ~8 H9 y  ]
沒這麼複雜,下面的就可以了* D' }- b" M6 n1 Q
Sitemap: hxxp://www.xxx.com/sitemap.xml
& R, t$ U. v- AUser-agent: *( H0 P2 x6 B# r5 k# a
Disallow: /cgi-bin/# |5 D7 e1 J( q- a( g: o
Disallow: /wp-*2 s! ]$ q6 ^" i  x0 o1 j  U
4 s/ ]5 ^/ c# M0 [4 a) _2 [
補充內容 (2013-12-27 17:17):7 [, A4 ~! _, l5 I& E
http://blog.csdn.net/wallacer/article/details/654289
發表於 2013-11-22 15:02:27 | 顯示全部樓層
好像禁止了動態收錄?具體聽高手解答~% d" r( v' U2 e9 Z+ j6 v$ a
回復 给力 爆菊

使用道具 舉報

發表於 2013-11-22 21:26:40 | 顯示全部樓層
我第一次看到這個robots.txt是在英文站.....- V  j4 \# o: |8 f9 E4 W* }; j
可以用於英文站
& b* \4 d' _- P( {, Y
回復 给力 爆菊

使用道具 舉報

發表於 2013-12-10 14:14:56 | 顯示全部樓層
) d  D+ S3 M, N4 A. g6 U! Q+ R
3 y: P. [, [5 O9 M0 W( d, r. {: Z

& m1 U: c1 o7 [% E( j# g- o; \9 w和競爭對手學習呀,他們是你最好的老是5 W2 U5 G( A' A& |, R7 M9 b5 h

# I9 ^( F7 }  T  [
回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

过期高净值品牌域名预定抢注

點基跨境 數位編輯創業論壇

GMT+8, 2025-5-26 05:25

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表