过期域名预定抢注

 找回密碼
 免费注册

如何寫好WordPress網站的robots.txt文件?

[複製鏈接]
發表於 2013-11-22 14:23:30 | 顯示全部樓層 |閱讀模式
本帖最後由 hardrock 於 2013-11-22 14:34 編輯
- D0 R0 H' N% k' b$ t
  W: |$ P/ n5 Z. e3 Irobots.txt文件要放在網站根目錄下,最基本的檢查方法就是用你的域名後面直接跟上robots.txt訪問,如果能訪問,那放置的位置就對了。
3 Y0 k9 F! }5 u0 `8 U$ u1 o8 G6 b+ O: n# k/ ^
找到份代碼,
  1. User-agent: ** o* j- u, O( B( p& V  l
  2. Disallow: /cgi-bin/
    5 ]% ^1 O2 v2 p) ~
  3. Disallow: /wp-admin/
    & v3 L) l  z  g% v' W5 {
  4. Disallow: /wp-content/cache/+ F9 t2 H$ f6 ~; ?  l5 Y- K
  5. Disallow: /wp-content/languages/
    9 \9 `# ~. a. g7 Z. x3 q6 {" [
  6. Disallow: /wp-content/plugins/
    ; ]# o( J; y; N! B( x) E: o" o
  7. Disallow: /wp-content/themes/$ W! ~% A% g/ `" ]! {2 d) p1 j. z
  8. Disallow: /wp-content/upgrade/, v2 W- f4 {" @. D) |
  9. Disallow: /wp-includes/
    0 t+ Z4 A$ F2 w1 ^
  10. Disallow: /comments/
    4 R2 p: R/ o: h! {' X' v
  11. Disallow: /category// [( J* f' [2 s8 L: J# k! p: [# ~
  12. Disallow: /tag/
    * r: j, ?8 F% Y: l& e6 m" P
  13. Disallow: /page/
    3 ^2 p& M* y( s! t' o: a- s
  14. Disallow: /feed/
    ' c. x& r% c3 R" n0 k" j# N0 r( M
  15. Disallow: /author/
      w/ w3 c. B# l# s# q
  16. Disallow: /trackback/1 v0 b) h8 f7 S) |
  17. Disallow: /2010/
    ( @5 B# b. U& p/ ~' }$ c( I1 ~
  18. Disallow: /2011/
    5 \- o/ W2 Q" ?1 _3 I1 q' b
  19. Disallow: /2012/
    7 V" X: ?( z: ]0 f+ m2 O
  20. Disallow: /2013/
    : [( J4 o% N; W0 \' {
  21. Disallow: /*/feed/4 ]2 E% W6 H: w8 h
  22. Disallow: /*/trackback/" ^' p/ O2 f& Y' |& ^( H1 M
  23. Disallow: /*?1 Q+ v# i  b+ x3 L
  24. Disallow: /*/*?
    0 B& b9 p" B) L5 N: }$ r1 G! u
  25. Disallow: /*/*/*?0 E* T- [& C7 X% a* i, @1 A% W
  26. Disallow: /*.php$  D+ G- F1 d7 i
  27. Disallow: /*.js$
    ( S4 Z' p3 A& h% n6 ?
  28. Disallow: /*.inc$
    ' |. V) U( T- V! P
  29. Disallow: /*.css$( u8 P# o4 ?( r) T/ c
  30. 4 O: W7 q, R% K9 n0 Q
  31. # Google Image) V7 M0 c) ^  [1 u
  32. User-agent: Googlebot-Image
    ! i3 A: T" Y! g: x$ P* ~
  33. Disallow:
    + c7 h1 y) L/ `8 Z+ v$ ^/ j( [
  34. Allow: /
    ( c2 z2 |6 w; Y5 M3 G/ V

  35. & u4 I* i6 \; R  M8 w2 f
  36. # Google AdSense
    ( a6 J1 E* x+ Y: }2 k" f: y
  37. User-agent: Mediapartners-Google*" M, [+ [- y; j1 |- U& \) ~  N
  38. Disallow:
    4 m  ^, H3 n: L7 F
  39. Allow: /- Q* a$ k# s0 w8 I

  40. 3 [5 c( j4 A3 x: x
  41. # digg mirror( H9 Z! G2 t2 E  l
  42. User-agent: duggmirror3 s& J- V5 w% k9 `9 v8 q- ~
  43. Disallow: /7 o9 |% r) S, R& u' I- M5 R
  44. ; h% }. R# A4 Z1 u  E
  45. # Alexa archiver
    ) _! R0 N6 u+ S: s; i
  46. User-agent: ia_archiver
    + E- ~( t$ X; e+ @) `. T# j# b
  47. Disallow: /5 ^' k7 y" H3 `1 U0 b7 C/ Q

  48. 5 x8 s+ N; B+ y
  49. Sitemap:http://www.xxx.com/sitemap.xml
    2 {8 @3 y1 q  G0 n; P3 O7 T, `" H7 w
  50. Sitemap:http://www.xxx.com/sitemap_baidu.xml
複製代碼
問題是這份代碼適用於中文站用於百度,我是做英文站要適用於google, 以上代碼怎樣改成適用英文站的?3 o8 B8 k1 x6 p6 z1 b* O
對於代碼 一竅不通...4 P, l" o  W: w
/ G2 p1 x" G/ A" U* ]3 c
主要疑問是31----47行的代碼,既然是英文站,這幾行代碼應該是允許的吧?中文站才禁止抓取?$ _5 b5 m5 J: R) M7 q
( B% B/ I. b5 W( u0 a

/ @' D3 |8 H8 F1 Z$ I( M6 ]9 G. w2 i

1 Z" \+ n% ?8 [4 \% [' m$ c補充內容 (2013-12-22 17:43):8 m5 K: U' V& K5 Z# T" D8 E2 K2 a
沒這麼複雜,下面的就可以了: Z8 B, p, z2 s% [* ~
Sitemap: hxxp://www.xxx.com/sitemap.xml; m0 o4 x. A, p: d
User-agent: *
& L% ~7 g, [0 \4 W1 ^9 I5 Q: ZDisallow: /cgi-bin/
7 G" V% K3 S+ d3 E" P; j5 PDisallow: /wp-*
5 ~: E, \. K) g! I/ w- k% G6 H% g9 t2 E( g9 [8 J
補充內容 (2013-12-27 17:17):! r, x  z6 n& K& f
http://blog.csdn.net/wallacer/article/details/654289
發表於 2013-11-22 15:02:27 | 顯示全部樓層
好像禁止了動態收錄?具體聽高手解答~- E# {6 H( M% v9 Z' p
回復 给力 爆菊

使用道具 舉報

發表於 2013-11-22 21:26:40 | 顯示全部樓層
我第一次看到這個robots.txt是在英文站.....! @+ w# u; i9 O( C- f
可以用於英文站
3 k: w# H- P1 d) c8 ~& F
回復 给力 爆菊

使用道具 舉報

發表於 2013-12-10 14:14:56 | 顯示全部樓層
6 X4 [; o& {7 Q; [4 \

0 Y2 D+ L$ ^8 I$ c# Y
( E! N7 w( i) |& [! O* e和競爭對手學習呀,他們是你最好的老是- s5 Z; n5 q- Y6 @/ T2 L7 L
& e0 h0 ^3 w# D+ d7 u, X: t6 Q, K5 W
回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

过期高净值品牌域名预定抢注

點基跨境 數位編輯創業論壇

GMT+8, 2025-5-26 09:06

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表