过期域名预定抢注

用戶名  找回密碼
 免费注册

如何寫好WordPress網站的robots.txt文件?

[複製鏈接]
發表於 2013-11-22 14:23:30 | 顯示全部樓層 |閱讀模式
本帖最後由 hardrock 於 2013-11-22 14:34 編輯
3 c4 j! n7 m" M9 c
" H7 w/ y  G- D/ C4 G6 ^& Jrobots.txt文件要放在網站根目錄下,最基本的檢查方法就是用你的域名後面直接跟上robots.txt訪問,如果能訪問,那放置的位置就對了。
4 v: N8 g- g5 V( w# Y# i
& f0 C) K7 T7 m- ~9 x找到份代碼,
  1. User-agent: *
    : m" {6 m  C0 z) H6 V) s
  2. Disallow: /cgi-bin/7 g4 X" B0 r5 |+ @  @% u
  3. Disallow: /wp-admin/
    3 _. s/ h9 I1 `" P# K: p/ e4 q5 Z
  4. Disallow: /wp-content/cache/0 O3 ]# Y  P1 W5 [8 k
  5. Disallow: /wp-content/languages/
    5 m: J! y" q- M  Z+ T( d
  6. Disallow: /wp-content/plugins/% F0 k6 I9 O6 q3 L$ }
  7. Disallow: /wp-content/themes/
      p* O$ g& Q( w; j$ \& {2 q
  8. Disallow: /wp-content/upgrade/2 }6 s0 i# ?& Q* c- E& x2 E
  9. Disallow: /wp-includes/, J( G$ d; _) C6 V* Z* _" G
  10. Disallow: /comments/
    5 o: l. ~+ j" Y% |2 C
  11. Disallow: /category/4 i4 a$ v* q% K* ~/ ]" B
  12. Disallow: /tag/
    % p+ ?8 u3 h: n: J1 A* f6 L
  13. Disallow: /page/
    5 O8 H" ]+ t* ^5 Z8 E
  14. Disallow: /feed/7 u! t9 g2 d9 m! `; }* u
  15. Disallow: /author/
    , x' L$ C8 @2 W1 G. L, V
  16. Disallow: /trackback/* p# m3 R# x! G: A7 }
  17. Disallow: /2010/( {& s2 B% y( Z7 P5 E$ ?, U/ K
  18. Disallow: /2011/: t5 r/ I' S& W# {- e( v, r
  19. Disallow: /2012/$ m5 p& `/ w) K& [. R
  20. Disallow: /2013/" s& [4 j, A7 ~9 S2 a
  21. Disallow: /*/feed/
    ! N. h6 {8 j7 E7 N2 L1 S" I3 }
  22. Disallow: /*/trackback/# N, z# r; `- z3 g2 i7 E5 b
  23. Disallow: /*?1 `" e7 d2 ~, N3 c6 R
  24. Disallow: /*/*?* M9 Q, E3 E) C. @5 B
  25. Disallow: /*/*/*?
    ) B. O6 w1 Q' Q& u6 T
  26. Disallow: /*.php$4 {8 s) Q9 F& b5 X5 x
  27. Disallow: /*.js$
    % l4 u8 r3 {8 K! G. e$ R
  28. Disallow: /*.inc$5 C/ M# n* i4 b8 p, g
  29. Disallow: /*.css$& {+ \& A3 s& q$ K% a7 u9 k8 b
  30. + |0 W- q( O. ]. K; \8 S
  31. # Google Image
    - q+ W" ]8 p& K4 y
  32. User-agent: Googlebot-Image3 t1 \! f& g* w0 t
  33. Disallow:
    + Q4 K4 O6 y* M$ V, h7 b  e
  34. Allow: /0 P. ]1 `" r) v. ]
  35. 1 D& o) i6 k5 R" P4 \. `6 a
  36. # Google AdSense
    , P2 P; W1 H& R6 i( Y
  37. User-agent: Mediapartners-Google*0 b& i  X, A& Z
  38. Disallow:/ z9 H4 Y" @. i: d$ |
  39. Allow: /$ C! m! [4 G6 a% _  w. }
  40. - @* N, \9 {. h/ M6 f7 g
  41. # digg mirror5 S2 v) ]- q& g! v( T/ l, `
  42. User-agent: duggmirror
    ) l0 F8 _, a. [4 ?  V
  43. Disallow: /) J2 ?3 g( P1 N( p

  44. / {' R0 J; ~) e% C
  45. # Alexa archiver* G  N: X- M3 A; W1 I: [3 \
  46. User-agent: ia_archiver
    3 \) n0 {4 S; z( D
  47. Disallow: /( H7 ~0 P- A2 l9 b
  48. ! M  i4 p4 i" O
  49. Sitemap:http://www.xxx.com/sitemap.xml, F* l  \7 g6 Z" ^2 I
  50. Sitemap:http://www.xxx.com/sitemap_baidu.xml
複製代碼
問題是這份代碼適用於中文站用於百度,我是做英文站要適用於google, 以上代碼怎樣改成適用英文站的?
! D9 K9 T2 A+ S6 W$ k" @0 S對於代碼 一竅不通...
, Z% U# L1 f. p1 D8 @+ C8 T0 [6 c+ m2 v2 ^* j
主要疑問是31----47行的代碼,既然是英文站,這幾行代碼應該是允許的吧?中文站才禁止抓取?: G* H' F* J" k8 ?8 A, S3 @: X5 K

( Z. H0 o8 l% N2 C. o( }, e9 ~2 j
' j3 ]1 G! m  ]& o
0 ?( n& t' [5 w5 j" _) C8 `# p
* S/ a. Y9 a) C# ]補充內容 (2013-12-22 17:43):
* q% V6 r- l8 s' l* m1 s沒這麼複雜,下面的就可以了
9 F  r# t: U. W1 q7 ZSitemap: hxxp://www.xxx.com/sitemap.xml# N7 O2 f# F- o  u; s4 z4 f" H8 k/ h
User-agent: *  u( o, i0 `. A* d
Disallow: /cgi-bin/: r+ a, z. {. N, b. M, y
Disallow: /wp-*8 Y: F+ M, o- g" t4 O5 z! W2 ^  u
0 Y' T' z7 }; b4 H( {* q; c, [
補充內容 (2013-12-27 17:17):$ j/ p, Q. u# \  a  `: K
http://blog.csdn.net/wallacer/article/details/654289
發表於 2013-11-22 15:02:27 | 顯示全部樓層
好像禁止了動態收錄?具體聽高手解答~
. M: e" s; `: }
回復 给力 爆菊

舉報

發表於 2013-11-22 21:26:40 | 顯示全部樓層
我第一次看到這個robots.txt是在英文站.....
5 P, c; O( S3 L) x可以用於英文站
2 C& n, _3 c3 }/ y
回復 给力 爆菊

舉報

發表於 2013-12-10 14:14:56 | 顯示全部樓層

1 ]% V, o8 I6 [
3 q2 M5 A) ]( w8 K% a1 q
+ v& \  a* p, W和競爭對手學習呀,他們是你最好的老是
% Q" B0 C4 M1 R$ E  m- i8 y& V8 w3 C( f/ K
回復 给力 爆菊

舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

點基跨境 數位編輯創業論壇

GMT+8, 2025-6-20 18:26

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表