过期域名预定抢注

 找回密碼
 免费注册

如何寫好WordPress網站的robots.txt文件?

[複製鏈接]
發表於 2013-11-22 14:23:30 | 顯示全部樓層 |閱讀模式
本帖最後由 hardrock 於 2013-11-22 14:34 編輯
, |. V$ |% X! d" V. K! o: f5 M+ V
: S+ Z: A7 s3 G) irobots.txt文件要放在網站根目錄下,最基本的檢查方法就是用你的域名後面直接跟上robots.txt訪問,如果能訪問,那放置的位置就對了。
$ k! h+ g6 y# c# n$ m1 l  ^0 s
* C- S" n: w+ ]. E- ?# i$ s找到份代碼,
  1. User-agent: */ e7 U' ^/ N; o
  2. Disallow: /cgi-bin/
    * Z5 W$ |0 ^/ r% \
  3. Disallow: /wp-admin/6 I6 a/ A- N6 r7 B4 E7 H
  4. Disallow: /wp-content/cache/: N: J( r9 W* X: n  l3 }9 A3 d" I  B6 b
  5. Disallow: /wp-content/languages/5 R  e/ |3 E9 g) l. A
  6. Disallow: /wp-content/plugins/
    % Y6 ?. {0 y0 ~9 p- M
  7. Disallow: /wp-content/themes/
    6 [7 Q) i2 b3 m' P! z* K: T
  8. Disallow: /wp-content/upgrade/( {, X, f3 i1 l! d( @  i
  9. Disallow: /wp-includes/
    / w$ b6 M  w9 L9 s) y
  10. Disallow: /comments/
    * P3 K0 _, K5 j4 s- k8 f
  11. Disallow: /category/1 h$ {- [( F0 `/ j4 q: N; q8 b% B2 U
  12. Disallow: /tag/
    . Z5 h& b! E; O/ F
  13. Disallow: /page/
    1 f& Q! A# A+ d
  14. Disallow: /feed/2 a, V$ B; b; \6 Y# H
  15. Disallow: /author/! s/ Y! u8 P% @# f9 e
  16. Disallow: /trackback/
    * b3 H9 I2 p3 h. Z) G. K5 {$ u' J
  17. Disallow: /2010/
    ; u* m- T0 I2 Z2 t$ \
  18. Disallow: /2011/! Y- c, W* V" z1 {0 I2 O  x
  19. Disallow: /2012/
    . r$ o# a0 d2 X, }( P! F. r
  20. Disallow: /2013/# Q5 T/ K% {' k# G4 l
  21. Disallow: /*/feed/
    : B4 m$ E% \' [2 K' {& y
  22. Disallow: /*/trackback/" Y/ n5 O! F3 |
  23. Disallow: /*?/ Y& q8 i& m! I3 m% H  w# C4 o
  24. Disallow: /*/*?
    7 W% i9 O( ]- T+ n  \
  25. Disallow: /*/*/*?& i# P0 @9 H& v# k! y) r, |. Q2 Z( B
  26. Disallow: /*.php$
      j* _: C( b1 d
  27. Disallow: /*.js$
    5 S  P! o! A' l  Q6 U, w
  28. Disallow: /*.inc$. \/ p1 E0 z6 M7 ?( e# W
  29. Disallow: /*.css$" |& _) O/ |2 X; |

  30. 7 k% B+ n8 u6 x% a/ C/ q, J+ m
  31. # Google Image0 y: n+ z% R5 h; z8 `* _6 z
  32. User-agent: Googlebot-Image! t- v. Z+ X" X0 e* C; t! l7 l, V( v
  33. Disallow:3 Z4 J& Y! u& X; N
  34. Allow: /2 H; a& Z) h: \2 ?3 i+ E) l

  35. # X$ \+ m$ [) |( n6 b7 n  z: Q9 I
  36. # Google AdSense2 w2 a/ t, K- U* r  V- |1 Z* X( s
  37. User-agent: Mediapartners-Google*
    : [3 Z9 q! @! S0 X
  38. Disallow:
    - j# e& E+ v) c/ \: O
  39. Allow: /
    & M! E0 R$ `" l
  40. : ^- y  c# c7 ?
  41. # digg mirror
    4 g# D& N9 r6 h4 E
  42. User-agent: duggmirror
      E$ b" u: {) n
  43. Disallow: /
    " Z- h/ R( B1 Z6 B) Q, R) g* U

  44. - J# d; D4 }9 [
  45. # Alexa archiver
    . z) F; P* g8 K
  46. User-agent: ia_archiver6 E* ^8 j) W9 o  ?
  47. Disallow: /( G% R3 V: z6 ~& e4 `  b: d
  48. , h( v. R% a0 B( z( O, x2 I+ Z
  49. Sitemap:http://www.xxx.com/sitemap.xml. h2 T9 B9 X( O
  50. Sitemap:http://www.xxx.com/sitemap_baidu.xml
複製代碼
問題是這份代碼適用於中文站用於百度,我是做英文站要適用於google, 以上代碼怎樣改成適用英文站的?" X$ x( j% J% i2 A
對於代碼 一竅不通...
7 A, U* T( r* `) S# @' K% A2 q0 x' ^2 W- u
主要疑問是31----47行的代碼,既然是英文站,這幾行代碼應該是允許的吧?中文站才禁止抓取?' T9 ?6 `+ U! G; v0 ?7 B

, s: `. V+ t/ t! U  L: t% |2 Q$ H2 c6 v. _# N/ k4 n. l) S
" s$ a1 j4 L9 s$ ^4 c* g

. I( ^0 M/ D# z% K, ?補充內容 (2013-12-22 17:43):
, H1 d% f& c6 l. q6 `沒這麼複雜,下面的就可以了
0 o0 C* ^2 L  E5 T& {Sitemap: hxxp://www.xxx.com/sitemap.xml
4 s4 n3 w' b3 a1 W- uUser-agent: *6 i& z3 t8 X) `: T2 ^
Disallow: /cgi-bin/: |+ T0 B( Z0 Y$ }7 u$ K# E
Disallow: /wp-*
5 t" Q9 q1 m2 r, F2 R# j9 K- X/ {& c4 c, ?2 _# u
補充內容 (2013-12-27 17:17):# U$ Y% H$ |, U. F' n
http://blog.csdn.net/wallacer/article/details/654289
發表於 2013-11-22 15:02:27 | 顯示全部樓層
好像禁止了動態收錄?具體聽高手解答~$ C/ ~; v8 j) Z5 G7 }& }
回復 给力 爆菊

使用道具 舉報

發表於 2013-11-22 21:26:40 | 顯示全部樓層
我第一次看到這個robots.txt是在英文站.....
6 P, n" M/ U& {/ V# T. p可以用於英文站8 ]2 l% @/ P, l! _4 I1 L- u
回復 给力 爆菊

使用道具 舉報

發表於 2013-12-10 14:14:56 | 顯示全部樓層

9 w4 f1 L4 P0 N) H
8 H. h0 @7 j& p! K% h9 K  X& P8 @7 j- T6 q$ N+ ~( ^6 |1 \1 |
和競爭對手學習呀,他們是你最好的老是; d1 @, w+ T! a, x

1 y0 l8 `' ~& M# r
回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

點基跨境 數位編輯創業論壇

GMT+8, 2025-5-26 06:11

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表