淘寶和百度最近是打的熱火朝天的,咱們這些旁觀者也不能光看熱鬧啊,得從中學到什麼啊,. ~5 x* Z- S/ `- `, k/ J6 s. q
我們看到,淘寶和百度兩打架,有個傢伙在做怪,那是什麼呢?robots.txt文件,
Q2 C" R7 `# U% Q* S4 a1 p下面呢,我就給不知道什麼是robots.txt文件的朋友掃盲,高手可略過," L+ `6 h- X5 Z7 p. x
可能有太多的做搜索引擎優化和網絡營銷的新手朋友經常接觸robots這個詞,但並沒有對它做深入的研究,本文將幫你輕而易舉的理解robots文件的內涵,並且毫不費力的做出符合搜索引擎興趣和心性的robots內容,您只需要花費一點點時間,就能和robots這個傢伙輕鬆成為朋友。何樂而不為呢, w+ h) x$ h' `$ n+ q5 w
/ N& o$ a2 k+ ^$ c q7 p
9 f; S) M4 X. x+ [想像一下,如果你和robots成為朋友,你就和搜索引擎達成了一個協議,一個建立在平等基礎上的協議,: i+ ~5 a/ w) {& s$ T" _
當你擁有robots這個朋友的時候,你就可以輕鬆的對搜索引擎說不了,你的網站上的一些隱私或其它內容當搜索引擎過來訪問時,robots這位朋友就是一位強大的保護神,把搜索引擎拒之門外。
' x$ p g6 w7 U
; V8 C# Q- }1 T/ {4 e我在這裡不但會告訴你一些怎樣設置robots文件的秘訣,而且還告訴你如何設置它能更加對搜索引擎友好,以有利於你的網站排名,並且教你幾招輕鬆搞定robots函數的辦法/ {/ q s2 D/ O, i% O
7 \* q* X: @' M4 j% z" G- \8 Q4 A1 \1,那麼,什麼是robots文件呢,當搜索引擎這個機器人慢悠悠的來到你的網站的時候,它首先看一下你的網站中是不是有robots.txt這個文件,所以說robots.txt文件是搜索引擎已經和我們達成的一個約定,如果我們按約定那樣做了,它們就不要收錄。: e% [# I: C) a: u9 \& b7 ^3 r& P
3 w! H$ x( Z$ ~/ Y% E/ u& _* z' v2。robots.txt文件放在你的網站什麼地方呢,,記住,一定是根目錄下,比如www.123.com/robots.txt,切記不要放到別的地方,
. z) j. O/ D5 u+ ~/ I' A+ C6 H B' b' {/ }
3,robots.txt文件如何設置呢,很簡單,如果你希望網站的網頁全部被抓取,三種辦法,一是不要robots.txt文件,二是建立一個空的純文本文件,命名為robots.txt,上傳到你的空間的根目錄下,如果你不希望網頁被全部抓取,那就設置一下robots函數就可以了,+ n: i0 v3 O9 m) J. B) L2 r
- N! l% o! T2 k6 q2 j/ R0 A
4 在robots.txt文件裡你基本上只用兩個函數就可以了,:User-agent和
6 l% |4 T8 V# Y+ aDisallow
- S+ y, V; Y. ZUser-agent: * 允許所有搜索引擎收錄% ]$ i4 F7 i, S4 \0 w
《適用於所有搜索引擎》
2 R- I# ?# r0 n* fDisallow:) R% V( d. H# P! k" {2 v
允許訪問所有文件
3 C6 _: z/ F% z% [1 ]8 B9 @* `Disallow: / 禁止訪問所有的網頁文件# x5 \% T# `- N9 Z9 w
User-agent: baiduspider
8 ~" r1 M2 O7 R! c6 ~; G, Z0 w/ K3 Q
Disallow: / 僅禁止baiduspider訪問您的網站6 u+ B' n6 a, s& `
User-agent: *
* T7 ^8 m& Q1 ~4 n4 P) W; ^* C" W5 K0 b f5 p- h
Disallow: /cgi-bin/ 禁止所有搜索引擎訪問cgi-bin/ 目錄下所有文件
/ A4 T/ J1 n) Z- P6 O% [9 Y& u7 mUser-agent: *8 J K$ v. w& D- L$ p4 X
; c9 I! N5 s5 `% L6 n* ?5 f
Disallow: /*?* 禁止訪問網站中所有的動態頁面
2 }1 Q$ A5 o9 w/ q
+ x4 }" h, S( H1 h5,接下來我將告訴你如何設置你的robots文件來達到最優化網站的方法,0 F/ Z' X, A6 E1 z Y) i7 ^
當你檢查你的網站時,你會發現很多重複或相似的網頁,這些網頁不利於你的網站的權重,所以你就要用到robots這個朋友來禁止一些相似的網頁
4 F! V: A; T- }4 U- D7 R當你發現一些網頁沒有關鍵詞時,最好用它禁止,
; ]* j% x! ~ P$ Q8 Y4 Q/ @6 e5 G4 Y當你發現一些死鏈接時,最好禁止2 _8 I- L. x! b* v
當多個鏈接同指向一個網頁時,最好禁止動態的那些鏈接
7 U. H/ N/ w( [0 E- r% U; G以上所有這些都是對搜索引擎友好的設置
0 _/ q3 R1 Y/ P+ ?" u) z' g- I7 D# N8 ]) |
6 那麼,設置了robots後多長時間生效呢,一般情況下二十四個小時,
7 D0 ^/ R9 ?: W$ o3 u4 f, @當你讀完這篇文章後,是否感到花費了幾分鐘是進學值得的,因為通過這篇文章你對robots文件已經有了更高層次的理解吧,
- `. d; M% i( N/ O$ z( y% @" U% S$ x9 \6 W
好,讓我們看一下我的robots文件設置吧robots.txt |
|