http://googlechinablog.com/2008/10/blog-post_20.html5 N6 M6 e4 V: U" y# b$ M
# d# b) O7 E0 O- |* M9 R我們碰到過很多網站管理員,像我們的朋友那樣,認為靜態或者看起來是靜態的網址對於網站的索引和排名是有優勢的。這種看法是基於這樣一個假設,即認為搜索引擎在抓取和分析含有會話標識 (session ID) 和來源追蹤器 (source tracker) 的網址時是有問題的。然而,事實是,谷歌在這兩個方面都有了相當的進展。就點擊率來說,靜態網址可能略微有些優勢,因為用戶可以很容易地讀懂這個網址。但是,就索引和排名來說,使用數據庫驅動網站並不意味著明顯的劣勢。相比較將參數隱藏以使他們看起來是靜態的網址來說,我們更希望網站將動態的網址直接提供給搜索引擎。9 X% f# B5 E T/ @
: }, Y7 H0 Y: t' @' O6 B現在,讓我們來看一些有關動態網址的廣為傳播的看法,並且來糾正一些蒙蔽網站管理員的假說。 # d9 @' u. Y" D& t
8 k' H" q4 x4 K8 [ `/ j" H% w
傳說:"動態網址不能被抓取。"3 E' |- N7 R+ m2 K6 k- w1 ]( z
事實:我們可以抓取動態網址並且解釋不同的參數。如果您為了讓網址看起來像是靜態的,而隱藏那些可以給谷歌提供有價值信息的參數,這樣做反而會給該網址的抓取和排名帶來麻煩。我們的建議是:請不要將一個動態網址改換格式以使其看起來是靜態的。盡可能地使用靜態網址來顯示靜態內容是可取的,但在您決定展示動態內容的情況下,請不要將參數隱藏起來從而使他們看起來像是靜態的,因為這樣做會刪除掉那些有助於我們分析網址的有用信息。
, }( `* P! a9 f1 a# V' n. ]1 k
* Z3 L) a% H% S& m! S1 E1 Z傳說:"動態網址的參數要少於3個。"
9 o5 H* S1 B9 J# L# j) T3 f3 v事實:對於參數的數量是沒有限制的。但是,一個好的經驗是不要讓您的網址太長(這個適用於所有的網址,不論是靜態的還是動態的)。您可以去掉一些對於 Googlebot 來說不重要的參數,給用戶一個好看一點的動態網址。如果您不能確定可以去掉哪些參數,我們建議您將動態網址中所有的參數都提供給我們,我們的系統會弄明白哪一些是不重要的。將參數隱藏起來會影響我們正確地分析您的網址,我們也就不能識別這些參數,一些重要信息可能也因此丟失了。1 S" f/ c% V1 |, @$ J0 _ I' y4 I
3 C" o/ u6 ^. i+ M下面一些是我們認為您可能會存在疑問的一些問題。
! a3 r9 l7 Z% i1 X, _5 [
3 C7 l4 T5 O! L5 r2 C這是否意味著我應該完全避免重寫動態網址?9 h8 X5 p! h3 t8 _7 q9 @
這是我們的建議,除非您能確保您只是去掉多餘的參數,或能夠把所有有可能有不良影響的參數完整地刪除。如果您把自己的動態網址任意修改使其看起來像是靜態的,您要清楚這樣做是有風險的,有可能會導致有些信息不能被正常地編譯和識別。如果您想給您的網站再增加一個靜態的版本,請您一定要提供一個真正意義上的靜態的內容,比如生成那些可以通過網站相應路徑而獲取的文件。如果您僅僅是修改了動態網址的表現形式,而沒有真正提供靜態的內容,那麼您有可能適得其反。請直接把標準的動態URL提供給我們,我們會自動找出那些冗余的參數。
1 N) d+ s5 ^5 G- U8 j5 L F) a7 u# m2 i/ F: P2 Z! G" y
你能給我舉一個例子麼?2 t2 @, e" y# W" l) N0 i" b, y
如果您有一個像下面這樣標準格式的動態網址:foo?key1=value&key2=value2,我們建議您不用改動它,谷歌會決定哪些參數可以去掉;或者您可以為用戶去掉那些不必要的參數。不過要慎重,僅僅去掉那些不重要的參數。這裡有一個含有多個參數的動態網址的例子:
/ P% A7 ]3 m3 a
( h- N9 l3 Z) {# J# z2 z# wwww.example.com/article/bin/answer.foo?language=en&answer=3&sid=98971298178906&query=URL& I# c3 Z; Q3 {
- language=en – 標明這篇文章的語言
- answer=3 – 這篇文章含有數字3
- sid=8971298178906 – 會話標識代碼是8971298178906
- query=URL – 使這篇文章被找到的查詢是
並不是所有的參數都提供額外的信息。所以將這個網址重寫為[url]www.example.com/article/bin/answer.foo?language=en&answer=3 可能不會引起任何問題,因為所有不相關的參數都去掉了。
N' y, p) F( ` ~5 v; D) H" k3 _8 l
下面是一些經過認為修改而看起來像是靜態網址的例子。相比較沒有重寫、直接提供動態網址來說,這些網址可能會引起更多抓取方面的問題。7 i5 u% q; E5 t) V4 e R
- www.example.com/article/bin/answer.foo/en/3/98971298178906/URL
- www.example.com/article/bin/answer.foo/language=en/answer=3/ sid=98971298178906/query=URL
- www.example.com/article/bin/answer.foo/language/en/answer/3/sid/ 98971298178906/query/URL
- www.example.com/article/bin/answer.foo/en,3,98971298178906,URL
如果您將動態網址重寫成如上所述的示例的話,可能會導致我們很多不必要的抓取,因為這些網址中都含有會話標識 (sid) 和查詢 (query) 參數的可變值,這無形中生成了很多看起來不同的 URL ,而他們包含的內容卻是相同的。這些格式讓我們很難理解通過這個網址返回的實際內容和參數URL以及98971298178906是無關的。不過,下面這個重寫的例子卻將所有無關的參數都去掉了:5 J$ `& m1 ]' t/ Q
- www.example.com/article/bin/answer.foo/en/3
儘管我們可以正確地處理這個網址,我們還是不鼓勵您使用這樣的重寫。因為它很難維護,而且一旦一個新的參數被加到原始的動態網址,那麼這個網址就需要馬上更新。不這樣做的話就會再次導致生成一個隱藏了參數的貌似靜態網址的 URL 。所以最好的解決方法是通常將動態網址保持他們原來的樣子。或者,如果您去掉不相關的參數,請記住一定要保持這個網址是動態的:# d7 M2 [* J, Y! @! p
- www.example.com/article/bin/answer.foo?language=en&answer=3
|
|