這是一篇2008年轉帖的帖子,但是本人覺得這篇文章現在對於很多的站長仍然是一篇好文章,所以轉帖了
0 ?( K6 N7 E. j8 Y9 P$ K! p i5 h; k1 j3 ^. K
一SEO的建議:URL標準化5 @- e. o6 {: t8 k0 ]' ~0 j9 }; P
admin 於 2008-1-6,21:34 瀏覽(506)0 r" M/ w( h9 R& N: S
歸類於: SEO優化, 網站建設與網站流量
6 k" u- I! _1 k7 c: n( f0 [ 標籤:SEO, URL標準化, 站長工具.
7 n4 |' o& D* p: s 轉載自google中文網站管理員Blog
* _( @7 S5 A/ ]; O( K* m! L 譯自: Matt Cutts Blog3 P2 l! Y( x7 {. g* y
6 Q' i ]5 O9 T5 B$ |7 j) i4 Y0 I
(譯者按: Matt Cutts, google反網絡emu組的帶頭人, 於 2006 年 1 月 4 日在他的個人Blog上發表了」SEO advice: url canonicalization「一文。儘管已快兩年了,Google(google)也為網站管理員提供了站長工具,我們發現對很多站長來說該文仍是一篇很好的 SEO 文章。)4 J) [$ A6 a* n/ w& Y
# O, j- A2 k5 g3 d4 H' m
' P6 |: t4 A* H4 H1 y3 v 在我開始收集關於 Bigdaddy 數據中心的反饋之前,我想簡略地談一談有關標準化、「www 相對於非 www」、重新定向、重複 URLs、302「劫持」等問題的看法,這樣我們的討論才有共同的基礎。 F. v8 L4 b- [4 }* {0 M& }
問:什麼是一個標準化 URL ?為什麼要用這麼一個奇怪的字眼?
% ]0 `& q3 k2 F: e( H5 x5 i4 ]答:很抱歉,這是一個奇怪的詞彙;這是google內部對它的稱呼。標準化是一個在若干選項中選取最佳 URL 的過程,這裡通常是指主頁。例如,多數人會將下列 URL 看作相同性質的:6 [7 C: A3 Q( `) ]* `1 U
! g" Y3 I- l, e7 A
* www.example.com& P* b( \) H; _& {
* example.com/
- ^( M( H/ C! ]4 l6 a* www.example.com/index.html
" _* ?3 K4 T: G% k# V* }4 Z* example.com/home.asp( n y) D6 e, ~( s+ A: W
1 H" v3 i! c- J5 n- N- G6 q
但是從技術角度看,這些 URL 都是互不相同的。對於上述 URLs,Web 服務器會返回完全不同的內容。當google「標準化」特定的 URL 時,我們試圖從一整套同類 URL 中選出看起來最具代表性的一個。6 z+ a; O" p% A" C# Z2 X; D& {
7 }% X1 I" k. [( P問:那麼我如何能確保google能挑選出我所想要的 URL?
3 F* R% w* L. e1 P答:挑選出你想要的 URL,並且在此後一直使用這個 URL 訪問特定網站,這是很有幫助的。例如,不要讓同一個輸入的鏈接一半指向 http: //example.com/ 而另一半則指向 http://www.example.com/ 。相反,挑選一個你喜歡的 URL,並且在你的內部鏈接中總是使用這個格式。) E6 ?' }, D) K" @( B
(譯者註:現在你可以使用站長工具來通過「控制台 > 工具 > 設置首選域名」)。
" R1 j3 y4 \; N' h$ D* I( F6 E) w( [9 K( l& ^7 r9 v
問:除此之外,我還能做什麼?
7 Y5 u5 A; Z$ m/ u答:比如,如果你希望你的默認 URL 為 http://www.example.com/。那麼,你可以設置你的 web 服務器,這樣如果有人請求 http: //example.com/,它就會產生一個 301 的(永久性)重新定向,鏈接到http://www.example.com/。這樣可以幫助google瞭解到你希望將哪個 URL 作為自己的標準。如果您的網站常有變更(例如動態內容和Blog等),那麼加入一個 301 重新定向可能更便於搜索引擎的定位和捕獲。
' R$ w; N, A3 h: {, e$ s; u9 ]) P( C" ~" ^9 o! W: P& q$ X
問:如果我希望去掉 domain.com,但希望保留 www.domain.com,我是否應該使用 URL 清除工具來刪除這個域名?. [0 z6 Y, @! A B0 R- ?% F
答:不要,絕對不要這樣做。對於任何一個 www 域名,或非 www 域名,一旦刪除其結果可能導致該域名在未來六個月內無法恢復。絕對不要這樣做。如果你本想使用 URL 清除工具刪除 www 域名或者非 www 域名,但實際上卻刪除了你所有的域名,請發送一個重新收錄請求,並聲明你用 URL 清除工具不小心刪除了整個域名,現在要求重新收錄。
) ?% V) z+ y0 d9 H
5 z; N+ {; Z& @& w) U+ u問:我注意到,你自己並沒有使用 301 重新定向將你的站點從非 www 版本轉向 www 版本,為何沒有這樣做?5 t" l0 s# Q1 R
答:實際上我是故意這樣做的。我幾個月之前就注意到了這一點,但決定不自行調整,或者請求google員工幫我搞定它。我或許最終會加入一個 301,但至少到目前為止,它還是一個有幫助的實驗案例。
l& N9 v% Q8 H5 I+ @! u" B5 ]: T3 `5 c
問: 那麼在討論「www 與非 www」時,你也認為這是一種標準化的類型嗎?還有沒有別的方法能實現 URL 的標準化?0 n9 A+ S9 V: i7 H
答:確實還有很多方法,但是多數人不會也無需注意到這些。搜索引擎能夠自動完成諸如保留或者刪除末尾的斜槓、將 URL 從大寫格式轉換為小寫格式,或者將 session ID 從 BBS 或其他軟件上刪除等任務(即使你省略了 session ID,許多 BBS 依然能夠正常運行)。0 i) j! I# Y/ f9 K" I ?) M
& {- V+ f4 h" {' \5 R
問:讓我們談談」inurl:」操作符。為何每個人都認為如果 inurl:mydomain.com 顯示出某些並非來自 mydomain.com 的結果,那麼他一定是被人劫持了?
" Y+ b- O9 l5 `9 v$ t- H& q答:早先,如果你看到 someresult.com/search2.php?url=mydomain.com,有時候其中會包含來自 mydomain 的內容。如果 someresult.com url 是一個指向 mydomain.com 的 302 重新定向,而我們決定顯示一個來自 someresult.com 的結果,就會產生這種情況。從那以後,我們已經改變了我們的啟發方式,大大降低了 302 重新定向源 URL 的顯示幾率。我們逐漸採納了一個用於處理重新定向的框架,它幾乎總是顯示目的地 URL。雅虎通常採用顯示目的地 URL 的方式來處理 302 重新定向,而我們正處於逐步過渡到一套類似啟發方式的過程中。請注意,雅虎保留了在重新定向的過程中處理所出現的例外的權力,而google也會這樣做。根據我們的分析,我們將在 302 重新定向過程中顯示 URL 源的總概率不到 0.5%(基本上,當我們有足夠的理由相信 URL 源正確無誤時才會顯示)。; _$ M) n- ~2 R8 |* |7 h
$ Z' H* ~6 P/ S' M% ~3 d
問:那麼,補充材料又如何呢?補充材料是否會招致google的懲罰?
# ]' `, a% V! [$ y7 b' T3 Y答:不會。
/ F/ D. h3 P. j% N0 n(譯者註:補充材料已成為歷史。請閱讀補充材料轉為主流一文)。4 k) i3 A; ?7 y9 e4 _& M n
) Q Q9 _+ g+ k* ?0 u) v問:在補充性結果中有我的一些網頁,但這些網頁已經很老舊了。我該怎麼辦?
! n' o8 V4 M9 w; u& c0 ]! i2 ?8 X答:如果換了我,就不會在這方面花太多的精力。如果網頁已經刪除,我會確保有一個 301 重新定向,指向新網頁的位置。如果的確徹底消失了,我會確保服務器返回一個關於這些網頁的 404 錯誤信息。此後,我不會再花費任何精力。當google最終重新抓取那些網頁時,就會發現其中的變化。但是由於我們自己爬取補充性結果的時間間隔要長一些,所以你可能在一段時間內看不到更新 |
|