這是一篇2008年轉帖的帖子,但是本人覺得這篇文章現在對於很多的站長仍然是一篇好文章,所以轉帖了/ m0 M9 I5 Y* q$ X& s# u0 {( V
1 i* ~" f) z# M5 K6 D
一SEO的建議:URL標準化
/ y1 J. L6 J, H" u: l3 D2 g w0 Uadmin 於 2008-1-6,21:34 瀏覽(506)
8 w. p/ @% a. [* J3 H歸類於: SEO優化, 網站建設與網站流量$ S% I6 ], X2 Q5 k, v u P
標籤:SEO, URL標準化, 站長工具.
- l( c$ ]0 J4 I: R1 Z 轉載自google中文網站管理員Blog
6 S; E+ T( Y! e% x 譯自: Matt Cutts Blog# e5 r/ w' e! ~- L$ q% B
; L% `! T- A% w- ?& C (譯者按: Matt Cutts, google反網絡emu組的帶頭人, 於 2006 年 1 月 4 日在他的個人Blog上發表了」SEO advice: url canonicalization「一文。儘管已快兩年了,Google(google)也為網站管理員提供了站長工具,我們發現對很多站長來說該文仍是一篇很好的 SEO 文章。). z# u" s$ ^1 r# d, U* s: j
# Q& Y+ l* g Q
7 f0 R8 N6 ]1 q1 {
在我開始收集關於 Bigdaddy 數據中心的反饋之前,我想簡略地談一談有關標準化、「www 相對於非 www」、重新定向、重複 URLs、302「劫持」等問題的看法,這樣我們的討論才有共同的基礎。
0 a5 _! f. t! i, Q( ?問:什麼是一個標準化 URL ?為什麼要用這麼一個奇怪的字眼?3 }! E2 N: e) K9 ~! n, M7 R/ L( q
答:很抱歉,這是一個奇怪的詞彙;這是google內部對它的稱呼。標準化是一個在若干選項中選取最佳 URL 的過程,這裡通常是指主頁。例如,多數人會將下列 URL 看作相同性質的:
# D% s+ u! M) \& {8 l7 m1 C, G$ C: f* U
* www.example.com
8 w3 q7 X& ^6 c5 ^4 F* example.com/
, k* k2 L. }7 z% Y$ m* www.example.com/index.html
8 w8 r8 N7 O+ w3 V* example.com/home.asp
: h6 Z$ c$ Z6 I) M$ L/ [3 E( ^
, v$ @& ^* N/ ?: M但是從技術角度看,這些 URL 都是互不相同的。對於上述 URLs,Web 服務器會返回完全不同的內容。當google「標準化」特定的 URL 時,我們試圖從一整套同類 URL 中選出看起來最具代表性的一個。
' A) x2 H" h+ C$ w# G6 D$ v0 P# w& E! v
問:那麼我如何能確保google能挑選出我所想要的 URL?2 G$ u- `& z& H9 u2 N
答:挑選出你想要的 URL,並且在此後一直使用這個 URL 訪問特定網站,這是很有幫助的。例如,不要讓同一個輸入的鏈接一半指向 http: //example.com/ 而另一半則指向 http://www.example.com/ 。相反,挑選一個你喜歡的 URL,並且在你的內部鏈接中總是使用這個格式。$ r3 g2 j8 i/ G+ k3 L
(譯者註:現在你可以使用站長工具來通過「控制台 > 工具 > 設置首選域名」)。
1 O8 @: t i6 z: ~& H; I. y6 S' W
7 z: k4 y) D8 F- J# L問:除此之外,我還能做什麼?
! X: n8 m9 G9 y& {" U! A答:比如,如果你希望你的默認 URL 為 http://www.example.com/。那麼,你可以設置你的 web 服務器,這樣如果有人請求 http: //example.com/,它就會產生一個 301 的(永久性)重新定向,鏈接到http://www.example.com/。這樣可以幫助google瞭解到你希望將哪個 URL 作為自己的標準。如果您的網站常有變更(例如動態內容和Blog等),那麼加入一個 301 重新定向可能更便於搜索引擎的定位和捕獲。3 N' q0 W) _' v/ b+ s ^$ S( C
* q5 X4 |1 E) P+ _" [問:如果我希望去掉 domain.com,但希望保留 www.domain.com,我是否應該使用 URL 清除工具來刪除這個域名?8 b0 B8 V! `: O$ ?: U9 R; @2 Z) {
答:不要,絕對不要這樣做。對於任何一個 www 域名,或非 www 域名,一旦刪除其結果可能導致該域名在未來六個月內無法恢復。絕對不要這樣做。如果你本想使用 URL 清除工具刪除 www 域名或者非 www 域名,但實際上卻刪除了你所有的域名,請發送一個重新收錄請求,並聲明你用 URL 清除工具不小心刪除了整個域名,現在要求重新收錄。
8 ?7 \. ]; ~; s6 M" n: X9 R) g
4 z$ J, q5 G" D5 z* f C" e問:我注意到,你自己並沒有使用 301 重新定向將你的站點從非 www 版本轉向 www 版本,為何沒有這樣做?( ]8 D- ^! z7 `7 r0 t( S
答:實際上我是故意這樣做的。我幾個月之前就注意到了這一點,但決定不自行調整,或者請求google員工幫我搞定它。我或許最終會加入一個 301,但至少到目前為止,它還是一個有幫助的實驗案例。1 w/ D8 @, C/ S8 W
$ E/ _! {6 H/ d# a7 F6 L. y7 w
問: 那麼在討論「www 與非 www」時,你也認為這是一種標準化的類型嗎?還有沒有別的方法能實現 URL 的標準化?% v5 [( O2 p' D, z7 E
答:確實還有很多方法,但是多數人不會也無需注意到這些。搜索引擎能夠自動完成諸如保留或者刪除末尾的斜槓、將 URL 從大寫格式轉換為小寫格式,或者將 session ID 從 BBS 或其他軟件上刪除等任務(即使你省略了 session ID,許多 BBS 依然能夠正常運行)。9 Y8 C1 A8 Y" p$ S* [- @: A
; j3 N+ H/ C1 j4 u8 K問:讓我們談談」inurl:」操作符。為何每個人都認為如果 inurl:mydomain.com 顯示出某些並非來自 mydomain.com 的結果,那麼他一定是被人劫持了?
% w3 ]) u/ v2 d, l# m: R答:早先,如果你看到 someresult.com/search2.php?url=mydomain.com,有時候其中會包含來自 mydomain 的內容。如果 someresult.com url 是一個指向 mydomain.com 的 302 重新定向,而我們決定顯示一個來自 someresult.com 的結果,就會產生這種情況。從那以後,我們已經改變了我們的啟發方式,大大降低了 302 重新定向源 URL 的顯示幾率。我們逐漸採納了一個用於處理重新定向的框架,它幾乎總是顯示目的地 URL。雅虎通常採用顯示目的地 URL 的方式來處理 302 重新定向,而我們正處於逐步過渡到一套類似啟發方式的過程中。請注意,雅虎保留了在重新定向的過程中處理所出現的例外的權力,而google也會這樣做。根據我們的分析,我們將在 302 重新定向過程中顯示 URL 源的總概率不到 0.5%(基本上,當我們有足夠的理由相信 URL 源正確無誤時才會顯示)。
E/ J& V0 o+ B+ P; Y) [6 p \
: T$ ]; b s7 ~0 j( f5 q' k問:那麼,補充材料又如何呢?補充材料是否會招致google的懲罰?/ l* T4 O4 W, Q; j+ C
答:不會。( V; |( y# V2 c+ f" z: Z
(譯者註:補充材料已成為歷史。請閱讀補充材料轉為主流一文)。2 B2 ]" b Q9 L* l' y
5 J4 u+ [8 u5 @) D% S# i
問:在補充性結果中有我的一些網頁,但這些網頁已經很老舊了。我該怎麼辦?; T' {- @0 E3 d1 ^% u( A$ \+ r
答:如果換了我,就不會在這方面花太多的精力。如果網頁已經刪除,我會確保有一個 301 重新定向,指向新網頁的位置。如果的確徹底消失了,我會確保服務器返回一個關於這些網頁的 404 錯誤信息。此後,我不會再花費任何精力。當google最終重新抓取那些網頁時,就會發現其中的變化。但是由於我們自己爬取補充性結果的時間間隔要長一些,所以你可能在一段時間內看不到更新 |
|