过期域名预定抢注

 找回密碼
 免费注册

SEO:Google網站管理員工具的抓取錯誤解決方法

  [複製鏈接]
發表於 2012-6-1 10:52:18 | 顯示全部樓層 |閱讀模式
「抓取錯誤」是 Google網站管理員工具(Webmaster Tools)中最受歡迎的工具之一。它可以幫助你檢查錯誤的鏈接,不僅僅是URL鏈接,還包行DNS解析失敗、服務器鏈接、robots.txt 文件等問題,幾乎所有網站都會出現抓取錯誤。
: p; H! A9 p1 H, N. s' P8 F+ c6 d0 v6 i/ d/ w2 w$ B7 w4 Y. r
  網站站長工具將錯誤分為兩類:網站錯誤(site errors)和鏈接地址錯誤(URL errors)。如果在一個網站上出現多個抓取錯誤,那麼你的網站信任度會下降,甚至會影響到排名,當然這工具對於百度優化同樣有效。那麼應當如何解決Google網站管理員工具的抓取錯誤呢。
. R! {+ H/ S( r, C* H3 K% E" R* o6 n9 g. y% w" ~# b
通過Googlebot抓取的錯誤分類就看知道是什麼導致抓取錯誤的原因了。
% o: k: _) v& Q& }8 L# k  b
% N: \: I; P0 @& e) o# V  一、HTTP的錯誤% R7 M/ s1 `7 o0 q% s# Z/ Y
1 M# j% g/ z2 Y6 {
  當一個網站上的網頁(例如,當用戶在瀏覽器中訪問您的網頁或Googlebot抓取頁面時)到您的服務器發出請求,服務器返回HTTP狀態碼響應請求。
7 n! b2 ^, I( T$ P" r+ E) ~: w" P: O- }& t( S' `$ G$ u) p. x
  如果出現403狀態,可以不用理睬,這表明是你的主機阻止了Googlebot抓取。對於所有HTTP狀態碼的列表文件,可以參考Google HTTP狀態碼幫助頁面。
" ~+ l  T4 m0 m; F: @
# U& L8 }& a& ~# y1 Y  二、Sitemap中的錯誤
3 n- Q) P; |: A, x" z: \/ h6 ~3 S$ {7 J8 Q( i
  Sitemap錯誤往往會造成404錯誤頁面,或在當前地圖返回一個404錯誤頁面,如果出現404錯誤頁面請檢查Sitemap中所有的鏈接,
4 w! x4 p3 Y% u' ~) g2 V# D* r* K: i: x9 Y
  Google會不斷抓取你已經刪除的Sitemap,這點很鬱悶,但也有辦法解決:確保舊的Sitemap已經在管理員工具中被刪除。如果不想被抓取,確保舊Sitemap出現404或者重新定向到新的Sitemap。9 x% o3 T4 O8 u  }! G, ^2 F" ]

% ]0 T. h9 \  n. U  i( G: e# q' D9 d  來自Google員工Susan Moskwa解釋道:
. k- ^) J0 E, C
$ u3 u' S# V8 U$ R  阻止Googlebot的爬行,最好的辦法是使這些網址(例如舊的sitemaps)出現404,當我們看到一個URL多次出現404後,Googlebot會停止爬行。6 @9 h$ N+ r5 x& B6 v2 h/ D" q" }' ]

2 ^# H& f: y- D' v6 p% l  三、重定向錯誤: l, D* c( f: F0 q3 A) L6 w
) o! l2 b( Z1 w9 E" o, ]: L# p
  有些錯誤是因為301從定向引起的,執行重定向後要注意什麼:
7 F1 `1 d  Q4 L6 U, |) r9 b( G9 y( l: B! V! z& r
  1:確保他們返回到正確的HTTP狀態碼。7 @( ]- E  g) V8 ~7 z2 ]  @

! a. L+ l+ O% ], x) Z. i  2:確保沒有任何循環重定向。: k! W' D; f% K- Z1 Z" i
6 }: J) l# d1 l
  3:確保重定向指向有效的網頁,而不是404頁,或其他錯誤頁,如503(服務器錯誤)或403(禁止抓取)
8 B! \# r+ {& T. D4 P8 ]
8 ^; ^+ t- M+ m$ H! l  4:確保重定向不是指向一個空頁面。0 i5 U, H- I4 i( s$ n$ R
2 F) y+ T' p, l: ~* C
  四、404錯誤7 G; b: C; j( V% ]9 B& K- _: U" H

1 u; h0 l$ T" r  A1 c  404錯誤可能會出現在以下幾個方面:
' e7 n7 {# G6 U  q% m% M: x6 Z
# r. N/ z* y: R" L% b2 W+ G  1:刪除了網站上的網頁;9 p* j. }* q+ z  Y

8 s; X8 t! [4 a4 B* q! n5 P* X* ?  2:改變了網頁的名稱;  K; u9 R, B& G2 n6 r* b" w3 e$ z, X

' Z$ O2 y: x+ x: L5 Q" g# b  4:鏈接到了一個不存在的頁面;& ~4 |% [8 a) J2 E: q6 q4 B. ?

+ O7 c3 d9 |: w+ G: F/ W  5:其他網站鏈接到你網站上一個不存在的頁面;% p6 ^7 v$ C$ e" _5 K4 l
% n6 M0 Z$ |9 R* o
  6:網站遷移到一個新的域名不完全匹配的網站。
# ^& m) W) d) U# k
+ q% X8 m6 N! `+ q9 h$ g) q  五、受robots.txt限制
1 F9 }4 q9 ]) |9 T% m! `. N! u% ^. R4 P; I* N- S
  還有一個原因是robots.txt文件阻止了Googlebot的抓取,如果出現大量抓取錯誤,第一步應該檢查robots.txt% V# Q) v1 w/ F7 R8 C3 n

7 d3 G# W) t+ ?) |6 I+ ^( U$ l6 U  六、軟404錯誤
) s& e3 R: F9 `" z6 I2 @
9 X: A- H- L5 H% d3 x2 Q; Y通常情況下,當有人請求的頁面不存在,服務器將返回一個404(未找到)錯誤。除了在響應請求的頁面不存在返回404代碼,服務器也將顯示一個404頁。 這可能是一個標準的「未找到文件」的消息,或旨在提供更多信息的用戶,它可能是一個自定義頁面。 頁的內容是由服務器返回的HTTP響應完全無關。僅僅因為一個頁面顯示404文件未找到消息並不意味著它是一個404頁。4 e) k$ B' \" j# }
6 x7 x3 o. a! }1 @/ }/ a) W9 ^) ^
七、超時* b) P. {% C$ `. w1 I$ t' `8 K. d

1 Y" d2 \7 K' _) S2 F+ N  網站超時也是出現抓取錯誤的原因之一,如果出現超時現象,Googlebot會停止抓取。超時的錯誤類型有:
2 E4 T, H9 ?* I! s6 j
7 ]- ^7 I, N  n; X  O( {  1:DNS超時,可以使用Nslookup 命令檢測DNS,出現DNS超時最大的因素是域名服務商的DNS服務器不穩定。& r1 Z, p! o7 R; e5 P3 L$ y9 B. E9 Z
5 f2 \0 J# \  Y! J* m
  2:網址超時,在某一個特定頁面,而不是整個域的錯誤。9 l5 P9 P5 y) r0 F4 f$ e: w& m) n
" [$ N1 i% W3 }" i6 ], x
  3:robots.txt超時,如果你網站有robots.txt,但服務器超時,Googlebot會假定該文件不存在。0 s2 [$ s$ R; z) v; \
. F* D' D: k$ e+ |% A% n
  4:動態網頁的響應時間過長而造成網頁載入時間過長。
 樓主| 發表於 2012-6-1 10:52:43 | 顯示全部樓層
在網站上看到的,感覺很好,很有用,跟大家分享一下。
回復 给力 爆菊

使用道具 舉報

發表於 2012-6-2 22:50:47 | 顯示全部樓層
謝謝版主 ,頂一下,支持,8 i, w0 Y9 q$ d- W4 F3 G. ^
http://www.i2source.com
回復 给力 爆菊

使用道具 舉報

發表於 2012-6-6 13:53:11 | 顯示全部樓層
Google網站管理員工具確實挺管用的
回復 给力 爆菊

使用道具 舉報

發表於 2012-6-6 14:32:35 | 顯示全部樓層
很好用的工具
回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

點基跨境 數位編輯創業論壇

GMT+8, 2025-5-6 00:52

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表