Google--PageRank(網頁級別)技術解密(二)
! i7 |* i/ ?5 b( O p; n7. 非PageRank因素闕值) O$ q# `4 T) @6 s/ `4 S$ L5 q
8. 使用闕值推知兩種排名策略的價值/ G( W- q/ f7 Z) \
9. PageRank的計算
/ U) ], Y3 c* A* m8 ?/ v" d# v七:非PageRank因子的上限闕值(Non-PageRank Factor Threshold)$ F2 q+ d& F ^" B# D
除了PageRank外,其它排名因子都存在一個闕值,也叫臨界值或差值。即當增長到一定值時,因子的重要性反而開始慢慢降低,則該值就是非PageRank因子的闕值。 / u! ?( R, m$ w
5 ?; F0 w% C' [+ R+ Q: ~3 p. ` 設闕值為1,000,如果網頁A和B是我們對某一查詢條件的其中兩個查詢結果,且A的總分數(包括頁面因子得分和PageRank得分)是900,B是500,則顯然A會排在B的前面。但由於A和B的分數均低於我們上面假設的非PageRank因子闕值,因而在不改變PageRank的情況下,我們可以通過對B頁進行精心的頁面優化使頁面因子分數得到提高來使其排名超過A。但如果A的總得分升至1,100分,則B若還只是一味優化頁面因子是遠遠不夠的。在這種情況下,提升PageRank就成為首要任務了。 0 U9 y8 S0 K& X6 B B6 H
# I8 k( v8 K2 w g+ A. N
一般說來,Google的查詢結果頁中既可能包含一些分數超過闕值的網頁,也可能包含一些分數低於闕值的網頁。所以:
- T8 B) g& m4 x. e3 Z+ ^% }6 U" W' n* Z+ p
為了提高競爭能力,必須在闕值範圍內盡可能提高頁面的搜索引擎排名得分,否則會降低頁面的競爭力。「頁面因子」是接近和達到闕值最迅捷的方式,它與PageRank的結合使用才是提升網站排名得分的最佳優化策略。; ^ e! s2 }0 f3 U" Z, i7 _ }
8 X) V! y P9 a2 k' N& G/ [' X& n
八:使用闕值推知兩種排名策略的價值. Z: x) {; \& H0 s
闕值解釋了搜索引擎商所遵循的原則和不同的實施途徑,同時亦闡述了為什麼會產生關於PageRank的一些誤解。我們可以把這兩種策略當成兩個人A和B。
* a s4 g- [ h# b! I, N
8 G2 L4 z- {" d0 D A認為「PageRank」並不重要。他們已有數年網頁優化經驗並知道如何完美地利用「頁面因素」來達到優化的目的。他們亦理解基本的錨文本,但對PageRank得分毫不在意。結果如何呢?由於最大化地使用了「頁面因子」,從而使A迅速達到「非PageRank因子的闕值」。所以通過精心選擇關鍵詞可使他們獲得較好的網站排名。而且只要網站內容比較好,隨著時間推移總會有排名高的站點鏈接,涓涓細流匯成河。A最後亦得到了PageRank得分,並籍此鞏固了排名。
+ s( d c5 A |1 p3 R
# n" D8 h4 F5 E1 i3 p B認為「PageRank」十分重要。他掌握了很多關於提升PageRank得分的信息,並為提高該得分下足了工夫。結果又如何呢?B的做法和A相反,但A在非PageRank因子上下工夫,結果卻得到了PageRank得分。而B在PageRank因子上下工夫,結果卻得到非PageRank因子得分。究其原因,就是由於提高PageRank得分需要外部鏈接,鏈接又具有錨文本,從而通過精心挑選外部鏈接的錨文本,B自發提高了其非PageRank因子的得分,從而贏得了較高的PageRank得分。2 E3 R7 h# r9 F% z, m
6 G" n% y6 E g/ B4 o 雖然這只是兩個極端,但我們可以利用它們來推知這兩種途徑各自的優缺點:
$ K. q; E7 r' Y' ~' \, f) E3 z3 C4 f6 e. _$ H9 G# l
對像 優點 缺點 ' ^% _1 k' s9 c" |/ _
A:忽略PageRank 網站排名在短期內就可得到提升
- M, ^. V) ?8 `. Q# l3 c/ @8 i" g/ O+ F; o' l
自我生成鏈接節省了工作量/ [1 @+ P8 I0 A3 b- d
需投入大量工作維持網站排名 9 ]5 R) [! u6 P! Z
' M/ C3 Y, N3 L+ ]對新競爭者的應變速度較慢
$ U# p+ B: a6 i) V2 U3 s* U7 J) Y) ~( l2 \$ U4 e' ?" `
B:忽略頁面排名因子 可獲得可靠網站排名,並可在需要時輕鬆修改頁面因素使排名迅速提升
* ^8 Z# ^9 v& Z" ?4 o! @ q, g" h1 v( a' D/ c9 H6 X h
極可能從非搜索類引擎來源上獲得更高訪問量
+ X! n p/ @0 r# R& x, g網站排名提升較慢 : U1 N% Y8 W5 }, e" Q6 b9 t; p
# E# @: i$ ] [2 q# R/ C( B
操作難度較大& q7 S- p0 S- x9 s/ j: ~3 p
: R8 F) Q1 X/ q/ \! Q* x容易為SPAM過濾程序所制
# H0 S- z0 h8 M( m, g! u
X7 R& r# D) d, s2 E) l) d/ |+ U5 g( |! L8 ~
0 l9 r1 V$ j: F) c5 N對像 優點 缺點 6 a8 N8 U3 G/ }$ p$ r
A:忽略PageRank 網站排名在短期內就可得到提升 8 G( @4 v, B& B! l) h# p$ a
/ {! `9 f k i0 G* _# l; s
自我生成鏈接節省了工作量
2 U4 j7 i( I. x/ B/ L# a" h7 `( V7 \需投入大量工作維持網站排名 7 ~1 l- s* `8 H8 g. P/ K' J
& n9 d9 L( Y3 _- F- ]2 Z$ w) l對新競爭者的應變速度較慢
% `4 Q3 I `$ l; B- y$ L
" y% i' x h9 y- wB:忽略頁面排名因子 可獲得可靠網站排名,並可在需要時輕鬆修改頁面因素使排名迅速提升
x9 H% T; }0 Q7 t, ]! A' w7 v& n9 A( m$ [0 ~. C# H: z" N
極可能從非搜索類引擎來源上獲得更高訪問量
3 w R; c. k9 N2 \. J% ~網站排名提升較慢
9 N) f' c- O& W Y+ K+ k1 y. o2 r/ M+ E, ]5 j+ V8 {3 @
操作難度較大 6 E. q5 S5 W& Q" h. j
9 x' ?1 ^: |9 i5 w3 Q容易為SPAM過濾程序所制6 f! T* F d3 J+ u. c( |# e
* \* i5 m! X& V0 ^/ F& C9 J6 r
7 o) i: u* f5 T
事實上,我們前面說過,最終排名得分=所有非PageRank因子實際得分x實際PageRank得分。亦即二者相輔相成,再加上隨著網上營銷方式的發展壯大,關鍵詞的競爭也變的愈來愈激烈,這種情況下只靠非PageRank因子得到好排名顯然是不可能的。而且非PageRank因子存在著闕值的局限性。同時,對於競爭性極高的關鍵詞,還存在著PageRank下限的問題。也就是說,除非網站的PageRank得分超過這個下限標準,否則網站排名很難上去。PageRank的下限由關鍵詞的競爭度所決定。競爭性一般的關鍵詞PageRank下限也不高,而對競爭較為激烈的關鍵詞來說,它所要求的PageRank下限相應就要高。而PageRank得分的提升又非常有難,這時候非PageRank因子就變的非常重要了。 * h3 P. t7 }& f% ~/ k& Q
綜上所述:我們需要充分發揮各排名因子的優勢來贏取理想的綜合排名得分。同時關鍵詞(競爭度適宜)的精心選擇亦變的非常重要,它可以節省大量的支出。3 G, r: R( y5 {7 f
, T8 R$ `! l6 G) ?九:PageRank的計算方法1 o$ Q( ^* K" |- s: s
PageRank (A) = (1-d) + d(PageRank (T1)/C(T1) + ... + PageRank (Tn)/C(Tn))
& M+ X1 B/ C, m2 p, [ [ 其中PageRank (A)表示給定頁面A的PageRank得分; m# c: P3 U5 Q- P, C8 Z/ o
D為阻尼因子,一般設為0.85;
3 W; w. V. c* i2 {1 ? PageRank (T1)表示一個指向A頁的網站其本身的PageRank得分;
) ]0 C: N8 o; X$ O C(T1)表示該頁面所擁有的導出鏈接數量;
0 ^0 D! S6 Z/ _/ l. R( s- k$ n PageRank (Tn)/C(Tn)表示為每一個指向A頁的頁面重複相同的操作步驟。
& a4 q$ `: h, w+ [- k/ q8 L: V) H" N9 @6 I
事實上,計算某個頁面的PageRank得分需要大量繁複計算。例如若計算A頁的PageRank得分則首先要知道所有鏈至A頁的網頁(導入鏈接)的PageRank得分。要想知道這些外部鏈接頁的PageRank得分,又需要先知道這些頁面的外部鏈接的PageRank得分,等等。我們只需要知道:
4 G0 ?2 |* T% B! H: ^' F8 [* D H
A頁的外部鏈接B能夠帶給A的PageRank得分與B的導出鏈接數量成反比,即隨著B上導出鏈接數的增加,帶給A的PageRank得分亦隨之降低。這同樣表明了一個網頁的PageRank得分是該網頁對其它頁面投票的一個基本的度量形式。一個網頁可以投票給一個或多個導出鏈接,但其總投票權一定,並被平均分配給所有的導出鏈接。假設B的PageRank得分是5,且B上只有一條指向A的鏈接,那麼A將獲得B全部的PageRank得分(B沒有損失任何東西,而A贏得了B的PageRank得分)。但如果B上有N個鏈接,則A只能得到B的PageRank得分的N分之一。
8 m0 F( u. e; a5 w0 ?
3 q! v1 z' z) W. @' a7 K. d3 ~ ~9 o 我們可以用圖表來闡述其工作原理。假設有四個網頁A,B,C和D,它們相互鏈接,如表-1所示:% @5 v# x$ |2 W: J* x8 A2 B
; V1 L: e* _; S7 g# ?4 {# c: q2 o, O
表-1:鏈接前的PageRank得分; v2 C# S: r- n/ S: R. T5 N
c$ V- E {, d7 y9 a
# D& x; j7 u4 i+ I6 O Y
- ?/ b7 ?. u5 `# b# u表-2:鏈接後的PageRank得分 y& J3 i4 Q/ ^& v1 e2 m, P
: O! c5 g6 i( ^
+ [- w6 n' p3 y* s
假設這四個網頁初始PageRank得分均為0。則根據上面的公式它們的PageRank得分都是0.15。我們計算一下鏈接後各自的PageRank得分情況。! i8 H. L5 {3 ^, [ _3 O* t
1.A鏈向B、C和D。A的初始PageRank得分是0.15,所以A的導出鏈接獲得PageRank得分總數為 0.85 * 0.15 = 0.1275。B,C和D三個網頁各得0.0425分。& D+ Y/ ]5 t: ?8 v( V( t
2.B鏈向C、B的初始PageRank得分也是0.15,所以其唯一鏈接頁面C所能夠獲得的PageRank得分是0.85 * 0.15 = 0.1275分。/ i6 M. ~! n3 A! I$ i
C鏈向A,其0.1275的PageRank得分傳遞給唯一鏈接對像A。6 }2 y6 f) t. R
D鏈向C,其0.1275的PageRank得分傳遞給了C。$ b; ]$ c0 B6 G2 v
現在各網頁的PageRank得分結果如下:& A+ ^# m! z# g4 u3 K0 @) e
A:0.15 + 0.1275 (得自C) = 0.27754 ^$ a1 T) e! q2 k
B:0.15 + 0.0425 (得自A) = 0.1925% s' D# l" r, K( {
C:0.15 + 0.0425 (得自A) + 0.1275 (得自B) + 0.1275 (得自D) = 0.4475& s: \/ @# O) h7 L
D:0.15 + 0.0425 (得自A) = 0.1925(如表-2所示)
8 |- S& _9 ^& X: Q' s$ X 繼續這樣的計算,直到每個頁面的數值逼近一個定值(PageRank屬收斂函數)。最後可以發現,C的PageRank最高。而且外部鏈接的數量顯著地改變了PageRank得的分佈。
* R, k! z4 ~3 D8 M
! R4 f9 Y2 v9 \7 p: T7 ], h
) `- E6 Q3 a2 z: h D2 M表-3:最後的PageRank得分結果
% m- Z6 X* ^1 r: T% o
& T: g* H& ?: W8 _7 H) s
3 d0 {; @6 s! Z7 X0 N表-4:外部鏈接與PageRank得分對照表: |