Google--PageRank(網頁級別)技術解密(二)
% V0 ?2 h+ l. p3 _: H0 o7. 非PageRank因素闕值
/ \ y1 ], m% Q2 e2 a7 N8. 使用闕值推知兩種排名策略的價值
8 z0 t2 p8 F5 n1 m+ E) V9. PageRank的計算 2 m/ i4 ~. x# s( R
七:非PageRank因子的上限闕值(Non-PageRank Factor Threshold)$ `4 D; n5 a$ ^% O
除了PageRank外,其它排名因子都存在一個闕值,也叫臨界值或差值。即當增長到一定值時,因子的重要性反而開始慢慢降低,則該值就是非PageRank因子的闕值。
, s' S- D: T: @! @ B- Z3 T3 x I
設闕值為1,000,如果網頁A和B是我們對某一查詢條件的其中兩個查詢結果,且A的總分數(包括頁面因子得分和PageRank得分)是900,B是500,則顯然A會排在B的前面。但由於A和B的分數均低於我們上面假設的非PageRank因子闕值,因而在不改變PageRank的情況下,我們可以通過對B頁進行精心的頁面優化使頁面因子分數得到提高來使其排名超過A。但如果A的總得分升至1,100分,則B若還只是一味優化頁面因子是遠遠不夠的。在這種情況下,提升PageRank就成為首要任務了。 1 I1 e2 x) [5 ?: H' A4 ^9 n$ F
- P2 \7 ~/ u. ~4 ?- t- e1 ]
一般說來,Google的查詢結果頁中既可能包含一些分數超過闕值的網頁,也可能包含一些分數低於闕值的網頁。所以:
r* [0 ]( w% k
4 {; q8 F7 p2 _, o5 t' f 為了提高競爭能力,必須在闕值範圍內盡可能提高頁面的搜索引擎排名得分,否則會降低頁面的競爭力。「頁面因子」是接近和達到闕值最迅捷的方式,它與PageRank的結合使用才是提升網站排名得分的最佳優化策略。8 C' y! h ]% H- C" x- N. \
1 D! c; d1 g0 c4 k& p4 q八:使用闕值推知兩種排名策略的價值- y3 e# ~8 c' W
闕值解釋了搜索引擎商所遵循的原則和不同的實施途徑,同時亦闡述了為什麼會產生關於PageRank的一些誤解。我們可以把這兩種策略當成兩個人A和B。' D9 p3 u* L9 Q+ ?: K# v
2 v% F% F! x$ G5 F" \4 r ` A認為「PageRank」並不重要。他們已有數年網頁優化經驗並知道如何完美地利用「頁面因素」來達到優化的目的。他們亦理解基本的錨文本,但對PageRank得分毫不在意。結果如何呢?由於最大化地使用了「頁面因子」,從而使A迅速達到「非PageRank因子的闕值」。所以通過精心選擇關鍵詞可使他們獲得較好的網站排名。而且只要網站內容比較好,隨著時間推移總會有排名高的站點鏈接,涓涓細流匯成河。A最後亦得到了PageRank得分,並籍此鞏固了排名。. x- b2 y4 o8 {- I
+ {1 N6 m7 ~. {# c9 U; Z7 e: P& v B認為「PageRank」十分重要。他掌握了很多關於提升PageRank得分的信息,並為提高該得分下足了工夫。結果又如何呢?B的做法和A相反,但A在非PageRank因子上下工夫,結果卻得到了PageRank得分。而B在PageRank因子上下工夫,結果卻得到非PageRank因子得分。究其原因,就是由於提高PageRank得分需要外部鏈接,鏈接又具有錨文本,從而通過精心挑選外部鏈接的錨文本,B自發提高了其非PageRank因子的得分,從而贏得了較高的PageRank得分。' d- `7 n! b/ F' h& z n& x- O
- @" d6 M1 e! z: K& `' U
雖然這只是兩個極端,但我們可以利用它們來推知這兩種途徑各自的優缺點:5 W- n! p+ I0 x6 @) Q, `
0 G. p/ h( G9 P, }
對像 優點 缺點 % U) i* m# x, e* Z
A:忽略PageRank 網站排名在短期內就可得到提升
0 P) H% ^3 R! ]5 c2 q. V3 m7 k: S! |: t( I
自我生成鏈接節省了工作量
3 X, ~/ ]' g5 x; Z7 ?需投入大量工作維持網站排名 ( e6 H, J. h) N5 Q# F
( K1 c9 m+ t" G B* }! m
對新競爭者的應變速度較慢) E$ B2 ~% ]! o' ~5 \7 H
+ Z9 F [ V. K% z2 ^' V! l' Q4 E
B:忽略頁面排名因子 可獲得可靠網站排名,並可在需要時輕鬆修改頁面因素使排名迅速提升 % a K0 g- c7 t
/ N" j9 I6 l4 Y& z, d
極可能從非搜索類引擎來源上獲得更高訪問量 3 M+ C* |# a, V) |, o
網站排名提升較慢 & c4 e! n; O( _# W9 J. f: ]- M' ]
+ Y. o( B. ^8 z) {1 w7 I
操作難度較大
3 _5 c0 G/ I5 D3 p. ?
9 @% o: c3 v+ A7 B. O$ F0 W) D容易為SPAM過濾程序所制! b4 G, X, A4 h$ b
0 W( O) \2 i ^/ C$ I2 |
5 W& ^6 u9 m8 u+ @+ X
1 M1 }: F$ W% n7 e
對像 優點 缺點 # Z- X, `; o* p6 Y, m& V* _ K
A:忽略PageRank 網站排名在短期內就可得到提升 ! X% C4 Y9 m0 _/ `/ o
6 V: f8 s4 D( @' B, j. k5 x
自我生成鏈接節省了工作量
- t# Z9 J u) g" M$ y" c9 x5 M( N需投入大量工作維持網站排名 9 O8 t4 M7 ?/ V/ v6 Z2 ?, E
1 k/ S) R. ~3 y" J
對新競爭者的應變速度較慢/ s4 G0 U8 D; N0 g+ R1 b o
" `1 S2 s" Q S! k& r% ^4 cB:忽略頁面排名因子 可獲得可靠網站排名,並可在需要時輕鬆修改頁面因素使排名迅速提升
2 ]! r' N) j# v: |9 `- {! w5 H9 P; F+ O% T6 g7 f
極可能從非搜索類引擎來源上獲得更高訪問量
; C2 Y5 \' w* r1 q: m網站排名提升較慢
" r# i2 g4 S |: ]; a! r
. C8 z+ K& P; x$ S) {* j操作難度較大 J0 B, Z0 Y' ^4 M* f5 @; N* @, R& O
6 ?$ J- R" Y# `! C/ L1 V- O容易為SPAM過濾程序所制0 G! U' v% A( O- w1 W7 [
4 N6 `( Z# z: P- x
+ J5 @- {! w+ l9 @) ^
事實上,我們前面說過,最終排名得分=所有非PageRank因子實際得分x實際PageRank得分。亦即二者相輔相成,再加上隨著網上營銷方式的發展壯大,關鍵詞的競爭也變的愈來愈激烈,這種情況下只靠非PageRank因子得到好排名顯然是不可能的。而且非PageRank因子存在著闕值的局限性。同時,對於競爭性極高的關鍵詞,還存在著PageRank下限的問題。也就是說,除非網站的PageRank得分超過這個下限標準,否則網站排名很難上去。PageRank的下限由關鍵詞的競爭度所決定。競爭性一般的關鍵詞PageRank下限也不高,而對競爭較為激烈的關鍵詞來說,它所要求的PageRank下限相應就要高。而PageRank得分的提升又非常有難,這時候非PageRank因子就變的非常重要了。 - ]# l P; K# @ m, F
綜上所述:我們需要充分發揮各排名因子的優勢來贏取理想的綜合排名得分。同時關鍵詞(競爭度適宜)的精心選擇亦變的非常重要,它可以節省大量的支出。
9 g+ Y5 s2 I7 F6 v2 O, D+ R# i z1 _: I1 ~+ o1 i! X! z3 G
九:PageRank的計算方法2 b; K/ x. A! b) ~. W0 f
PageRank (A) = (1-d) + d(PageRank (T1)/C(T1) + ... + PageRank (Tn)/C(Tn))
# n9 A2 {1 a) n9 u) J1 o+ B2 q3 H 其中PageRank (A)表示給定頁面A的PageRank得分; : J; R$ d, d6 H! j: y) G* E) {; |
D為阻尼因子,一般設為0.85;" y) j) y; p% L. T1 |3 C% q6 Z
PageRank (T1)表示一個指向A頁的網站其本身的PageRank得分;0 U$ {# _4 a3 R% e
C(T1)表示該頁面所擁有的導出鏈接數量;
6 T k/ \( r" d2 F PageRank (Tn)/C(Tn)表示為每一個指向A頁的頁面重複相同的操作步驟。; S' Y& }3 C- h" t0 r0 U; {
" X; ^" |# Z6 _4 E( N 事實上,計算某個頁面的PageRank得分需要大量繁複計算。例如若計算A頁的PageRank得分則首先要知道所有鏈至A頁的網頁(導入鏈接)的PageRank得分。要想知道這些外部鏈接頁的PageRank得分,又需要先知道這些頁面的外部鏈接的PageRank得分,等等。我們只需要知道:# U7 X' M0 L$ t) M# p! }* S! k# u
7 ?# L. L* ]9 p A頁的外部鏈接B能夠帶給A的PageRank得分與B的導出鏈接數量成反比,即隨著B上導出鏈接數的增加,帶給A的PageRank得分亦隨之降低。這同樣表明了一個網頁的PageRank得分是該網頁對其它頁面投票的一個基本的度量形式。一個網頁可以投票給一個或多個導出鏈接,但其總投票權一定,並被平均分配給所有的導出鏈接。假設B的PageRank得分是5,且B上只有一條指向A的鏈接,那麼A將獲得B全部的PageRank得分(B沒有損失任何東西,而A贏得了B的PageRank得分)。但如果B上有N個鏈接,則A只能得到B的PageRank得分的N分之一。0 P3 R9 A" l% s- V2 ^
: N6 C9 @0 x, Y% l& ?
我們可以用圖表來闡述其工作原理。假設有四個網頁A,B,C和D,它們相互鏈接,如表-1所示:& ?6 b8 ^3 y. C y2 @6 }2 O/ R% G
( m# D' ^6 X2 F- }
0 C8 T$ o, {1 O表-1:鏈接前的PageRank得分
8 K3 [3 y5 _* p9 c( I% l* ?
+ z* F* z5 ] N9 k
: N& D' |8 c/ m d/ j+ o8 C% k c8 m1 N2 b5 P, n* d
表-2:鏈接後的PageRank得分
8 z& R; ^$ w1 _/ S$ |, j# a" q% d9 i+ Y
( j& k; c6 M3 ^
假設這四個網頁初始PageRank得分均為0。則根據上面的公式它們的PageRank得分都是0.15。我們計算一下鏈接後各自的PageRank得分情況。# D$ V( l! M) ]% ^9 Q$ y4 D( k
1.A鏈向B、C和D。A的初始PageRank得分是0.15,所以A的導出鏈接獲得PageRank得分總數為 0.85 * 0.15 = 0.1275。B,C和D三個網頁各得0.0425分。5 G: R4 g- _- K0 B5 _6 S) E! q
2.B鏈向C、B的初始PageRank得分也是0.15,所以其唯一鏈接頁面C所能夠獲得的PageRank得分是0.85 * 0.15 = 0.1275分。3 {/ @7 f. H5 T3 F+ s7 L
C鏈向A,其0.1275的PageRank得分傳遞給唯一鏈接對像A。: [( V' B. M1 I5 y
D鏈向C,其0.1275的PageRank得分傳遞給了C。
. {. Y; z3 M ]& B. I1 e 現在各網頁的PageRank得分結果如下:
7 y- p0 _' h3 _3 z- R t A:0.15 + 0.1275 (得自C) = 0.2775
; N q7 {9 l) {+ o5 l' k B:0.15 + 0.0425 (得自A) = 0.19253 h2 F9 B( E* ? }: N; `$ q# M/ m
C:0.15 + 0.0425 (得自A) + 0.1275 (得自B) + 0.1275 (得自D) = 0.44752 ^$ F" o: D) u. J. g( @
D:0.15 + 0.0425 (得自A) = 0.1925(如表-2所示)
" q! a* ?1 F9 n/ ^. Z9 P! ` 繼續這樣的計算,直到每個頁面的數值逼近一個定值(PageRank屬收斂函數)。最後可以發現,C的PageRank最高。而且外部鏈接的數量顯著地改變了PageRank得的分佈。( E% Q+ c7 a& L* d
/ }' V, w. L2 B8 R7 M
' ]" `, Y( B3 u% H* [! P- q# F! l: G表-3:最後的PageRank得分結果1 x$ b6 a. z5 }$ d! h h
' H l* k) S; o3 S' g& V
' }4 o. h$ y8 x" X3 o- v$ z表-4:外部鏈接與PageRank得分對照表: |