剛才看了下你說的這個關鍵詞挖掘工具網頁版的,結論如下
7 l1 B+ u' `3 g3 O+ R0 w R( O3 n" }* d9 L
比如『美國』這個詞
# o1 S: m% j1 k
0 e2 V- `& h* Y1 e9 O1.他的關鍵詞來自於這幾個地址5 w; {* b4 d6 Q/ ~( ^/ ^
百度主搜索* f; R- ]# g; `) W# z8 l
http://www.baidu.com/s?wd=%E7%BE ... -8&usm=3&rsv_page=1
; p1 T$ P2 g. g" {; V; U% F7 [百度視頻搜索" S) |7 s3 L* e$ x n
http://video.baidu.com/v?word=%C ... =0&db=0&s=0&fbl=800
; [- W+ t: L4 _$ M) M. t8 a7 E百度圖片搜索
& M! E; g& c5 e2 |% t0 l9 Ehttp://image.baidu.com/i?tn=baid ... 2&word=%C3%C0%B9%FA0 E1 K9 s/ U8 F6 [2 P- w9 |
百度盜版文庫
7 Z2 A- f0 k' Nhttp://wenku.baidu.com/search?wo ... &ie=utf-8&lm=0&od=0+ ~) y J) s, G* J# n1 Q& |% n
: u; x7 [& M. p. Z* m/ U
所謂相關詞就是上面幾個地址最下面的詞了3 d. m! C. A; e8 X% O$ s5 r
6 o7 C2 k! H/ L6 X$ ^+ Y下面是製作方法
7 `+ G8 D, w/ s2 L. a8 Y7 I. C' Z8 n, _+ u
怎麼做成網頁工具,這些詞需要提前保存不?答案是,不需要,因為你沒有百度那麼強大的容量和服務器,你也做不到,其實只需要1台性能好的服務器就可以了,這台服務器要在國內,最好離北京很近,因為百度服務器在那裡,這樣採集速度飛快。$ w9 B& ?$ W( K# h
' I$ m: w! N: D# H: e+ G下面就是重點了 j3 l: r, H) z
6 D4 V l1 H. q
無論遊客還是註冊會員,挖掘出來的關鍵詞,都是一頁一頁的(愛戰),必須要翻頁
~; O0 b, f3 c- s; }0 M9 d- A0 ~就這個翻頁功能,用戶看第1頁的時候,自己的服務器採集百度以上幾個地址第一頁的詞,自己解析出來,然後顯示給客戶看,用戶看第2頁的時候,自己的服務器採集百度以上幾個地址的第2頁,解析出啦,然後顯示,以此類推。: Y4 i% `8 O5 f
* H# E6 R; X+ ?- J- o5 C; F
重複問題
8 H6 }+ J; s$ x- O( @為了解決重複問題,可以採集了美國這詞後,然後跟蹤一個相關詞的比如『美國大片』,通過這個詞繼續採集相關詞,只要帶美國就行。/ B7 A" e& K: `) r
1 K1 Y5 d& s) }& _0 s: u下面是發揮 h4 [2 t* X+ n2 `
為了不讓用戶察覺是在採集百度相應頁面的詞,特別是第1頁,可以在用戶看第1頁的時候,去採集非第1頁的頁面,隨機的一個數字頁面就可以了,這樣就打亂隨順了。2 J$ C, L/ M% B3 {' ^( Z
8 j& v; S: c/ ^8 T& \* C% n
; C( M; R1 {' n& K至於採集鏈接URL中,美國這個詞會轉化為%C3%C0%B9%FA,這個的話,在php裡面使用函數urlencode就可以做到,其他語言的話,自己去瞭解。 |