最近研究了下WordPress的RSS採集,但是我幾乎看了所有的插件,都有各種各樣的問題。
- }) a; Y) l9 A, w+ q; T R* Y2 `5 H6 X: ]& I: e
下面我把我研究的幾個WP的RSS採集插件簡述一下:6 k% O2 t3 P6 x
% `( t9 F1 v" A: r+ n5 g
jay_smart_rss4 ]' E. B$ o$ Q# C
http://www.jaylee.cn/jay_smart_rss/
$ m4 b g% V% M; B% ?/ U; w* T這個作者2006年就不更新了,只能用於WP2.2以下的版本,當時還是很不錯的,可惜新版的WP用不起了。我曾試圖修改這個插件,但發現他寫的太亂了,改的話幾乎就是100%,還有他那個rss解析部分寫的來我都看不懂。
" _3 C/ h4 b# _) \2 r/ ]3 ?9 P$ M) h: O. u+ o# \5 Z$ J
FwArtsAutoIn [風度自動文章採集發佈插件]
# R- U$ q$ ~1 _http://www.flywud.com/wp-content/fwautoinhelp/, R1 G5 m8 U7 n9 ?+ O" |
這個使用教程很詳細,而且我發現他還比較新,幾個月前的東西。但是看他教程的常見問題,就知道要是虛擬主機,各種虛擬主機給PHP開的權限和插件不一樣,只有配置較好的,才能用的順暢。我下載試了一下,居然採集了沒反應,好像對windows主機的php主機環境沒反應,懶的去研究代碼了,而且我想到php的採集能力還是比較弱的。
' C2 b! |0 [& Z" @. n0 S/ |8 j+ C) E8 o3 h5 Q
SMART_RSS
4 b! H) p4 M9 ^/ q+ y這個插件是老外的,我都沒有下到。聽說很多虛擬主機不兼容,同樣是PHP環境要配置的相當好才行。
0 `! z& d5 r; q0 {% G: Z$ b+ R
+ c% T# R# j) a5 p. T火車頭採集
0 }4 \3 O- O; E5 q' [好像有wordpress的採集模塊,但是我不會用火車頭,也不知道採集RSS難不難。但我想新手用起來肯定不是那麼容易的。( I L% F: }( E# P4 `3 D) O8 N
3 ?$ F) @2 w5 o0 Q# @. L& h0 M: G& L4 {
0 q. s9 z# C& s" B0 @# Q" T/ C寫個軟件版的『WordPressRSS採集助手』+PHP版的採集插件: W6 k6 b% A3 F5 q9 A* V2 R2 U9 k
功能比較簡單,遠比不上火車頭,但是專一,且使用簡單,就是採集各種RSS到WordPress1 _) _) N: k# Y* c/ b$ @' C2 O
最重要是新手用起來簡單無比
& e* V+ \2 h# m& I4 n; @! ^8 F. {; {) R' e) T, P
此軟件和插件共花時間2個晚上(我晚上才工作)
9 N6 S, W2 O$ P* {" x, S" q2 \6 p2 J w
介紹下它的功能:6 b2 t5 z: t4 Y% a# m( s( e9 z; K
% \6 F( f: {3 M% r$ Z2 WWordPressRSS採集助手,負責採集RSS工作,它比PHP採集要快和強,使用多線程,不超過5個3 I# I- \3 `+ |, J+ u
WordPressRSS採集助手將採集到的數據通過橋連接的方式發送到PHP的插件頁面,由插件負責保存到數據庫的工作。
8 Q6 j* W; v/ d8 d數據直接入庫,中間不經過任何wordpress的自帶環節,就是說只要有數據庫表,沒安裝wordpress都可以採集入庫。' f" F6 d% P: H# N, t
軟件已自帶文章去重複功能,重複的文章是會自己避開的。) F- c& K/ R1 T3 l4 a/ O
# n9 L3 _! y/ d" e/ r0 }! a% _
4 ]& h; T$ Q+ G- l" o介紹它的使用方法:$ [1 Z9 c" [- f6 Q: P
+ r" B3 N; P5 d6 E z
添加一個RSS鏈接就不說了,關鍵是RSS的節點配置% `0 [. ^; t# b4 P8 R
& f& A* G8 I; r4 d
比如一個RSS文本如下3 A5 Z3 B) u8 S% W |+ A. w0 ]5 B
- - <rss version="2.0">0 `1 }: Q5 P0 C7 X
- - <channel>3 }, M+ E" l' |# F
- - <item>
- t1 P2 x: a$ D" O: T - <title>外形很唬人 "啤酒瓶"造型電話現身</title>
- _; \6 q4 M0 u& R" h' t* @1 i' S - <span>http://news.dayoo.com/photo/200810/15/54034_4282360.htm</span>
, L5 {5 u( h1 u: U - <guid>http://news.dayoo.com/photo/200810/15/54034_4282360.htm</guid> # C% p0 [. |9 Q P
- <pubDate>Wed, 15 Oct 2008 11:00:05 GMT</pubDate>
! A# W/ p) a" K$ {0 T6 G$ |$ e' E - - <description>( @, m. t/ o M
- - <![CDATA[ 內容]]> 2 w3 J9 `$ D0 ]; u. o
- </description>2 O5 a, m; q9 `0 u
- </item>0 H8 k! P/ U: E1 A8 D8 n
- </channel>
" n/ Z: Y* R+ f2 K- B - </rss>
複製代碼
7 T5 ?& [0 L' r
; W5 {; f1 x) g; h i標題路徑:就是wordpress發貼時的標題,你想想,你是不是應該把上面RSS中,路徑 rss/channel/item/title 作為標題路徑呢。
1 z0 u$ L0 I; l4 Y7 ]+ b文章內容路徑:就是wordpress發貼時的標題對應的內容,路徑應該是 rss/channel/item/description
7 A0 ]$ O2 }0 R g. k3 N4 y( i% v( g: u
這裡不要想複雜了,其實異常的簡單,就是標籤的絕對路徑,只要你找準了,就能正確解析RSS。3 q/ |' a: ^* A/ w+ p# ?# \
" b5 x7 S/ g. L% |" _" f2 A6 H8 f
這裡可比火車頭的採集規則簡單得多。
! X, j8 d" j5 L ?- U. W @ k5 o* P8 \7 X7 r% J6 y7 c
Q4 t1 n% u& D/ B" N
# \: d# M. v+ |' ?+ m2 T) @0 j
* Y2 l! ^! } x% v( @' ?其他也沒有好說的了,要注意的是,採集的時候,一個鏈接採集了一次要隔一段時間再去採集,太頻繁了會被封一會。3 r b% c: k) G6 h
( X; ~$ P" A5 ]2 W! H) \; d
8 J/ N, _% c* G7 B% d
說下為什麼沒有做全自動的每天自動採集:6 w; s% ]) T+ P: o
1.因為我本人不提倡和不喜歡採集
, @0 p$ [1 P; B2.RSS更新很慢,每天手工點一下,這樣也有助於你收錄,因為搜索引擎不喜歡大量的搜錄,如果你每天或隔幾天才多出少許的新文章,這樣的站搜索引擎才不會認為你再採集。 v0 a% T9 b p
3.這個軟件第一版我看下反響,再考慮以後的版本功能,要是反應不好我就不做了。! `# \$ W( l ^5 I) `5 \# U$ T; p3 d s
4.假如有超強的全功能版本,我會收取少量費用,第一版就免費了,功能還是蠻不錯的。6 g# u* P0 m6 O$ L, O% d4 \( Y
6 ]+ f; ~! o+ K! ~# U4 F
8 C" F" ] Q; f' L0 z7 Q; u軟件的安裝:+ S4 L& e! c# I( z% D
0 b) N, y! o N* a5 J- N1.上傳 月光RSS採集插件 hyrinlight_gather_rss.php 到你的wordpress插件目錄1 s6 l8 [# r$ e) U
9 p! B: n* a8 {. ]+ _$ q2.打開助手,添加插件準確位置,保存。* A; K3 w( ^( g# ?
5 W- f" S$ x* X0 x* Q" n* n3.添加新的RSS鏈接,並設置採集節點。) |8 Q% k. L* F! Q# J' t
' l# x; w: }# y0 @+ ?7 B
4.開始採集並檢查結果。! e$ D; P4 ~0 C' w8 e1 I
- p5 k4 ] h& L! ~5 [# O6 _ c b8 q1 o }6 i# [$ d
2 W2 ?# |4 Q1 D C& \' u/ }) L$ o
. A# l, ^- l. S& Y9 W/ _
, q4 U' J0 H' C. T A8 C1 G最後附截圖 |
評分
-
查看全部評分
|