最近研究了下WordPress的RSS採集,但是我幾乎看了所有的插件,都有各種各樣的問題。( c0 K* h* ~( L/ {* e( N6 N
# t0 N/ a. M1 F1 l( T. ^: v下面我把我研究的幾個WP的RSS採集插件簡述一下: F7 N7 k5 x* F. w: s: c
8 ^0 o4 f7 Q& i1 X
jay_smart_rss
# V( ?7 t, g! y" s( Y- _http://www.jaylee.cn/jay_smart_rss/2 t- `) ]& C2 ^$ u( ]
這個作者2006年就不更新了,只能用於WP2.2以下的版本,當時還是很不錯的,可惜新版的WP用不起了。我曾試圖修改這個插件,但發現他寫的太亂了,改的話幾乎就是100%,還有他那個rss解析部分寫的來我都看不懂。
4 g# w/ S3 Q4 e0 b X9 V3 Z2 C" F" _/ v; Z
FwArtsAutoIn [風度自動文章採集發佈插件]
3 }9 A3 b0 t9 n1 c* k4 V' R& Ahttp://www.flywud.com/wp-content/fwautoinhelp/
3 Y. ~7 | |- o9 N這個使用教程很詳細,而且我發現他還比較新,幾個月前的東西。但是看他教程的常見問題,就知道要是虛擬主機,各種虛擬主機給PHP開的權限和插件不一樣,只有配置較好的,才能用的順暢。我下載試了一下,居然採集了沒反應,好像對windows主機的php主機環境沒反應,懶的去研究代碼了,而且我想到php的採集能力還是比較弱的。
. T. `, e" ?. |1 {9 F/ K- K
) c9 E2 ?, h' v- pSMART_RSS
i2 e" B6 g9 g% n; e4 Z+ u這個插件是老外的,我都沒有下到。聽說很多虛擬主機不兼容,同樣是PHP環境要配置的相當好才行。) I3 t3 |7 H+ t) z
. J3 I2 h: K1 b火車頭採集) N% `7 n: M# G$ E
好像有wordpress的採集模塊,但是我不會用火車頭,也不知道採集RSS難不難。但我想新手用起來肯定不是那麼容易的。
: ]! T, c1 M- @5 J# B; V, n( }. u- o
6 d6 \2 @0 e; D6 m* g0 M
' }4 b' z( h- e6 G
寫個軟件版的『WordPressRSS採集助手』+PHP版的採集插件# x2 n( ?! W0 Y$ U0 \. N+ G
功能比較簡單,遠比不上火車頭,但是專一,且使用簡單,就是採集各種RSS到WordPress
$ m3 M) S# c3 K' y$ v4 }" z最重要是新手用起來簡單無比
( b2 o; r# ` ]" X
$ u+ A* s; X# \ Y此軟件和插件共花時間2個晚上(我晚上才工作)
! F1 T0 M, J0 J- |7 j! a
: e4 J5 Q g% C P1 F! c. `7 Y# @6 ~介紹下它的功能:( z5 g7 y3 \; p9 t2 S% G( z! |
* `, Q/ ^- q9 Z7 t. X" u: ^WordPressRSS採集助手,負責採集RSS工作,它比PHP採集要快和強,使用多線程,不超過5個
& A: x5 U: h2 f: T5 X- [0 HWordPressRSS採集助手將採集到的數據通過橋連接的方式發送到PHP的插件頁面,由插件負責保存到數據庫的工作。' g2 A9 [4 Q1 e. z: [5 ]3 H
數據直接入庫,中間不經過任何wordpress的自帶環節,就是說只要有數據庫表,沒安裝wordpress都可以採集入庫。
! ` ^ T* R+ m7 a: Q/ A) u軟件已自帶文章去重複功能,重複的文章是會自己避開的。
' s7 Y7 `" M" V% q
$ {, w+ g4 G# t) {3 a5 Z/ U% x2 D. l, y# i% t1 Z
介紹它的使用方法:; ?8 m1 h* U3 G& h v" D
8 X; @" @! C- K9 L+ o e7 x8 U u
添加一個RSS鏈接就不說了,關鍵是RSS的節點配置8 @! o2 E. a, e' z. j8 R
6 |' V$ Y8 _, @" s2 x4 j, E; e比如一個RSS文本如下
Y* O! D* i) F" m+ U) ~- f- c, ]- - <rss version="2.0">
9 z' r5 o$ [8 V5 ^9 q0 } - - <channel>; k+ l) ]0 y1 j+ f3 Y
- - <item>
, `) \1 g9 t" d0 W" v - <title>外形很唬人 "啤酒瓶"造型電話現身</title> ; ?, }8 `# p- [3 n3 ?- R' ]
- <span>http://news.dayoo.com/photo/200810/15/54034_4282360.htm</span>
0 p) m) W! p0 l( u! E. u7 ] - <guid>http://news.dayoo.com/photo/200810/15/54034_4282360.htm</guid>
1 \: [5 I9 r& f9 i% N$ p* Y4 a5 O - <pubDate>Wed, 15 Oct 2008 11:00:05 GMT</pubDate>
0 o* L1 ]9 E5 W" y2 K& p - - <description>
+ D6 @3 p) r& E7 H4 T: x' s8 a - - <![CDATA[ 內容]]>
% W8 C$ C& E) g# a - </description>/ Z. k; V- E8 e5 Q$ Y' I( t
- </item>
- Y* L: }! U. ^1 _0 w) @. p - </channel>
' z' M8 _6 Q+ r7 ~2 k5 X - </rss>
複製代碼 , G4 p- ^+ U$ O) y$ `; X
( F3 K$ d. r1 `1 c$ A" U9 T標題路徑:就是wordpress發貼時的標題,你想想,你是不是應該把上面RSS中,路徑 rss/channel/item/title 作為標題路徑呢。
u' O4 i9 d+ G: k0 W& G文章內容路徑:就是wordpress發貼時的標題對應的內容,路徑應該是 rss/channel/item/description* k; J& E" w C( S' M, J
% U/ Q) l( t2 l4 M這裡不要想複雜了,其實異常的簡單,就是標籤的絕對路徑,只要你找準了,就能正確解析RSS。
. n% z" D2 x) N4 A8 s7 ?5 m; t7 ]) v
4 p3 X: K2 h$ Z) Q+ r這裡可比火車頭的採集規則簡單得多。$ ?% m; g" m: q. s; O
. u7 j1 x2 a/ ~" l- p/ h$ B) G6 Y: M H3 N, i* d
9 x% w G0 l( d7 ^1 Z* V
6 I. H- B9 R+ i/ H: F其他也沒有好說的了,要注意的是,採集的時候,一個鏈接採集了一次要隔一段時間再去採集,太頻繁了會被封一會。# ^1 r9 Q: W3 g: t2 R, {
4 k0 B5 `1 g/ M8 F/ E6 Q+ n+ J$ j
+ o; P2 k) p/ m5 d0 U說下為什麼沒有做全自動的每天自動採集:
1 O" t. Y. o0 F6 u4 U8 a' ]) k1.因為我本人不提倡和不喜歡採集( m8 O/ d3 I! y9 w# B. _3 G. }
2.RSS更新很慢,每天手工點一下,這樣也有助於你收錄,因為搜索引擎不喜歡大量的搜錄,如果你每天或隔幾天才多出少許的新文章,這樣的站搜索引擎才不會認為你再採集。! B" O- j- p2 P* G; _
3.這個軟件第一版我看下反響,再考慮以後的版本功能,要是反應不好我就不做了。
9 v5 v4 w% t* l. n3 x/ L0 L4.假如有超強的全功能版本,我會收取少量費用,第一版就免費了,功能還是蠻不錯的。
" I H V; U' c- O7 M
# K8 C) M( y( ^( k: X
$ A' `1 s( q, U1 Y軟件的安裝:. K1 p1 v1 ?2 ~9 B& X# r9 T
) d. Z# t( X( a1.上傳 月光RSS採集插件 hyrinlight_gather_rss.php 到你的wordpress插件目錄
: v6 k" h8 C+ y6 B3 F. v5 N5 S( P! `" x
2.打開助手,添加插件準確位置,保存。
: L, ]( p0 }% C& {2 K1 a% S$ T9 Y8 o* z9 a5 M
3.添加新的RSS鏈接,並設置採集節點。: n. n" R; E# y3 v0 Y5 Q: Z
2 n8 I) O: N5 @! T; T4.開始採集並檢查結果。) o! G* k G% w# T) {$ h
8 c) Z1 _6 ?6 ^6 x% z0 H. X" z3 o& e, R2 M# r& A1 [" c& E" D, G
3 u1 F* g) c8 V& }4 s5 b; \' v0 O& B# {4 O8 X* q2 \7 N8 R+ `
6 Z! | }8 d* t, x, R6 G
最後附截圖 |
評分
-
查看全部評分
|