过期域名预定抢注

 找回密碼
 免费注册

Wordpress 評論求教

  [複製鏈接]
發表於 2013-9-13 17:45:16 | 顯示全部樓層
月光飛燕 發表於 2013-9-13 07:32
. P+ k! v6 u" s- f& J" M% o這種評論真的沒有什麼價值啊,而且會k站的; a/ Q$ x! }; o1 _
有3種可能,
  X) s1 P5 H* l" d0 E0 J第1是這些站的後台裡面直接添加的,使用xmlprc,說 ...

- U8 b8 n, ~2 B) x' S: z/ j 第二種比較有意思.* S. z4 k, U  L
不過,首先得獲取相對應文章的ID,
2 t3 M% m5 [# f; i0 g6 S) a評論那邊有個隱藏的input, comment_post_ID.
3 i2 y3 A' M0 O0 m  o: \所以還是得先訪問頁面( u$ m* F/ i6 r1 _
! ~2 u6 ?( c8 q! r1 [5 Z- u- u
: V- }7 O" }9 P  u% U
回復 给力 爆菊

使用道具 舉報

發表於 2013-9-13 18:02:14 | 顯示全部樓層
luguokankan 發表於 2013-9-13 17:45 . @2 D8 V2 B) y1 C, i
第二種比較有意思.
3 [+ }  h/ d- S+ H不過,首先得獲取相對應文章的ID,
( {  u6 n( r6 U0 T' J評論那邊有個隱藏的input, comment_post_ID.

" k, r$ ^- ]6 C6 X8 X; u' D! t) O+ ~2 J沒有實踐過,如果是你說的那樣,至少可以不去讀js和大量的頭像等
  k% J% E" u6 r* `如果寬帶充足,問題不大" E$ V# T# a- ~- @+ W
8 x2 g0 {6 E- s! P# X

1 }3 u2 H# k7 i
回復 给力 爆菊

使用道具 舉報

發表於 2013-9-13 19:15:20 | 顯示全部樓層
月光飛燕 發表於 2013-9-13 18:02 , O0 m3 H. }3 Y/ R5 p( y5 M3 e
沒有實踐過,如果是你說的那樣,至少可以不去讀js和大量的頭像等( H* h; G; P9 y( k! V8 @
如果寬帶充足,問題不大
$ T" W/ z* X& O( K0 E, P; n* T* J
其實大部分scraper都是只讀取目標html結構,不會去讀取其他文件的, 這些文件包括js,css,圖片的.. f$ y( o2 b" c! n4 Y

7 I( {: D1 S, R# Q% f比如你用php curl下載一個網頁, 絕對就只有那個網頁文件,不會有它引用的其他文件." s/ y2 ?7 F4 _+ `1 ^: ]

* e2 E! w4 q3 E. i* `這幾年不是流行nodejs之類的headless webkit東東,這個用來做scraper,可以支持js.
( f& W! Z+ I9 Q4 M1 j/ ~
7 H, E) f0 s- F+ R3 F% I
: w( d9 N/ g8 S% m/ N) o) w8 w# l; T* _4 r% b0 ], r" a  L7 d
' B7 t, s, @6 X" I' e% b
# g0 j: e; o2 _5 a& X4 N3 H1 g% S
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2013-9-13 21:26:53 | 顯示全部樓層
luguokankan 發表於 2013-9-13 17:45 : k1 R) L' p5 X' Z# W; G5 Y
第二種比較有意思.
+ |1 f, A  e$ d" ~- q不過,首先得獲取相對應文章的ID, 1 r3 a; h- J6 w5 i+ ^. {
評論那邊有個隱藏的input, comment_post_ID.

9 w! P! Z6 K; }" a9 ^$ d我覺得你的思路對路的,假如直接post到 wp-comment-post.php 的話, 就給以繞過下載那個超大的網頁了。問題就是要弄個腳本拿到文章地址的 文章ID, 我們不可能一個個的去查文章ID的; z2 j- ?: {) f; o* z% ?
. j" J( f. s* D0 S9 R. x
回復 给力 爆菊

使用道具 舉報

發表於 2013-9-14 07:06:17 | 顯示全部樓層
HONG 發表於 2013-9-13 21:26
; e7 B4 X" f4 R1 n8 F9 v8 e& I我覺得你的思路對路的,假如直接post到 wp-comment-post.php 的話, 就給以繞過下載那個超大的網頁了。問 ...

! ?7 l/ t% Q" E7 u* V對啊,這個方法的局限就是你得先找到post id.
; S" U: Z  P; v' c# A
9 C3 {3 k. n1 a' n不過可以猜啊. - @( u4 Z( Q# Y2 @8 w2 i
www.test.com/?p=xxx
$ f% s+ ]2 O$ e9 a& q
' p& s+ P9 k( A; [6 V你發header請求驗證頁面是否存在.
4 h- m* \$ g7 ~9 T1 Q1 s6 T1 M# X2 u. t) ^4 N0 z3 D+ f
用header就避免了下載整個網頁了,對不對 # X/ J$ U) Q/ ]% v1 E( O5 T& l. Y! v
; B- ~; l8 J7 U9 n7 J
那麼多spam, 肯定comment不需要管理, 猜對post id直接post到wp-comment-post.php
+ r0 u  g  Z& P4 ]
0 d$ z( u1 z0 e: t" q2 e, j$ e% L: Z4 Z# c6 R0 `8 e, Q3 R2 \* B
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2013-9-14 11:56:03 | 顯示全部樓層
luguokankan 發表於 2013-9-14 07:06 , s& ~: Y; k* m/ D
對啊,這個方法的局限就是你得先找到post id.
+ G& U- w( O% ]7 R* G( \* G1 @
& b' f$ R7 L  Z4 K4 s2 N2 h不過可以猜啊.
- Q; t( x3 N6 c, g, n$ [
嗯,對於 id在鏈接中的話,我們很容易用php 腳本拿到。 但是,文章偽靜態了呢?比如這個! N) x+ V9 j+ ^$ w" p
http://arcadegameworld.com/play/stone-age-mahjong-connect/
0 E! o9 b6 p; m. R# B# @: a2 d, [6 B9 P
我對你說到的header 辦法不是很明白,能否明示。/ D' A& O' Y* c/ t* U
或者請路過高人,加以指點: 如何能夠用php 或者其他辦法通過博文地址拿到ID,比如上面這個地址。
9 _$ i: G: G) a! L關鍵是: 有的博文很大很大, 一般常規採集的函數 php file_get_contents 可能不好使。
- h+ q0 b, Q* \; X' A9 u- m$ L6 a- q8 d: |! E! A8 ^8 N- g
今天,就在這裡碰碰運氣,看能否解決我的難題 , M- J8 I/ i- e

" Y  K9 z! o; R% p+ C) N! O6 l3 }4 O, L: U

* z; F' A! j" b- o5 A$ x7 A) [
回復 给力 爆菊

使用道具 舉報

發表於 2013-9-14 12:21:55 | 顯示全部樓層
本帖最後由 luguokankan 於 2013-9-14 12:23 編輯 9 s( t4 E6 v3 ~# P1 q" D  s+ {- r7 R
HONG 發表於 2013-9-14 11:56
: i, f; `1 m& [8 k* K7 \嗯,對於 id在鏈接中的話,我們很容易用php 腳本拿到。 但是,文章偽靜態了呢?比如這個( P+ h6 s% ]& }/ c1 d3 i
http://arcadega ...
- `* @1 e6 O0 Z1 f, O- J" {( v7 D* Z0 m
額,我說的是猜....4 x; i1 Q: m9 r0 t

3 Y+ a' ?0 b- h1 _3 L啟動了偽靜態, 比如: www.test.com/hello-world
+ @0 ]3 E2 E9 y7 _5 o2 H" C3 y4 D
3 `6 j5 v8 E4 j; Y5 X1 m0 j你還是可以通過www.test.com/?p=1訪問的
, i: V% `3 C; z! N# P. c
; J4 `) Q# m; m) s/ Q, l& O* K9 J至於header請求嘛,  你知道get, post吧?  你自己查下吧. 跟ping差不多吧.# m. |& R! D5 H" l/ T
/ a5 h, O: f* ^) e6 I
之前比較懶,沒有動手測試. 現在給你看下header請求的結果1 F0 o3 ^& v8 R$ J

  }, ~, D  e0 Z, d( g Screenshot from 2013-09-14 12:18:25.png 3 I1 v. e) i2 }, Y

3 z+ _+ S+ ]2 p8 F9 l! Y0 h沒想到文章id直接在headers裡面. 我算半個高人吧
- x% H4 _/ ?. C7 v& \; M
- M4 A2 W, K/ X: u  h. p- x, R. i0 E還有,我奉勸你別使用file_put_contents, 用php curl吧, 支持header請求
1 H+ e. @8 j1 D
& l* F( f% M( N9 O/ U. u" A* }& P) M( P( u! O6 P/ D1 l
3 e# {6 R/ E8 C; e; e

評分

參與人數 1點點 +1 收起 理由
HONG + 1

查看全部評分

回復 给力 爆菊

使用道具 舉報

發表於 2013-9-14 16:17:04 | 顯示全部樓層
樓上高手,直接在header裡查id
  `0 E: m9 D) u' ], g( J2 u
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2013-9-14 17:23:29 | 顯示全部樓層
luguokankan 發表於 2013-9-14 12:21
# P6 a0 {  j% M+ s1 n額,我說的是猜....
( k# Y$ D; I8 {0 O, {- ~$ W
, s! K8 t: Q# t3 @9 ?: `+ G0 U啟動了偽靜態, 比如: www.test.com/hello-world

2 ?% W5 p1 [7 e* A謝謝您,經過您的指點,我已近實驗成功了" p8 K$ z) r% b: l6 V
! U1 X/ w, o+ ?" w! S) m3 ^
回復 给力 爆菊

使用道具 舉報

發表於 2013-9-14 17:32:20 | 顯示全部樓層
HONG 發表於 2013-9-14 17:23 1 ~  }4 b1 @. H* @) I7 f
謝謝您,經過您的指點,我已近實驗成功了
- b4 x; ^3 r* b9 |$ n* M5 a
做出來記得給我一份啊
3 ^$ `0 L6 J& U, D% H
2 Z! B, X! q7 T1 J6 g8 Q$ e

評分

參與人數 1點點 +1 收起 理由
HONG + 1 虽然你不缺分数,但我还是愿意给您,聊表心.

查看全部評分

回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

點基

GMT+8, 2026-3-21 23:49

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表