过期域名预定抢注

 找回密碼
 免费注册

繼續是採集的問題,如何獲得google、bing的緩存頁地址

  [複製鏈接]
發表於 2014-10-13 16:19:32 | 顯示全部樓層 |閱讀模式
今天開始嘗試用火車頭採集google、bing的緩存頁(即快照),但是遇到問題了,緩存頁都需要點開下來箭頭才能顯示出來,在代碼裡又不能看到,不知道怎麼獲取這個地址,有高手能解決嗎
  d6 t. E2 b, _9 V; m/ l$ L% J. O
% R) L) X# ?+ ]- a1 _2 o
回復

使用道具 舉報

發表於 2014-10-13 18:33:49 | 顯示全部樓層
直接採集目標站,而不是快照
, Q, d9 a" O8 S, g
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2014-10-13 21:27:38 | 顯示全部樓層
月光飛燕 發表於 2014-10-13 18:33 # l" O" m1 i! M
直接採集目標站,而不是快照

8 `! v% c: a. Z7 X+ j0 V- I# \例如ezinearticles.com這樣的網站會有限制的,直接採集需要的IP多還是採集bing的IP多,就這個問題糾結$ O7 @9 s) ?5 p& A5 y; y% ~) b8 M
回復 给力 爆菊

使用道具 舉報

發表於 2014-10-13 22:03:51 | 顯示全部樓層
以前採集用過有道搜索,限制低,現在不知。
3 O- C' e' v9 U1 s- f) q

點評

谢谢分享  發表於 2014-10-13 23:43
回復 给力 爆菊

使用道具 舉報

發表於 2014-10-13 23:49:08 | 顯示全部樓層
抓包,快照地址都在json裡面5 j  r  I: P% M" d1 w3 o* c

評分

參與人數 1點點 +1 收起 理由
bbbbb111115 + 1

查看全部評分

回復 给力 爆菊

使用道具 舉報

發表於 2014-10-13 23:56:04 | 顯示全部樓層
更改useragent為文本瀏覽器,比如說w3m 或lynx
5 i4 q8 h1 e! ]- X* d; H5 x: b- i6 o9 B2 K9 q& _% J- B
普通瀏覽器頁面裡面也有,仔細找
6 U" M' c, {: y# Q) p; J& A) k& B$ v  N7 Y
不建議采緩存,不全
9 P+ R/ i% s0 `% ]4 [5 A
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2014-10-14 09:09:59 | 顯示全部樓層
無言 發表於 2014-10-13 23:49 ; M! b* G& R5 l4 I( S5 u# _
抓包,快照地址都在json裡面

( |, W1 G6 a% `4 G; ]: I- t+ X可以加我,教教我怎麼抓包,我現在都研究,就是不懂怎麼抓
) z1 M; A3 ?5 L% S
回復 给力 爆菊

使用道具 舉報

發表於 2014-10-14 21:22:59 | 顯示全部樓層
bbbbb111115 發表於 2014-10-14 09:09 % {4 x( y, h1 [3 @) V- \
可以加我,教教我怎麼抓包,我現在都研究,就是不懂怎麼抓
' \& m/ n) J0 c2 d
用fiddler抓包,可以百度一下怎麼用) c4 Q+ X+ o% s- l* m% {0 q5 j
2 {, j6 k  ^6 o
回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

點基跨境 數位編輯創業論壇

GMT+8, 2025-5-12 17:06

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表