过期域名预定抢注

 找回密碼
 免费注册

繼續是採集的問題,如何獲得google、bing的緩存頁地址

  [複製鏈接]
發表於 2014-10-13 16:19:32 | 顯示全部樓層 |閱讀模式
今天開始嘗試用火車頭採集google、bing的緩存頁(即快照),但是遇到問題了,緩存頁都需要點開下來箭頭才能顯示出來,在代碼裡又不能看到,不知道怎麼獲取這個地址,有高手能解決嗎  Y6 F' n; B$ y" s9 ]. R

' m9 P( T( O# Q, _, H. g( \
回復

使用道具 舉報

發表於 2014-10-13 18:33:49 | 顯示全部樓層
直接採集目標站,而不是快照9 }+ ^, L3 i; F
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2014-10-13 21:27:38 | 顯示全部樓層
月光飛燕 發表於 2014-10-13 18:33 # V# m& M- U% c* M  J# h
直接採集目標站,而不是快照
. \8 a; _& i; _7 L. v7 L# C
例如ezinearticles.com這樣的網站會有限制的,直接採集需要的IP多還是採集bing的IP多,就這個問題糾結
% S+ O6 x8 M6 X( U: C$ x
回復 给力 爆菊

使用道具 舉報

發表於 2014-10-13 22:03:51 | 顯示全部樓層
以前採集用過有道搜索,限制低,現在不知。2 L( l$ @% D8 p

點評

谢谢分享  發表於 2014-10-13 23:43
回復 给力 爆菊

使用道具 舉報

發表於 2014-10-13 23:49:08 | 顯示全部樓層
抓包,快照地址都在json裡面# M8 L( s0 a2 w4 i9 n

評分

參與人數 1點點 +1 收起 理由
bbbbb111115 + 1

查看全部評分

回復 给力 爆菊

使用道具 舉報

發表於 2014-10-13 23:56:04 | 顯示全部樓層
更改useragent為文本瀏覽器,比如說w3m 或lynx
2 T; y8 C& C) s1 s7 R6 |/ m6 p$ z: A, p+ Q' z! ]1 U! W3 U
普通瀏覽器頁面裡面也有,仔細找
' s) o$ I/ @1 g9 n' m& L0 M1 K& W: P- m
不建議采緩存,不全0 f8 ]& e% T5 ~; O9 s2 q  x  c9 J
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2014-10-14 09:09:59 | 顯示全部樓層
無言 發表於 2014-10-13 23:49 ) V% [. |4 N" L6 c" A4 C! \# n( c' f
抓包,快照地址都在json裡面

4 L% C( j9 b3 N9 d* \可以加我,教教我怎麼抓包,我現在都研究,就是不懂怎麼抓7 p$ d9 d- P- e. X# `: I9 B" s, ~
回復 给力 爆菊

使用道具 舉報

發表於 2014-10-14 21:22:59 | 顯示全部樓層
bbbbb111115 發表於 2014-10-14 09:09 . k* u& a: z) w: \
可以加我,教教我怎麼抓包,我現在都研究,就是不懂怎麼抓
; L  X1 a* l3 s
用fiddler抓包,可以百度一下怎麼用
, V' g$ [4 _0 i8 y8 g! h0 C% W9 a& A; i% W
回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

點基跨境 數位編輯創業論壇

GMT+8, 2025-5-11 22:34

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表