过期域名预定抢注

用戶名  找回密碼
 免费注册

繼續是採集的問題,如何獲得google、bing的緩存頁地址

  [複製鏈接]
發表於 2014-10-13 16:19:32 | 顯示全部樓層 |閱讀模式
今天開始嘗試用火車頭採集google、bing的緩存頁(即快照),但是遇到問題了,緩存頁都需要點開下來箭頭才能顯示出來,在代碼裡又不能看到,不知道怎麼獲取這個地址,有高手能解決嗎/ t& Q$ b. ^- @" A5 l/ y) e6 n

; b0 |7 y7 I* T+ A. |5 Q# }( s. g9 G
回復

使用道具 舉報

發表於 2014-10-13 18:33:49 | 顯示全部樓層
直接採集目標站,而不是快照
8 _$ g* }. `9 B( X% Z" e
回復 给力 爆菊

舉報

 樓主| 發表於 2014-10-13 21:27:38 | 顯示全部樓層
月光飛燕 發表於 2014-10-13 18:33
% t7 F) _" a2 Y" X; s# }直接採集目標站,而不是快照
2 X! R- e, N0 K& [
例如ezinearticles.com這樣的網站會有限制的,直接採集需要的IP多還是採集bing的IP多,就這個問題糾結1 _* \: s% f8 c: v: V
回復 给力 爆菊

舉報

發表於 2014-10-13 22:03:51 | 顯示全部樓層
以前採集用過有道搜索,限制低,現在不知。
* P+ W# v" t! h

點評

谢谢分享  發表於 2014-10-13 23:43
回復 给力 爆菊

舉報

發表於 2014-10-13 23:49:08 | 顯示全部樓層
抓包,快照地址都在json裡面0 b0 }$ y! ?2 C; S- Z6 p

評分

參與人數 1點點 +1 收起 理由
bbbbb111115 + 1

查看全部評分

回復 给力 爆菊

舉報

發表於 2014-10-13 23:56:04 | 顯示全部樓層
更改useragent為文本瀏覽器,比如說w3m 或lynx
7 j: Y! p6 @  m3 B4 l$ U9 E: a% I% M/ `
普通瀏覽器頁面裡面也有,仔細找
8 }) Y' H6 ?+ b6 D' e6 ]5 \0 ^( m' H* w! P+ p
不建議采緩存,不全
; [* |5 C8 @2 e( ^/ R
回復 给力 爆菊

舉報

 樓主| 發表於 2014-10-14 09:09:59 | 顯示全部樓層
無言 發表於 2014-10-13 23:49
; ~  r) F/ m! P5 X( |% X9 m抓包,快照地址都在json裡面
+ @+ R' \; _: S- s& Q
可以加我,教教我怎麼抓包,我現在都研究,就是不懂怎麼抓
3 D+ u6 O, V, m/ h2 H7 S1 g% R# f
回復 给力 爆菊

舉報

發表於 2014-10-14 21:22:59 | 顯示全部樓層
bbbbb111115 發表於 2014-10-14 09:09 ! o3 H1 ^; S# A0 k& e
可以加我,教教我怎麼抓包,我現在都研究,就是不懂怎麼抓
  E7 T- O, ~1 }' ~* n& \
用fiddler抓包,可以百度一下怎麼用0 t& e" F4 V' m0 ~0 B8 {

( y- T$ }4 C, H  [! w2 @
回復 给力 爆菊

舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

點基跨境 數位編輯創業論壇

GMT+8, 2025-5-18 18:12

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表