風吹不動 發表於 2015-1-1 08:39 . X7 q8 d5 P; y/ W( H: Z
求分享採集思路,貌似翻頁有最大限制,無法全部採集
- o7 `+ d* N" M兄弟,換個思路吧,不要跟著amazon的頁面走,也不要想著獲取list然後再獲取productdetail,採集只需要的是productdetail即可。重要一點:直接把amazon 的sitemap下載下來,然後再解壓gzip,再將解壓的xml內容給解析出來,取出loc和權重值放到數據庫裡面即可。
, \5 P! H" a8 [2 w6 K2 d0 v) M: v, G4 k4 T7 q' [
|