發表於 2015-1-1 10:34:23
|
顯示全部樓層
風吹不動 發表於 2015-1-1 08:39 
9 S& f; [9 I# ]- a6 I求分享採集思路,貌似翻頁有最大限制,無法全部採集 : k d% X- W, O5 J. D
兄弟,換個思路吧,不要跟著amazon的頁面走,也不要想著獲取list然後再獲取productdetail,採集只需要的是productdetail即可。重要一點:直接把amazon 的sitemap下載下來,然後再解壓gzip,再將解壓的xml內容給解析出來,取出loc和權重值放到數據庫裡面即可。
( L" ?2 p7 Q, r: F
7 E3 D/ M0 u* w- [6 C |
|