[mw_shl_code=php,true]<?php 8 t1 d O0 ~6 n2 A4 M7 c1 B
set_time_limit(0);//設置程序執行時間
5 }% T/ L$ L7 J" q/ S/ vheader("Content-Type: text/html; charset= utf-8"); //設置頁面的編碼,不設置會亂碼 7 ? M) e& X) @: V3 ?9 n
- E$ E4 z5 o9 B+ r; r
$url="http://www.luosuo.net/old/forum-4-1.html";
; a, \( I% a m y8 e/ C. I- B* w$ch = curl_init($url);//初始化
* f6 q1 t( j, i# ]# O# A5 ^5 O8 C: ecurl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);//返回的內容我們是作為變量儲存, 而不輸出,所以這裡選1.
' m9 d! S [. w8 }' B$contents = curl_exec($ch);// 運行cURL,請求網頁
. p* ^8 F1 b6 D% |preg_match_all('{<a href="([^"]+)" target="_blank">(.*)</a>}',$contents,$matches);//正則匹配想要的內容 : r- s9 ]( A/ u" d4 l2 O
curl_close($ch);// 關閉URL請求 4 W) X4 I) W2 l! E( ]& F
print_r($matches);
( Q0 q: V) W+ x; lfor ($i=0;$i<count($matches[1]);$i++)//for循環結構很常用,這裡的作用是循環記錄總數的的次數,每次循環中可以任意處理採集到的內容
' ]. l9 l7 o& N6 X3 a/ L* G6 K) x{
7 j% Y7 ?1 f$ w/ ^$title = $matches[2][$i]; " W4 n) P7 g9 H5 G1 M/ z2 ~; b- j
$geturl = $matches[1][$i];
6 H5 y& p2 e, E( M: I2 b& ` Decho "我要的標題是:" . $title. "<br/>" . "對應的網址是:" . $geturl . "<br/><br/><br/>"; o9 A) ^5 P& {( i. I# M! B& o
} 6 |# F/ U5 Z4 J+ N Z1 C! n x+ A
?>[/mw_shl_code]) g. c2 ]5 b+ @+ E
' ]8 r0 i9 A/ ]: H
這是我測試的代碼,怎麼出現了這個* S) ?; e% j* v/ a, O; o- Q/ d
2 u! X, @) {, e. i
. p- ~8 r5 U2 n; `' N |