[mw_shl_code=php,true]<?php l6 E3 ?/ I$ O$ w8 a
set_time_limit(0);//設置程序執行時間
9 U" j- J& X$ z8 X7 ^( d6 Bheader("Content-Type: text/html; charset= utf-8"); //設置頁面的編碼,不設置會亂碼
8 {3 r5 n8 I2 O$ }& o- o3 t: K5 Z; \( h% [" p
$url="http://www.luosuo.net/old/forum-4-1.html";
. F2 C% N% O/ _* M$ch = curl_init($url);//初始化
9 G! k$ p" |. X) R; L1 v) Mcurl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);//返回的內容我們是作為變量儲存, 而不輸出,所以這裡選1. ' o7 T; d( a D1 s* G5 q
$contents = curl_exec($ch);// 運行cURL,請求網頁
' G# o3 m/ h) i8 p& Bpreg_match_all('{<a href="([^"]+)" target="_blank">(.*)</a>}',$contents,$matches);//正則匹配想要的內容
% i& i6 z. ]* }$ ]% @/ J8 Icurl_close($ch);// 關閉URL請求
7 O) L: p$ c+ }* Pprint_r($matches);
/ O' O' @5 e1 ]. U+ W7 |for ($i=0;$i<count($matches[1]);$i++)//for循環結構很常用,這裡的作用是循環記錄總數的的次數,每次循環中可以任意處理採集到的內容
/ ~4 a6 a; z- s" P9 K/ Q9 ^{
( h! a7 L8 e1 @' V$title = $matches[2][$i];
% A6 C i7 Z5 ~$geturl = $matches[1][$i]; & Q! p1 T/ d1 q- @7 r' F3 N! |
echo "我要的標題是:" . $title. "<br/>" . "對應的網址是:" . $geturl . "<br/><br/><br/>";
- E8 P2 L0 A+ ?6 K. R}
3 G( w- M$ r5 ], K. a- F?>[/mw_shl_code]
# B, q$ f3 S( ^$ O. ?- ~6 s
2 F+ i4 \) _% d8 a+ N& X; R3 p. d這是我測試的代碼,怎麼出現了這個$ h% b4 `# R( L. ]
/ Z* h* |% ?8 H2 L$ j/ p) g5 Q' ~; n* c+ R$ c! @
|