[mw_shl_code=php,true]<?php 4 p5 g2 x9 p$ V$ y7 o- v0 K# g# e
set_time_limit(0);//設置程序執行時間 / c2 ~4 K2 B. w) P2 w. p9 O' z- O* d
header("Content-Type: text/html; charset= utf-8"); //設置頁面的編碼,不設置會亂碼
2 c3 h" O$ D: j) d: l+ M( b' J$ f/ F: G6 [3 N, h0 H, v
$url="http://www.luosuo.net/old/forum-4-1.html";
8 [1 V4 d3 E/ x. k3 H$ch = curl_init($url);//初始化 & u, F) Q+ X3 @. W# q$ F2 h9 l
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);//返回的內容我們是作為變量儲存, 而不輸出,所以這裡選1. / N3 i+ Y2 E' m) b1 v
$contents = curl_exec($ch);// 運行cURL,請求網頁 5 k5 V# U$ X# i- V C
preg_match_all('{<a href="([^"]+)" target="_blank">(.*)</a>}',$contents,$matches);//正則匹配想要的內容 + x8 `' F; `' O+ v3 {0 R/ I
curl_close($ch);// 關閉URL請求
5 J- J8 a7 K# Cprint_r($matches);2 t0 J1 A- Z+ q2 t5 K6 R
for ($i=0;$i<count($matches[1]);$i++)//for循環結構很常用,這裡的作用是循環記錄總數的的次數,每次循環中可以任意處理採集到的內容 / R+ T! e% ~1 P. h
{ 7 y, W8 I* s/ z" h ]
$title = $matches[2][$i]; 9 R8 z4 u: d& q& C; o4 W
$geturl = $matches[1][$i];
: d- r3 z6 W$ s! q6 eecho "我要的標題是:" . $title. "<br/>" . "對應的網址是:" . $geturl . "<br/><br/><br/>"; 0 }8 C5 m! L# S" h& A; C" f4 A- C
}
4 l" u/ n6 f1 r% S; f$ V' ?- i?>[/mw_shl_code]
% D- \, z3 i+ d# S7 r
) i [4 `1 g l2 q1 s) W這是我測試的代碼,怎麼出現了這個
" _1 i0 B8 G q3 G- Y. W7 H
# V( @: v' X* e% ?. B. ^! {$ M# \* B5 ?
/ S3 u3 v- g. S2 p |