新聞中心
了解正則表達式之前,需要掌握一些常用的正則表達式的基礎(chǔ)知識,這些如果能記住***記住,記不住需要用的時候能查到就行,就幾個特殊字符,所以說正則表達式玩的就是特殊,具體大家可以查看更加詳細的說明。

為鄂州等地區(qū)用戶提供了全套網(wǎng)頁設(shè)計制作服務(wù),及鄂州網(wǎng)站建設(shè)行業(yè)解決方案。主營業(yè)務(wù)為成都做網(wǎng)站、成都網(wǎng)站建設(shè)、鄂州網(wǎng)站設(shè)計,以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務(wù)。我們深信只要達到每一位用戶的要求,就會得到認可,從而選擇與我們長期合作。這樣,我們也可以走得更遠!
preg_match_all函數(shù)具體說明大家可以查看PHP手冊,本文使用preg_match_all用于測試正則表達的效果。
實例代碼:
$html = ' |
實例要求:分別將每一個DIV元素的ID和內(nèi)容取出,如biuuu,biuuu_2,biuuu_3,,2和3(一些常用的抓站方法就是這樣匹配的)
分析:字符串是一個簡單的HTML元素,每一個DIV元素對應(yīng)該一個ID和內(nèi)容,并且是獨立的,首先考慮如何取出一個DIV內(nèi)的ID值和內(nèi)容,如:,然后匹配其它類似的元素。一個DIV中需要取出兩個值,也就是兩個匹配的表達式,***個表達式用于匹配ID值(biuuu),第二個表達式用于匹配ID的內(nèi)容(),正則表達式常用的表達式使用小括號,那么前面的元素將會變成如下形式:
|
好,使用如上小括號把需要匹配的區(qū)域進行了劃分,接下來就是如何匹配各個表達式內(nèi)的內(nèi)容,我們猜想一個ID可能是字母,數(shù)字或下劃線,那這就變得簡單了,使用中括號就可以實現(xiàn),如下:
表達式1:[a-zA-Z0-9_]+ (表示匹配大小寫字母,數(shù)字和下劃線)
那如何匹配表達式2,因為ID的內(nèi)容可以是任意的字符,但是要注意,不能匹配<或>字符,因為如果匹配這兩個字符將會把后面使用的DIV都匹配出來,因此需要排除這兩個字符開始的元素,也就是不匹配以<或>字符,如下:
表達式2:[^<>]+ (表示不匹配<和>字符)
這樣,需要匹配的子表達式就實現(xiàn)了,但是還要需要匹配一個
的表達式,方法如下:
表達式:/ '\"(表達式1)\"'>(表達式2)<\/div>/
注意其中的雙引號"和/需要使用\轉(zhuǎn)義字符轉(zhuǎn)義,然后把前面兩個表達式放進去,如下:
| '\"([a-z0-9_]+)\"'>/ ([^<>]+)<\/div>/ 這樣就實現(xiàn)一個匹配每一個DIV元素ID值和內(nèi)容的正則表達式,然后使用preg_match_all函數(shù)測試如下: $html = ' 2 3 '; preg_match_all('/([^<>]+)<\/div>/',$html,$result); var_dump($result);
|
結(jié)果:
|
array(3) { [0]=> array(3) { [0]=> string(30) " " [1]=> string(33) "2 " [2]=> string(33) "3 " } [1]=> array(3) { [0]=> string(5) "biuuu" [1]=> string(7) "biuuu_2" [2]=> string(7) "biuuu_3" } [2]=> array(3) { [0]=> string(8) "" [1]=> string(9) "2" [2]=> string(9) "3" } }
|
共有三個表達式,分別顯示每一個表達式匹配的值,并以數(shù)組的形式存儲,這樣就把每一個DIV元素的ID和內(nèi)容取出。使用正則表達式最主要還是要知道需要什么,然后跟椐需要進行匹配,并且思路清晰,并適當?shù)慕柚鷓reg_match_all函數(shù)進行輸出調(diào)試,非常方便。
當前標題:PHP函數(shù)preg_match_all正則表達式的簡單應(yīng)用
網(wǎng)站地址:http://fisionsoft.com.cn/article/cohpcej.html


咨詢
建站咨詢
