新聞中心
在寫正則表達(dá)式的時(shí)候總會(huì)遇到不少的問題, 特別是在表達(dá)式有多個(gè)元組的時(shí)候。下面看下re模塊下的findall()函數(shù)和多個(gè)表達(dá)式元組相遇的時(shí)候會(huì)出現(xiàn)什么樣的坑。

10多年的吉州網(wǎng)站建設(shè)經(jīng)驗(yàn),針對設(shè)計(jì)、前端、開發(fā)、售后、文案、推廣等六對一服務(wù),響應(yīng)快,48小時(shí)及時(shí)工作處理。營銷型網(wǎng)站的優(yōu)勢是能夠根據(jù)用戶設(shè)備顯示端的尺寸不同,自動(dòng)調(diào)整吉州建站的顯示方式,使網(wǎng)站能夠適用不同顯示終端,在瀏覽器中調(diào)整網(wǎng)站的寬度,無論在任何一種瀏覽器上瀏覽網(wǎng)站,都能展現(xiàn)優(yōu)雅布局與設(shè)計(jì),從而大程度地提升瀏覽體驗(yàn)。創(chuàng)新互聯(lián)公司從事“吉州網(wǎng)站設(shè)計(jì)”,“吉州網(wǎng)站推廣”以來,每個(gè)客戶項(xiàng)目都認(rèn)真落實(shí)執(zhí)行。
代碼如下
import re
str="a b c d"
regex0=re.compile("((\w+)\s+\w+)")
print(regex0.findall(str))
regex1=re.compile("(\w+)\s+\w+")
print(regex1.findall(str))
regex2=re.compile("\w+\s+\w+")
print(regex2.findall(str))輸出結(jié)果
[('a b', 'a'), ('c d', 'c')]
['a', 'c']
['a b', 'c d']可能結(jié)果有點(diǎn)意外,下面解釋一下
第一個(gè)正則表達(dá)式中是帶有2個(gè)括號(hào)的,我們可以看到其輸出是一個(gè)list 中包含2個(gè) tuple
第二個(gè)正則表達(dá)式中帶有1個(gè)括號(hào),其輸出的內(nèi)容就是括號(hào)匹配到的內(nèi)容,而不是整個(gè)表達(dá)式所匹配到的結(jié)果。
第三個(gè)正則表達(dá)式中不帶有括號(hào),其輸出的內(nèi)容就是整個(gè)表達(dá)式所匹配到的內(nèi)容。
結(jié)論:findall()返回的是括號(hào)所匹配到的結(jié)果(如regex1),多個(gè)括號(hào)就會(huì)返回多個(gè)括號(hào)分別匹配到的結(jié)果(如regex),如果沒有括號(hào)就返回就返回整條語句所匹配到的結(jié)果(如regex2)。所以在提取數(shù)據(jù)的時(shí)候就需要注意這個(gè)坑。
實(shí)際上是由其并不是python特有的,這是 正則 所特有的 , 任何一門高級(jí)語言使用正則都滿足這個(gè)特點(diǎn):有括號(hào)時(shí)只能匹配到括號(hào)中的內(nèi)容,沒有括號(hào)【相當(dāng)于在最外層增加了一個(gè)括號(hào)】。在正則里面 “()” 代表的是分組的意思,一個(gè)括號(hào)代表一個(gè)分組,你只能匹配到"()"中的內(nèi)容。
網(wǎng)頁題目:創(chuàng)新互聯(lián)Python教程:Python正則表達(dá)式findall函數(shù)詳解
網(wǎng)址分享:http://fisionsoft.com.cn/article/djepggd.html


咨詢
建站咨詢
