新聞中心
awk是Unix環(huán)境下一種非常好的語言,適合于文本處理和報(bào)表生成,它還有許多精心設(shè)計(jì)的特性,允許進(jìn)行特殊技巧程序設(shè)計(jì)。對(duì)于短消息來說,比如處理話單文件,使用awk就非常方便本篇文章重點(diǎn)為大家講解一下 awk 的特殊模式:BEGIN 和 END 。

創(chuàng)新互聯(lián)建站是一家專業(yè)提供沙市企業(yè)網(wǎng)站建設(shè),專注與網(wǎng)站設(shè)計(jì)、做網(wǎng)站、H5場(chǎng)景定制、小程序制作等業(yè)務(wù)。10年已為沙市眾多企業(yè)、政府機(jī)構(gòu)等服務(wù)。創(chuàng)新互聯(lián)專業(yè)網(wǎng)站建設(shè)公司優(yōu)惠進(jìn)行中。
隨著我們逐漸展開,并探索出更多構(gòu)建復(fù)雜 awk 操作的方法,將會(huì)證明 awk 的這些特殊功能的是多么強(qiáng)大。
開始前,先讓我們回顧一下 awk 系列的介紹,記得當(dāng)我們開始這個(gè)系列時(shí),我就指出 awk 指令的通用語法是這樣的:
# awk 'script' filenames
在上述語法中,awk 腳本擁有這樣的形式:
/pattern/ { actions }
你通常會(huì)發(fā)現(xiàn)腳本中的模式(/pattern )是一個(gè)正則表達(dá)式,此外,你也可以在這里用特殊模式 BENGIN 和 END 。因此,我們也能按照下面的形式編寫一條 awk 命令:
awk ' BEGIN { actions } /pattern/ { actions } /pattern/ { actions } ………. END { actions } ' filenames
假如你在 awk 腳本中使用了特殊模式:BEGIN 和 END ,以下則是它們對(duì)應(yīng)的含義:
-
BEGIN 模式:是指 awk 將在讀取任何輸入行之前立即執(zhí)行BEGIN 中指定的動(dòng)作。
-
END 模式:是指 awk 將在它正式退出前執(zhí)行 END中指定的動(dòng)作。
含有這些特殊模式的 awk 命令腳本的執(zhí)行流程如下:
-
當(dāng)在腳本中使用了 BEGIN 模式,則 BEGIN 中所有的動(dòng)作都會(huì)在讀取任何輸入行之前執(zhí)行。
-
然后,讀入一個(gè)輸入行并解析成不同的段。
-
接下來,每一條指定的非特殊模式都會(huì)和輸入行進(jìn)行比較匹配,當(dāng)匹配成功后,就會(huì)執(zhí)行模式對(duì)應(yīng)的動(dòng)作。對(duì)所有你指定的模式重復(fù)此執(zhí)行該步驟。
-
再接下來,對(duì)于所有輸入行重復(fù)執(zhí)行步驟 2 和 步驟 3。
-
當(dāng)讀取并處理完所有輸入行后,假如你指定了 END 模式,那么將會(huì)執(zhí)行相應(yīng)的動(dòng)作。
當(dāng)你使用特殊模式時(shí),想要在 awk 操作中獲得最好的結(jié)果,你應(yīng)當(dāng)記住上面的執(zhí)行順序。
為了便于理解,讓我們使用第八節(jié)的例子進(jìn)行演示,那個(gè)例子是關(guān)于 Tecmint 擁有的域名列表,并保存在一個(gè)叫做 domains.txt 的文件中。
news.tecmint.com
tecmint.com
linuxsay.com
windows.tecmint.com
tecmint.com
news.tecmint.com
tecmint.com
linuxsay.com
tecmint.com
news.tecmint.com
tecmint.com
linuxsay.com
windows.tecmint.com
tecmint.com
$ cat ~/domains.txt
查看文件內(nèi)容
在這個(gè)例子中,我們希望統(tǒng)計(jì)出 domains.txt 文件中域名tecmint.com 出現(xiàn)的次數(shù)。所以,我們編寫了一個(gè)簡單的 shell 腳本幫助我們完成任務(wù),它使用了變量、數(shù)學(xué)表達(dá)式和賦值運(yùn)算符的思想,腳本內(nèi)容如下:
#!/bin/bash
for file in $@; do
if [ -f $file ] ; then
### 輸出文件名
echo "File is: $file"
### 輸出一個(gè)遞增的數(shù)字記錄包含 tecmint.com 的行數(shù)
awk '/^tecmint.com/ { counter+=1 ; printf "%s/n", counter ; }' $file
else
### 若輸入不是文件,則輸出錯(cuò)誤信息
echo "$file 不是一個(gè)文件,請(qǐng)指定一個(gè)文件。" >&2 && exit 1
fi
done
### 成功執(zhí)行后使用退出代碼 0 終止腳本
exit 0
現(xiàn)在讓我們像下面這樣在上述腳本的 awk 命令中應(yīng)用這兩個(gè)特殊模式:BEGIN 和 END :
我們應(yīng)當(dāng)把腳本:
awk '/^tecmint.com/ { counter+=1 ; printf "%s/n", counter ; }' $file
改成:
awk ' BEGIN { print "文件中出現(xiàn) tecmint.com 的次數(shù)是:" ; } /^tecmint.com/ { counter+=1 ; } END { printf "%s/n", counter ; } ' $file
在修改了 awk 命令之后,現(xiàn)在完整的 shell 腳本就像下面這樣:
#!/bin/bash
for file in $@; do
if [ -f $file ] ; then
### 輸出文件名
echo "File is: $file"
### 輸出文件中 tecmint.com 出現(xiàn)的總次數(shù)
awk ' BEGIN { print "文件中出現(xiàn) tecmint.com 的次數(shù)是:" ; } /^tecmint.com/ { counter+=1 ; } END { printf "%s/n", counter ; } ' $file
else
### 若輸入不是文件,則輸出錯(cuò)誤信息
echo "$file 不是一個(gè)文件,請(qǐng)指定一個(gè)文件。" >&2 && exit 1
fi
done
### 成功執(zhí)行后使用退出代碼 0 終止腳本
exit 0
awk 模式 BEGIN 和 END
當(dāng)我們運(yùn)行上面的腳本時(shí),它會(huì)首先輸出 domains.txt 文件的位置,然后執(zhí)行 awk 命令腳本,該命令腳本中的特殊模式 BEGIN 將會(huì)在從文件讀取任何行之前幫助我們輸出這樣的消息“文件中出現(xiàn) tecmint.com 的次數(shù)是: ”。
接下來,我們的模式/^tecmint.com/ 會(huì)在每個(gè)輸入行中進(jìn)行比較,對(duì)應(yīng)的動(dòng)作{ counter+=1 ; } 會(huì)在每個(gè)匹配成功的行上執(zhí)行,它會(huì)統(tǒng)計(jì)出 tecmint.com 在文件中出現(xiàn)的次數(shù)。
最終,END 模式將會(huì)輸出域名 tecmint.com 在文件中出現(xiàn)的總次數(shù)。
$ ./script.sh ~/domains.txt
用于統(tǒng)計(jì)字符串出現(xiàn)次數(shù)的腳本
最后總結(jié)一下,我們?cè)诒竟?jié)中演示了更多的 awk 功能,并學(xué)習(xí)了特殊模式 BEGIN 和 END 的概念。
網(wǎng)站欄目:Awk的特殊模式:BEGIN和END
標(biāo)題網(wǎng)址:http://fisionsoft.com.cn/article/dpsdsgp.html


咨詢
建站咨詢
