如下圖所示:
以下練習使用如下文字:
ID Name Python Linux MySQL Java
1 Tangs 88 87 86 85.55
2 Sunwk 99 98 97 96,66
3 Zhubj 77 76 75 74.44
4 Shahs 66 65 64 63.33
BEGIN
是AWK的保留字,是一種特殊的條件型別。
BEGIN
的執行時機是在AWK程式一開始時,尚未讀取任何資料之前執行。
BEGIN
後的動作只執行一次,因為當AWK開始從檔案中讀入資料,BEGIN
的條件就不再成立,所以BEGIN
定義的動作只能被執行一次。
練習:執行命令檢視BEGIN
作用:
執行命令:awk 'BEGIN{print "This is BEGIN action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
[root@localhost tmp]# awk 'BEGIN{print "This is BEGIN action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
This is BEGIN action
Name Python Java
Tangs 88 85.55
Sunwk 99 96.66
Zhubj 77 74.44
Shahs 66 63.33
說明:
- AWK命令只要檢測不到完整的單引號不會執行,所以這個命令的換行不用加入
\
,就是一行命令- 上邊命令定義了兩個動作:
第一個動作使用BEGIN
條件,所以會在讀入檔案資料前列印「This is BEGIN action」(只會執行一次)
第二個動作會列印檔案中的對應文字。
END
也是AWK保留字,不過剛好和BEGIN
相反。
END
是在AWK程式處理完所有資料,即將結束時執行。END
後的動作只在程式結束時執行一次。
練習:執行命令檢視END
作用:
執行命令:awk 'END{print "This is END action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
[root@localhost tmp]# awk 'END{print "This is END action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
Name Python Java
Tangs 88 85.55
Sunwk 99 96.66
Zhubj 77 74.44
Shahs 66 63.33
This is END action
說明:在輸出結尾輸入「This is END action」,這並不是檔案本身的內容,而且只會執行一次。
假設我想看看Java績大於等於80分的學員是誰,就可以這樣輸入命令:
grep -v "Name" student.txt | awk '$6>=80 {printf $2 "\n"}'
# 判斷第六欄位(Java成績)大於等於80分的行,如果判斷式成立,則列印第2列(學員名)
[root@localhost tmp]# grep -v "Name" student.txt | awk '$6>=80 {printf $2 "\n"}'
Tangs
Sunwk
grep -v "Name" student.txt
是把標題過濾掉。
要先說明一下,雖然AWK是列提取命令,但是也要按行來讀入的。
在AWK處理一個文字檔案的時候:
BEGIN
。BEGIN
定義的操作,且執行一次。BEGIN
或者BEGIN
定義的動作執行完成之後,會把文字中的第一行資料讀入AWK中,$0
變數中,$1
變數中,第二列賦值在$2
變數中,以此類推。awk '{printf $2 "\n"}' student.txt
,意思是列印文字中的第二列姓名。awk '$6>=80 {printf $2 "\n"}' student.txt
END
,則把END
中定義的動作執行一次。以上就是AWK的執行流程。
如果要想讓AWK識別字串,必須使用//
包含,//
中識別的就是正規表示式規則匹配的字串。
例如:
# 輸出列印Sunwk的成績
# awk會匹配有Sunwk符號的行,並輸出
[root@localhost tmp]# awk '/Sunwk/ {print}' student.txt
2 Sunwk 99 98 97 96.66
注意:這裡要注意在AWK中,使用
//
包含的字串,AWK命令才會查詢。也就是說字串必須用//
包含,AWK命令才能正確識別。
A~B
練習A~B
是A包含B的意思。
練習:檢視Sunwk
使用者的Java成績。
# 匹配第二欄位中包含有「Sun」字元,則列印第六欄位資料
[root@localhost tmp]# awk '$2 ~ /Sun/ {printf $6 "\n" }' student.txt
96.66
提示:(6)練習的方式,是在某一列中查詢是否包含一個字串。而上面(5)的寫法,是在一行資料當中匹配是否包含一個字串,根據需求靈活使用。
注意:
~
兩邊有無空格都可以。
拓展練習:
當使用df
命令檢視分割區使用情況時,如果我只想檢視真正的系統分割區的使用狀況,而不想檢視光碟和臨時分割區的使用狀況,則可以執行如下:
# 查詢包含有sda+數位的行,並列印第一欄位和第五欄位
[root@localhost tmp]# df -h | awk '/sda[0-9]/ {printf $1 "\t" $5 "\t" "\n"}'
/dev/sda3 12%
/dev/sda1 15%