『忘了再學』Shell基礎 — 28、AWK中條件表示式說明

2022-06-09 15:01:55

1、AWK的條件表達

如下圖所示:

2、條件表示式說明

以下練習使用如下文字:

ID      Name    Python  Linux   MySQL   Java
1       Tangs   88      87      86      85.55
2       Sunwk   99      98      97      96,66
3       Zhubj   77      76      75      74.44
4       Shahs   66      65      64      63.33

(1)BEGIN

BEGIN是AWK的保留字,是一種特殊的條件型別。

BEGIN的執行時機是在AWK程式一開始時,尚未讀取任何資料之前執行。

BEGIN後的動作只執行一次,因為當AWK開始從檔案中讀入資料,BEGIN的條件就不再成立,所以BEGIN定義的動作只能被執行一次。

練習:執行命令檢視BEGIN作用:

執行命令:awk 'BEGIN{print "This is BEGIN action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt

[root@localhost tmp]# awk 'BEGIN{print "This is BEGIN action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
This is BEGIN action
Name    Python  Java
Tangs   88      85.55
Sunwk   99      96.66
Zhubj   77      74.44
Shahs   66      63.33

說明:

  • AWK命令只要檢測不到完整的單引號不會執行,所以這個命令的換行不用加入\,就是一行命令
  • 上邊命令定義了兩個動作:
    第一個動作使用BEGIN條件,所以會在讀入檔案資料前列印「This is BEGIN action」(只會執行一次)
    第二個動作會列印檔案中的對應文字。

(2)END

END也是AWK保留字,不過剛好和BEGIN相反。

END是在AWK程式處理完所有資料,即將結束時執行。END後的動作只在程式結束時執行一次。

練習:執行命令檢視END作用

執行命令:awk 'END{print "This is END action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt

[root@localhost tmp]# awk 'END{print "This is END action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
Name    Python  Java
Tangs   88      85.55
Sunwk   99      96.66
Zhubj   77      74.44
Shahs   66      63.33
This is END action

說明:在輸出結尾輸入「This is END action」,這並不是檔案本身的內容,而且只會執行一次。

(3)關係運算子

假設我想看看Java績大於等於80分的學員是誰,就可以這樣輸入命令:

grep -v "Name" student.txt | awk '$6>=80 {printf $2 "\n"}'

# 判斷第六欄位(Java成績)大於等於80分的行,如果判斷式成立,則列印第2列(學員名)
[root@localhost tmp]# grep -v "Name" student.txt | awk '$6>=80 {printf $2 "\n"}'
Tangs
Sunwk

grep -v "Name" student.txt是把標題過濾掉。

(4)說明AWK中條件表示式的執行過程

要先說明一下,雖然AWK是列提取命令,但是也要按行來讀入的。

在AWK處理一個文字檔案的時候:

  • 先判斷表示式中有沒有BEGIN
    如果有,就先執行BEGIN定義的操作,且執行一次。
  • 如果沒有BEGIN或者BEGIN定義的動作執行完成之後,會把文字中的第一行資料讀入AWK中,
    把該行的整行資料賦予$0變數中,
    把該行資料的第一列賦值在$1變數中,第二列賦值在$2變數中,以此類推。
  • 例如awk '{printf $2 "\n"}' student.txt,意思是列印文字中的第二列姓名。
    我們先忽略掉條件,流程是:
    AWK讀取第一行資料(上面一步),然後執行動作輸出第二列資訊,也就是輸出第一行的第二列資訊。
    然後開始讀取第二行資料,然後再執行動作,輸出第二行的第二列資訊,
    然後再讀取第三行資料,之後執行動作,輸出第三行的第二列資訊,
    以此類推,基本上就是這樣的一個過程。
  • 然後在加上條件awk '$6>=80 {printf $2 "\n"}' student.txt
    判斷第六列Java的成績大於80分,才輸出。
    還是和上邊一樣,先是AWK讀取第一行資料完成之後,就要處理動作了,
    但是在處理動作之前,先要判斷一下動作前面的條件是否成立,
    如果成立,則執行後邊的動作。
    如果不成立,則不執行跟在後邊的動作。
    然後在開始讀取第二行資料,重複上邊的流程,以此類推。
    總結一下就是:加入了條件之後,只有條件成立動作才會執行,如果條件不滿足,則動作則不執行。
  • 最後如果有END,則把END中定義的動作執行一次。

以上就是AWK的執行流程。

(5)AWK中使用正規表示式

如果要想讓AWK識別字串,必須使用//包含,//中識別的就是正規表示式規則匹配的字串。

例如:

# 輸出列印Sunwk的成績
# awk會匹配有Sunwk符號的行,並輸出
[root@localhost tmp]# awk '/Sunwk/ {print}' student.txt
2   Sunwk   99  98  97  96.66

注意:這裡要注意在AWK中,使用//包含的字串,AWK命令才會查詢。也就是說字串必須用//包含,AWK命令才能正確識別。

(6)A~B練習

A~B是A包含B的意思。

練習:檢視Sunwk使用者的Java成績。

# 匹配第二欄位中包含有「Sun」字元,則列印第六欄位資料
[root@localhost tmp]# awk '$2 ~ /Sun/ {printf $6 "\n" }' student.txt
96.66

提示:(6)練習的方式,是在某一列中查詢是否包含一個字串。而上面(5)的寫法,是在一行資料當中匹配是否包含一個字串,根據需求靈活使用。

注意:~兩邊有無空格都可以。

拓展練習:

當使用df命令檢視分割區使用情況時,如果我只想檢視真正的系統分割區的使用狀況,而不想檢視光碟和臨時分割區的使用狀況,則可以執行如下:

# 查詢包含有sda+數位的行,並列印第一欄位和第五欄位
[root@localhost tmp]# df -h | awk '/sda[0-9]/ {printf $1 "\t" $5 "\t" "\n"}'
/dev/sda3   12%
/dev/sda1   15%