awk 總結(jié)

寫在前面

本篇是個人學(xué)習(xí)整理筆記而得。
原書：Sed and Awk 101 Hacks -中文版
引用書結(jié)尾的一句話:
Knowledge is not one man’s Entity

awk 基本使用

1. 程序結(jié)構(gòu)

### begin 區(qū)域的語法:
BEGIN { awk-commands }
### BEGIN 區(qū)域的命令只在最開始執(zhí)行一次姻政，可選

### body 區(qū)域的語法：
/pattern/{action}
### 每從輸入文件中讀取一行涵妥，就會執(zhí)行一次body區(qū)域的命令

### end 區(qū)域的語法：
END { awk-commands }
### END  區(qū)域在 awk  執(zhí)行完所有操作后執(zhí)行蓄坏，并且只執(zhí)行一次盛龄，可選

### 一個例子
]# awk 'BEGIN {FS=":";print"-----header-----"} \
> /mail/{print $1} \
> END {print "-----footer-----"}' /etc/passwd
-----header-----
mail
-----footer-----
]#

2. 執(zhí)行多個文件

### 例子
]# awk 'BEGIN {FS=":";print "-----header-----"}
/mail/{print $1}
END {print "------footer-----"}' /etc/passwd /etc/group
-----header-----
mail
mail
------footer-----
]# 
### 注意扎筒，即是指定了多個文件艰山，BEGIN 和 END 區(qū)域，仍然只會執(zhí)行一次

3. 打印命令 print

### 不帶參數(shù)，打印整行數(shù)據(jù)
]# awk '{print}' employee.txt
101,John Doe,CEO
102,Jason Smith,IT Manager
103,Raj Reddy,Sysadmin
104,Anand Ram,Developer
105,Jane Miller,Sales Manager
]# 

### 按逗號分隔打印第二個字段
]# awk -F ',' '{print $2}' employee.txt
John Doe
Jason Smith
Raj Reddy
Anand Ram
Jane Miller
]#

4. 模式匹配

### 和sed一樣谣辞，awk也可以只對匹配到的行進(jìn)行操作
# 只打印管理者行
]# awk -F ',' '/Manager/{print $2": "$3}' employee.txt
Jason Smith: IT Manager
Jane Miller: Sales Manager
]#

awk 內(nèi)置變量

1. FS - 輸入字段分隔符

### 默認(rèn)分隔符是一個或多個空格字符
### -F 選項的作用和FS變量一樣的
### FS 變量只能在BEGIN區(qū)域定義
### FS 變量支持正則
]# cat employee.txt
101,John Doe:CEO%10000
102,Jason Smith:IT Manager%5000
103,Raj Reddy:Sysadmin%4500
104,Anand Ram:Developer%4500
105,Jane Miller:Sales Manager%3000

]# awk 'BEGIN {FS="[,:%]"}{print $2": "$3}' employee.txt
John Doe: CEO
Jason Smith: IT Manager
Raj Reddy: Sysadmin
Anand Ram: Developer
Jane Miller: Sales Manager
]#

2. OFS - 輸出字段分隔符

### 默認(rèn)情況下迫摔，awk輸出字段之間是以空格分開
]# awk -F ',' '{print $2,$3}' employee.txt
John Doe CEO
Jason Smith IT Manager
Raj Reddy Sysadmin
Anand Ram Developer
Jane Miller Sales Manager
]#

### 使用OFS變量指定輸出分隔符
]# awk -F ',' 'BEGIN {OFS=": "} {print $2,$3}' employee.txt
John Doe: CEO
Jason Smith: IT Manager
Raj Reddy: Sysadmin
Anand Ram: Developer
Jane Miller: Sales Manager
]# 

### 輸出變量間沒有逗號，不使用OFS泥从，輸出打印間沒有字符
]# awk -F ',' 'BEGIN {OFS=": "} {print $2$3}' employee.txt
John DoeCEO
Jason SmithIT Manager
Raj ReddySysadmin
Anand RamDeveloper
Jane MillerSales Manager
]#

3. RS - 記錄分隔符

### 默認(rèn)情況下記錄分隔符是換行符
### 一條記錄也就是默認(rèn)情況下的一行
# 要打印雇員的姓名
]# cat emp_one_line.txt 
101,John Doe;102,Jason Smith;103,Raj Reddy;104,Anand Ram;105,Jane, Miller
]# awk -F ',' '{print $2}' emp_one_line.txt 
John Doe;102
]# 
# 需要指定記錄分隔符為分號
]# awk -F ',' 'BEGIN {RS=";"} {print $2}' emp_one_line.txt 
John Doe
Jason Smith
Raj Reddy
Anand Ram
Jane
]#

4. ORS - 輸出記錄分隔符

### 可以看出默認(rèn)的輸出記錄分隔符是換行符
# 使用ORS指定輸出每行換隔
]# awk 'BEGIN {FS=",";OFS=": ";ORS="\n-----\n"} {print $2,$3}' employee.txt
John Doe: CEO
-----
Jason Smith: IT Manager
-----
Raj Reddy: Sysadmin
-----
Anand Ram: Developer
-----
Jane Miller: Sales Manager
-----
]#

5. NR - 記錄序號

### NR是記錄每一行的行號
### 在END塊中NR值是最后一行的行號，也就是總行數(shù)
]# awk 'BEGIN {FS=","}
{print "Emp Id of record number",NR,"is",$1}
END {print "Total number of records:",NR}' employee.txt
Emp Id of record number 1 is 101
Emp Id of record number 2 is 102
Emp Id of record number 3 is 103
Emp Id of record number 4 is 104
Emp Id of record number 5 is 105
Total number of records: 5
]# 

### 在BEGIN塊中NR的值是0
]# awk 'BEGIN {FS=",";print NR}' empname.txt 
0
]#

6. FILENAME - 當(dāng)前處理得文件名

### awk在處理多個文件時沪摄，F(xiàn)ILENAME變量可以顯示當(dāng)前處理得文件名
]# awk '{print FILENAME}' employee.txt emp_one_line.txt 
employee.txt
employee.txt
employee.txt
employee.txt
employee.txt
emp_one_line.txt
]# 

### 沒有輸入文件時躯嫉，F(xiàn)ILENAME的值是-
]# echo "Johe Doe" | awk '{print "Last name:",$2;print "Filename:"FILENAME}'
Last name: Doe
Filename:-
]#

7. FNR - 文件中的NR

### 在處理多個文件時，NR會在多個文件之間持續(xù)疊加
### FNR會在不同文件杨拐，分別疊加行數(shù)
]# awk 'BEGIN{OFS=": "} {print FILENAME,FNR}' employee.txt emp_one_line.txt 
employee.txt: 1
employee.txt: 2
employee.txt: 3
employee.txt: 4
employee.txt: 5
emp_one_line.txt: 1
]#

awk

awk 語法和基礎(chǔ)命令

awk 程序結(jié)構(gòu)

BEGIN 區(qū)域
- BEGIN { awk-commands }
- 最開始階段執(zhí)行僅一次
- 可以一個或多個命令
- 關(guān)鍵字 BEGIN 必須大寫
- 可選
body 區(qū)域
- /pattern/{action}
- 每次讀取一行時都執(zhí)行
- 沒有關(guān)鍵字
END 區(qū)域
- END{ awk-commands }
- 最后階段執(zhí)行僅一次
- 可以一個或多個命令
- 關(guān)鍵字 END 必須大寫
- 可選

# 例子一枚
]# awk 'BEGIN{ FS=":";print("-----header-----")} \
/mail/{print $1} \
END { print "-----footer-----"} ' /etc/passwd

-----header-----
mail
-----footer-----

# 支持輸入多文件, 支持多字符分割
awk -F '[:/]' '/mail/{print $1}' /etc/passwd /etc/group

print 命令

# 不帶參數(shù)祈餐，打印整行數(shù)據(jù)
awk '{print}' <filename>
# 等價于
awk '{print $0}' <filename>

# $<n>, 打印指定字段
awk '{print $2}' <filename>

# $<n>, 打印指定字段
awk '{print $2}' <filename>

# 模式匹配
awk '/pattern/{print $2}' <filename>

awk 內(nèi)置變量

FS - 輸入字段分隔符

默認(rèn)一個或多個空格為輸入分隔符

awk 'BEGIN{ FS=":" }/mail/{print $1}' <filename>
# 等價于
awk -F ':' '/mail/{print $1}' <filename>

# 正則匹配多個分隔符
awk 'BEGIN{ FS="[:/]" }/mail/{print $1}' <filename>

OFS - 輸出字段分隔符

默認(rèn) 空格為輸出字段輸出分隔符

awk 'BEGIN{ FS=":";OFS="||"; }/mail/{print $1,$2}' <filename>

RS - 記錄分隔符

默認(rèn) 換行符為記錄分隔符

# 處理所有數(shù)據(jù)在單行
# 假使數(shù)據(jù)之間以':'隔開的
awk 'BEGIN{ RS=":" }{print $2}' <filename>

ORS - 輸出記錄分隔符

默認(rèn) 換行符為輸出記錄分隔符

# 以 ';' 為ORS
awk 'BEGIN{ ORS=";" }{print $$2}' <filename>

NR - 記錄序號

處理時的記錄序號，重復(fù)處理會疊加

awk -F ':' '{print NR,"is",$1}' <filename>

FNR - 文件中的序號

文件中的記錄序號哄陶，重復(fù)處理不會疊加

awk -F ':' '{print FNR,"is",$1}' <filename>

FILENAME - 當(dāng)前文件名

awk -F ':' '{print FILENAME,$1}' <filename01> <filename02>

awk 變量操作符

變量

$ vi total-company-salary.awk
BEGIN {
    FS=",";
    total=0;
}
{
    print $2 "'s slary is: " $4;
    total=total+$4
}
END {
    print "---\nTotal company salary =$"total;
}

一元操作符

取正 +
取反 -
自增 ++
自減 --

算術(shù)操作符

加 +
減 -
乘 *
除 /
取余 %

字符串操作符

空格: 字符串連接符

str03=str01 str02

賦值操作符

賦值 =
加法賦值 +=
減法賦值 -=
乘法賦值 *=
除法賦值 /=
取模賦值 %=

比較操作符

大于/大于等于 > >=
小于/小于等于 < <=
等于/不等于 == !=
且/或 && ||

正則操作符

匹配 ~
匹配 !~

awk 分支和循環(huán)

if else

if(conditional-expression)
{
    action01;
}
else
{
    action02;
}

三元操作符

BEGIN{
    FS=":";
}
{
    aa=$3==27?$1:$3
    print aa
}

while 循環(huán)

do while 類似

BEGIN{
    FS=":";
}
{
    i=0
    while(i<3)
    {
        print $1
        i++
    }
}

for 循環(huán)

]# echo -e '1 3 5 7\n2 4 6 8' | awk '{for(i=1;i<=NF;i++){total=total+$i;}print total;}'
16
36
]# echo -e '1 3 5 7\n2 4 6 8' | awk '{for(i=1;i<=NF;i++)total=total+$i;}END{print total}'
36
]#

其他

break
continue
exit

awk 關(guān)聯(lián)數(shù)組

引用數(shù)組元素

BEGIN{
  x=item[55];
  item[101]="test_101"
  if ( 55 in item )
  {
    print "if_01>>>"item[55]
  }
  if ( 101 in item )
  {
    print "if_02>>>"item[101]
  }
  if ( 1000 in item )
  {
    print "if_03>>>"item[1000]
  }
}

循環(huán)遍歷數(shù)組

for ( var in arrayname )
    actions

刪除數(shù)組元素

delete arrayname[index];

其他 awk 命令

printf 格式化輸出

printf "%s, %s\n", $2,$ 3
printf "%s, %s\n", $2,$ 3

格式化字符	描述
s	字符串
c	單個字符
d	數(shù)值
e	指數(shù)
f	浮點數(shù)
g	根據(jù)值決定使用 e 或 f 中較短的輸出
o	八進(jìn)制
x	十六進(jìn)制
%	百分號

awk 內(nèi)置數(shù)值函數(shù)

int(n) 取整數(shù)
log(n) 取對數(shù)
sqrt(n) 取正平方根
exp(n) 取 e 的 n 次冪
sin(n) 取 n 的正弦值
cos(n) 取 n 的余弦值

隨機(jī)數(shù)生成器

rand() 產(chǎn)生 0-1 之間的隨機(jī)數(shù)

# 產(chǎn)生10個 0-100 之間的隨機(jī)正整數(shù)
awk 'BEGIN{ while(i<10){print int(rand()*100);i++; } }'

srand(n) 產(chǎn)生 n 開始的隨機(jī)數(shù)

常見字符串函數(shù)

index(str, substr)

substr 在 str 的第幾個位置(1開始)帆阳，如果不存在，返回 0
length(str) str字符串的長度
split(input_str, output_array, separator)
substr(input_str, index, length)

從 input_str 的 index 位置開始取 length 長的字符串

雙向管道

awk 可以使用 |& 和外部進(jìn)程通信屋吨，這個過程是雙向的蜒谤。

BEGIN {
command = "sed 's/Awk/Sed and Awk/'"
print "Awk is Great!" |& command
close(command,"to");
command |& getline tmp
print tmp;
close(command);
}

系統(tǒng)函數(shù)

system(command)

]# awk 'BEGIN{ system("date") }'
Tue Dec 24 20:11:42 CST 2019

getline 命令

執(zhí)行完 getline 命令，會直接讀取下一行數(shù)據(jù)至扰。
會重置 NF NR FNR $0 等內(nèi)置變量

# 打印偶數(shù)行(注: 最后一行也會被打印)
awk '{ getline;print $0; }' items.txt
# 保存在 temp
awk '{ getline temp;print temp; }' items.txt

awk '{ getline temp;print "奇數(shù)",$0;print "偶數(shù)",temp; }' items.txt

# 從其他文件 getline
# 兩個文件內(nèi)容交替打印
awk '{ print $0;getline < "digit.txt";print $0;}' items.txt
# 等價于保存到變量打印
awk '{ print $0;getline tmp < "digit.txt";print tmp;}' items.txt

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末鳍徽，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子敢课，更是在濱河造成了極大的恐慌阶祭，老刑警劉巖，帶你破解...
沈念sama閱讀 206,214評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件直秆，死亡現(xiàn)場離奇詭異濒募，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)圾结，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,307評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門瑰剃，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人疫稿，你說我怎么就攤上這事培他。” “怎么了遗座？”我有些...
開封第一講書人閱讀 152,543評論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵舀凛，是天一觀的道長。經(jīng)常有香客問我途蒋，道長猛遍，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,221評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮懊烤，結(jié)果婚禮上梯醒，老公的妹妹穿的比我還像新娘。我一直安慰自己腌紧，他們只是感情好茸习，可當(dāng)我...
茶點故事閱讀 64,224評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著壁肋，像睡著了一般号胚。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上浸遗，一...
開封第一講書人閱讀 49,007評論 1贊 284
城市分裂傳說
那天猫胁，我揣著相機(jī)與錄音，去河邊找鬼跛锌。笑死弃秆，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的髓帽。我是一名探鬼主播菠赚，決...
沈念sama閱讀 38,313評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼氢卡！你這毒婦竟也來了锈至？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 36,956評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤译秦，失蹤者是張志新（化名）和其女友劉穎峡捡，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體筑悴，經(jīng)...
沈念sama閱讀 43,441評論 1贊 300
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡们拙，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 35,925評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了阁吝。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片砚婆。...
茶點故事閱讀 38,018評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖突勇，靈堂內(nèi)的尸體忽然破棺而出装盯，到底是詐尸還是另有隱情，我是刑警寧澤甲馋，帶...
沈念sama閱讀 33,685評論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布埂奈，位于F島的核電站，受9級特大地震影響定躏，放射性物質(zhì)發(fā)生泄漏账磺。R本人自食惡果不足惜芹敌，卻給世界環(huán)境...
茶點故事閱讀 39,234評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望垮抗。院中可真熱鬧氏捞，春花似錦、人聲如沸冒版。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,240評論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽辞嗡。三九已至豁护，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間欲间，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,464評論 1贊 261
情欲美人皮
我被黑心中介騙來泰國打工断部，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留猎贴，地道東北人。一個月前我還...
沈念sama閱讀 45,467評論 2贊 352
代替公主和親
正文我出身青樓蝴光，卻偏偏與公主長得像她渴，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子蔑祟，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 42,762評論 2贊 345

awk 總結(jié)

寫在前面

awk 基本使用

1. 程序結(jié)構(gòu)

2. 執(zhí)行多個文件

3. 打印命令 print

4. 模式匹配

awk 內(nèi)置變量

1. FS - 輸入字段分隔符

2. OFS - 輸出字段分隔符

3. RS - 記錄分隔符

4. ORS - 輸出記錄分隔符

5. NR - 記錄序號

6. FILENAME - 當(dāng)前處理得文件名

7. FNR - 文件中的NR

awk

awk 語法和基礎(chǔ)命令

awk 程序結(jié)構(gòu)

print 命令

awk 內(nèi)置變量

FS - 輸入字段分隔符

OFS - 輸出字段分隔符

RS - 記錄分隔符

ORS - 輸出記錄分隔符

NR - 記錄序號

FNR - 文件中的序號

FILENAME - 當(dāng)前文件名

awk 變量操作符

變量

一元操作符

算術(shù)操作符

字符串操作符

賦值操作符

比較操作符

正則操作符

awk 分支和循環(huán)

if else

三元操作符

while 循環(huán)

for 循環(huán)

其他

awk 關(guān)聯(lián)數(shù)組

引用數(shù)組元素

循環(huán)遍歷數(shù)組

刪除數(shù)組元素

其他 awk 命令

printf 格式化輸出

awk 內(nèi)置數(shù)值函數(shù)

隨機(jī)數(shù)生成器

常見字符串函數(shù)

雙向管道

系統(tǒng)函數(shù)

getline 命令

推薦閱讀更多精彩內(nèi)容