awk常用基礎命令(ing)

Awk

1. 打印文件的某列:

awk '{print $2}' handdata
注:handdata為文件名,其中的$1..$n表示第幾例着茸。注:$0表示整個行

2. 過濾記錄:

awk '$2==0 ' handdata
注:篩選出第二列為零的
awk '$2==0 && $3>10' handdata
注:篩選出第二列等于0贮泞,第三列>10的
篩選等于字符串的條件需要用雙引號
awk '$2==”xxx”' handdata
awk '$2==0 && $3>10 {print $0}' handdata
注:篩選出第二列等于0蘸鲸,第三列>10的后荤堪,打印全部
如果我們需要表頭的話谜喊,我們可以引入內(nèi)建變量NR
Eg:awk '$2==0 && $3>10 || NR==1' handdata

3. awk指定分隔符

FS : 輸入字段分隔符顺少,默認空白(空格或者tab)朋其。
RS : 輸入行分隔符,默認\n脆炎。
OFS : 輸出字段分隔符梅猿,默認空格。
ORS : 輸出行分隔符秒裕,默認\n
cat tcomvv160907 |awk -F"\t" '{print $16}'|more
打印 tcomvv160907文件按\t分割的第十六列
cat tcomvv160907 |awk -F"\t" '$16==0 {print $0}'
指定輸入輸出分隔符
head -n 5000 part-m-00000 |awk 'BEGIN{FS="\001";OFS="\t"} $30 == "電子商務" {print $1,$30}'
代碼中輸入分隔符為\001,輸出分隔符為\t
統(tǒng)計某一列不重復的數(shù)量
awk -F"\001" '{cnt[$19]=1}END{print length(cnt)}' part-m-00000

4.對列求和:

cat session160905new|awk '{sum+=$2} END {print "Sum = ", sum}'

5.或操作

驗證第三個字的值是否在1-20范圍內(nèi)袱蚓,可以打印出不符合要求的數(shù)據(jù)來驗證,使用了默認處理{print $0}(不指定Action則使用默認的Action):
awk -F',' '$3<1 || $3>20' data.csv

6.處理一個大日志文件几蜻,只想隨機抽取其中一些樣本來進行分析

awk 'rand()<0.1' log.csv > sample.csv
在模式中喇潘,使用了rand()函數(shù)來隨機產(chǎn)生0,1之間的小數(shù),只有當前產(chǎn)生的值小于0.1才打印當前行梭稚,即只隨機抽取10%的數(shù)據(jù)作為樣本响蓉。

7.倒數(shù)

打印日志的字段數(shù)使用變量NF,最后一列數(shù)據(jù)使用變量$NF哨毁,倒數(shù)第二列使用$(NF-1):
$ awk '{print NF, $NF枫甲,$(NF-1)}' log.csv

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市扼褪,隨后出現(xiàn)的幾起案子想幻,更是在濱河造成了極大的恐慌,老刑警劉巖话浇,帶你破解...
    沈念sama閱讀 216,591評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件脏毯,死亡現(xiàn)場離奇詭異,居然都是意外死亡幔崖,警方通過查閱死者的電腦和手機食店,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,448評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來赏寇,“玉大人吉嫩,你說我怎么就攤上這事⌒岫ǎ” “怎么了自娩?”我有些...
    開封第一講書人閱讀 162,823評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長渠退。 經(jīng)常有香客問我忙迁,道長脐彩,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,204評論 1 292
  • 正文 為了忘掉前任姊扔,我火速辦了婚禮惠奸,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘恰梢。我一直安慰自己晨川,他們只是感情好,可當我...
    茶點故事閱讀 67,228評論 6 388
  • 文/花漫 我一把揭開白布删豺。 她就那樣靜靜地躺著,像睡著了一般愧怜。 火紅的嫁衣襯著肌膚如雪呀页。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,190評論 1 299
  • 那天拥坛,我揣著相機與錄音蓬蝶,去河邊找鬼。 笑死猜惋,一個胖子當著我的面吹牛丸氛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播著摔,決...
    沈念sama閱讀 40,078評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼缓窜,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了谍咆?” 一聲冷哼從身側(cè)響起禾锤,我...
    開封第一講書人閱讀 38,923評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎摹察,沒想到半個月后恩掷,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,334評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡供嚎,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,550評論 2 333
  • 正文 我和宋清朗相戀三年黄娘,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片克滴。...
    茶點故事閱讀 39,727評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡逼争,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出劝赔,到底是詐尸還是另有隱情氮凝,我是刑警寧澤,帶...
    沈念sama閱讀 35,428評論 5 343
  • 正文 年R本政府宣布望忆,位于F島的核電站罩阵,受9級特大地震影響竿秆,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜稿壁,卻給世界環(huán)境...
    茶點故事閱讀 41,022評論 3 326
  • 文/蒙蒙 一幽钢、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧傅是,春花似錦匪燕、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,672評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至书闸,卻和暖如春尼变,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背浆劲。 一陣腳步聲響...
    開封第一講書人閱讀 32,826評論 1 269
  • 我被黑心中介騙來泰國打工嫌术, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人牌借。 一個月前我還...
    沈念sama閱讀 47,734評論 2 368
  • 正文 我出身青樓度气,卻偏偏與公主長得像,于是被迫代替她去往敵國和親膨报。 傳聞我的和親對象是個殘疾皇子磷籍,可洞房花燭夜當晚...
    茶點故事閱讀 44,619評論 2 354

推薦閱讀更多精彩內(nèi)容

  • awk介紹awk變量printf命令:實現(xiàn)格式化輸出操作符awk patternawk actionawk數(shù)組aw...
    哈嘍別樣閱讀 1,564評論 0 4
  • 轉(zhuǎn)載 原文的排版和內(nèi)容都更加友好,并且詳細,我只是在這里貼出了一部分留作自己以后參考和學習,如希望更詳細了解AWK...
    XKirk閱讀 3,214評論 2 25
  • awk:報告生成器,格式化文本輸出 內(nèi)容: awk介紹 awk基本用法 awk變量 awk格式化 awk操作符 a...
    BossHuang閱讀 1,456評論 0 9
  • awk命令的基本使用 [root@shellscript ~]# head -n 3 /etc/passwd | ...
    古寒飛閱讀 1,064評論 0 2
  • 本章主要學習內(nèi)容awk介紹 ?awk基本用法 ?awk變量 ?awk格式化 ?awk操作符 ?awk條件判斷 ?a...
    楠人幫閱讀 1,269評論 0 8