Linux之文本處理軟件awk

awk默認(rèn)是以行為單位處理文本的角溃，對test.txt中的每一行都執(zhí)行后面 "{ }" 中的語句望抽。

若有一個需要重新格式化的字典test.txt(用戶名溪窒、密碼夯接、地址)：

    xiaosan sadasdw jiaozuo
    234wer  asdfasd asdas
    1111    aaaa    cccc
    2222    aaaa    degd
    1111    aaaa    cccc
    3333    aaaa    dfger
    21asd   sdfsd   sadasd
    dwqx    asds    sasdfcv

要求：

    1.里面有重復(fù)數(shù)據(jù)闲擦，使用命令去重
    2.提取出用戶名和密碼 每一行前面加上id數(shù)字慢味，遞增。
    3.只提取出密碼作為爆破字典
    4.某些公司都是一個公司前綴+姓名簡寫墅冷，所以為用戶名一欄全部改為uv_用戶名
    5.提取出密碼一列纯路，有些密碼爆破成功率高，所以增加一列寞忿，標(biāo)出密碼出現(xiàn)次數(shù)

去重：

[wyb@localhost ~]$ cat test.txt | awk '!a[$1]++'
[wyb@localhost ~]$ cat test.txt | uniq //作用和上面命令相同
aosan sadasdw jiaozuo
234wer  asdfasd asdas
1111    aaaa    cccc
2222    aaaa    degd
3333    aaaa    dfger
21asd   sdfsd   sadasd
dwqx    asds    sasdfcv

去重驰唬、添加id：

一般字典不需要id、user、pass等標(biāo)示符叫编，這里只是為了便于觀看

[wyb@localhost ~]$ cat test.txt | awk '!a[$1]++' | awk -F '\t' '{print "id:"NR"\tuser:"$1"\tpass:"$2"\taddress:"$3}' | column -t  //最后一個命令可以將列對齊
id:1    user:aosan      pass:sadasdw    address:jiaozuo
id:2    user:234wer     pass:asdfasd    address:asdas
id:3    user:1111       pass:aaaa       address:cccc
id:4    user:2222       pass:aaaa       address:degd
id:5    user:3333       pass:aaaa       address:dfger
id:6    user:21asd      pass:sdfsd      address:sadasd
id:7    user:dwqx       pass:asds       address:sasdfcv

去重辖佣、添加id、添加公司前綴：

[wyb@localhost ~]$ cat test.txt | awk '!a[$1]++' | awk -F '\t' '{print "id:"NR"\tuser:uv_"$1"\tpass:"$2"\taddress:"$3}'
id:1    user:uv_aosan   pass:sadasdw    address:jiaozuo
id:2    user:uv_234wer  pass:asdfasd    address:asdas
id:3    user:uv_1111    pass:aaaa       address:cccc
id:4    user:uv_2222    pass:aaaa       address:degd
id:5    user:uv_3333    pass:aaaa       address:dfger
id:6    user:uv_21asd   pass:sdfsd      address:sadasd
id:7    user:uv_dwqx    pass:asds       address:sasdfcv

去重然后輸出密碼：

[wyb@localhost ~]$ cat test.txt | awk '!a[$1]++' | awk -F '\t' '{print "pass:"$2}'
pass:sadasdw
pass:asdfasd
pass:aaaa
pass:aaaa
pass:aaaa
pass:sdfsd
pass:asds

輸出密碼搓逾、得到密碼出現(xiàn)次數(shù)：

下面的'a[$1]++'是按第一列來去重的,若有兩條數(shù)據(jù)只有第一列重復(fù)則成功卷谈，可以用$0按行來去重
[wyb@localhost ~]$ cat test.txt | awk '!a[$1]++' | awk -F '\t' '{print $2}' | awk '{a[$1]++} END {for (j in a) print a[j],j}'
1 sadasdw
1 sdfsd
1 asdfasd
1 asds
3 aaaa

uniq 只能去除挨著的重復(fù)數(shù)據(jù)，所以先sort升序排序霞篡，然后uniq -c統(tǒng)計重復(fù)世蔗，再sort -r降序排序
cat test.txt | awk '{print $2}' | sed '1d' |sort | uniq -c |sort -r

其他：

對'!a[$1]++'的解釋如下：

a[e54r56wer]為空，!a[e54r56wer]為真朗兵，可以輸出污淋，然后++
若再來一個a[e54r56wer]，因為上一步已經(jīng)++余掖，此時值為1寸爆，!a[e54r56wer]為假，不輸出盐欺，再++

對for輸出數(shù)組的解釋如下：

  awk '{a[$1]++} END {for (j in a) print a[j],j}' test.txt

在遍歷完文件后而昨，通過END把后面的句子連起來
for (j in a) 是指打印數(shù)組a的下標(biāo)，并定義下標(biāo)為變量j
最后print a[j],j就是打印數(shù)組下標(biāo)和數(shù)組找田，這樣就相同的$1排重并計數(shù)

最后編輯于：2017.12.03 08:25:00

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末歌憨，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子墩衙，更是在濱河造成了極大的恐慌务嫡，老刑警劉巖，帶你破解...
沈念sama閱讀 216,692評論 6贊 501
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件漆改，死亡現(xiàn)場離奇詭異心铃，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)挫剑，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,482評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門去扣，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人樊破，你說我怎么就攤上這事愉棱。” “怎么了哲戚？”我有些...
開封第一講書人閱讀 162,995評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵奔滑，是天一觀的道長。經(jīng)常有香客問我顺少，道長朋其，這世上最難降的妖魔是什么王浴？我笑而不...
開封第一講書人閱讀 58,223評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮梅猿，結(jié)果婚禮上氓辣，老公的妹妹穿的比我還像新娘。我一直安慰自己袱蚓，他們只是感情好筛婉，可當(dāng)我...
茶點故事閱讀 67,245評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著癞松，像睡著了一般爽撒。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上响蓉，一...
開封第一講書人閱讀 51,208評論 1贊 299
城市分裂傳說
那天硕勿，我揣著相機(jī)與錄音，去河邊找鬼枫甲。笑死源武，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的想幻。我是一名探鬼主播粱栖，決...
沈念sama閱讀 40,091評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼脏毯！你這毒婦竟也來了闹究？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 38,929評論 0贊 274
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤食店，失蹤者是張志新（化名）和其女友劉穎渣淤，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體吉嫩，經(jīng)...
沈念sama閱讀 45,346評論 1贊 311
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡价认，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,570評論 2贊 333
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了自娩。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片用踩。...
茶點故事閱讀 39,739評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖忙迁，靈堂內(nèi)的尸體忽然破棺而出脐彩，到底是詐尸還是另有隱情，我是刑警寧澤动漾，帶...
沈念sama閱讀 35,437評論 5贊 344
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布丁屎，位于F島的核電站荠锭，受9級特大地震影響旱眯，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,037評論 3贊 326
男人毒藥：我在死后第九天來索命
文/蒙蒙一删豺、第九天我趴在偏房一處隱蔽的房頂上張望共虑。院中可真熱鬧，春花似錦呀页、人聲如沸妈拌。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,677評論 0贊 22
一樁弒父案蓬蝶，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽尘分。三九已至，卻和暖如春丸氛，著一層夾襖步出監(jiān)牢的瞬間培愁，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,833評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工缓窜，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留定续，地道東北人。一個月前我還...
沈念sama閱讀 47,760評論 2贊 369
代替公主和親
正文我出身青樓禾锤，卻偏偏與公主長得像私股，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子恩掷，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,647評論 2贊 354

Linux之文本處理軟件awk

去重：

去重驰唬、添加id：

去重辖佣、添加id、添加公司前綴：

去重然后輸出密碼：

輸出密碼搓逾、得到密碼出現(xiàn)次數(shù)：

其他：

對'!a[$1]++'的解釋如下：

對for輸出數(shù)組的解釋如下：

推薦閱讀更多精彩內(nèi)容