Linux之文本處理軟件awk

awk默認(rèn)是以行為單位處理文本的角溃,對test.txt中的每一行都執(zhí)行后面 "{ }" 中的語句望抽。

  • 若有一個需要重新格式化的字典test.txt(用戶名溪窒、密碼夯接、地址):
    xiaosan sadasdw jiaozuo
    234wer  asdfasd asdas
    1111    aaaa    cccc
    2222    aaaa    degd
    1111    aaaa    cccc
    3333    aaaa    dfger
    21asd   sdfsd   sadasd
    dwqx    asds    sasdfcv
  • 要求:
    1.里面有重復(fù)數(shù)據(jù)闲擦,使用命令去重
    2.提取出用戶名和密碼 每一行前面加上id數(shù)字慢味,遞增。
    3.只提取出密碼作為爆破字典
    4.某些公司都是一個公司前綴+姓名簡寫墅冷,所以為用戶名一欄全部改為uv_用戶名
    5.提取出密碼一列纯路,有些密碼爆破成功率高,所以增加一列寞忿,標(biāo)出密碼出現(xiàn)次數(shù)

去重:

[wyb@localhost ~]$ cat test.txt | awk '!a[$1]++'
[wyb@localhost ~]$ cat test.txt | uniq //作用和上面命令相同
aosan sadasdw jiaozuo
234wer  asdfasd asdas
1111    aaaa    cccc
2222    aaaa    degd
3333    aaaa    dfger
21asd   sdfsd   sadasd
dwqx    asds    sasdfcv

去重驰唬、添加id:

一般字典不需要id、user、pass等標(biāo)示符叫编,這里只是為了便于觀看

[wyb@localhost ~]$ cat test.txt | awk '!a[$1]++' | awk -F '\t' '{print "id:"NR"\tuser:"$1"\tpass:"$2"\taddress:"$3}' | column -t  //最后一個命令可以將列對齊
id:1    user:aosan      pass:sadasdw    address:jiaozuo
id:2    user:234wer     pass:asdfasd    address:asdas
id:3    user:1111       pass:aaaa       address:cccc
id:4    user:2222       pass:aaaa       address:degd
id:5    user:3333       pass:aaaa       address:dfger
id:6    user:21asd      pass:sdfsd      address:sadasd
id:7    user:dwqx       pass:asds       address:sasdfcv

去重辖佣、添加id、添加公司前綴:

[wyb@localhost ~]$ cat test.txt | awk '!a[$1]++' | awk -F '\t' '{print "id:"NR"\tuser:uv_"$1"\tpass:"$2"\taddress:"$3}'
id:1    user:uv_aosan   pass:sadasdw    address:jiaozuo
id:2    user:uv_234wer  pass:asdfasd    address:asdas
id:3    user:uv_1111    pass:aaaa       address:cccc
id:4    user:uv_2222    pass:aaaa       address:degd
id:5    user:uv_3333    pass:aaaa       address:dfger
id:6    user:uv_21asd   pass:sdfsd      address:sadasd
id:7    user:uv_dwqx    pass:asds       address:sasdfcv

去重然后輸出密碼:

[wyb@localhost ~]$ cat test.txt | awk '!a[$1]++' | awk -F '\t' '{print "pass:"$2}'
pass:sadasdw
pass:asdfasd
pass:aaaa
pass:aaaa
pass:aaaa
pass:sdfsd
pass:asds

輸出密碼搓逾、得到密碼出現(xiàn)次數(shù):

下面的'a[$1]++'是按第一列來去重的,若有兩條數(shù)據(jù)只有第一列重復(fù)則成功卷谈,可以用$0按行來去重
[wyb@localhost ~]$ cat test.txt | awk '!a[$1]++' | awk -F '\t' '{print $2}' | awk '{a[$1]++} END {for (j in a) print a[j],j}'
1 sadasdw
1 sdfsd
1 asdfasd
1 asds
3 aaaa

uniq 只能去除挨著的重復(fù)數(shù)據(jù),所以先sort升序排序霞篡,然后uniq -c統(tǒng)計重復(fù)世蔗,再sort -r降序排序
cat test.txt | awk '{print $2}' | sed '1d' |sort | uniq -c |sort -r

其他:

對'!a[$1]++'的解釋如下:

  • a[e54r56wer]為空,!a[e54r56wer]為真朗兵,可以輸出污淋,然后++
  • 若再來一個a[e54r56wer],因為上一步已經(jīng)++余掖,此時值為1寸爆,!a[e54r56wer]為假,不輸出盐欺,再++

對for輸出數(shù)組的解釋如下:

  awk '{a[$1]++} END {for (j in a) print a[j],j}' test.txt
  • 在遍歷完文件后而昨,通過END把后面的句子連起來
  • for (j in a) 是指打印數(shù)組a的下標(biāo),并定義下標(biāo)為變量j
  • 最后print a[j],j就是打印數(shù)組下標(biāo)和數(shù)組找田,這樣就相同的$1排重并計數(shù)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末歌憨,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子墩衙,更是在濱河造成了極大的恐慌务嫡,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,692評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件漆改,死亡現(xiàn)場離奇詭異心铃,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)挫剑,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,482評論 3 392
  • 文/潘曉璐 我一進(jìn)店門去扣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人樊破,你說我怎么就攤上這事愉棱。” “怎么了哲戚?”我有些...
    開封第一講書人閱讀 162,995評論 0 353
  • 文/不壞的土叔 我叫張陵奔滑,是天一觀的道長。 經(jīng)常有香客問我顺少,道長朋其,這世上最難降的妖魔是什么王浴? 我笑而不...
    開封第一講書人閱讀 58,223評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮梅猿,結(jié)果婚禮上氓辣,老公的妹妹穿的比我還像新娘。我一直安慰自己袱蚓,他們只是感情好筛婉,可當(dāng)我...
    茶點故事閱讀 67,245評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著癞松,像睡著了一般爽撒。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上响蓉,一...
    開封第一講書人閱讀 51,208評論 1 299
  • 那天硕勿,我揣著相機(jī)與錄音,去河邊找鬼枫甲。 笑死源武,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的想幻。 我是一名探鬼主播粱栖,決...
    沈念sama閱讀 40,091評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼脏毯!你這毒婦竟也來了闹究?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,929評論 0 274
  • 序言:老撾萬榮一對情侶失蹤食店,失蹤者是張志新(化名)和其女友劉穎渣淤,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體吉嫩,經(jīng)...
    沈念sama閱讀 45,346評論 1 311
  • 正文 獨居荒郊野嶺守林人離奇死亡价认,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,570評論 2 333
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了自娩。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片用踩。...
    茶點故事閱讀 39,739評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖忙迁,靈堂內(nèi)的尸體忽然破棺而出脐彩,到底是詐尸還是另有隱情,我是刑警寧澤动漾,帶...
    沈念sama閱讀 35,437評論 5 344
  • 正文 年R本政府宣布丁屎,位于F島的核電站荠锭,受9級特大地震影響旱眯,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,037評論 3 326
  • 文/蒙蒙 一删豺、第九天 我趴在偏房一處隱蔽的房頂上張望共虑。 院中可真熱鬧,春花似錦呀页、人聲如沸妈拌。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,677評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽尘分。三九已至,卻和暖如春丸氛,著一層夾襖步出監(jiān)牢的瞬間培愁,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,833評論 1 269
  • 我被黑心中介騙來泰國打工缓窜, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留定续,地道東北人。 一個月前我還...
    沈念sama閱讀 47,760評論 2 369
  • 正文 我出身青樓禾锤,卻偏偏與公主長得像私股,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子恩掷,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,647評論 2 354

推薦閱讀更多精彩內(nèi)容

  • ¥開啟¥ 【iAPP實現(xiàn)進(jìn)入界面執(zhí)行逐一顯】 〖2017-08-25 15:22:14〗 《//首先開一個線程倡鲸,因...
    小菜c閱讀 6,402評論 0 17
  • 個人學(xué)習(xí)批處理的初衷來源于實際工作;在某個迭代版本有個BS(安卓手游模擬器)大需求黄娘,從而在測試過程中就重復(fù)涉及到...
    Luckykailiu閱讀 4,717評論 0 11
  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理旦签,服務(wù)發(fā)現(xiàn),斷路器寸宏,智...
    卡卡羅2017閱讀 134,652評論 18 139
  • 1. Java基礎(chǔ)部分 基礎(chǔ)部分的順序:基本語法宁炫,類相關(guān)的語法,內(nèi)部類的語法氮凝,繼承相關(guān)的語法羔巢,異常的語法,線程的語...
    子非魚_t_閱讀 31,623評論 18 399
  • WIN+R
    hey_沙子閱讀 2,088評論 0 9