13Linux 基礎(chǔ)入門(mén)--正則表達(dá)式基礎(chǔ)

正則表達(dá)式基礎(chǔ)

正則表達(dá)式

什么是正則表達(dá)式呢涯贞？
正則表達(dá)式辜纲，又稱(chēng)正規(guī)表示式、正規(guī)表示法、正規(guī)表達(dá)式兵志、規(guī)則表達(dá)式、常規(guī)表示法（英語(yǔ)：Regular Expression悲敷，在代碼中常簡(jiǎn)寫(xiě)為 regex馁龟、regexp 或 RE），計(jì)算機(jī)科學(xué)的一個(gè)概念傀缩。正則表達(dá)式使用單個(gè)字符串來(lái)描述那先、匹配一系列符合某個(gè)句法規(guī)則的字符串。在很多文本編輯器里赡艰，正則表達(dá)式通常被用來(lái)檢索售淡、替換那些符合某個(gè)模式的文本。
許多程序設(shè)計(jì)語(yǔ)言都支持利用正則表達(dá)式進(jìn)行字符串操作慷垮。例如揖闸，在 Perl 中就內(nèi)建了一個(gè)功能強(qiáng)大的正則表達(dá)式引擎。正則表達(dá)式這個(gè)概念最初是由 UNIX 中的工具軟件（例如sed和grep）普及開(kāi)的料身。正則表達(dá)式通程乐剑縮寫(xiě)成“regex”，單數(shù)有 regexp芹血、regex贮泞，復(fù)數(shù)有 regexps、regexes幔烛、regexen啃擦。

簡(jiǎn)單的說(shuō)形式和功能上正則表達(dá)式和我們前面講的通配符很像，不過(guò)它們之間又有很大差別饿悬，特別在于一些特殊的匹配字符的含義上议惰，希望初學(xué)者注意不要將兩者弄混淆。

舉例

假設(shè)我們有這樣一個(gè)文本文件乡恕，包含 shiyanlou 和 shilouyan 這兩個(gè)字符串言询，同樣一個(gè)表達(dá)式：

shi*

如果這作為一個(gè)正則表達(dá)式，它將只能匹配 shi傲宜，而如果不是作為正則表達(dá)式 * 作為一個(gè)通配符运杭，則將同時(shí)匹配這兩個(gè)字符串。這是為什么呢函卒？因?yàn)樵谡齽t表達(dá)式中 * 表示匹配前面的子表達(dá)式（這里就是它前面一個(gè)字符）零次或多次辆憔，比如它可以匹配 sh，shii，shish虱咧，shiishi 等等熊榛，而作為通配符表示匹配通配符后面任意多個(gè)任意字符，所以它可以匹配 shiyanlou 和 shilouyan 兩個(gè)字符腕巡。

基本語(yǔ)法

一個(gè)正則表達(dá)式通常被稱(chēng)為一個(gè)模式（pattern）玄坦，為用來(lái)描述或者匹配一系列符合某個(gè)句法規(guī)則的字符串。
選擇
| 豎直分隔符表示選擇绘沉，例如 boy|girl 可以匹配 boy 或者 girl煎楣。
數(shù)量限定
數(shù)量限定除了我們舉例用的 * 還有 + 加號(hào) ? 問(wèn)號(hào)，如果在一個(gè)模式中不加數(shù)量限定符則表示出現(xiàn)一次且僅出現(xiàn)一次：
+ 表示前面的字符必須出現(xiàn)至少一次(1 次或多次)车伞，例如 goo+gle 可以匹配 gooogle择懂，goooogle 等；
? 表示前面的字符最多出現(xiàn)一次（0 次或 1 次）另玖，例如困曙，colou?r，可以匹配 color 或者 colour;
* 星號(hào)代表前面的字符可以不出現(xiàn)谦去，也可以出現(xiàn)一次或者多次（0 次慷丽、或 1 次、或多次）哪轿，例如，0*42 可以匹配 42翔怎、042窃诉、0042、00042 等赤套。
范圍和優(yōu)先級(jí)
() 圓括號(hào)可以用來(lái)定義模式字符串的范圍和優(yōu)先級(jí)飘痛，這可以簡(jiǎn)單的理解為是否將括號(hào)內(nèi)的模式串作為一個(gè)整體。例如容握，gr(a|e)y 等價(jià)于 gray|grey宣脉，（這里體現(xiàn)了優(yōu)先級(jí)，豎直分隔符用于選擇 a 或者 e 而不是 gra 和 ey）剔氏，(grand)?father 匹配 father 和 grandfather（這里體現(xiàn)了范圍塑猖，? 將圓括號(hào)內(nèi)容作為一個(gè)整體匹配）。
語(yǔ)法（部分）
正則表達(dá)式有多種不同的風(fēng)格谈跛，下面列舉一些常用的作為 PCRE 子集的適用于 perl 和 python 編程語(yǔ)言及 grep 或 egrep 的正則表達(dá)式匹配規(guī)則：
PCRE（Perl Compatible Regular Expressions 中文含義：perl 語(yǔ)言兼容正則表達(dá)式）是一個(gè)用 C 語(yǔ)言編寫(xiě)的正則表達(dá)式函數(shù)庫(kù)羊苟，由菲利普.海澤(Philip Hazel)編寫(xiě)。PCRE 是一個(gè)輕量級(jí)的函數(shù)庫(kù)感憾，比 Boost 之類(lèi)的正則表達(dá)式庫(kù)小得多蜡励。PCRE 十分易用，同時(shí)功能也很強(qiáng)大，性能超過(guò)了 POSIX 正則表達(dá)式庫(kù)和一些經(jīng)典的正則表達(dá)式庫(kù)凉倚。

image.png

優(yōu)先級(jí)
優(yōu)先級(jí)為從上到下從左到右兼都，依次降低：

image.png

更多正則表達(dá)式的內(nèi)容可以參考以下鏈接：
正則表達(dá)式 wiki
幾種正則表達(dá)式引擎的語(yǔ)法差異
各語(yǔ)言各平臺(tái)對(duì)正則表達(dá)式的支持
regex 的思導(dǎo)圖：

image.png

grep 模式匹配命令

上面空談了那么多正則表達(dá)式的內(nèi)容也并沒(méi)有提及具體該如何使用它，實(shí)在枯燥稽寒，如果說(shuō)正則表達(dá)式是一門(mén)武功扮碧，那它也只能算得上一些口訣招式罷了，要把它真正練起來(lái)還得需要一些兵器在手才行瓦胎，這里我們要介紹的 grep 命令以及后面要講的 sed芬萍，awk 這些就該算作是這樣的兵器了。

基本操作

grep 命令用于打印輸出文本中匹配的模式串搔啊，它使用正則表達(dá)式作為模式匹配的條件柬祠。grep 支持三種正則表達(dá)式引擎，分別用三個(gè)參數(shù)指定：

image.png

不過(guò)在你沒(méi)學(xué)過(guò) perl 語(yǔ)言的大多數(shù)情況下你將只會(huì)使用到 ERE 和 BRE负芋，所以我們接下來(lái)的內(nèi)容都不會(huì)討論到 PCRE 中特有的一些正則表達(dá)式語(yǔ)法（它們之間大部分內(nèi)容是存在交集的漫蛔，所以你不用擔(dān)心會(huì)遺漏多少重要內(nèi)容）。
在通過(guò)grep命令使用正則表達(dá)式之前旧蛾，先介紹一下它的常用參數(shù)：

image.png

注：在大多數(shù)發(fā)行版中是默認(rèn)設(shè)置了 grep 的顏色的莽龟，你可以通過(guò)參數(shù)指定或修改GREP_COLOR環(huán)境變量。

image.png

使用正則表達(dá)式

使用基本正則表達(dá)式锨天，BRE
位置
查找 /etc/group 文件中以 shiyanlou 為開(kāi)頭的行

grep 'shiyanlou' /etc/group
grep '^shiyanlou' /etc/group

數(shù)量

# 將匹配以'z'開(kāi)頭以'o'結(jié)尾的所有字符串
echo 'zero\nzo\nzoo' | grep 'z.*o'
# 將匹配以'z'開(kāi)頭以'o'結(jié)尾毯盈，中間包含一個(gè)任意字符的字符串
echo 'zero\nzo\nzoo' | grep 'z.o'
# 將匹配以'z'開(kāi)頭，以任意多個(gè)'o'結(jié)尾的字符串
echo 'zero\nzo\nzoo' | grep 'zo*'

選擇

# grep默認(rèn)是區(qū)分大小寫(xiě)的病袄，這里將匹配所有的小寫(xiě)字母
echo '1234\nabcd' | grep '[a-z]'
# 將匹配所有的數(shù)字
echo '1234\nabcd' | grep '[0-9]'
# 將匹配所有的數(shù)字
echo '1234\nabcd' | grep '[[:digit:]]'
# 將匹配所有的小寫(xiě)字母
echo '1234\nabcd' | grep '[[:lower:]]'
# 將匹配所有的大寫(xiě)字母
echo '1234\nabcd' | grep '[[:upper:]]'
# 將匹配所有的字母和數(shù)字搂赋，包括0-9，a-z益缠，A-Z
echo '1234\nabcd' | grep '[[:alnum:]]'
# 將匹配所有的字母
echo '1234\nabcd' | grep '[[:alpha:]]'

下面包含完整的特殊符號(hào)及說(shuō)明：

image.png

注意：之所以要使用特殊符號(hào)脑奠，是因?yàn)樯厦娴?[a-z] 不是在所有情況下都管用，這還與主機(jī)當(dāng)前的語(yǔ)系有關(guān)幅慌，即設(shè)置在 LANG 環(huán)境變量的值宋欺，zh_CN.UTF-8 的話(huà) [a-z]，即為所有小寫(xiě)字母胰伍，其它語(yǔ)系可能是大小寫(xiě)交替的如齿诞，"a A b B...z Z"，[a-z] 中就可能包含大寫(xiě)字母骂租。所以在使用 [a-z] 時(shí)請(qǐng)確保當(dāng)前語(yǔ)系的影響掌挚，使用 [:lower:] 則不會(huì)有這個(gè)問(wèn)題。

# 排除字符
echo 'geek\ngood' | grep '[^o]'

當(dāng) ^ 放到中括號(hào)內(nèi)為排除字符菩咨，否則表示行首吠式。

image.png

使用擴(kuò)展正則表達(dá)式陡厘，ERE
要通過(guò) grep 使用擴(kuò)展正則表達(dá)式需要加上 -E 參數(shù)，或使用 egrep特占。
數(shù)量

# 只匹配"zo"
echo 'zero\nzo\nzoo' | grep -E 'zo{1}'
# 匹配以"zo"開(kāi)頭的所有單詞
echo 'zero\nzo\nzoo' | grep -E 'zo{1,}'

推薦掌握 {n,m} 即可 +糙置，?，* 這幾個(gè)不太直觀是目，且容易弄混淆谤饭。
選擇

# 匹配"www.shiyanlou.com"和"www.google.com"
echo 'www.shiyanlou.com\nwww.baidu.com\nwww.google.com' | grep -E 'www\.(shiyanlou|google)\.com'
# 或者匹配不包含"baidu"的內(nèi)容
echo 'www.shiyanlou.com\nwww.baidu.com\nwww.google.com' | grep -Ev 'www\.baidu\.com'

因?yàn)?. 號(hào)有特殊含義，所以需要轉(zhuǎn)義懊纳。

sed 流編輯器

sed 工具在 man 手冊(cè)里面的全名為"sed - stream editor for filtering and transforming text "揉抵，意即，用于過(guò)濾和轉(zhuǎn)換文本的流編輯器嗤疯。
在 Linux/UNIX 的世界里敢稱(chēng)為編輯器的工具冤今，大都非等閑之輩，比如前面的 vi/vim（編輯器之神）茂缚，emacs（神的編輯器）戏罢，gedit 這些編輯器。sed 與上述的最大不同之處在于它是一個(gè)非交互式的編輯器脚囊，下面我們就開(kāi)始介紹 sed 這個(gè)編輯器龟糕。

sed 常用參數(shù)介紹

sed 命令基本格式：

sed [參數(shù)]... [執(zhí)行命令] [輸入文件]...
# 形如：
$ sed -i 's/sad/happy/' test # 表示將test文件中的"sad"替換為"happy"

image.png

sed 編輯器的執(zhí)行命令（這里”執(zhí)行“解釋為名詞）

sed 執(zhí)行命令格式：

[n1][,n2]command
[n1][~step]command

其中一些命令可以在后面加上作用范圍，形如：

sed -i 's/sad/happy/g' test # g 表示全局范圍
sed -i 's/sad/happy/4' test # 4 表示指定行中的第四個(gè)匹配字符串

其中 n1,n2 表示輸入內(nèi)容的行號(hào)悔耘，它們之間為 , 逗號(hào)則表示從 n1 到 n2 行讲岁，如果為 ~ 波浪號(hào)則表示從 n1 開(kāi)始以 step 為步進(jìn)的所有行；command 為執(zhí)行動(dòng)作衬以，下面為一些常用動(dòng)作指令：

image.png

sed 操作舉例

我們先找一個(gè)用于練習(xí)的文本文件：

cp /etc/passwd ~

打印指定行

# 打印2-5行
nl passwd | sed -n '2,5p'
# 打印奇數(shù)行
nl passwd | sed -n '1~2p'

行內(nèi)替換

# 將輸入文本中"shiyanlou" 全局替換為"hehe"缓艳，并只打印替換的那一行，注意這里不能省略最后的"p"命令
sed -n 's/shiyanlou/hehe/gp' passwd

行內(nèi)替換可以結(jié)合正則表達(dá)式使用泄鹏。
刪除某行

nl passwd | grep "shiyanlou"
# 刪除第30行
sed -i '30d' passwd

awk 文本處理語(yǔ)言

看到上面的標(biāo)題郎任，你可能會(huì)感到驚異秧耗，難道我們這里要學(xué)習(xí)的是一門(mén)“語(yǔ)言”么备籽，確切的說(shuō)，我們是要在這里學(xué)習(xí) awk 文本處理語(yǔ)言分井，只是我們并不會(huì)在這里學(xué)習(xí)到比較完整的關(guān)于 awk 的內(nèi)容车猬，還是因?yàn)榍懊娴脑颍珡?qiáng)大了尺锚，它的應(yīng)用無(wú)處不在珠闰，我們無(wú)法在這里以簡(jiǎn)短的文字描述面面俱到，如果你有目標(biāo)成為一個(gè) linux 系統(tǒng)管理員瘫辩，確實(shí)想學(xué)好 awk伏嗜，可以學(xué)習(xí)我們的其他 Linux 課程坛悉。下面的內(nèi)容，我們就作為一個(gè)關(guān)于 awk 的入門(mén)體驗(yàn)章節(jié)吧承绸，其中會(huì)介紹一些 awk 的常用操作裸影。

awk 介紹

AWK 是一種優(yōu)良的文本處理工具，Linux 及 Unix 環(huán)境中現(xiàn)有的功能最強(qiáng)大的數(shù)據(jù)處理引擎之一军熏。其名稱(chēng)得自于它的創(chuàng)始人 Alfred Aho（阿爾佛雷德·艾侯）轩猩、Peter Jay Weinberger（彼得·溫伯格）和 Brian Wilson Kernighan（布萊恩·柯林漢)姓氏的首個(gè)字母 AWK，三位創(chuàng)建者已將它正式定義為“樣式掃描和處理語(yǔ)言”荡澎。它允許你創(chuàng)建簡(jiǎn)短的程序均践，這些程序讀取輸入文件、為數(shù)據(jù)排序摩幔、處理數(shù)據(jù)彤委、對(duì)輸入執(zhí)行計(jì)算以及生成報(bào)表，還有無(wú)數(shù)其他的功能热鞍。最簡(jiǎn)單地說(shuō)葫慎，AWK 是一種用于處理文本的編程語(yǔ)言工具。
在大多數(shù) Linux 發(fā)行版上面薇宠，實(shí)際我們使用的是 gawk（GNU awk偷办，awk 的 GNU 版本），在我們的環(huán)境中 ubuntu 上澄港，默認(rèn)提供的是 mawk椒涯，不過(guò)我們通常可以直接使用 awk 命令（awk 語(yǔ)言的解釋器）回梧，因?yàn)橄到y(tǒng)已經(jīng)為我們創(chuàng)建好了 awk 指向 mawk 的符號(hào)鏈接废岂。

ll /usr/bin/awk

image.png

nawk：在 20 世紀(jì) 80 年代中期，對(duì) awk 語(yǔ)言進(jìn)行了更新狱意，并不同程度地使用一種稱(chēng)為 nawk(new awk) 的增強(qiáng)版本對(duì)其進(jìn)行了替換湖苞。許多系統(tǒng)中仍然存在著舊的 awk 解釋器，但通常將其安裝為 oawk (old awk) 命令详囤，而 nawk 解釋器則安裝為主要的 awk 命令财骨，也可以使用 nawk 命令。Dr. Kernighan 仍然在對(duì) nawk 進(jìn)行維護(hù)藏姐，與 gawk 一樣隆箩，它也是開(kāi)放源代碼的，并且可以免費(fèi)獲得;
gawk：是 GNU Project 的 awk 解釋器的開(kāi)放源代碼實(shí)現(xiàn)羔杨。盡管早期的 GAWK 發(fā)行版是舊的 AWK 的替代程序捌臊，但不斷地對(duì)其進(jìn)行了更新，以包含 NAWK 的特性;
mawk 也是 awk 編程語(yǔ)言的一種解釋器兜材，mawk 遵循 POSIX 1003.2 （草案 11.3）定義的 AWK 語(yǔ)言理澎，包含了一些沒(méi)有在 AWK 手冊(cè)中提到的特色逞力，同時(shí) mawk 提供一小部分?jǐn)U展，另外據(jù)說(shuō) mawk 是實(shí)現(xiàn)最快的 awk糠爬。

awk 的一些基礎(chǔ)概念

awk 所有的操作都是基于 pattern(模式)—action(動(dòng)作)對(duì)來(lái)完成的掏击，如下面的形式：

pattern {action}

你可以看到就如同很多編程語(yǔ)言一樣，它將所有的動(dòng)作操作用一對(duì) {} 花括號(hào)包圍起來(lái)秩铆。其中 pattern 通常是表示用于匹配輸入的文本的“關(guān)系式”或“正則表達(dá)式”砚亭，action 則是表示匹配后將執(zhí)行的動(dòng)作。在一個(gè)完整 awk 操作中殴玛，這兩者可以只有其中一個(gè)捅膘，如果沒(méi)有 pattern 則默認(rèn)匹配輸入的全部文本，如果沒(méi)有 action 則默認(rèn)為打印匹配內(nèi)容到屏幕滚粟。
awk 處理文本的方式寻仗，是將文本分割成一些“字段”，然后再對(duì)這些字段進(jìn)行處理凡壤，默認(rèn)情況下署尤，awk 以空格作為一個(gè)字段的分割符，不過(guò)這不是固定的亚侠，你可以任意指定分隔符曹体，下面將告訴你如何做到這一點(diǎn)。

awk 命令基本格式

awk [-F fs] [-v var=value] [-f prog-file | 'program text'] [file...]

其中 -F 參數(shù)用于預(yù)先指定前面提到的字段分隔符（還有其他指定字段的方式）硝烂，-v 用于預(yù)先為 awk 程序指定變量箕别，-f 參數(shù)用于指定 awk 命令要執(zhí)行的程序文件，或者在不加 -f 參數(shù)的情況下直接將程序語(yǔ)句放在這里滞谢，最后為 awk 需要處理的文本輸入串稀，且可以同時(shí)輸入多個(gè)文本文件。

awk 操作體驗(yàn)

先用 vim 新建一個(gè)文本文檔：

vim test

包含如下內(nèi)容：

I like linux
www.shiyanlou.com

使用 awk 將文本內(nèi)容打印到終端：

# "quote>" 不用輸入
awk '{
quote> print
quote> }' test
# 或者寫(xiě)到一行
awk '{print}' test

image.png

說(shuō)明:在這個(gè)操作中我是省略了 pattern狮杨，所以 awk 會(huì)默認(rèn)匹配輸入文本的全部?jī)?nèi)容母截，然后在 {} 花括號(hào)中執(zhí)行動(dòng)作，即 print 打印所有匹配項(xiàng)橄教，這里是全部文本內(nèi)容清寇。
將 test 的第一行的每個(gè)字段單獨(dú)顯示為一行：

$ awk '{
> if(NR==1){
> print $1 "\n" $2 "\n" $3
> } else {
> print}
> }' test

# 或者
$ awk '{
> if(NR==1){
> OFS="\n"
> print $1, $2, $3
> } else {
> print}
> }' test

image.png

說(shuō)明:你首先應(yīng)該注意的是，這里我使用了 awk 語(yǔ)言的分支選擇語(yǔ)句if颤陶，它的使用和很多高級(jí)語(yǔ)言如 C/C++ 語(yǔ)言基本一致颗管，如果你有這些語(yǔ)言的基礎(chǔ)陷遮，這里將很好理解滓走。另一個(gè)你需要注意的是 NR 與 OFS，這兩個(gè)是 awk 內(nèi)建的變量帽馋，NR 表示當(dāng)前讀入的記錄數(shù)搅方，你可以簡(jiǎn)單的理解為當(dāng)前處理的行數(shù)比吭，OFS 表示輸出時(shí)的字段分隔符，默認(rèn)為" "空格姨涡，如上圖所見(jiàn)衩藤，我們將字段分隔符設(shè)置為 \n 換行符，所以第一行原本以空格為字段分隔的內(nèi)容就分別輸出到單獨(dú)一行了涛漂。然后是 $N 其中 N 為相應(yīng)的字段號(hào)赏表，這也是 awk 的內(nèi)建變量，它表示引用相應(yīng)的字段匈仗，因?yàn)槲覀冞@里第一行只有三個(gè)字段瓢剿，所以只引用到了 $3。除此之外另一個(gè)這里沒(méi)有出現(xiàn)的 $0悠轩，它表示引用當(dāng)前記錄（當(dāng)前行）的全部?jī)?nèi)容间狂。
將 test 的第二行的以點(diǎn)為分段的字段換成以空格為分隔：

awk -F'.' '{
> if(NR==2){
> print $1 "\t" $2 "\t" $3
> }}' test

# 或者
awk '
> BEGIN{
> FS="."
> OFS="\t"  # 如果寫(xiě)為一行，兩個(gè)動(dòng)作語(yǔ)句之間應(yīng)該以";"號(hào)分開(kāi)
> }{
> if(NR==2){
> print $1, $2, $3
> }}' test

image.png

說(shuō)明：這里的 -F 參數(shù)火架，前面已經(jīng)介紹過(guò)鉴象，它是用來(lái)預(yù)先指定待處理記錄的字段分隔符。我們需要注意的是除了指定 OFS 我們還可以在 print 語(yǔ)句中直接打印特殊符號(hào)如這里的 \t何鸡，print 打印的非變量?jī)?nèi)容都需要用""一對(duì)引號(hào)包圍起來(lái)纺弊。上面另一個(gè)版本，展示了實(shí)現(xiàn)預(yù)先指定變量分隔符的另一種方式骡男，即使用 BEGIN俭尖，就這個(gè)表達(dá)式指示了，其后的動(dòng)作將在所有動(dòng)作之前執(zhí)行洞翩，這里是 FS 賦值了新的 . 點(diǎn)號(hào)代替默認(rèn)的空格稽犁。
注意:首先說(shuō)明一點(diǎn)，我們?cè)趯W(xué)習(xí)和使用 awk 的時(shí)候應(yīng)該盡可能將其作為一門(mén)程序語(yǔ)言來(lái)理解骚亿，這樣將會(huì)使你學(xué)習(xí)起來(lái)更容易已亥，所以初學(xué)階段在練習(xí) awk 時(shí)應(yīng)該盡量按照我那樣的方式分多行按照一般程序語(yǔ)言的換行和縮進(jìn)來(lái)輸入，而不是全部寫(xiě)到一行（當(dāng)然這在你熟練了之后是沒(méi)有任何問(wèn)題的）来屠。

awk 常用的內(nèi)置變量

image.png

作業(yè)

1虑椎、練習(xí)其他幾個(gè)命令動(dòng)作的使用。
練習(xí) 1: 結(jié)合正則表達(dá)式做更多練習(xí)俱笛。
練習(xí) 2: 參考下面的鏈接捆姜，掌握 sed 處理文本的基本原理，理解 pattern space 和 hold space 概念迎膜。 sed 簡(jiǎn)明教程 sed 單行腳本快速參考 sed 完全手冊(cè)
練習(xí) 3: 基于 pattern space 和 hold space 實(shí)現(xiàn)將一個(gè)文本倒序輸出和交換奇數(shù)行和偶數(shù)行泥技。
2、一個(gè)在線(xiàn)游戲磕仅，當(dāng)然我們主要目的是學(xué)習(xí)珊豹，這個(gè)游戲也是有寓教于樂(lè)的性質(zhì)簸呈，讓你快速學(xué)會(huì) vim 的基礎(chǔ)操作：
vim 大冒險(xiǎn)

挑戰(zhàn)：數(shù)據(jù)提取

小明在做數(shù)據(jù)分析的時(shí)候需要提取文件中關(guān)于數(shù)字的部分，同時(shí)還要提取用戶(hù)的郵箱部分店茶，但是有的行不是數(shù)組也不是郵箱蜕便，現(xiàn)在需要你在 data2 這個(gè)文件中幫助他用正則表達(dá)式匹配出數(shù)字部分和郵箱部分。
數(shù)據(jù)文件可以使用以下命令下載：

$ cd /home/shiyanlou
$ wget https://labfile.oss.aliyuncs.com/courses/1/data2

在文件 /home/shiyanlou/data2 中匹配數(shù)字開(kāi)頭的行贩幻，將所有以數(shù)字開(kāi)頭的行都寫(xiě)入 /home/shiyanlou/num 文件轿腺。
在文件 /home/shiyanlou/data2 中匹配出正確格式的郵箱，將所有的郵箱寫(xiě)入 /home/shiyanlou/mail 文件丛楚，注意該文件中每行為一個(gè)郵箱吃溅。

grep '^[0-9]' /home/shiyanlou/data2 > /home/shiyanlou/num
grep -E '^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(.[a-zA-Z0-9_-]+)+$' /home/shiyanlou/data2 > /home/shiyanlou/mail

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市鸯檬，隨后出現(xiàn)的幾起案子决侈，更是在濱河造成了極大的恐慌，老刑警劉巖喧务，帶你破解...
沈念sama閱讀 212,884評(píng)論 6贊 492
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件赖歌，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡功茴，警方通過(guò)查閱死者的電腦和手機(jī)庐冯，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,755評(píng)論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)坎穿，“玉大人展父，你說(shuō)我怎么就攤上這事×崦粒” “怎么了栖茉？”我有些...
開(kāi)封第一講書(shū)人閱讀 158,369評(píng)論 0贊 348
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)孵延。經(jīng)常有香客問(wèn)我吕漂，道長(zhǎng)，這世上最難降的妖魔是什么尘应？我笑而不...
開(kāi)封第一講書(shū)人閱讀 56,799評(píng)論 1贊 285
?港島之戀（遺憾婚禮）
正文為了忘掉前任惶凝，我火速辦了婚禮，結(jié)果婚禮上犬钢，老公的妹妹穿的比我還像新娘苍鲜。我一直安慰自己，他們只是感情好玷犹，可當(dāng)我...
茶點(diǎn)故事閱讀 65,910評(píng)論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布混滔。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪遍坟。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 50,096評(píng)論 1贊 291
城市分裂傳說(shuō)
那天晴股，我揣著相機(jī)與錄音愿伴，去河邊找鬼。笑死电湘，一個(gè)胖子當(dāng)著我的面吹牛隔节，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播寂呛，決...
沈念sama閱讀 39,159評(píng)論 3贊 411
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼怎诫，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了贷痪？” 一聲冷哼從身側(cè)響起幻妓，我...
開(kāi)封第一講書(shū)人閱讀 37,917評(píng)論 0贊 268
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎劫拢，沒(méi)想到半個(gè)月后肉津，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 44,360評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡舱沧，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,673評(píng)論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年妹沙，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片熟吏。...
茶點(diǎn)故事閱讀 38,814評(píng)論 1贊 341
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡距糖，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出牵寺，到底是詐尸還是另有隱情悍引，我是刑警寧澤，帶...
沈念sama閱讀 34,509評(píng)論 4贊 334
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布帽氓，位于F島的核電站吗铐，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏杏节。R本人自食惡果不足惜唬渗，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 40,156評(píng)論 3贊 317
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望奋渔。院中可真熱鬧镊逝，春花似錦、人聲如沸嫉鲸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,882評(píng)論 0贊 21
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至座菠，卻和暖如春狸眼，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背浴滴。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 32,123評(píng)論 1贊 267
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工拓萌，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人升略。一個(gè)月前我還...
沈念sama閱讀 46,641評(píng)論 2贊 362
代替公主和親
正文我出身青樓微王，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親品嚣。傳聞我的和親對(duì)象是個(gè)殘疾皇子炕倘，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,728評(píng)論 2贊 351

13Linux 基礎(chǔ)入門(mén)--正則表達(dá)式基礎(chǔ)

正則表達(dá)式基礎(chǔ)

正則表達(dá)式

舉例

基本語(yǔ)法

grep 模式匹配命令

基本操作

使用正則表達(dá)式

sed 流編輯器

sed 常用參數(shù)介紹

sed 編輯器的執(zhí)行命令（這里”執(zhí)行“解釋為名詞）

sed 操作舉例

awk 文本處理語(yǔ)言

awk 介紹

awk 的一些基礎(chǔ)概念

awk 命令基本格式

awk 操作體驗(yàn)

awk 常用的內(nèi)置變量

作業(yè)

挑戰(zhàn)：數(shù)據(jù)提取

推薦閱讀更多精彩內(nèi)容