1. 簡介
sed命令是一個很強大的文本編輯器怕篷,可以對來自文件、以及標準輸入的文本進行編輯脓鹃。
執(zhí)行時,sed會從文件或者標準輸入中讀取一行属拾,將其復制到緩沖區(qū)将谊,對文本編輯完成之后冷溶,讀取下一行直到所有的文本行都編輯完畢。
所以sed命令處理時只會改變緩沖區(qū)中文本的副本尊浓,如果想要直接編輯原文件逞频,可以使用-i選項或者將結果重定向到新的文件中。
sed命令的基本語法如下:
sed [options] commands [inputfile...]
options表示sed命令的一些選項栋齿,常見的選項如下表:
選項名 | 作用 |
---|---|
-n | 取消默認輸出 |
-e | 多點編輯苗胀,可以執(zhí)行多個子命令 |
-f | 從腳本文件中讀取命令(sed操作可以事先寫入腳本,然后通過-f讀取并執(zhí)行) |
-i | 直接編輯原文件 |
-l | 指定行的長度 |
-r | 在腳本中使用擴展表達式 |
2. 應用場景
sed命令比較適用于大的文本文件瓦堵,用普通文本編輯器難以勝任的情況基协。下面分別介紹直接打印、插入菇用、刪除澜驮、替換等編輯操作。
???實驗用文件內(nèi)容
#===================test1.txt======================
letitia
mail
uuencode
1003605091
01566
(1)行打印惋鸥,輸出緩沖區(qū)內(nèi)容杂穷,使用sed的p子命令
sed '1,3 p' test1.txt
echo "====================="
sed -n '1,3 p' test1.txt
#輸出結果
letitia
letitia
mail
mail
uuencode
uuencode
1003605091
01566
=====================
letitia
mail
uuencode
p子命令代表print,可以打印出sed緩沖區(qū)內(nèi)的內(nèi)容卦绣。
sed命令中耐量,直接采用數(shù)字代表某個特定的文本行:'1 p'
代表打印第一行;'1,3 p'
代表打印1到3行滤港;特別的廊蜒,最后一行的行號為$。
觀察輸出結果溅漾,不使用-n選項時山叮,sed命令把1到3行輸出了兩次。這是因為不使用-n時樟凄,sed首先讀取一行聘芜,并默認將緩沖區(qū)內(nèi)的文本輸出出來,之后p子命令再次輸出缝龄。使用-n時,默認輸出取消挂谍,只有p子命令的輸出結果叔壤。
sed -n '/^ma/,5 p' test1.txt
#輸出結果
mail
uuencode
1003605091
01566
sed命令支持正則表達式定位。語法為/re/
口叙,re表示正則表達式炼绘。
本例表示打印出從匹配正則表達式的地方到第5行,也就是從匹配以ma開頭的文本行處開始妄田。
sed -n '1~2 p' test1.txt
#輸出結果
letitia
uuencode
01566
1~2
表示從第一行開始俺亮,行號遞增2輸出驮捍,即輸出奇數(shù)行。語法格式為first~step
脚曾。
(2)插入文本行东且,追加文本行
這兩種情況很類似。插入文本使用i子命令
本讥,表示在指定位置前面插入文本珊泳;追加文本使用a子命令
,表示在指定位置之后插入文本拷沸。觀察一下兩個的區(qū)別:
sed -n -e '2 i insert' -e '1,4 p' test1.txt
#-e選項表示多個子命令色查,本例執(zhí)行i子命令之后執(zhí)行了p子命令
#輸出結果
letitia
insert
mail
uuencode
1003605091
sed -n -e '2 a insert' -e '1,4 p' test1.txt
#輸出結果
letitia
mail
insert
uuencode
1003605091
(3)刪除文本行,使用d子命令
sed -n -e '2 d' -e '1,$ p' test1.txt
#輸出結果
letitia
uuencode
1003605091
01566
(4)替換文本行撞芍,使用c子命令
sed -n -e '2 c newmail' -e '1,$ p' test1.txt
#輸出結果
letitia
newmail
uuencode
1003605091
01566
【注】以上均未使用-i選項秧了,所以更改的只是副本。
<b>(5)替換指定文本序无,使用s子命令
</b>
這一個命令實用性很廣验毡,并且靈活。語法也比之上面特別一些:
sed '位置參數(shù) s/pattern/replaced/[flag]'
pattern為要替換的文本愉镰,支持正則表達式米罚,replaced表示用來替換的一般字符串(不支持正則表達式)。
flag是替換標志丈探,用來影響匹配替換的規(guī)則:
flag | 用法 |
---|---|
g | 全局匹配录择,會替換文本行中所有匹配的字符串 |
十進制n | 替換文本行中第n個匹配的字符串 |
p | 替換第一個匹配的字符串,并且將緩沖區(qū)輸出到標準輸出 |
w | 替換第一個匹配的字符串碗降,并且將改動的行輸出到磁盤文件中 |
缺省 | 替換第一個匹配的字符串 |
sed -n -e 's/[0-9]\{10\}/miss letitia/g' -e '1,$ p' test1.txt
#{}要轉義隘竭,因為此處使用的不是擴展正則表達式
#輸出結果
letitia
mail
uuencode
miss letitia
01566
sed -n -e '1,/^ma/ s/l/L/g' -e '1,$ p' test1.txt
#輸出結果
Letitia
maiL
uuencode
miss letitia
01566
#可以看到,本例將前兩行里的l替換為L讼渊。
sed -n '1,3{
s/l/L/g
s/e/E/g
2 i tyrone
p
}' test1.txt
#輸出結果
LEtitia
tyrone
maiL
uuEncodE
最后這個例子比較復雜动看。使用大括號,表示對1到3行做了一組操作爪幻。
3. 其他的小事
- 以上都是采用了文件輸入做實驗菱皆,也可以采用其他方式,例如
sed -i "s/letitia/hello world/g" `grep "letitia" -rl test1.txt`
#將grep的結果作為輸入挨稿,注意要用反引號括起來仇轻,將括號內(nèi)部分解釋為linux命令
- 當用戶的編輯操作比較復雜時,建議使用sed腳本文件奶甘。
- 同正則表達式一樣篷店,匹配元字符時要用轉義。使用基本正則表達式時臭家,{}等也要轉義疲陕。