sed是一種流編輯器诬像,它是文本處理中非常好的工具昌腰,能夠完美的配合正則表達式使用,功能不同凡響飞醉。處理時冲茸,把當前處理的行存儲在臨時緩沖區(qū)中,稱為“模式空間”(pattern space),接著用sed命令處理緩沖區(qū)中的內容轴术,處理完成后蹲盘,把緩沖區(qū)的內容送往屏幕。接著處理下一行膳音,這樣不斷重復召衔,直到文件末尾。文件內容并沒有改變祭陷,除非你使用重定向存儲輸出苍凛。Sed主要用來自動編輯一個或多個文件,可以將數(shù)據(jù)行進行替換兵志、刪除醇蝴、新增、選取等特定工作想罕,簡化對文件的反復操作悠栓,編寫轉換程序等。
sed的選項按价、命令惭适、替換標記
命令格式
sed的命令格式:sed [options] 'command' file(s);
sed的腳本格式:sed [options] -f scriptfile file(s);
選項
-e :直接在命令行模式上進行sed動作編輯,此為默認選項;
-f :將sed的動作寫在一個文件內楼镐,用–f filename 執(zhí)行filename內的sed動作;
-i :直接修改文件內容;
-n :只打印模式匹配的行癞志;
-r :支持擴展表達式;
-h或--help:顯示幫助;
-V或--version:顯示版本信息框产。
參數(shù)
文件:指定待處理的文本文件列表凄杯。
sed常用命令
a\ 在當前行下面插入文本;
i\ 在當前行上面插入文本;
c\ 把選定的行改為新的文本;
d 刪除,刪除選擇的行;
D 刪除模板塊的第一行;
s 替換指定字符;
h 拷貝模板塊的內容到內存中的緩沖區(qū);
H 追加模板塊的內容到內存中的緩沖區(qū);
g 獲得內存緩沖區(qū)的內容秉宿,并替代當前模板塊中的文本;
G 獲得內存緩沖區(qū)的內容戒突,并追加到當前模板塊文本的后面;
l 列表不能打印字符的清單;
n 讀取下一個輸入行,用下一個命令處理新的行而不是用第一個命令;
N 追加下一個輸入行到模板塊后面并在二者間嵌入一個新行描睦,改變當前行號碼;
p 打印模板塊的行膊存。 P(大寫) 打印模板塊的第一行;
q 退出Sed;
b lable 分支到腳本中帶有標記的地方,如果分支不存在則分支到腳本的末尾;
r file 從file中讀行;
t label if分支酌摇,從最后一行開始膝舅,條件一旦滿足或者T嗡载,t命令窑多,將導致分支到帶有標號的命令處,或者到腳本的末尾;
T label 錯誤分支洼滚,從最后一行開始埂息,一旦發(fā)生錯誤或者T,t命令,將導致分支到帶有標號的命令處千康,或者到腳本的末尾;
w file 寫并追加模板塊到file末尾;
W file 寫并追加模板塊的第一行到file末尾;
! 表示后面的命令對所有沒有被選定的行發(fā)生作用;
= 打印當前行號;
把注釋擴展到下一個換行符以前;
sed替換標記
g 表示行內全面替換;
p 表示打印行;
w 表示把行寫入一個文件;
x 表示互換模板塊中的文本和緩沖區(qū)中的文本;
y 表示把一個字符翻譯為另外的字符(但是不用于正則表達式);
\1 子串匹配標記;
& 已匹配字符串標記;
sed元字符集
^ 匹配行開始享幽,如:/^sed/匹配所有以sed開頭的行;
/匹配所有以sed結尾的行;
. 匹配一個非換行符的任意字符拾弃,如:/s.d/匹配s后接一個任意字符值桩,最后是d;
- 匹配0個或多個字符,如:/*sed/匹配所有模板是一個或多個空格后緊跟sed的行;
[] 匹配一個指定范圍內的字符豪椿,如/[ss]ed/匹配sed和Sed;
[^] 匹配一個不在指定范圍內的字符奔坟,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一個字母開頭,緊跟ed的行;
(..) 匹配子串搭盾,保存匹配的字符咳秉,如s/(love)able/\1rs,loveable被替換成lovers;
& 保存搜索字符用來替換其他字符鸯隅,如s/love/&/澜建,love這成love;
< 匹配單詞的開始,如:/<love 匹配包含以love開頭的單詞的行;> 匹配單詞的結束蝌以,如/love>/匹配包含以love結尾的單詞的行;
x{m} 重復字符x炕舵,m次,如:/0{5}/匹配包含5個0的行;
x{m,} 重復字符x跟畅,至少m次幕侠,如:/0{5,}/匹配至少有5個0的行;
x{m,n} 重復字符x,至少m次碍彭,不多于n次晤硕,如:/0{5,10}/匹配5~10個0的行;
sed用戶實例
替換操作:s命令
替換文本中的字符串:
sed 's/book/books/' file
-n選項和p命令一起使用表示只打印那些發(fā)生替換的行:
sed -n 's/test/TEST/p' file
直接編輯文件選項-i,會匹配file文件中每一行的第一個book替換為books
sed -i 's/book/books/g' file
全面替換標記g
使用后綴 /g 標記會替換每一行中的所有匹配:
sed 's/book/books/g' file
當需要從第N處匹配開始替換時庇忌,可以使用 /Ng:
echo sksksksksksk | sed 's/sk/SK/2g'
skSKSKSKSKSK
echo sksksksksksk | sed 's/sk/SK/3g'
skskSKSKSKSK
echo sksksksksksk | sed 's/sk/SK/4g'
skskskSKSKSK
定界符
以上命令中字符 / 在sed中作為定界符使用舞箍,也可以使用任意的定界符
sed 's:test:TEXT:g'
sed 's|test|TEXT|g'
定界符出現(xiàn)在樣式內部時,需要進行轉義:
sed 's//bin//usr/local/bin/g'
刪除操作:d命令
刪除空白行:
sed '/^$/d' file
刪除文件的第2行:
sed '2d' file
刪除文件的第2行到末尾所有行:
sed '2,$d' file
刪除文件最后一行:
sed '$d' file
刪除文件中所有開頭是test的行:
sed '/^test/'d file
已匹配字符串標記&
正則表達式 \w+ 匹配每一個單詞皆疹,使用 [&] 替換它疏橄,& 對應于之前所匹配到的單詞:
echo this is a test line | sed 's/\w+/[&]/g'
[this] [is] [a] [test] [line]
所有以192.168.0.1開頭的行都會被替換成它自已加localhost:
sed 's/^192.168.0.1/&localhost/' file 192.168.0.1localhost
子串匹配標記\1
匹配給定樣式的其中一部分:
echo this is digit 7 in a number | sed 's/digit ([0-9])/\1/'
this is 7 in a number
命令中 digit 7,被替換成了 7略就。樣式匹配到的子串是 7捎迫,(..) 用于匹配子串,對于匹配到的第一個子串就標記為 \1表牢,依此類推匹配到的第二個結果就是 \2窄绒,例如:
echo aaa BBB | sed 's/([a-z]+) ([A-Z]+)/\2 \1/'
BBB aaa
love被標記為1,所有l(wèi)oveable會被替換成lovers崔兴,并打印出來:
sed -n 's/(love)able/\1rs/p' file
組合多個表達式
sed '表達式' | sed '表達式' 等價于:
sed '表達式; 表達式'
引用
sed表達式可以使用單引號來引用彰导,但是如果表達式內部包含變量字符串蛔翅,就需要使用雙引號。
test=hello
echo hello WORLD | sed "s/$test/HELLO"
HELLO WORLD
選定行的范圍:,(逗號)
所有在模板test和check所確定的范圍內的行都被打游荒薄:
sed -n '/test/,/check/p' file
打印從第5行開始到第一個包含以test開始的行之間的所有行:
sed -n '5,/^test/p' file
對于模板test和west之間的行山析,每行的末尾用字符串a(chǎn)aa bbb替換:
sed '/test/,/west/s/$/aaa bbb/' file
多點編輯:e命令
-e選項允許在同一行里執(zhí)行多條命令:
sed -e '1,5d' -e 's/test/check/' file
上面sed表達式的第一條命令刪除1至5行,第二條命令用check替換test掏父。命令的執(zhí)行順序對結果有影響笋轨。如果兩個命令都是替換命令,那么第一個替換命令將影響第二個替換命令的結果赊淑。
和 -e 等價的命令是 --expression:
sed --expression='s/test/check/' --expression='/love/d' file
從文件讀入:r命令
file里的內容被讀進來翩腐,顯示在與test匹配的行后面,如果匹配多行膏燃,則file的內容將顯示在所有匹配行的下面:
sed '/test/r file' filename
寫入文件:w命令
在example中所有包含test的行都被寫入file里:
sed -n '/test/w file' example
追加(行下):a\命令
將 this is a test line 追加到 以test 開頭的行后面:
sed '/^test/a\this is a test line' file
在 test.conf 文件第2行之后插入 this is a test line:
sed -i '2a\this is a test line' test.conf
插入(行上):
i\命令 將 this is a test line 追加到以test開頭的行前面:
sed '/^test/i\this is a test line' file
在test.conf文件第5行之前插入this is a test line:
sed -i '5i\this is a test line' test.conf
下一個:n命令
如果test被匹配茂卦,則移動到匹配行的下一行,替換這一行的aa组哩,變?yōu)閎b等龙,并打印該行,然后繼續(xù):
sed '/test/{ n; s/aa/bb/; }' file
變形:y命令
把1~10行內所有abcde轉變?yōu)榇髮懥娣。⒁庵肱椋齽t表達式元字符不能使用這個命令:
sed '1,10y/abcde/ABCDE/' file
退出:q命令
打印完第10行后,退出sed sed '10q' file 保持和獲仁蜓谩:h命令和G命令 在sed處理文件的時候泥畅,每一行都被保存在一個叫模式空間的臨時緩沖區(qū)中,除非行被刪除或者輸出被取消琅翻,否則所有被處理的行都將打印在屏幕上位仁。接著模式空間被清空,并存入新的一行等待處理方椎。
sed -e '/test/h' -e '$G' file
在這個例子里聂抢,匹配test的行被找到后,將存入模式空間棠众,h命令將其復制并存入一個稱為保持緩存區(qū)的特殊緩沖區(qū)內琳疏。第二條語句的意思是,當?shù)竭_最后一行后闸拿,G命令取出保持緩沖區(qū)的行空盼,然后把它放回模式空間中,且追加到現(xiàn)在已經(jīng)存在于模式空間中的行的末尾新荤。在這個例子中就是追加到最后一行揽趾。簡單來說,任何包含test的行都被復制并追加到該文件的末尾迟隅。
保持和互換:h命令和x命令
互換模式空間和保持緩沖區(qū)的內容但骨。也就是把包含test與check的行互換:
sed -e '/test/h' -e '/check/x' file
腳本scriptfile
sed腳本是一個sed的命令清單,啟動Sed時以-f選項引導腳本文件名智袭。Sed對于腳本中輸入的命令非常挑剔奔缠,在命令的末尾不能有任何空白或文本,如果在一行中有多個命令吼野,要用分號分隔校哎。以#開頭的行為注釋行,且不能跨行瞳步。
sed [options] -f scriptfile file(s)
打印奇數(shù)行或偶數(shù)行
方法1:
sed -n 'p;n' test.txt #奇數(shù)行 sed -n 'n;p' test.txt #偶數(shù)行
方法2:
sed -n '1~2p' test.txt #奇數(shù)行 sed -n '2~2p' test.txt #偶數(shù)行
打印匹配字符串的下一行
grep -A 1 SCC URFILE
sed -n '/SCC/{n;p}' URFILE
awk '/SCC/{getline; print}' URFILE