1.txt內(nèi)容:
file content
aabbcc<<<comment part 1
abcdefg
hilkdifdfdf
mmmmmmmm
eeeeeeeeeeeeee
comment part 2>>>
ddeeff
sed -e ":begin; /<<</,/>>>/ { />>>/! { $! { N; b begin }; }; s/<<<.*>>>/ /; };" 1.txt
file content
aabbcc
ddeeff
首先花括號(hào){}代表命令塊的開始,類似c的語(yǔ)法,后面就不再說了。
:begin
,這是一個(gè)標(biāo)號(hào),man中叫做label,也就是跳轉(zhuǎn)標(biāo)記,供b和t命令用,本例中使用了b命令。
/<<</,/>>>/
,這是一個(gè)地址范圍(Addresses),后面{}中的命令只對(duì)地址范圍之間的內(nèi)容使用。其中逗號(hào)前面的部分是開始地址,逗號(hào)后面是結(jié)束地址,都是正則表達(dá)式。由于sed是“流”式“行”處理,所以結(jié)束地址是可以省略的,即如果地址的結(jié)束范圍不存在,那么將一直處理到文件結(jié)尾。本例中使用這個(gè)地址范圍主要是縮小處理的數(shù)據(jù)量,因?yàn)殡m然后面用N命令把對(duì)一行的處理擴(kuò)展為了多行,但如果從文件開頭一直N擴(kuò)展到<<<出現(xiàn)為止,buffer中要處理的字符串可能會(huì)很長(zhǎng),影響效率。所以去掉這個(gè)處理范圍也是能夠得到正確結(jié)果的,
,比如:
$ sed -e ":begin; { />>>/! { $! { N; b begin }; }; s/<<<.*>>>/COMMENT/; };" test
or
$ sed -e "{:begin; />>>/! { $! { N; b begin }; }; s/<<<.*>>>/COMMENT/; };" test
/>>>/!
,>>>
是要替換內(nèi)容的結(jié)束標(biāo)記,帶上!
就是說當(dāng)一行處理完畢之后,如果沒有發(fā)現(xiàn)結(jié)束標(biāo)記。。。
$!
,$
在正則中表示字符串結(jié)尾,在sed中代表文件的最后一行,本句和上一句結(jié)合起來的意思就是:如果在本行沒有發(fā)現(xiàn)結(jié)束標(biāo)記,并且當(dāng)前掃描過的行并不是文件的最后一行。
N;
,把下一行的內(nèi)容追加(append)到緩沖區(qū)(pattern)之后,在我們的例子中,在處理aabbcc<<<comment part 1
這一行的內(nèi)容時(shí),就會(huì)執(zhí)行到這里,然后把下一行的內(nèi)容comment part 2>>>
一起放入緩沖區(qū),相當(dāng)于“合并”成了一行(sed的緩沖區(qū)中默認(rèn)都只會(huì)包含一行的內(nèi)容)。
b begin
,由于仍然沒有找到結(jié)束標(biāo)記<<<
(注意上一條說的緩沖區(qū)還沒有被處理),所以在這里跳回到標(biāo)號(hào)begin,重新開始命令。如果開始和結(jié)束標(biāo)記之間間隔了多行,那么就會(huì)有多次跳轉(zhuǎn)發(fā)生。
s/<<<.*>>>/COMMENT/;
,終于,/>>>/!
不再匹配成功,也就是我們已經(jīng)找到了結(jié)束標(biāo)記,那么用s命令來進(jìn)行替換。如果開始和結(jié)束標(biāo)記在一行的話,就會(huì)越過上面那些復(fù)雜的處理,直接執(zhí)行到這里了
如果要?jiǎng)h除標(biāo)c里的注釋:可用如下命令
sed -e ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" 2.txt
2.txt內(nèi)容如下:
file content
aabbcc/*comment part 1
abcdefg
hilkdifdfdf
mmmmmmmm
eeeeeeeeeeeeee
comment part 2*/
ddeeff
執(zhí)行命令結(jié)果如下:
file content
aabbcc
ddeeff
sed '/\/\*/{/\*\//d;:a;N;/\*\//d;ba};s,//.*,,' 2.txt會(huì)把上面的aabbcc那一行刪掉
上面的命令適合于注釋多行,代碼和注釋行沒有在一行,用sed -e ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" 會(huì)導(dǎo)致出現(xiàn)一個(gè)空行
如果是下面的情況也沒有問題
file content
aabbcc
/*comment part 1
abcdefg
hilkdifdfdf
mmmmmmmm
eeeeeeeeeeeeee
comment part 2*/ddeeff
執(zhí)行sed -e ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" 結(jié)果還是
file content
aabbcc
ddeeff
不過還是有空行,所以如果要?jiǎng)h除C注釋用sed -e ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" 比較合適,然后在刪除空行就行
sed /^$/d filename 刪除空行,實(shí)際應(yīng)用中可以把-e參數(shù)換成-i,這樣就可以直接對(duì)源文件進(jìn)行操作和修改了;
以下是刪除各種標(biāo)c和c++,還有shell腳本本身的注釋#的腳本
#delete the comment line begin with '//comment'
sed -i "/^[ \t]*\/\//d" $filename
#delete the commnet line end with '//comment'
sed -i "s/\/\/[^\"]*//" $filename
#delete the comment only occupied one line '/* commnet */'
sed -i "s/\/\*.*\*\///" $filename
#delete the comment that occupied many lines '/*comment
# *comment
# */
sed -i "/^[ \t]*\/\*/,/.*\*\//d" test.conf
sed -i 's#\#.*# #' $filename
sed -i ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" $filename
sed -i '/^$/d' $filename