1.txt內容:
file content
aabbcc<<<comment part 1
abcdefg
hilkdifdfdf
mmmmmmmm
eeeeeeeeeeeeee
comment part 2>>>
ddeeff
sed -e ":begin; /<<</,/>>>/ { />>>/! { $! { N; b begin }; }; s/<<<.*>>>/ /; };" 1.txt
file content
aabbcc
ddeeff
首先花括號{}代表命令塊的開始,類似c的語法,后面就不再說了。
:begin
,這是一個標號,man中叫做label,也就是跳轉標記,供b和t命令用,本例中使用了b命令。
/<<</,/>>>/
,這是一個地址范圍(Addresses),后面{}中的命令只對地址范圍之間的內容使用。其中逗號前面的部分是開始地址,逗號后面是結束地址,都是正則表達式。由于sed是“流”式“行”處理,所以結束地址是可以省略的,即如果地址的結束范圍不存在,那么將一直處理到文件結尾。本例中使用這個地址范圍主要是縮小處理的數據量,因為雖然后面用N命令把對一行的處理擴展為了多行,但如果從文件開頭一直N擴展到<<<出現為止,buffer中要處理的字符串可能會很長,影響效率。所以去掉這個處理范圍也是能夠得到正確結果的,
,比如:
$ sed -e ":begin; { />>>/! { $! { N; b begin }; }; s/<<<.*>>>/COMMENT/; };" test
or
$ sed -e "{:begin; />>>/! { $! { N; b begin }; }; s/<<<.*>>>/COMMENT/; };" test
/>>>/!
,>>>
是要替換內容的結束標記,帶上!
就是說當一行處理完畢之后,如果沒有發現結束標記。。。
$!
,$
在正則中表示字符串結尾,在sed中代表文件的最后一行,本句和上一句結合起來的意思就是:如果在本行沒有發現結束標記,并且當前掃描過的行并不是文件的最后一行。
N;
,把下一行的內容追加(append)到緩沖區(pattern)之后,在我們的例子中,在處理aabbcc<<<comment part 1
這一行的內容時,就會執行到這里,然后把下一行的內容comment part 2>>>
一起放入緩沖區,相當于“合并”成了一行(sed的緩沖區中默認都只會包含一行的內容)。
b begin
,由于仍然沒有找到結束標記<<<
(注意上一條說的緩沖區還沒有被處理),所以在這里跳回到標號begin,重新開始命令。如果開始和結束標記之間間隔了多行,那么就會有多次跳轉發生。
s/<<<.*>>>/COMMENT/;
,終于,/>>>/!
不再匹配成功,也就是我們已經找到了結束標記,那么用s命令來進行替換。如果開始和結束標記在一行的話,就會越過上面那些復雜的處理,直接執行到這里了
如果要刪除標c里的注釋:可用如下命令
sed -e ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" 2.txt
2.txt內容如下:
file content
aabbcc/*comment part 1
abcdefg
hilkdifdfdf
mmmmmmmm
eeeeeeeeeeeeee
comment part 2*/
ddeeff
執行命令結果如下:
file content
aabbcc
ddeeff
sed '/\/\*/{/\*\//d;:a;N;/\*\//d;ba};s,//.*,,' 2.txt會把上面的aabbcc那一行刪掉
上面的命令適合于注釋多行,代碼和注釋行沒有在一行,用sed -e ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" 會導致出現一個空行
如果是下面的情況也沒有問題
file content
aabbcc
/*comment part 1
abcdefg
hilkdifdfdf
mmmmmmmm
eeeeeeeeeeeeee
comment part 2*/ddeeff
執行sed -e ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" 結果還是
file content
aabbcc
ddeeff
不過還是有空行,所以如果要刪除C注釋用sed -e ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" 比較合適,然后在刪除空行就行
sed /^$/d filename 刪除空行,實際應用中可以把-e參數換成-i,這樣就可以直接對源文件進行操作和修改了;
以下是刪除各種標c和c++,還有shell腳本本身的注釋#的腳本
#delete the comment line begin with '//comment'
sed -i "/^[ \t]*\/\//d" $filename
#delete the commnet line end with '//comment'
sed -i "s/\/\/[^\"]*//" $filename
#delete the comment only occupied one line '/* commnet */'
sed -i "s/\/\*.*\*\///" $filename
#delete the comment that occupied many lines '/*comment
# *comment
# */
sed -i "/^[ \t]*\/\*/,/.*\*\//d" test.conf
sed -i 's#\#.*# #' $filename
sed -i ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" $filename
sed -i '/^$/d' $filename