Shell刪除各種注釋的腳本
file content
aabbcc<<<comment part 1
abcdefg
hilkdifdfdf
mmmmmmmm
eeeeeeeeeeeeee
comment part 2>>>
ddeeff
sed -e ":begin; /<<</,/>>>/ { />>>/! { $! { N; b begin }; }; s/<<<.*>>>/ /; };" 1.txt
file content
aabbcc
ddeeff
首先花括號{}代表命令塊的開始,類似c的語法,后面就不再說了。
:begin
,這是一個標號,man中叫做label,也就是跳轉(zhuǎn)標記,供b和t命令用,本例中使用了b命令。
/<<</,/>>>/
,這是一個地址范圍(Addresses),后面{}中的命令只對地址范圍之間的內(nèi)容使用。其中逗號前面的部分是開始地址,逗號后面是結(jié)束地址,都是正則表達式。由于sed是“流”式“行”處理,所以結(jié)束地址是可以省略的,即如果地址的結(jié)束范圍不存在,那么將一直處理到文件結(jié)尾。本例中使用這個地址范圍主要是縮小處理的數(shù)據(jù)量,因為雖然后面用N命令把對一行的處理擴展為了多行,但如果從文件開頭一直N擴展到<<<出現(xiàn)為止,buffer中要處理的字符串可能會很長,影響效率。所以去掉這個處理范圍也是能夠得到正確結(jié)果的,
,比如:
$ sed -e ":begin; { />>>/! { $! { N; b begin }; }; s/<<<.*>>>/COMMENT/; };" test
or
$ sed -e "{:begin; />>>/! { $! { N; b begin }; }; s/<<<.*>>>/COMMENT/; };" test
/>>>/!
,>>>
是要替換內(nèi)容的結(jié)束標記,帶上!
就是說當一行處理完畢之后,如果沒有發(fā)現(xiàn)結(jié)束標記。。。
$!
,$
在正則中表示字符串結(jié)尾,在sed中代表文件的最后一行,本句和上一句結(jié)合起來的意思就是:如果在本行沒有發(fā)現(xiàn)結(jié)束標記,并且當前掃描過的行并不是文件的最后一行。
N;
,把下一行的內(nèi)容追加(append)到緩沖區(qū)(pattern)之后,在我們的例子中,在處理aabbcc<<<comment part 1
這一行的內(nèi)容時,就會執(zhí)行到這里,然后把下一行的內(nèi)容comment part 2>>>
一起放入緩沖區(qū),相當于“合并”成了一行(sed的緩沖區(qū)中默認都只會包含一行的內(nèi)容)。
b begin
,由于仍然沒有找到結(jié)束標記<<<
(注意上一條說的緩沖區(qū)還沒有被處理),所以在這里跳回到標號begin,重新開始命令。如果開始和結(jié)束標記之間間隔了多行,那么就會有多次跳轉(zhuǎn)發(fā)生。
s/<<<.*>>>/COMMENT/;
,終于,/>>>/!
不再匹配成功,也就是我們已經(jīng)找到了結(jié)束標記,那么用s命令來進行替換。如果開始和結(jié)束標記在一行的話,就會越過上面那些復雜的處理,直接執(zhí)行到這里了
如果要刪除標c里的注釋:可用如下命令
sed -e ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" 2.txt
2.txt內(nèi)容如下:
file content
aabbcc/*comment part 1
abcdefg
hilkdifdfdf
mmmmmmmm
eeeeeeeeeeeeee
comment part 2*/
ddeeff
執(zhí)行命令結(jié)果如下:
file content
aabbcc
ddeeff
sed '/\/\*/{/\*\//d;:a;N;/\*\//d;ba};s,//.*,,' 2.txt會把上面的aabbcc那一行刪掉
上面的命令適合于注釋多行,代碼和注釋行沒有在一行,用sed -e ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" 會導致出現(xiàn)一個空行
如果是下面的情況也沒有問題
file content
aabbcc
/*comment part 1
abcdefg
hilkdifdfdf
mmmmmmmm
eeeeeeeeeeeeee
comment part 2*/ddeeff
執(zhí)行sed -e ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" 結(jié)果還是
file content
aabbcc
ddeeff
不過還是有空行,所以如果要刪除C注釋用sed -e ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" 比較合適,然后在刪除空行就行
sed /^$/d filename 刪除空行,實際應用中可以把-e參數(shù)換成-i,這樣就可以直接對源文件進行操作和修改了;
以下是刪除各種標c和c++,還有shell腳本本身的注釋#的腳本
#delete the comment line begin with '//comment'
sed -i "/^[ \t]*\/\//d" $filename
#delete the commnet line end with '//comment'
sed -i "s/\/\/[^\"]*//" $filename
#delete the comment only occupied one line '/* commnet */'
sed -i "s/\/\*.*\*\///" $filename
#delete the comment that occupied many lines '/*comment
# *comment
# */
sed -i "/^[ \t]*\/\*/,/.*\*\//d" test.conf
sed -i 's#\#.*# #' $filename
sed -i ":begin; { /\*\//! { $! { N; b begin }; }; s/\/\*.*\*\// /; };" $filename
sed -i '/^$/d' $filename