為生存而奔跑

:: 首頁 :: 聯系 :: 聚合

:: 管理

271 Posts :: 0 Stories :: 58 Comments :: 0 Trackbacks

留言簿(5)

我參與的團隊

隨筆分類

隨筆檔案

相冊

Girl

搜索

積分與排名

積分 - 331734
排名 - 74

閱讀排行榜

評論排行榜

sed實例一

sed 示例

sed 通過對輸入數據執行任意數量用戶指定的編輯操作（“命令”）來工作。sed 是基于行的，因此按順序對每一行執行命令。然后，sed 將其結果寫入標準輸出 (stdout)，它不修改任何輸入文件。

讓我們看一些示例。頭幾個會有些奇怪，因為我要用它們演示 sed 如何工作，而不是執行任何有用的任務。然而，如果您是 sed 新手，那么理解它們是十分重要的。下面是第一個示例：

$ sed -e 'd' /etc/services

如果輸入該命令，將得不到任何輸出。那么，發生了什么？在該例中，用一個編輯命令 'd' 調用 sed。sed 打開 /etc/services 文件，將一行讀入其模式緩沖區，執行編輯命令（“刪除行”），然后打印模式緩沖區（緩沖區已為空）。然后，它對后面的每一行重復這些步驟。這不會產生輸出，因為 "d" 命令除去了模式緩沖區中的每一行！

在該例中，還有幾件事要注意。首先，根本沒有修改 /etc/services。這還是因為 sed 只讀取在命令行指定的文件，將其用作輸入 -- 它不試圖修改該文件。第二件要注意的事是 sed 是面向行的。'd' 命令不是簡單地告訴 sed 一下子刪除所有輸入數據。相反，sed 逐行將 /etc/services 的每一行讀入其稱為模式緩沖區的內部緩沖區。一旦將一行讀入模式緩沖區，它就執行 'd' 命令，然后打印模式緩沖區的內容（在本例中沒有內容）。我將在后面為您演示如何使用地址范圍來控制將命令應用到哪些行 -- 但是，如果不使用地址，命令將應用到 所有行。

第三件要注意的事是括起 'd' 命令的單引號的用法。養成使用單引號來括起 sed 命令的習慣是個好注意，這樣可以禁用 shell 擴展。

回頁首

另一個 sed 示例

下面是使用 sed 從輸出流除去 /etc/services 文件第一行的示例：

$ sed -e '1d' /etc/services | more

如您所見，除了前面有 '1' 之外，該命令與第一個 'd' 命令十分類似。如果您猜到 '1' 指的是第一行，那您就猜對了。與第一個示例中只使用 'd' 不同的是，這一次使用的 'd' 前面有一個可選的數字地址。通過使用地址，可以告訴 sed 只對某一或某些特定行進行編輯。

回頁首

地址范圍

現在，讓我們看一下如何指定地址范圍。在本例中，sed 將刪除輸出的第 1 到 10 行：

$ sed -e '1,10d' /etc/services | more

當用逗號將兩個地址分開時，sed 將把后面的命令應用到從第一個地址開始、到第二個地址結束的范圍。在本例中，將 'd' 命令應用到第 1 到 10 行（包括這兩行）。所有其它行都被忽略。

回頁首

帶規則表達式的地址

現在演示一個更有用的示例。假設要查看 /etc/services 文件的內容，但是對查看其中包括的注釋部分不感興趣。如您所知，可以通過以 '#' 字符開頭的行在 /etc/services 文件中放置注釋。為了避免注釋，我們希望 sed 刪除以 '#' 開始的行。以下是具體做法：

$ sed -e '/^#/d' /etc/services | more

試一下該例，看看發生了什么。您將注意到，sed 成功完成了預期任務。現在，讓我們分析發生的情況。

要理解 '/^#/d' 命令，首先需要對其剖析。首先，讓我們除去 'd' -- 這是我們前面所使用的同一個刪除行命令。新增加的是 '/^#/' 部分，它是一種新的 規則表達式地址。規則表達式地址總是由斜杠括起。它們指定一種模式，緊跟在規則表達式地址之后的命令將僅適用于正好與該特定模式匹配的行。

因此，'/^#/' 是一個規則表達式。但是，它做些什么呢？很明顯，現在該復習規則表達式了。

回頁首

規則表達式復習

可以使用規則表達式來表示可能會在文本中發現的模式。您在 shell 命令行中用過 '*' 字符嗎？這種用法與規則表達式類似，但并不相同。下面是可以在規則表達式中使用的特殊字符：

字符	描述
	與行首匹配
	與行末尾匹配
	與任一個字符匹配
	將與前一個字符的零或多個出現匹配
[ ]	與 [ ] 之內的所有字符匹配

感受規則表達式的最好方法可能是看幾個示例。所有這些示例都將被 sed 作為合法地址接受，這些地址出現在命令的左邊。下面是幾個示例：

規則表達式	描述
/./	將與包含至少一個字符的任何行匹配
/../	將與包含至少兩個字符的任何行匹配
/^#/	將與以 '#' 開始的任何行匹配
/^$/	將與所有空行匹配
/}^/	將與以 '}'（無空格）結束的任何行匹配
/} *^/	將與以 '}' 后面跟有零或多個空格結束的任何行匹配
/[abc]/	將與包含小寫 'a'、'b' 或 'c' 的任何行匹配
/^[abc]/	將與以 'a'、'b' 或 'c' 開始的任何行匹配

在這些示例中，鼓勵您嘗試幾個。花一些時間熟悉規則表達式，然后嘗試幾個自己創建的規則表達式?？梢匀缦率褂?regexp：

$ sed -e '/regexp/d' /path/to/my/test/file | more

這將導致 sed 刪除任何匹配的行。然而，通過告訴 sed 打印regexp 匹配并刪除不匹配的內容，而不是與之相反的方法，會更有利于熟悉規則表達式?？梢杂靡韵旅钸@樣做：

$ sed -n -e '/regexp/p' /path/to/my/test/file | more

請注意新的 '-n' 選項，該選項告訴 sed 除非明確要求打印模式空間，否則不這樣做。您還會注意到，我們用 'p' 命令替換了 'd' 命令，如您所猜想的那樣，這明確要求 sed 打印模式空間。就這樣，將只打印匹配部分。

回頁首

有關地址的更多內容

目前為止，我們已經看到了行地址、行范圍地址和 regexp 地址。但是，還有更多的可能。我們可以指定兩個用逗號分開的規則表達式，sed 將與所有從匹配第一個規則表達式的第一行開始，到匹配第二個規則表達式的行結束（包括該行）的所有行匹配。例如，以下命令將打印從包含 "BEGIN" 的行開始，并且以包含 "END" 的行結束的文本塊：

$ sed -n -e '/BEGIN/,/END/p' /my/test/file | more

如果沒發現 "BEGIN"，那么將不打印數據。如果發現了 "BEGIN"，但是在這之后的所有行中都沒發現 "END"，那么將打印所有后續行。發生這種情況是因為 sed 面向流的特性 -- 它不知道是否會出現 "END"。

回頁首

C 源代碼示例

如果只要打印 C 源文件中的 main() 函數，可輸入：

$ sed -n -e '/main[[:space:]]*(/,/^}/p' sourcefile.c | more

該命令有兩個規則表達式 '/main[[:space:]]*(/' 和 '/^}/'，以及一個命令 'p'。第一個規則表達式將與后面依次跟有任意數量的空格或制表鍵以及開始圓括號的字符串 "main" 匹配。這應該與一般 ANSI C main() 聲明的開始匹配。

在這個特別的規則表達式中，出現了 '[[:space:]]' 字符類。這只是一個特殊的關鍵字，它告訴 sed 與 TAB 或空格匹配。如果愿意的話，可以不輸入 '[[:space:]]'，而輸入 '['，然后是空格字母，然后是 -V，然后再輸入制表鍵字母和 ']' -- Control-V 告訴 bash 要插入“真正”的制表鍵，而不是執行命令擴展。使用 '[[:space:]]' 命令類（特別是在腳本中）會更清楚。

好，現在看一下第二個 regexp。'/^}' 將與任何出現在新行行首的 '}' 字符匹配。如果代碼的格式很好，那么這將與 main() 函數的結束花括號匹配。如果格式不好，則不會正確匹配 -- 這是執行模式匹配任務的一件棘手之事。

因為是處于 '-n' 安靜方式，所以 'p' 命令還是完成其慣有任務，即明確告訴 sed 打印該行。試著對 C 源文件運行該命令 -- 它應該輸出整個 main() { } 塊，包括開始的 "main()" 和結束的 '}'。

posted on 2010-05-20 21:20 baby-fly 閱讀(240) 評論(0) 編輯收藏引用所屬分類: Ubuntu&Linux

只有注冊用戶登錄后才能發表評論。


相關文章: tmux 分割終端 grub2 ccache ubuntu配置 linux 編譯添加一個模塊 AUPE 程序10-11 信號設置和sigprocmask實例 fork兩次如何避免僵尸進程收藏 vim 復制粘貼 SIGCLD和wait VIM全選 const char 與 char const

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

為生存而奔跑

留言簿(5)

我參與的團隊

隨筆分類

隨筆檔案

相冊

搜索

積分與排名

最新評論

閱讀排行榜

評論排行榜