国产精品嫩草影院久久,久久亚洲美女精品国产精品,国产99久久久国产精品小说

sed -i命��o(h��)详解

Prayer — Thu, 04 Apr 2019 09:49:00 GMT

https://www.cnblogs.com/ev-zhk/p/4277023.html

[root@www ~]# sed [-nefr] [动作] 选项与参敎ͼ�(x��) -n �Q���用安�?silent)模式。在一�?sed 的用法中�Q�所有来�?STDIN 的数据一般都�?x��)被列出到终端上。但如果加上 -n 参数后，则只有经�q�sed �Ҏ(gu��)��处理的那一�?或者动�?才会(x��)被列出来�?-e �Q�直接在命��o(h��)列模式上�q�行 sed 的动作编辑； -f �Q�直接将 sed 的动作写在一个文件内�Q?-f filename 则可以运�?filename 内的 sed 动作�Q?-r �Q?span style="margin: 0px; padding: 0px; color: #0000ff; line-height: 1.5 !important;">sed 的动作支持的是�g伸型正规表示法的语法�?默认是基���正规表示法语�? -i �Q�直接修改读取的文�g内容�Q�而不是输出到�l�端�? 动作说明�Q?[n1[,n2]]function n1, n2 �Q�不见得�?x��)存在，一般代表『选择�q�行动作的行数』，举例来说�Q�如果我的动作是需要在 10 �?20 行之间进行的�Q�则�?10,20[动作行�ؓ(f��)] �? function�Q?a �Q�新增， a 的后面可以接字串�Q�而这些字串会(x��)在新的一行出�?目前的下一�?�?c �Q�取代， c 的后面可以接字串�Q�这些字串可以取�?n1,n2 之间的行�Q?d �Q�删除，因�ؓ(f��)是删除啊�Q�所�?d 后面通常不接��M��咚咚�Q?i �Q�插入， i 的后面可以接字串�Q�而这些字串会(x��)在新的一行出�?目前的上一�?�Q?p �Q�列华ͼ�亦即���某个选择的数据印出。通常 p �?x��)与参�?sed -n 一赯���行～ s �Q�取代，可以直接�q�行取代的工作哩�Q�通常�q�个 s 的动作可以搭配正规表�C�法�Q�例�?1,20s/old/new/g ���是啦！

sed -i ��是直接�Ҏ(gu��)��本文件进行操作的

sed -i 's/原字�W�串/新字�W�串/' /home/1.txt sed -i 's/原字�W�串/新字�W�串/g' /home/1.txt

�q�两条命令的区别��是�Q�看�C�Z��?/p>

�q�是1.txt的内�?/p>

#cat 1.txt d ddd #ff

再看执行�q�两条命令的区别�?/p>

sed -i 's/d/7523/' /home/1.txt 执行�l�果 7523 7523dd #ff  sed -i 's/d/7523/g' /home/1.txt 执行�l�果 7523 752375237523 #ff

��L�� “行首” �?#8220;@”的首字母@

sed -i 's/^@//' file

特定字符串的行前插入新行

sed -i '/特定字符�?i 新行字符�?/span>' file

特定字符串的行后插入新行

sed -i '/特定字符�?a 新行字符�?/span>' file

特定字符串的删除

sed -i '/字符�?d' file

Prayer 2019-04-04 17:49 发表评论

Prayer — Thu, 04 Apr 2019 09:46:00 GMT

https://blog.csdn.net/halazi100/article/details/41722021

在��用sed�Ҏ(gu��)��志或者其它文本进行parse的过�E�当中，有时候我们需要引用外部变量的��|��

或者获取一个shell命��o(h��)执行的结果，以便辑ֈ�更加可观的输出结果。这里介�l�如何做到�?br style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; word-wrap: break-word;" />
sed中��用变量替�?br style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; word-wrap: break-word;" />
1.sed命��o(h��)使用双引��L(f��ng)��情况下，使用$var直接引用

$ echo|sed "s/^/$RANDOM.rmvb_/g"
29328.rmvb_

如果替换的变量内容中含有/�W�号则会(x��)提示如下错误�Q�如
查找当前目录下的目录文�g�q�将相对路径替换为绝对�\�?br style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; word-wrap: break-word;" />find . -type f | sed -n "s/\./$PWD/p"
sed: -e expression #1, char 19: unknown option to `s'
从语法上看，没有��M��问题�Q�但�׃��变量中包含有“/”作�ؓ(f��)分隔�W�，�q�会(x��)和sed的替换操作的分隔�W?#8220;/”引�v��h��Q�所以，只要不��?#8220;/”做分隔符��可以解册��个问题，如果使用“%”而不�?#8220;/”来作为sed的替换操作的分隔�W�，��׃��?x��)出错。其实��?�?�?作�ؓ(f��)分隔�W�也是可以的�Q�只要不�?x��)与替换中有相同的而且不是元字�W�的�Ҏ(gu��)��W�号都是可以的；使用时可以根据情�늁��z�选择�?br style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; word-wrap: break-word;" />find . -type f | sed -n "s%\.%$PWD%p"
find . -type f | sed -n "s#\.#$PWD#p"

# 上面例子引用了一个环境变�?RANDOM的�?br style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; word-wrap: break-word;" />
2.sed命��o(h��)使用单引��L(f��ng)��情况下，使用'"$var"'引用

�c�M��Q�我们可以看�?br style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; word-wrap: break-word;" />
$ echo|sed 's/^/'"$RANDOM"'.rmvb_/g'
31338.rmvb_

sed中执行外部命�?br style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; word-wrap: break-word;" />
1.sed命��o(h��)使用单引��L(f��ng)��情况下��?`shell command`'或�?$(shell command)'引用命��o(h��)执行的结�?br style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; word-wrap: break-word;" />
�q�是以上面案例分析，例子如下

$ echo|sed 's/^/'`echo $RANDOM`'.rmvb_/g'
8063.rmvb_

# 上面的例子��用了旧式的命令替换，也可以采用新式的命��o(h��)替换�Ҏ(gu��)��Q�如�?br style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; word-wrap: break-word;" />
$ echo|sed 's/^/'$(echo $RANDOM)'.rmvb_/g'
18554.rmvb_

# 下面例子取用当前日期作�ؓ(f��)�l�果的一部分�Q�如�?br style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; word-wrap: break-word;" />
$ echo|sed 's/^/'$(date +"%Y%m%d")'.rmvb_/g'
20120108.rmvb_

2.sed命��o(h��)使用双引��L(f��ng)��情况下直接`shell command`或�?(shell command)引用命��o(h��)执行的结�?br style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; word-wrap: break-word;" />

�c�M��的，双引��L(f��ng)��情况�Q�如�?br style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; word-wrap: break-word;" />
$ echo|sed "s/^/$(date +"%Y%m%d").rmvb_/g"
20120108.rmvb_

# 使用环境变量$RANDOM以及(qi��ng)旧式命��o(h��)替换的例�?br style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; word-wrap: break-word;" />
$ echo|sed "s/^/`echo $RANDOM`.rmvb_/g"
4988.rmvb_

�ȝ��

在sed语句里面�Q�变量替换或者执行shell命��o(h��)�Q�双引号比单引号��绕一些弯�?/p>

Prayer 2019-04-04 17:46 发表评论

linux 比较两个文�g夹不�?(diff命��o(h��), md5列表)

Prayer — Thu, 04 Apr 2019 09:46:00 GMT

比较文�g夹diff�Q�可以直接��用diff命��o(h��)

[root@~]# diff -urNa dir1 dir2
　　-a Treat all files as text and compare them line-by-line, even if they do not seem to be text.
　　-N, --new-file
　　　　In directory comparison, if a file is found in only one directory, treat it as present but empty in the other directory.
　　-r When comparing directories, recursively compare any subdirectories found.

　　-u Use the unified output format.

比较文�g夹diff�Q�也可以比较文�gMD5列表。下面命令可以获取文件夹中文件md5列表

find /home/ -type f -not $ -name '.*' $ -exec md5sum {} \;

说明�Q?1) /home/文�g目录

　　 (2) -type f 文�g�c�d��为普通文�?/p>

　　 (3) -not $ -name '.*' $ �q��o(h��)掉隐藏文件。可以过滤掉不需要考虑的文�?/p>

(4) -exec md5sum {} \; �Ҏ(gu��)��个文件执行md5sum命��o(h��)

用tar命��o(h��)压羃后，比较文�g的MD5是不行的。tar压羃�?x��)带上文件的旉��?/strong>

Prayer 2019-04-04 17:46 发表评论

Prayer — Thu, 04 Apr 2019 09:13:00 GMT

https://www.jianshu.com/p/66f79ad53406

如果知道行号可以用下面的�Ҏ(gu��)��
sed -i '88 r b.file' a.file #在a.txt的第88行插入文件b.txt awk '1;NR==88{system("cat b.file")}' a.file > a.file
如果不知道行��P��可以用正則匹�?/h3>
sed -i '/regex/ r b.txt' a.txt # regex是正则表辑ּ� awk '/target/{system("cat b.file")}' a.file > c.file
sed的話如果不改变源文�g�Q�可以去�?i开养I��修改�?x��)输出到STDOUT
原文�Ӟ��(x��)
[root@xiaowu shell]# cat -n file 1 aaaa 2 bbbb 3 cccc 4 dddd
现在要在�W�二行即“bbbb”行的下面��d��一行，内容�?#8220;xiaowu”
[root@xiaowu shell]# sed '/bbbb/a\xiaowu' file aaaa bbbb xiaowu cccc dddd
如果要加两行“xiaowu”可以用一下语句，注意�?#8220;\n”换行
[root@xiaowu shell]# sed '/bbbb/a\xiaowu\nxiaowu' file aaaa bbbb xiaowu xiaowu cccc dddd
如果要在�W�二行即“bbbb”行的上添加一行，内容�?#8220;xiaowu”�Q�可以把参数“a”换成“i”
[root@xiaowu shell]# sed '/b/i\xiaowu' file aaaa xiaowu bbbb cccc dddd
以上文�g中只有一行匹配，如果文�g中有两行或者多行匹配，�l�果有是如何呢？
[root@xiaowu shell]# cat -n file 1 aaaa 2 bbbb 3 cccc 4 bbbb 5 dddd
[root@xiaowu shell]# sed '/bbbb/a\xiaowu' file aaaa bbbb xiaowu cccc bbbb xiaowu dddd
��q��果可知，每个匚w��行的下一行都�?x��)被��d��“xiaowu”
那么如果指向在第二个“bbbb”的下一行添加内�?#8220;xiaowu”�Q�该如何操作呢？
可以考虑先获取第二个“bbbb”行的行号�Q�然后根据行号在此行的下一行添�?#8220;xiaowu”
获取�W�二�?#8220;bbbb”行的行号的方法：(x��)
�Ҏ(gu��)��一�Q?/p>
[root@xiaowu shell]# cat -n file |grep b |awk '{print $1}'|sed -n "2"p 4
�Ҏ(gu��)��二：(x��)
[root@xiaowu shell]# sed -n '/bbbb/=' file |sed -n "2"p 4
��q��果可知第二个“bbbb”行的行号�?�Q�然后再在第四行的前或后��d��相应的内�?
[root@xiaowu shell]# sed -e '4a\xiaowu' file aaaa bbbb cccc bbbb xiaowu dddd
[root@xiaowu shell]# sed -e '4a\xiaowu\nxiaowu' file aaaa bbbb cccc bbbb xiaowu xiaowu dddd
向指定行的末��添加指定内容，比如�?#8220;ccccc”行的行尾介绍“ eeeee”
[root@xiaowu shell]# cat file aaaaa bbbbb ccccc ddddd [root@xiaowu shell]# sed 's/cc.*/& eeeee/g' file aaaaa bbbbb ccccc eeeee ddddd
原文链接

Prayer 2019-04-04 17:13 发表评论

Linux Sftp 下蝲整个文�g目录

Prayer — Mon, 18 Mar 2019 06:42:00 GMT

直接看图�Q?/span>

有两个特点：(x��)
1�Q��?r参数
2�Q�在目录后面使用"."�?br style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; word-wrap: break-word;" />
�q�样的话��可以把/opt/merkle 目录和子目录里面的文件全部下载到本地了�?/span>

Prayer 2019-03-18 14:42 发表评论

Prayer — Fri, 01 Mar 2019 07:20:00 GMT

在匹配字�W�串相等�Ӟ��我用了类��D��L(f��ng)��语句�Q?/span>
if [ $STATUS == "OK" ]; then
echo "OK"
fi
    在运行时出现�?#8220; [: =: unary operator expected” 的错误，��׃��直找不到原因�Q�尝试了删除�{�号两侧的空格和括号里的�I�格都不��用。最�?a target="_blank" style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; color: #6795b5; text-decoration: none; cursor: pointer; word-wrap: break-word;">baidu了一下，才找到原因，在条件表辑ּ�外再��d��一�?#8220;[]”�Q�就不会(x��)出错了，如下�Q?/span>
if [[ $STATUS = "OK" ]]; then
echo "OK"
fi
    �I�其原因�Q�是因�ؓ(f��)如果变量STATUS��gؓ(f��)�I�，那么条�g表达�?/span>��成�?[ = "OK"] �Q�显�?[ �?"OK" 不相�{��ƈ且缺��了 [ �W�号�Q�所以报了这��L(f��ng)��错误。当然不��L��出错�Q�如果变量STATUS��g��为空�Q�程序就正常了，所以这��L(f��ng)��错误�q�是很隐蔽的�?/span>
    或者，用下面的�Ҏ(gu��)��也能避免�q�种错误�Q?/span>
if [ "$STATUS"x == "OK"x ]; then
echo
"OK"
fi�?/span>
当然�Q�x也可以是其他字符。顺便提一点，shell中有没有双引号在很多情况下是一致的�?/span>

转自�Q?a rel="nofollow" target="_blank" style="box-sizing: border-box; outline: 0px; margin: 0px; padding: 0px; color: #336699; text-decoration: none; cursor: pointer; word-wrap: break-word;">http://hi.baidu.com/vishare/blog/item/bd8ab9ee289753252cf53417.html

Prayer 2019-03-01 15:20 发表评论

Prayer — Thu, 24 Jan 2019 06:18:00 GMT
     摘要: https://www.cnblogs.com/zwgblog/p/6031256.html假设有变�?var=http://www.aaa.com/123.htm.1. # ��h��取，删除左边字符�Q�保留右边字�W��?echo ${var#*//} 其中 var 是变量名�Q? ��h��q�算�W�，*// 表示从左边开始删除第一�?// 号及(qi��ng)左边的所有字�W�即删除 http://�l�果�?�Q�www.aaa...  阅读全文

Prayer 2019-01-24 14:18 发表评论

Prayer — Mon, 29 Nov 2010 10:50:00 GMT

fg、bg、jobs�?amp;、ctrl + z都是跟系�l��Q务有关的�Q�虽然现在基本上不怎么需要用到这些命令，但学�?x��)了也是很实用�?br>一�?amp; 最�l�常被用�?br> �q�个用在一个命令的最后，可以把这个命令放到后台执�?br>二。ctrl + z
可以��一个正在前台执行的命��o(h��)攑ֈ�后台�Q��ƈ且暂�?br>三。jobs
查看当前有多��在后台�q�行的命�?br>四。fg
��后��C��的命令调臛_��台��l�运�?br> 如果后台中有多个命��o(h��)�Q�可以用 fg %jobnumber��选中的命令调出，%jobnumber是通过jobs命��o(h��)查到的后台正在执行的命��o(h��)的序�?不是pid)
五。bg
��一个在后台暂停的命令，变成�l�箋执行
如果后台中有多个命��o(h��)�Q�可以用bg %jobnumber��选中的命令调出，%jobnumber是通过jobs命��o(h��)查到的后台正在执行的命��o(h��)的序�?不是pid)

Prayer 2010-11-29 18:50 发表评论

shell数组详解

Prayer — Wed, 15 Sep 2010 05:26:00 GMT

Bash中还可以使用数组变量,其赋值有两种:

(1) name = (value1 ... valuen) 此时下标�?开�?br>(2) name[index] = value

数组下标的范围没有�Q何限�?同时也不必��用连�l�的分量.

$ A=(a b c def)

==================================================
$ echo ${A[@]}          //取全部元�?br>a b c def

=================================================

$ echo ${A[0]}         //取第一个元�?br>a

=================================================

//取得数组元素的个�?br>$ echo ${#A[@]}
4
$ echo ${#A[*]}
4
$ echo ${#A[3]}     //取得元素3的长�?/div>
$

==================================================

$ A[3]=yaoshuyin    //��第三个元素重新赋�?br>$ echo ${A[@]}
a b c yaoshuyin

==================================================
//清除变量
$ unset A
$ echo ${A[@]}

$

==================================================

//清空变量,卛_��值变为空
$ A=
$ echo ${A[@]}

$

==================================================

A=B
B=C
unset $A 事实上所取消的变量是 B 而不�?A

=======================�C�Z�� while循环========================

#建立数组
arrSource=("arrJobs.php" "arrSubHangye.php" "arrFirst.php" )

arrDest=("buildhr"            \
         "buildtrain/htdocs" \
         "bankhr"             \
         "healthr"            \
         "elehr"              \
         )

#取数�l�无元素个数
lenArrSource=${#arrSource[*]}
lenArrDest=${#arrDest[*]}

#循环列出数组元素
i=0
while [ $i -lt $lenArrSource ]
do
   echo ${arrSource[$i]}
   let i++
done

i=0
while [ $i -lt $lenArrDest ]
do

   echo ${arrDest[$i]}

   let i++

done

=======================�C�Z��Q?for循环===============================

#源文�?/span>

arrSource=("/home/800hr/htdocs/login_jump.php")

#目标�|�站

arrDest=(ithr elehr buildhr bankhr healthr ctvhr chenhr mechr clothr cneduhr 56hr tourhr foodhr greenhr cnlawhr waimaohr)

for outer in ${arrSource[*]}
#${arrSource[*]} 是数�l�中的所有元�?/span>

do

   for inner in ${arrDest[*]}

   do

      echo "ln -s $outer /home/${inner}/campus/"

   done

done

Prayer 2010-09-15 13:26 发表评论

sed的一��强例子集锦的翻�?�?

Prayer — Wed, 15 Sep 2010 03:13:00 GMT
sed的一��强例子集锦的翻�?
��译了一�?
http://bbs.chinaunix.net/forum/24/20040514/325187.html

我是新手�Q�翻译得不好�Q�加注得马马虎虎�Q�很多地斚w��是凭自己的理解写的。由于刚开始学sed�Q�所以很多地方写得很初��Q�呵呵，隑օ�有些�|�嗦。写到最后又有些头晕�Q�还请大虾们多多指点�Q�里头好几个命��o(h��)我解释不清楚�Q�如不吝赐教�Q�感�Ȁ不尽�Q?nbsp;

FILE SPACING:
# double space a file
#使一个文件中每一行都占用两行�I�间(��是在每一行后�Ҏ(gu��)��一行空�?
sed G
###sed 中G命��o(h��)的解释�ؓ(f��)append hold space to pattern space.
###��是在当前位�|�后加一行保留空间中的内容，无�Q何动作时�Q�保留空间�ؓ(f��)�I��
###所以就double space a file 了，呵呵�Q?
# double space a file which already has blank lines in it. Output file
# should contain no more than one blank line between lines of text.
#假若文�g已经含有�I�白行在其中�Q��一个文件中每一行占用两�?
#�I�间。输出文件中文本行之间不含有��过一行的�I��
sed '/^$/d;G'
###先用sed '/^$/d' 查找�q�删除空行；然后�?sed G插入�I��
# triple space a file
#使一个文件中每一行都占用三行�I�间(��是在每一行后�Ҏ(gu��)��两行�I��)
sed 'G;G'
###不用说了吧，重复两次sed G.
# undo double-spacing (assumes even-numbered lines are always blank)
#撤销占用两行�I�间�?�?假设偶数行都是空白行)
sed 'n;d'
###sed 中命令n的解释�ؓ(f��)Read　the next line of input into the pattern space�Q?
###所以我理解为用sed n ��d��下一行兵紧接着用sed d 删除�Q�如果隔两行删除一行那�?
###用sed 'n,n,d',要是�?00行删除一行呢....什�???!!!你要�?00个n???!!!
# insert a blank line above every line which matches "regex"
#在每个含有字�W�串regex的行上插入一行空白行
sed '/regex/{x;p;x;}'
###sed 中命令x解释为Exchange the contents of the hold and pattern spaces.
###我的理解也就是交换保留空间与模式�I�间的内�?
###sed 中命令p为Print the current pattern space�Q�就是打印模式空间中的内容．
###所以理解�ؓ(f��)保留�I�间中开始�ؓ(f��)�I��Q�模式空间中�l�过sed '/regex/'查询后�ؓ(f��)包含
###regex内容的那一行，1)x;交换模式�I�间和保留空间的内容�Q�此时模式空间中内容
###为空行，保留�I�间中内容�ؓ(f��)含有regex内容的行�Q?2)p�Q�命令打印模式空间内�?
###�I��)�Q�在原文中含有regex内容的那一行的位置出现两行�I��Q�其中后一行�ؓ(f��)
###模式�I�间中的内容�Q?)x;后交换模式空间和保留�I�间中的内容�Q�．�Q�．�Q�结果就是在�?
###来出现regex的位�|�前一行加入了一行空行�?
# insert a blank line below every line which matches "regex"
# 在每个含有字�W�串regex的行下插入一行空白行
sed '/regex/G'
###比较��单，查找后在后边加入一�I��
# insert a blank line above and below every line which matches "regex"
#在每个含有字�W�串regex的行上，下各插入一行空白行
sed '/regex/{x;p;x;G;}'
###兄弟两个sed '/regex/G'和sed '/regex/{x;p;x;}'合作的结果．
NUMBERING:
# number each line of a file (simple left alignment) Using a tab (see
# note on '\t' at end of file)instead of space will preserve margins.
#�l�文件每一行加上数字序受��用TAB制表�W�替换空间来保留�I�白(?)
#(在数字序号和文本中间加一TAB制表�W?
sed = filename | sed 'N;s/
/\t/'
###sed = filename的功能是 Print the current line number.
###但是�q�个功能是在每一行前面另加一行，�q�且昄��行号,而不是直接在行首加序�?
###sed中命令N的解释�ؓ(f��)Append the next line of input into the pattern space.
###也就是把当前行后一行的内容加在当前行后边．
###sed中命令s/regexp/replacement/解释为Attempt to match regexp against the
###pattern space. If successful, replace that portion matched with
### replacement.大概意思是在模式空间外匚w��regexp�Q�如果成功，使用匚w��replace
###ment的内�Ҏ(gu��)��换regexp.说白了就是查找替换吧�Q?br>是换行符,\t是TAB制表�W?
###所以整个命令的意思也��出来了�Q?
# number each line of a file (nnumber on left, right-aligned)
#�l�文件每一行加上数字序�?数字在左边，向右寚w��Q?
sed = filename | sed 'N; s/^/ /; s/ *$.\{6,\}$
/\1 /'
### 前面不用说了�Q�但是后�?.....
###s/ *$.\{6,\}$
/\1 /' �q�个地方��实不是很明�?~~
# number each line of file, but only print numbers if line is not blank
#�l�文件每一行加上数字序��P��但是仅当行非�I�时打印数字
sed '/./=' filename | sed '/./N; s/
/ /'
###sed '/./=' filename的用处是查找除非�I��赋予行号,sed '/./N; s/
/ /'查找�?
##�I��q�把后一行附加到当前�?然后用空格替换换行符

# count lines (emulates "wc -l")
#�l�计行数(�c�M��?"wc -l")
sed -n '$='
#sed中参数n的含义是suppress automatic printing of pattern space,也就是限�?
###自动打印模式�I�间中内容的功能�Q?'$='�?的含义是Match the last line�Q?前边
###已经说过了，��是打印行号�Q�所以匹配最后一行而且只打印行号不打印内容�Q�就�?
###"wc -l"�?
TEXT CONVERSION AND SUBSTITUTION:
# IN UNIX ENVIRONMENT: convert DOS newlines (cR/LF)to Unix format
#在UNIX环境下：(x��)转换DOS换行�W??)(cR/LF)UNIX格式
sed 's/.$//' # assumes that all lines end with CR/LF
# 假设所有的行都以CR/LF�l�尾
###可能在DOS中的ASCII�?包括CR/LF)��C��UNIX中都成了单字�W�吧�Q�又因�ؓ(f��)".$"代表
###每行最后一个字�W�，所以把它们替换掉就O(ji��n)K了．CR/LF是啥�Q�CR---ASCII Carriage
###Return(ASCII 回�R) ,LF----ASCII Linefeed (ASCII换行)
sed 's/^M$//' # in bash/tcsh, press Ctrl-V then Ctrl-M
#在bash/tcsh中，按下Ctrl-V然后�?Ctrl-M
###没啥说的�Q�就是查找替换，注意命��o(h��)�?^M"在输入时一定是按下Ctrl-V然后�?Ctrl-M
###如果输入成ctrl+6键，然后输入一个大写M,什么替换也完成不了啦．
sed 's/\x0D$//' # gsed 3.02.80, but top script is easier
# ???
###不是很了解！高手说一下吧�Q?
# IN UNIX ENVIRONMENT: convert Unix newlines (F)to DOS format
#在unix环境中：(x��)转换Unix换行�W?F)DOS格式
sed "s/$/`echo -e \\\r`/" # command line under ksh
　　　　　　　　　　　　　#在ksh下的命��o(h��)�?
sed 's/$'"/`echo \\\r`/" # command line under bash
　　　　　　　　　　　　 #在bash下的命��o(h��)�?
sed "s/$/`echo \\\r`/" # command line under zsh
#在zsh下的命��o(h��)�?
sed 's/$/\r/' # gsed 3.02.80
　　　　　　　# gsed3.02.80版本下的命��o(h��)�?
###以上四个命��o(h��)是在不同的shell版本下用\r(好象��是ASCII码下的CR)替换行尾
# IN DOS ENVIRONMENT: convert Unix newlines (F)to DOS format
#在DOS环境下�{换Unix换行�W�到DOS格式
sed "s/$//" # method 1
sed -n p # method 2
###�q�句又不是很了解�Q�本�?��是行尾了，把行��替换成�I�，那就变成了DOS格式了吗�Q?
###下边一句也很奇怪，参数-n是suppress automatic printing of pattern space�Q�命
###令p是Print the current pattern space�Q�一正一反就换成DOS格式了？乖乖~~
# IN DOS ENVIRONMENT: convert DOS newlines (cR/LF)to Unix format
#在Dos环境下：(x��)转换DOS换行�W��ؓ(f��)UNIX格式
# Cannot be done with DOS versions of sed. Use "tr" instead.
#用DOS版本的sed不能做到�q�点�Q�用"tr"代替�Q?
tr -d \r outfile # GNU tr version 1.22 or higher
　　　　　　　　　　　　　#GNU tr 1.22版本或者更高版�?
# delete leading whitespace (spaces, tabs)from front of each line
# aligns all text flush left
#删除每一行开头的�I�白(�I�格�Q�TAB)左对齐排列全文．
sed 's/^[ \t]*//' # see note on '\t' at end of file
　　　　　　　　　# ???
### 又是替换成空�Q�^[ \t]* 的含义�ؓ(f��)以空格或者TAB键开始的(或者是他们的组�?行．
# delete trailing whitespace (spaces, tabs)from end of each line
#从每一行结��֤�删除最后的�I�格(�I�格,TAB)
sed 's/[ \t]*$//' # see note on '\t' at end of file
#??
### 跟上边的命��o(h��)"前呼后拥"呀�Q?
# delete BOTH leading and trailing whitespace from each line
#删除每一行的开头和�l�尾的空�?
sed 's/^[ \t]*//;s/[ \t]*$//'
###两步赎ͼ�
# insert 5 blank spaces at beginning of each line (ake page offset)
#在每一行开始处插入5个空�?整页偏移)
sed 's/^/ /'
###没啥说的�Q?
# align all text flush right on a 79-column width
#叛_��齐，�?9列宽排列所有文�?
sed -e :a -e 's/^.\{1,78\}$/ &/;ta' # set at 78 plus 1 space
###�q�个语句好像很麻�?ch��)，不过看懂了还挺有意思．�Q�）(j��)
###首先出现了几个新东东1.":" 2."&". 3. "-e " 4."t"�Q�解释一�?
###1.":" Label for b and t commands.(�l�b和t命��o(h��)加注标签)
###2."&"　表示重复整个匚w��的规则表辑ּ��Q?
###3. "-e" add the script to the commands to be executed
### 把脚本加到命令里用以执行
###4. t label If a s/// has done a successful substitution since the last
###input line was read and since the last t or T command, then branch to
###label; if label is omitted, branch to end of script.
###如果从读入最后一个输入行�q�且执行最后一个t或者T命��o(h��)后，一个s///命��o(h��)成功替换�Q?
###那么��程分支指向label处，如果label被忽�?��是没有成功替换吧，我想),那么��程
###分支指向脚本�l�束�Q?
###回过头来看，整个sed命��o(h��)行是一个��@环执行的语句�Q�每一行都要替�?78-当前行的�?
###�W�数)��?所以如果整个文件比较大�Q�或者一行字�W�数比较?y��u)��，做这个动作就有点吃力了�?
###不信你试试吧�Q�呵呵．
# center all text in the middle of 79-column width. In method 1,
# spaces at the beginning of the line are significant, and trailing
# spaces are appended at the end of the line. In method 2, spaces at
# the beginning of the line are discarded in centering the line, and
# no trailing spaces appear at the end of lines.
#使所有文本居�?9列宽的格式中央。在�W�一�U�方法中�Q�每一行开头处的空格是
#很重要的�Q�最后的�I�格被附在行��。第二种�Ҏ(gu��)��中，一行开头的�I�格在中心对
#齐的行中被丢弃，行尾也没有原来结��֤�的空根{�?
sed -e :a -e 's/^.\{1,77\}$/ & /;ta' # method 1
sed -e :a -e 's/^.\{1,77\}$/ &/;ta' -e 's/$*$1/\1/' # method 2
###跟上边的差不�?当两辚w��加空格的时候，效率要高一些~~
# substitute (ind and replace)"foo" with "bar" on each line
#在每一行中�?bar"替换(扑�ƈ替换)foo"
sed 's/foo/bar/' # replaces only 1st instance in a line
# 在一行中�Q�仅在第一�ơ出现时替换
sed 's/foo/bar/4' # replaces only 4th instance in a line
#在一行中�Q�仅在第四次出现时替�?
sed 's/foo/bar/g' # replaces ALL instances in a line
#在一行中替换所有出现的�?
###�q�三个命令很��?不多说了.
sed 's/$.*$foo$.*foo$/\1bar\2/' # replace the next-to-last case
#替换紧邻最后一个匹配出现的�?
###'s///---- The replacement may contain the special character & to refer to that
###portion of the pattern space which matched, and the special escapes \1
### through \9 to refer to the corresponding matching sub-expressions in the regexp.
###��׃��直接��译了，大概意思就是replacement处可以包�?amp;代表匚w��的模式空间中
###的部�?�Ҏ(gu��)��的\1-\9可以代表regexp中相应的"子表辑ּ�",也就是说前面regexp
###可以分�ؓ(f��)几个子表辑ּ�,而后边replacement中可以用\1-\9分别代表它们.�q�样��?
###增加了灵�z�L��，便于修改sed命��o(h��).
###把regexp中的\��L��后，��变�?.*)foo(*foo),其中(.*)表示零个或者多个字�W�，
###�q�样加上后边的\1bar\2��变成了改变倒数�W�二个foo,而倒数�W�一个不�?
sed 's/$*$foo/\1bar/' # replace only the last case
#只替换最后一个�?
###比上一个简�?
# substitute "foo" with "bar" ONLY for lines which contain "baz"
#在每一含有"baz"的行中用"bar"替换(查找�q�替�?foo"
sed '/baz/s/foo/bar/g'
### /baz/用来查找�Q�后边的用来替换
# substitute "foo" with "bar" EXCEPT for lines which contain "baz"
#在每一不含�?baz"的行中用"bar"替换(扑�ƈ替换)foo"
sed '/baz/!s/foo/bar/g'
###反其道而行之．
# change "scarlet" or "ruby" or "puce" to "red"
#��?scarlet"或�?ruby"或�?puce"替换�?red"
sed 's/scarlet/red/g;s/ruby/red/g;s/puce/red/g' # most seds
#大多数sed可用
###三步赎ͼ�
gsed 's/scarlet\|ruby\|puce/red/g' # GNU sed only
#仅GNU sed可用
# reverse order of lines (emulates "tac")
#反�{文章行的��序(�c�M��"tac" )
# bug/feature in HHsed v1.5 causes blank lines to be deleted
#???????
sed '1!G;h;$!d' # method 1
###
###首先看第一个命�?!G�Q�这个是啥意�?"!"表示后边的命令对所有没�?
###被选定的行发生作用�Q�G呢？获得保留�I�间(专业名词叫内存缓冲区?)�?
###的内容，�q�追加到当前模式�I�间的后�?1��是选定�W�一�?h的含义是拯��
###模式�I�间内容��C��留空�?内存�~�冲�?。那么先�?sed '1!G'什么含�?
###执行一下这个命令，假若文�g�?
### $ cat test.txt
### 1
### 2
### 3
### 4
###那么 sed '1!G' test.txt的结果是
### $ sed '1!G' test.txt
### 1
### 2
###
### 3
###
### 4
###
### $
### 也就是说除了�W�一�?后边每行都加了空�?�q�是因�ؓ(f��)内存�~�冲��Z��默认�?
###是空行吧。然后我们加上h,看看发生什�?
### $ sed '1!G;h' test.txt
### 1
### 2
### 1
### 3
### 2
### 1
### 4
### 3
### 2
### 1
### $
### �I��没了�Q�咋回事?我是�q�样理解的，不知道对不对�Q�大家帮助看看：(x��)�Q?
###首先要确定，执行到每一行，sed把当前处理的行存在��(f��)时的�~�冲区内�Q?
###�U�Cؓ(f��)模式�I�间(pattern space).一旦sed完成�Ҏ(gu��)��式空间中行的处理�Q�模�?
###�I�间中的行就被送往屏幕�Q�行被处理完成后�Q�就被移出模式空��_(d��)��Q�．
###
###命��o(h��)执行�W�一行时�Q�由于匹配了�W�一行，所�?!G"不�v作用�Q�只打印�?
###�W�一行的内容�Q�然�?h"把模版块中的内容也就是第一行的内容拯��q�缓冲区�Q?
###注意此时是用�W�一行的内容替换�I��.模式�I�间中的内容要打华ͼ�所以出�?.
###执行到第二行�Ӟ��打印�W�二行内容，而且�׃��不匹�?1",所以在后边"G"命��o(h��)�?
###作用,获得了缓冲区中的�W�一行的内容�Q�然后加到当前模式空间中�Q��ƈ打印,出现
###21。然后把模式�I�间中的内容写入�~�冲区，也就是把21写入�~�冲区。执行到�W�三�?
###匚w��不成�?所以缓冲区的内容应该是�W�二行的内容加上�W�一行的内容�Q�追加到�?
###式空间的�W�三行后边：(x��)321.然后�?21拯��到缓冲区�Q�．�Q�．以此�c�L��出��C��?
###面的�l�果.
###我不知道�q�么解释对不对，但是当我把命令中�?换成2�Q?�Q?后执行，得到了我
###惌��的结果。还请高手指点~~
###加上最后一�?$!d",那就是前面三行的�l�果删除�Q�保留最后一行。这样就形成�?
### tac的效果啦�?
sed -n '1!G;h;$p' # method 2
###与上边类似的�Q�不�|�嗦!
# reverse each character on the line (emulates "rev")
#反�{一行中每个字符的顺�?�c�M��"rev")
sed '/
/!G;s/$.$$.*
$/&\2\1/;//D;s/.//'
###�q�个命��o(h��)真是.....
###我是在解释不�?所以按照我的想法来说一下吧,完全是瞎�?
###'/
/!G'是判断本行是否有换行�W?如果没有执行G命��o(h��)
###'s/$.$$.*
$/&\2\1/'命��o(h��)是在原来�?�W�二个字�W?或者没�?开始到换行�W?�W�一个字�W?
###//D命��o(h��)是在模式�I�间删除�W�一�?注意执行完成后如果模式空间不为空�Q��l�下一�?
###循环执行.
###s/.//命��o(h��)是删除第一个字�W?
###假设一行文字是 123

###那么执行后模式空间中的内容应该按下边的顺序变�?
### 123

### 123
23
1
### 23
1
### 23
13
21
### 13
21
### 3
21
### 3
21
321
###
321
### 321
### 我的疑问��是,��Z��么第一�ơ没有执行s/.//?!如果执行�?那么��得不到�l�果了啊!
### 救~~~~命~~~啊！????????????????????????????????
# join pairs of lines side-by-side (like "paste")
#把两行合��Z��?�c�M��?paste")
sed '$!N;s/
/ /'
###�q�个命��o(h��)�Ҏ(gu��)�� sed 'N;s/
/ /'一样可以达到目的，不知前面
###�?!有什么用�?..
# if a line ends with a backslash, append the next line to it
#如果一行以"\"�l�束�Q�把下一行加在此行上
sed -e :a -e '/\\$/N; s/\\
//; ta'
###循环%作，两次替换�?
# if a line begins with an equal sign, append it to the previous line
# and replace the "=" with a single space
#如果一�{�号开始某一行，把这一行加到前一行后边，�q�且用一个空格替换等�?
sed -e :a -e '$!N;s/
=/ /;ta' -e 'P;D'
###和上边差不多�Q�要注意两个新的命��o(h��):
### P命��o(h��)--Print up to the first embedded newline of the current
###pattern space.打印当前模式�I�间中第一行�?
###D命��o(h��)--Delete up to the first embedded newline in
### the pattern space. Start next cycle, but skip reading from
###the input if there is still data in the pattern space.
###删除当前模式�I�间中第一行。开始新的��@环，但是如果在模式空间中仍然
###有数据，那么跌��d��输入�?
# add commas to numeric strings, changing "1234567" to "1,234,567"
#�l�数字串加逗号�Q�把"1234567"变�ؓ(f��)"1,234,567"
gsed ':a;s/\B[0-9]\{3\}\>/,&/;ta' # GNU sed
sed -e :a -e 's/$.*[0-9]$$[0-9]\{3\}$/\1,\2/;ta' # other seds
###(.*[0-9])表示零个或者多个字�W?可能包含数字)+一个数�?�?
###([0-9]{3})表示三个数字,然后不停的替�?直到条�g不成�?也就是没�?
###四个以上�q�箋的数字出现就停止�?
# add commas to numbers with decimal points and minus signs (NU sed)
#�l�带有小数点和负��L(f��ng)��数字的数字加上逗号
gsed ':a;s/$^\|[^0-9.]$$[0-9]\+$$[0-9]\{3\}$/\1\2,\3/g;ta'
###没有gsed�Q�不解释�?
# add a blank line every 5 lines (after lines 5, 10, 15, 20, etc.)
#每五行后加一�I��
gsed '0~5G' # GNU sed only
sed 'n;n;n;n;G;' # other seds
###一大早��p��q�了�?..
SELECTIVE PRINTING OF CERTAIN LINES:
# print first 10 lines of file (emulates behavior of "head")
#打印一个文件的�?0�?模仿动作"head")
sed 10q
# print first line of file (emulates "head -1")
#打印一个文件的�W�一�?�?head -1")
sed q
### q命��o(h��)的解释Immediately quit the sed script without processing
###any more input, except that if auto-print is not disabled the
###current pattern space will be printed.
### 所以上边两个命令都清楚了，执行到第10行退出就打印�?0行，执行�W�一�?
###��退出就打印�W�一�?
# print the last 10 lines of a file (emulates "tail")
#打印一个文件的�?0�?�?tail")
sed -e :a -e '$q;N;11,$D;ba'
###Label b : Branch to label; if label is omitted, branch to end of script.
###命��o(h��)D 删除模式�I�间内第一�?newline 字母
前的资料�?
###命��o(h��)N 把输入的下一行添加到模式�I�间中�?
### b label:分支到脚本中带有标号的地方，如果标号不存��分支到脚本的末��?
###
waker 写到:
试着注一下，不知道对不对
如果我们只看sed -e :a -e '$q;N;ba'
�q�个循环不停的读入下一行直到结��，�q�样整个文本��Ş成一个由
分割的链
现在加上11,$D
sed -e :a -e '$q;N;11,$D;ba'
如果文本不超�q?0�?
模式�I�间��保留整个文本打印出�?
如果文本大于10�?
从第11行开始，在下一行加入到链中后，模式�I�间�W�一个由
分割的记录将被删除，�q�样看�v来就是链头被铑ְ�挤出整个链，��L��保持10个链环，循环�l�束后，链中保存的就是文件的�?0�?最后印出结�?

# print the last 2 lines of a file (emulates "tail -2")
#打印一个文件的最后两�?�?tail -2")
sed '$!N;$!D'
### 开始看不太懂，抄了CU�_�֍�一�D?
###sed '$!N;$!D' : �Ҏ(gu��)��件倒数�W�二行以前的行来��_(d��)��N ��当前行的下一行放到模
###式空间中以后�Q�D ��将模式�I�间的内容删除了�Q�到倒数�W�二行的时候，��最后一�?
###附加到倒数�W�二行下面，然后最后一行不执行 D �Q�所以文件的最后两行都保存下来了�?
###不知道是�q�段话说得有些含�p�，�q�是我理解得有偏差，总觉得D命��o(h��)解释�?
###"��模式空间的内容删除�?有些让�h�p�涂.
###而我是这��L(f��ng)��解的�Q�不知道对不�?首先说D命��o(h��)�?Delete up to the first
###embedded newline in the pattern space.也就是说D命��o(h��)是删除模式空间中
###�W�一个换行符之前的内容，也就是删除第一�?然后D命��o(h��)的解释还有一�?我认�?
###�q�句很重�? Start next cycle, but skip reading from the input if there
### is still data in the pattern space.开始下一个��@环，但是如果模式�I�间中有
###数据�Q�则跌��从输入中��d��数据.
###具体怎么工作�? 假设文�g�?
### $ cat test.txt
### 1
### 2
### 3
### 4
### 5
### 那么当执行第一行时,$!N把第二行加入到模式空间中�W�一行后�?然后$!D把第一�?
###内容删除�Q�模式空间中只剩下第二行的内�?注意,此时�׃��D命��o(h��)开始下一个��@环，
###所以不打印模式�I�间中的内容! (�q�个地方也是我想了半天才�q�么解释的，我也知道
###很可能不对，�Ƣ迎拍砖�Q�呵�?�׃��D命��o(h��)要求模式�I�间中有数据的话��p��q�读取下一行，
###所以��l�下一个��@环又��C��$!N�Q�此时读入第三行加到�W�二行后边，....以此�c�L��?
###执行到读入第5行附加在�W�四行后边，然后�׃��$!D得不到执行，所以第4行和�W?�?
###都被保留�Q�命令结束，打印模式�I�间...
# print the last line of a file (emulates "tail -1")
#打印一个文件的最后一�?�?tail -1")
sed '$!d' # method 1
sed -n '$p' # method 2
###哈哈�Q�终于看懂了一个，你也看懂了吧　�Q�）(j��)
# print only lines which match regular expression (emulates "grep")
#只打印匹配的一定字�W�的�?�?grep")
sed -n '/regexp/p' # method 1
sed '/regexp/!d' # method 2
###明白参数-n和命令p和d��明白这两个命��o(h��)�Q?
# print only lines which do NOT match regexp (emulates "grep -v")
#只打��C��一定字�W�不匚w��的行(�?grep -v")
sed -n '/regexp/!p' # method 1, corresponds to above
sed '/regexp/d' # method 2, simpler syntax
###和上边相反，正如注释所��_(d��)��
# print the line immediately before a regexp, but not the line
# containing the regexp
#打印包含"regexp"那一行的上一�?但是不打印包�?regexp"的行.
sed -n '/regexp/{g;1!p;};h'
###在命令执行到包含"regexp"那一行的上一行时,模式�I�间中这行的内容�?
###拯��C��留空间中�Q�执行到包含"regexp"那一行时��打印它�?
# print the line immediately after a regexp, but not the line
# containing the regexp
#打印�?regexp"之后紧跟那一行，但是除去包含"regexp"的行.
sed -n '/regexp/{n;p;}'
###与上边类��|��比上边简单．
# print 1 line of context before and after regexp, with line number
# indicating where the regexp occurred (imilar to "grep -A1 -B1")
#�?regexp"前后打印一行上下文�Q��其行��h��C?regexp"在哪里出�?
#grep -A1 -B1�怼�)
sed -n -e '/regexp/{=;x;1!p;g;$!N;p;D;}' -e h
###看上��d��像挺复杂�Q�其实倒是不难解释�Q?
###假设文��是这�?
###$ cat test.txt
### 1 abc
### 2 cde
### 3 regexp
### 4 fgh
### 5 xyz
###命��o(h��)执行到regexp前一行，引号里边的命令不执行,只执行h命��o(h��)得到�l�果
### command parttern space holdspace output
### 执行到前一�?2cde 2cde
### 执行到regexp�?"=" 3regexp 3
### "x" 2cde 3regexp
### "1!p" 2cde 3regexp 2cde
### "g" 3regexp 3regexp
### "$N" 3regexp  4fgh 3regexp
### "p" 3regexp  4fgh 3regexp 3regexp
### 4fgh
### "D" 4fgh 3regexp
### "h" 4fgh 4fgh
###
### 看一下最双��的输出结果，�q�不错吧�Q?
# grep for AAA and BBB and CCC (n any order)
#查找"AAA"�?BBB"�?CCC".(��L��序)
sed '/AAA/!d; /BBB/!d; /CCC/!d'
# grep for AAA and BBB and CCC (n that order)
# 查找"AAA"�?BBB"�?CCC".(一定顺�?
sed '/AAA.*BBB.*CCC/!d'
# grep for AAA or BBB or CCC (emulates "egrep")
#查找"AAA"�?BBB"�?CCC".(��L��序)
sed -e '/AAA/b' -e '/BBB/b' -e '/CCC/b' -e d # most seds
gsed '/AAA\|BBB\|CCC/!d' # GNU sed only
###上边三个没什么说的，��是查找功能呗．
# print paragraph if it contains AAA (blank lines separate paragraphs)
# HHsed v1.5 must insert a 'G;' after 'x;' in the next 3 scripts below
#如果某段包含"AAA",则打印这一�D�c(di��n)�?�I��用来分隔�D�落)
#HHsed v1.5必须�?x;'之后插入一�?G;'
sed -e '/./{H;$!d;}' -e 'x;/AAA/!d;'
###前边一部分命��o(h��)用保留空间来存储整个�D�落内容�Q�后边一个命令用来查�?
# print paragraph if it contains AAA and BBB and CCC (n any order)
#如果某段包含"AAA"�?BBB"�?CCC",则打印这一�D?
sed -e '/./{H;$!d;}' -e 'x;/AAA/!d;/BBB/!d;/CCC/!d'
###同上
# print paragraph if it contains AAA or BBB or CCC
# 如果某段包含"AAA"�?BBB"�?CCC",则打印这一�D?
sed -e '/./{H;$!d;}' -e 'x;/AAA/b' -e '/BBB/b' -e '/CCC/b' -e d
gsed '/./{H;$!d;};x;/AAA\|BBB\|CCC/b;d' # GNU sed only
###同上
# print only lines of 65 characters or longer
#仅打印长�?5个字�W�的�?
sed -n '/^.\{65\}/p'
###�q�也没什么好说的�Q�正则表辑ּ�的运用．
# print only lines of less than 65 characters
#仅打印少�?5个字�W�的�?
sed -n '/^.\{65\}/!p' # method 1, corresponds to above
sed '/^.\{65\}/d' # method 2, simpler syntax
###又没啥吧
# print section of file from regular expression to end of file
#打印从字�W?regexp"开始到文�g�l�束的部�?
sed -n '/regexp/,$p'
###�q�没啥，注意","的作用是选择行的范围�Q�从包含regexp的行到最后一�?
# print section of file based on line numbers (ines 8-12, inclusive)
#�Ҏ(gu��)��行号来打印文件的一部分(-12行，包括在内)
sed -n '8,12p' # method 1
sed '8,12!d' # method 2
# print line number 52
#打印�W?2�?
sed -n '52p' # method 1
sed '52!d' # method 2
sed '52q;d' # method 3, efficient on large files
###仅注意第三种�Ҏ(gu��)��效率比较高就行了
# beginning at line 3, print every 7th line
#从第三行开始，�?行打��C��?
gsed -n '3~7p' # GNU sed only
sed -n '3,${p;n;n;n;n;n;n;}' # other seds
###好像很容易理解了�?
# print section of file between two regular expressions (nclusive)
#打印文�g中指定字�W�之间的部分(含字�W�在�?
sed -n '/Iowa/,/Montana/p' # case sensitive
###现在��单了吧．�Q�）(j��)
SELECTIVE DELETION OF CERTAIN LINES:
# print all of file EXCEPT section between 2 regular expressions
#打印除指定字�W�之间部分之外的全文
sed '/Iowa/,/Montana/d'
###与上边相似的��?
# delete duplicate, consecutive lines from a file (emulates "uniq")
# First line in a set of duplicate lines is kept, rest are deleted.
#删除文�g中重复的�q�箋的行(��g��"uniq"命��o(h��))
#重复行中�W�一行保留，其他删除
sed '$!N; /^$.*$
\1$/!P; D' 　
###如果不是最后一行，��把下一行附加在模式�I�间�Q�然后进行查�?�?
###"^"�?$"中间的内容如果有重复��匹配成功．如果匚w��不成功就用P打印
###�W�一行．　然后删除�W�一行．
# delete duplicate, nonconsecutive lines from a file. Beware not to
# overflow the buffer size of the hold space, or else use GNU sed.
#删除文�g中重复的�Q�但不连�l�的行。注意不要溢��Z��留空间的�~�冲器的大小�Q?
#否则使用GNU sed.
sed -n 'G; s/
/&&/; /^$[ -~]*
$.*
\1/d; s/
//; h; P'
###在我的linux环境执行不了�Q�出错是sed: -e expression #1, char 34:
###Invalid range end.是不是所谓的溢出保留�I�间的大��了呢？我也不得而知�Q?
###大家补充吧．!!?????????????????
# delete the first 10 lines of a file
#删除一个文件中�?0�?
sed '1,10d'
# delete the last line of a file
#删除一个文件中最�?�?
sed '$d'
###与上边一个都是查扑ֈ��?
# delete the last 2 lines of a file
#删除一个文件中最�?�?
sed 'N;$!P;$!D;$d'
###如果理解了sed '$!N;$!D'是如何工作的�Q�这句话也不在话下吧�Q?
# delete the last 10 lines of a file
#删除一个文件中�?0�?
sed -e :a -e '$d;N;2,10ba' -e 'P;D' # method 1
sed -n -e :a -e '1,10!{P;N;D;};N;ba' # method 2
###和打印后10行相��|��什么？打印�?0那个没看�? /shakehand �Q�）(j��)
###?????????????????
# delete every 8th line
# �?行删�?�?
gsed '0~8d' # GNU sed only
sed 'n;n;n;n;n;n;n;d;' # other seds
###没说�?
# delete ALL blank lines from a file (ame as "grep '.' ")
#删除文�g所有空白行(��g��"grep '.' ")
sed '/^$/d' # method 1
sed '/./!d' # method 2
###�q�两句就是告诉我�?.无内容的删除,2.有内容的保留 : )
# delete all CONSECUTIVE blank lines from file except the first; also
# deletes all blank lines from top and end of file (emulates "cat -s")
#删除文�g中除一行空白行之外的所有连�l�空白行�Q�也同时删除所有从头到��所
#有空白行(��g��"cat -s")
sed '/./,/^$/!d' # method 1, allows 0 blanks at top, 1 at EOF
#�Ҏ(gu��)��1不允许文仉��部有�I��Q�文件尾部可�?
sed '/^$/N;/
$/D' # method 2, allows 1 blank at top, 0 at EOF
#�Ҏ(gu��)��2不允许文件尾部有�I��Q�文仉��部可�?
###两个先选择�Q�后删除命��o(h��).不多说了.
# delete all CONSECUTIVE blank lines from file except the first 2:
#删除文�g中连�l�空行中除前两行�I�白行之外的所有空白行
sed '/^$/N;/
$/N;//D'
###跟上边的命��o(h��)�怼��Q�多了一步而已.
# delete all leading blank lines at top of file
#删除文�g开头部分中的所有空白行
sed '/./,$!d'
###从有字符开始的行直到最后一行保留，其他删除.
# delete all trailing blank lines at end of file
#删除文�g�l�尾部分中的所有空白行
sed -e :a -e '/^
*$/{$d;N;ba' -e '}' # works on all seds
sed -e :a -e '/^
*$/N;/
$/ba' # ditto, except for gsed 3.02*
###不行了要��M��Q�还是高手说吧，我再看下��M��(x��)疯的�Q?
###?????????????????????????????
# delete the last line of each paragraph
#删除每个�D�落中最�?�?
sed -n '/^$/{p;h;};/./{x;/./p;}'
###应该是假设段落间用空行分�?
###命��o(h��)执行�Ӟ��如果不是�I��那么交换模式�I�间和保留空��_(d��)��如果交换�?
###模式�I�间不�ؓ(f��)�I�，则打印模式空间中内容�Q�如果是�I��Q�那么打印模式空�?
###间中的内�?也就是打印空�?..以此�c�L��,出现�l�果.
###�l�于完了�Q�下边的�Ҏ(gu��)��应用没有加注�Q�随便翻译了一下，可能不够准确�Q�大家参考一下吧.
SPECIAL APPLICATIONS:
# remove nroff overstrikes (char, backspace)from man pages. The 'echo'
# command may need an -e switch if you use Unix System V or bash shell.
# 从man page��里删除所有overstrikes(字符,backspace).如果使用unix�pȝ��v
#或者bash shell,echo命��o(h��)可能需�?e参数.
sed "s/.`echo \\\b`//g" # double quotes required for Unix environment
#unix环境下需要双引号
sed 's/.^H//g' # in bash/tcsh, press Ctrl-V and then Ctrl-H
#在bash/tcsh中，按Ctrl-V然后按Ctrl-H
sed 's/.\x08//g' # hex expression for sed v1.5
#sed v1.5中的hex表达�?
# get Usenet/e-mail message header
# 获得新闻�l?e-mail信息的标题部�?
sed '/^$/q' # deletes everything after first blank line
# get Usenet/e-mail message body
#获得新闻�l?e-mail信息的主体部�?
sed '1,/^$/d' # deletes everything up to first blank line
# get Subject header, but remove initial "Subject: " portion
#获得题目的标题，但是删去开始的"Subject: "部分
sed '/^Subject: */!d; s///;q'
# get return address header
#获得�q�回的地址标题()
sed '/^Reply-To:/q; /^From:/h; /./d;g;q'
# parse out the address proper. Pulls out the e-mail address by itself
# from the 1-line return address header (ee preceding script)
#正确解析地址。把email地址从一行中单独提出来�ƈ�q�回地址�?)
sed 's/ *(*)/; s/>.*//; s/.*[: /'
# delete leading angle bracket & space from each line (nquote a message)
#删除每行的尖括号和空�?)信息不被引用)
sed 's/^> //'
# remove most HTML tags (ccommodates multiple-line tags)
#删去大部分HTML标签(供多行标�{?)
sed -e :a -e 's/]*>//g;/zipup.bat
dir /b *.txt | sed "s/^$*$.TXT/pkzip -mo \1 \1.TXT/" >>zipup.bat

本文来自ChinaUnix博客�Q�如果查看原文请点：(x��)http://blog.chinaunix.net/u1/44068/showart_391470.html

Prayer 2010-09-15 11:13 发表评论

sed学习(f��n)�W�记�?-高��命��o(h��)

Prayer — Wed, 15 Sep 2010 02:33:00 GMT

版权声明�Q?/strong>原创作品�Q�允许�{载，转蝲时请务必以超链接形式标明文章原始出处、作者信息和本声明。否则将�q�究法律责�Q�?a >http://licong.blog.51cto.com/542131/204226

之前写过一��?/span>sed学习(f��n)�W�记�?/span>http://licong.blog.51cto.com/542131/152541�Q�讲了一�?/span>sed入门的东西，本篇��l�介�l?/span>sed高��命��o(h��)部分。所谓高�U�，主要是指�q�里��要提到的命令都能改�?/span>sed执行或者控制的��程��序�Q?/span>sed通常都是一行被��d��模式�I�间�Q��ƈ用脚本中�?/span>sed命��o(h��)一个接一个的应用于那一行）(j��)

高��sed命��o(h��)分成3个组�Q?/span>

1�?span>    处理多行模式�I�间�Q?/span>N�?/span>D�?/span>P�Q��?/span>

2�?span>    采用保持�I�间来保存模式空间的内容�q��他们可用于后�l�的命��o(h��)�Q?/span>H�?/span>h�?/span>G�?/span>g�?/span>x�Q��?/span>

3�?span>    �~�写使用分支和条件指令的脚本来更�Ҏ(gu��)��制流�Q�：(x��)�?/span>b�?/span>t�Q��?nbsp;

N命��o(h��)�Q�追加下一�?/span>

多行Next(N)命��o(h��)通过��d��当前行的下一行，�q�把两行拼成一行来�q�行接下来的处理�?/span>

$ cat file

line 1

line 2

line 3

line 4

file文�g中的每一行后面都有一个隐藏的换行�W?/span>”\n”�Q?/span>sed不对每行末尾�?/span>”\n”�q�行处理�?/span>

$ sed N file

line 1

line 2

line 3

line 4

�l�过N处理�q�的输出和原文�g没有区别�Q�但是本质是不一��L(f��ng)��。这�?/span>sed其实认�ؓ(f��)自己打印的是2行，�W�一行�ؓ(f��)”line 1\nline 2”,而第2行�ؓ(f��)”line 3\nline 4”,注意�q�里�?/span>2行末��依焉��藏换行符”\n”�Q?/span>sed依然不处理行��”\n”�Q�但是处理行内的”\n”。因��里默认的动作是打华ͼ�所以处理行内的”\n”我们也看不出来�?/span>

值得注意的是�Q�处�?/span>line 1�Ӟ��line 2被读入�ƈ�q�加�?/span>line 1后面�Q�所�?/span>line 1处理完后不再��d��line 2�Q�前面已�l�读�q�了�Q�而直接读�?/span>line 3�q�行下一�?/span>N命��o(h��)�Q�即��d��line 4�q�追加到line 3后面�Q��?/span>

上面2�D�如果不理解的话�Q�看下面�q�个命��o(h��)�Q?/span>

$ sed ‘N;s/\n/ /g’ file

line 1 line 2

line 3 lin3 4

�q�个命��o(h��)在原来的基础上把行内�?/span>”\n”替换成空��g��Q�尽��用了全局替换标志g�Q?/span>sed依然不处理行��换行符�Q�）(j��)�Q�看明白N的作用了吗，单独�?/span>N可以创徏2行模式空间�?nbsp;

D命��o(h��)�Q�删除多行模式空间中�Q�直到第一个行内的”\n”为止的所有内宏V�?/span>

D命��o(h��)通常位于N命��o(h��)之后�Q�用于处�?/span>N命��o(h��)创徏的多行模式空间�?/span>D命��o(h��)删除多行模式�I�间行内�W�一�?/span>”\n”�?qi��ng)其之前的内容后�Q�对余下的内容（�W�一个行�?/span>”\n”之后的内容）(j��)重新�?/span>sed�W�一个命令进行处理�?/span>

D�?/span>d的相同点是，删除内容后，重新�?/span>sed�W�一个命令开始处理，�q�一点看�?/span>D�?/span>d都有改变sed执行��序的能力；区别在于d删除模式�I�间中的所有内容，然后重新��d��文本下一行从sed�剙��q�行处理�Q��?/span>D删除模式�I�间的一部分内容�Q�而将模式�I�间剩下的内容从sed�剙��q�行处理�?/span>

$ sed ‘N;d’ file

$

$sed ‘N;D’ file

line 4

‘N;d’每次创徏2行模式空��_(d��)��q�将模式�I�间的内容全部删除，所以结果所�?/span>4行（sed看来�?/span>2行）(j��)都删除了。如�?/span>file�?/span>5行数据，则第5行将被打印出来，因�ؓ(f��)�W?/span>5行执�?/span>N时读不到下一行了�Q�所�?/span>d不执行，打印�W?/span>5行，你可以自��p��一试�?/span>

‘N;D’每次创徏2行模式空��_(d��)��删除前面一行，�q�将模式�I�间的第2行��l�执�?/span>’N;D’,直到最后一�?/span>N没内容可读，不执�?/span>D�Q�而是打印最后一行�?/span>’N;D’实际构成了一个��@环（��x��N直接��d��下一行，�?/span>2行进行处理，下一�ơ对�W?/span>2行就不处理了而是��d��W?/span>3行处理；而加�?/span>D之后�Q�先处理2行，再对剩下的第2行接着�q�行处理�Q?nbsp;

P命��o(h��)�Q�打印模式空间直到第一�?/span>”\n”为止的所有内宏V�?/span>

p�Q�小写）(j��)是打印模式空间的所有内容，P�Q�大写）(j��)是打印模式空间的一部分�Q�这一区别�?/span>D/d�c�M��。有一点要注意�Q�不要把��M��命��o(h��)攑֜�d或�?/span>D后面�Q�因为那栯��命��o(h��)永远也没有执行的��Z��(x��)了。例�?/span>sed ‘N;D;P’ file�?/span>sed ‘N;D’ file是完全相同的效果�?/span>

$ cat file

line 1 li

cong line 2

line 3 licong

line 4 li

cong line 5

我们要把分在两行�?/span>li�?/span>cong合到一行应该怎么做呢�Q?/span>

$ sed 'N;s/li\ncong */licong\n/g;P;D' file

line 1 licong

line 2

line 3 licong

line 4 licong

line 5

执行�q�个sed命��o(h��)的流�E�是�q�样的：(x��)

一、首行文本应�?/span>N��d��下一行，构成2行模式空�?/span>

line 1 li\n

cong line 2

s命��o(h��)��?/span>li\ncong (注意cong后有一个空�?/span>)替换�?/span>licong\n,�?/span>

line 1 licong

line 2

接着执行P�Q�打�?/span>line 1 licong�Q?/span>P�l�束后两行模式空间没有改变）(j��)

再对两行模式�I�间执行D�Q�删�?/span>line 1 licong\n,�q�将剩下�?/span>line 2做�ؓ(f��)新的模式�I�间从头执行sed命��o(h��)�Q?/span>

二、对模式�I�间内容line 2先执�?/span>N�Q�读取下一�?/span>line 3 licong�Q�创��Z��行模式空�?/span>

line 2

line 3 licong

�q�次s没找到匹配内容，所以执�?/span>s后面�?/span>P;D命��o(h��)�Q�重新打印、删除，�q�行下一轮��@环；

。。�?/span>

三、最后一�?/span>line 5执行N没有内容可读�Q�直接打印该行�?/span>

h�?/span>H�?/span>g�?/span>G�?/span>x�q�几个命令都是用于模式空间和保持�I�间转换的。这里有必要解释一下模式空间和保持�I�间了：(x��)

模式�I�间——容�U�_��前输入行的缓冲区�?/span>

除了h/H/g/G/x�Q�其他所�?/span>sed命��o(h��)都是针对模式�I�间的内容进行处理的�Q?/span>

保持�I�间——模式空间以外的一个预留缓冲区�?/span>

只有h/H/g/G/x命��o(h��)可以讉K��C��持空间的内容�Q��ƈ用于与模式空间内容的转换�?/span>

h�Q�将模式�I�间的内容复制到保持�I�间�Q�类��g��重定向符�?/span>>�Q�会(x��)覆盖原由保持�I�间内容

H�Q�将模式�I�间的内容追加到保持�I�间�Q�类��g��q�加重定�?/span>>>�Q�追加到保持�I�间的尾行下

g�Q�类�?/span>h�Q�将保持�I�间的内容复制到模式�I�间

G�Q�类�?/span>H�Q�将保持�I�间的内容追加到模式�I�间

x�Q�交换模式空间与保持�I�间中的内容

$ cat file

1

2

11

22

$ sed ‘/1/{h;d};/2/G’ file

2

1

22

11

�q�个sed命��o(h��)完成了反转的功能�Q�我们来看看是怎么实现的：(x��)

一�?/span>/1/{h;d}命��o(h��)搜烦(ch��)模式�I�间包含1的行然后先后执行h�?/span>d命��o(h��)。结果首�?/span>1��被应用�Q?span>h把该行（内容�?/span>1�Q�复制到保持�I�间�Q�此时模式空间和保持�I�间中的内容为：(x��)

模式�I�间�Q?/span>1

保持�I�间�Q?/span>1

接着执行d�Q?/span>d不能讉K��保持�I�间�Q�只处理模式�I�间的内容，��模式空间的内容删除�Q�此�Ӟ��(x��)

模式�I�间�Q?/span>      �Q�空�Q�没有内容）(j��)

保持�I�间�Q?/span>1

二�?/span>d命��o(h��)执行完之后，执行/2/G�Q�即在模式空间搜索包�?/span>2的行�q�行G处理�Q�而此时模式空间无内容�Q�所以不做�Q何操作�?/span>

三、读取下一行文本到模式�I�间�Q��l�执�?/span>’/1/{h;d};/2/G’。下一行文本的内容�?/span>2�Q�此�Ӟ��(x��)

模式�I�间�Q?/span>2

保持�I�间�Q?/span>1

与步骤二的道理相同，h�?/span>d得不到执行（因�ؓ(f��)模式可空间没扑ֈ�包含1的行�Q�；�?/span>’/2/G’��被执行�Q�将保持�I�间的内容追加到模式�I�间后面�Q�此�Ӟ��(x��)

模式�I�间�Q?/span>2

         1

保持�I�间�Q?/span>1

�q�一步完成以后，模式�I�间的内容将�?/span>sed默认地打印出来（如果�?/span>-n参数才不打印�Q�，于是前两行处理完之后�Q�将输出�Q?/span>

2

1

同理�Q�后两行处理完之后，��输出：(x��)

22

11

于是�Q�我们看��C��最后的�l�果�Q?/span>

2

1

22

11

�q�个最��单的例子有很多地方值得挖掘�Q�我们就来看看最重要的几炏V�?/span>

1�?nbsp;�?/span>sed后面带有一个以上的命��o(h��)�Ӟ��它的处理��序是这��L(f��ng)��Q?/span>

一�ơ读入一行到模式�I�间�Q�然后将所有的命��o(h��)应用于该行；而不是一�ơ将一个命令作用与所有行�Q?/span>

2�?nbsp;当某个条件后面有{}�Ӟ��{}里面的命令依�ơ作用于满��该条件的行；

3�?nbsp;h/H/g/G命��o(h��)操作�~�冲区时�Q�都�?x��)在目的�~�冲区后加一个换行（即��该缓冲区无内容）(j��)�Q�然后复制或�q�加源缓冲区内容在该换行�W�之后；

4�?nbsp;没有使用-n参数�Ӟ��当一行执行完所有命令后�Q?/span>sed�?x��)默认打印最�l�模式空间中的内容；

如果使用-n参数�Q�只有应用了p/P命��o(h��)的模式空间内�Ҏ(gu��)��?x��)被打印出来�?/span>

x命��o(h��)暂不举例�Q�我们来看看最后一�l�高�U�命令（�Q��?/span>b�?/span>t�Q?/span>

分支�Q?/span>b�Q�和��试�Q?/span>t�Q�命令几乎可以�Q意改�?/span>sed命��o(h��)的执行顺序，他们都将sed转移到包含标�{��行，如果没有指定标签�Q�则��{�U�d��命��o(h��)末尾�?/span>b用于无条件的转移�Q�即一��到b立刻转移�Q�；t用于有条件�{�U�，只有当替换命令改变当前行时才�?x��)执行�?nbsp;

标签定义�Q?/span>

:lable

lable可以随便用什么名字，自己能方便看明白��p��Q�冒号和标签之间不允许有�I�格�Q?/span>lable后面如果有空格将被认为是lable的一部分�Q�不��?/span>lable后面带空��|��(j��)

b�?/span>t的用法：(x��)

[address]b [lable]

[address]t [lable]

b/t�?/span>lable之间有空��|��?/span>lable后面不要插入�I�格�?/span>

举例�Q?/span>

$ cat file

line 1 li

cong line 2

line 3 licong

line 4 li

cong line 5

$ sed -n '$!{/licong/!{h;N;D}

x;G;N;p;b

}

${/licong/{x;G;p}}' file

cong line 2

line 3 licong

line 4 li

�q�个sed命��o(h��)的功能是��L��包含字符�?/span>licong的行�Q��ƈ打印该行�?qi��ng)其前后一行。这个命令�ƈ不完善，它不能很好的处理�W�一行匹配的情况�Q�加入该功能命��o(h��)�?x��)变得更复杂。我们来解释一下上面的�l�果是怎么来的�?/span>

一�?/span>sed -n '$!{/licong/!{h;N;D}

x;G;N;p;b

}

寚w��末行以外的所有行($!的作�?/span>)�Q�执�?/span>/licong/!{h;N;D}�Q?/span>x;G;N;p;b

二�?/span>/licong/!{h;N;D}

对不包含字符�?/span>licong的行依次执行h�Q?/span>N�Q?/span>D�Q�第一�?/span>line 1 li不包�?/span>licong�Q�于是执行：(x��)

把该行复制到保持�I�间�Q�读取追加下一行，此时

模式�I�间�Q?/span>line 1 li

cong line 2

保持�I�间�Q?/span>line 1 li

再对模式�I�间执行D�Q��ƈ接着从头处理新的模式�I�间�Q�此�?/span>

模式�I�间�Q?/span>cong line 2

保持�I�间�Q?/span>line 1 li

三、从头对模式�I�间的内�?/span>cong line 2执行$!{/licong/!{h;N;D}�Q�此时的模式�I�间依然不包�?/span>licong�Q�所以进行一二两步同��L(f��ng)��操作�Q�结束后�Q?/span>

模式�I�间�Q?/span>line 3 licong

保持�I�间�Q?/span>cong line 2

四、再从头�Ҏ(gu��)��的模式空�?/span>line 3 licong执行/licong/!{h;N;D}�Q?/span>x;G;N;p;b。因为此时的模式�I�间包含licong�Q�所以不执行h;N;D了，而是执行x;G;N;p;b�?/span>x用与交换模式�I�间和保持空间的内容�Q�交换的�l�果是：(x��)

模式�I�间�Q?/span>cong line 2

保持�I�间�Q?/span>line 3 licong

接下来执�?/span>G�Q�将保持�I�间的内容追加到模式�I�间之后�Q?/span>

模式�I�间�Q?/span>cong line 2

           line 3 licong

保持�I�间�Q?/span>line 3 licong

再执�?/span>N�Q�将下一行读取追加到模式�I�间之后�Q?/span>

模式�I�间�Q?/span>cong line 2

line 3 licong

                    line 4 li

保持�I�间�Q?/span>line 3 licong

再执�?/span>p�Q�打印模式空间的内容�Q?/span>

cong line 2

    line 3 licong

       line 4 li            �Q�这��是我们看到的结果）(j��)

之后�q�有一�?/span>b�Q�就是蟩�q?/span>b后面的命令，再读下一行。命令最后一部分${/licong/{x;G;p}}是用来处理最后一行的�Q�如果最后一行包�?/span>licong则打印该行很上面一行（而不打印下一行，因�ؓ(f��)没有N命��o(h��)�Q?/span>

到此�Q?/span>sed的高�U�命令就介绍完了。�?/span>sed&awk》第二版有一句话�Q?#8220;一旦你理解了这里所�l�出的命令，那么��可以认��己是真正�?/span>sed的主��Z��?#8221;

再�ȝ��一�?/span>sed所有的功能�Q��ȝ��来说�q�是替换命��o(h��)’[address]s/source/replace/flag’最常用�Q�而高�U�命令则用于完成复杂的�Q务；�q�有sed�?/span>-n�Q�抑刉��认输出）(j��)�?/span>-i�Q�更改原文�g�Q�等参数也很常用�?nbsp;

��写到这里吧�Q�等待拍砖了。。�?/span>

本文�� “licong” 博客�Q�请务必保留此出�?a >http://licong.blog.51cto.com/542131/204226
本文�� 51CTO.COM技术博�?/a>

Prayer 2010-09-15 10:33 发表评论

Prayer — Wed, 15 Sep 2010 02:15:00 GMT
��空格替换�ؓ(f��)换行�W��?br>两种犯方�?br>1使用cutr V+ctrl J代替换行�W?br>sed 's/ /\^J/g'
2 直接使用换行�W?br>s/ /\
/g

Prayer 2010-09-15 10:15 发表评论

使用shell提供的命令行�~�辑功能, 选择set -o vi �q�是 set -o emacs

Prayer — Wed, 01 Sep 2010 01:36:00 GMT

今天��d��pȝ��Q?敲了N多命令后�Q�习(f��n)惯性的用向上的方向键来扑֯�历史命��o(h��)�Q�突然看��C��q�个�Q?/p>
$^[[A^[[A^[[A

按删除键�Q�出来的是这个：(x��)

$ ^H^H^H^H^H^H^H

只能�?Ctrl+BackSpace 才能删除光标左边的内�?..用的那个不习(f��n)惯啊~~~�Q�！�Q?- -b

后来问到 Wells �Q�原来只需要做一个小��的讑֮��Q�在Console中启用：(x��)

$set -o emasc

原因后来上网查了一下，暂且引用一下《FreeBSD使用大全》中的一�D�内容：(x��)

-----------------------------------------------------------------------------------------------

配置用戶shell
　　事實上sh與csh�Q��ƈ不是普通用戶的最佳選擇，因為這兩個shell在易用性方面做的不夠好�Q�例如命令行�R?輯功能不弗��不能利用熱鍵重復執行命令等。較新的shell�Q�如bash和tcsh都具有這些方便用戶使用的功能，�?必須安裝了這些shell�E�序之后�Q�才能更�Ҏ(gu��)��通用戶的shell�a�置以��用這些shell�E�序。更改用戶的shell 可以使用pw、vipw或chsh�?/p>
　　這兩個shell分別�늅�sh和csh的風��|��因此喜好csh風格的可以選擇tcsh�Q�而喜歡sh風格的選�?bash。除了這兩�E�shell之外�Q�還有ksh、zsh�{�shell可供選擇。如果對兩種shell沒有偏好�Q�可�?選擇bash�Q�它是一個GNU軟�g�Q�比標准sh功能強大的多�?/p>
　　使用了這兩些增強型shell之后�Q�用戶就可以使用shell提供的命令行�R�輯功能。按照習慣的不同�Q�可以選擇vi風格的編輯方式或emacs風格的方式，�~�省為emacs方式�Q�這種方式使用方向鍵來回溯埯��過的命��o(h��)�Q��ƈ進行修改�Q�而vi風格使用字母命��o(h��)作編輯鍵�Q�例如��用h、j、k、l四個鍵來移動光標，vi風格的好處是不��用基本鍵盤之外的控制鍵，因而可以適用于��M��i�端�a�備�Q��ƈ且進行�R�輯時手不需離開基本�늛��Q�熟�R�操作之后最為快捗��emacs風格比�vvi風格更適合從個�h�a�算��轉向Unix的��用者的��慣。bash, ksh ,zsh下��用下面的命��o(h��)在emacs 風格和vi風格切換�Q?/p>
　　bash$ set -o emacs

　　bash$ set -o vi

　　tcsh中��用不同的命��o(h��)�Q?/p>
　　% bind emacs

　　% bind vi

　　還可以為常用的命令設�|�別名，��化用戶輸入�Q�例如：(x��)

　　bash$ alias ec=”echo This is a alias”

　　bash$ ec

　　This is a alias

　　shell用于方便用戶操作的另一項能力是自動補全命��o(h��)或文件名的功能，因為FreeBSD下的文�g名可能很 ��P��它們全部��入比較麻煩。事實上可以輸入部分名字�Q�然后按Tab鍵（在vi風格下是連續兩次按Esc鍵）(j��)�Q�shell ��自動補全文件名的剩余部分。如果已�E��入的這部分名字不能確定具體的命��o(h��)或文�Ӟ��那么shell只將能確定的�?分補上，然后韉K��通知使用者繼�U��入以明確具體的文件�?/p>
　　事實上即使在基本的sh或csh下，也可以��?“*” �{�特�D�字�W�，用模式匹配的方式來簡化��入�?/p>
　　bash$ cd /usr/loca*

　　bash$ pwd

　　/usr/local

　　Unix中的多數�E�序都具備模式匹配的處理能力�Q�而shell的模式匹配功能最為常用。shell可以使用�?些特�D�模式來配置多個文�Ӟ��達到��化操作的目的。如果要熟練掌握Unix�Q�必須掌握模式匹配�?/p>
　　當試圖在bash下��入��字的時候，除了必須�a�置�i�端屬性能接受8位字�W�之外（埯��stty pass8命��o(h��) �Q�，還需要設�|�bash的��入��換，可以在登錄腳�?profile文�g中包括以下設�|�：(x��)

　　bind 'set convert-meta off'

　　bind 'set meta-flag on'

　　bind 'set output-meta on'

本文来自CSDN博客�Q��{载请标明出处�Q?a >http://blog.csdn.net/chenguoda/archive/2008/06/08/2524292.aspx

Prayer 2010-09-01 09:36 发表评论

Prayer — Thu, 26 Aug 2010 10:26:00 GMT
一:"'$var'"

�q�种写法大家无需改变�?括�vawk�E�序的习(f��n)�?是老外常用的写�?�?

var="test"

awk 'BEGIN{print "'$var'"}'

�q�种写法其实际是双括号变为单括号的常�?传递给了awk.

如果var中含�I�格,��Z��shell不把�I�格作�ؓ(f��)分格�W?便应该如下��?

var="this is a test"

awk 'BEGIN{print "'"$var"'"}'

�?'"$var"'

�q�种写法与上一�U�类�?如果变量含空�?则变�?""$var""'较�ؓ(f��)可靠.

�?把括起awk�E�序�?'变�ؓ(f��)"",使用"$var"

�?

$var="this is a test"

awk 'BEGIN{print "$var"}"

�q�是因�ؓ(f��)�?"�?是特�D�字�W?而在''�?是普通字�W?

�?export 变量,使用ENVIRON["var"]形式,

�?

$var="this is a test";export $var

awk 'BEGIN{print ENVIRON["var"]}'

�?当然也可以��?v选项

�?

$var="this is a test"

awk -vnvar="$var" '{print nvar}'

�q�样便把�pȝ��变量定义成了awk变量.

Prayer 2010-08-26 18:26 发表评论

Prayer — Thu, 26 Aug 2010 10:16:00 GMT

1.利用shell cmdline的特�?/div>
A=123

awk '/^'"$A"'/ { print $2 }'

上面的cmdline中，shell�?/^'"$A"'/ { print $2 }'作�ؓ(f��)awk的第一个参敎ͼ��q�个'/^'"$A"'/ { print $2 }'可以分�ؓ(f��)3��块

�Q?�Q?/^'�Q�因�?^被单引号引�v来，所以shell传这个小部分�l�awk时候，传的是：(x��)/^

�Q?�Q?$A"�Q�因�?A是被双引号引��P��所以shell传这个小部分�l�awk时候，先把$A,做给“变量替换”�Q�所以传的是�Q?23

�Q?�Q?/ { print $2 }'�Q�因�? { print $2 }被单引�v来，所以传的是�Q? { print $2 }

�q?个小部分做�ؓ(f��)一个参��C��l�awk�Q�合�?个小部分�Q�那么传的就�?/div>
/^123/ { print $2 }

2.使用-v参数

A=123

awk -v B="$A" '/^B/ { print $2 }'

3.pass variable settings into awk as "fake file names"

awk '/^B/ { print $2 }' B="$A"

Prayer 2010-08-26 18:16 发表评论

awk的next使用

Prayer — Thu, 26 Aug 2010 02:35:00 GMT

next  可以��单理解�ؓ(f��)跌��后面的代码，如果next被执行，那么它后面的代码��都不会(x��)被执行了�?/td>

Prayer 2010-08-26 10:35 发表评论

AWK高��~�程

Prayer — Thu, 26 Aug 2010 02:26:00 GMT

1. �E�序元素

一个awk �E�序是一对以模式(pattern) 与大括号框�v来的操作(action) �l�合而成的，或许�Q�还�?x��)加上实现操作细节的函�?function ) 。针�Ҏ(gu��)��个匹配于输�h数据的模式，操作�?x��)被执行�Q�且所有模式都�?x��)针��?gu��)��条输��录而检查。模式或操作可省略其中一个。如果模式省略，则操作将被应用到每条输�h记录; 如果操作省略�Q�则默认操作为打印匹配之记录在标准输��Z��。以下是传统awk �E�序的配�|?

pattern {action} 如模式匹配，则执行操�?

pattern {action} 如模式匹配，则打印记�?

虽然�Q�模式多半是数字或字�W�串表达式，不过awk 以保留字BEGIN 与END 提供两种�Ҏ(gu��)��模式�?

与BEG 工N 兌��的操作只�?x��)执行一�ơ，在�Q何命令行文�g或一般命令行赋��D��处理之前�Q�但是在��M��开头的一V 选项指定已经完成之后�?

END 操作也是只执行一�ơ，用于所有输入数据已被处理完之后。它多半用于产生摘要报告�Q�或是执行清除操作�?

BEGIN 与END 模式可以是�Q意顺序，可以存在于awk �E�序内的��M��位置。不�q�，��Z��方便�Q�我们通常��BEGIN 模式攑֜��E�序的第一个位�|�，而将END 模式攑֜�最后�?

2. 注释与空�?

awk 里的注释是从# 开始到该行�l�束�Q�就像在Shell 里那栗��空行等同于�I�的注释�?

3. 字符串与字符串表辑ּ�

awk 字符串包含零臛_��个字�W�，且在字符串的长度上没有限�Ӟ��视可用内存而定�?

字符串的比较�Q�用的是传统的关�p�运��符�Q?=( 相等) �?=( 不等) �?lt;( ��于) �?lt;=( ��于�{�于) �?gt;( 大于) �Q�以�?gt;=( 大于�{�于》。比较后�q�回l 为真�Q? 为假。比较不同长度的字符�Ԍ��且其中一个字�W�串为另一个的初始子字�W�串�Ӟ��较短的会(x��)定义为小于较长的那个�Q�因此，“A ”< “AA ”的��gؓ(f��)真�?

awk �q�无�Ҏ(gu��)��的字�W�串接箋�q�算�W�。也��是��_(d��)��两个�q�箋字符�Ԍ��?x��)自动地�q�接在一赗��以下每一�l�赋��D��|�标量变量。�ؓ(f��)相同的具有四个字�W�的字符�?

s = “ABCD ”

s = “AB ”“CD ”

s = “A ”“B ”“CD ”

s = “A ”“B ”“C ”“D ”

字符串不需要是常数�Q�如果我们��l�上�q�的赋�?

t= s s s

则t 的��gؓ(f��)“ABCDABCDABCD “�?

��数字�{换�ؓ(f��)字符�Ԍ��通过数字�q�接�I�字�W�串卛_��

n =123 �Q?

接着是：(x��)

s = ““ n �Q�把�?#8220;123 ”赋给s �?

awk 功能强大的地方大多来自于它对正则表达式的支持。有两个�q�算�W�：(x��)~( 匚w��) �?~( 不匹�? 让awk 更容易��用正则表辑ּ��Q?#8221;ABC ”~ ”^[A-Z]+$ “�Q�结果�ؓ(f��)真�?

4. 数��g��数��D��辑ּ�

所有awk 里的数字�Q�都以双�_��度的��点��D��C�。��Q�Ҏ(gu��)��可以包含一个末端以字母e( 或E) 所表示�?0 �ơ方指数以及(qi��ng)可选地带正负号的一个整数。�D例来�?0.03125, 3.125e-2, 3125e-5 �?.003125E1 �Q�同样都是表�C?/32 。因为awk 里所有算术都是��Q点算术�?

awk �q�没有提供字�W�串转数字的函数�Q�不�q�awk 的做法很��单：(x��)只要加个零到字符串里�Q�例如：(x��)s="123" �Q�接着是n=0+s �Q�便��数�?23 赋值给n 了�?

5. awk 的数��D��符

�? 一�Q�awk 的数��D��符( 优先�U�由大到��排�?

�q�算�W?nbsp;                  说明

++ --                    增加与减��? 前置或后�|?

^ **                     指数( 右结合�?

! + -                     非、一�?unary) 加号、一元减�?

* / %                    乘、除、余�?

+ -                      加、减

< <= == != > >=           比较

&&                         逻辑AND( ��?

||                        逻辑OR( ��?

?:                        三元条�g�?

= += -= *= /= %= ^= **=      赋�? 右结合�?

6. 标量变量

保存单一值的变量叫做标量变量�?

a wk 的变量名�U�必��M��ACSII 字母或下划线开始，然后选择性地接上字母、下划线�?qi��ng)字。因此，变量名称要匹配正则表辑ּ�[A-Za-z-][A-Za-z_0-9]* 。变量名�U�在实际上�ƈ没有长度的限制。awk 的变量名�U�是与大��写有关�?foo, Fo 。与FOO 是完全不同的三个名称。一般��用上以及(qi��ng)��用法�? ��L��?f��n)惯�Q�将局部变量全设�ؓ(f��)��写、全局变量�W�一个字母�ؓ(f��)大写�Q�而内建变量则全是大写�?

7. 数组变量

awk 允许在数�l�名�U�C��后，以方括号��Q意数字或字符串表辑ּ� 括�v来作为烦(ch��)引。例�?

telephone["Alice"]= “555-0134"

telephone["Bob"]= “555-0135"

telephone["Carol”]= “555-0136"

telephone["Don"]= “555-0141"

以�Q意��gؓ(f��)索引的数�l�，�U�C��为关联数�l�，因�ؓ(f��)它们的名�U�C��值是相关联的。重要的是，awk ��其应用于数�l�中�Q�允许查�? find ) 、插�?insert ) 以及(qi��ng)删除( remove) �{�操作，在一定的旉��内完成，与存储多��项目无兟�?

一个变量不能同时用作标量变量和数组变量。当你应用delet 。语句删除数�l�的元素

(element] 的时候，不会(x��)删除它的名称。因此。像�q�样的代�?

x[1]=3

delete x

x=789

�?x��)引发awk 发出提示�Q�告诉你不可以给数组名称赋�?

8. 命��o(h��)行参�?

awk 通过内徏变量ARGC( 参数计数) 与ARGV( 参数向量�Q�或参数�? �Q�让命��o(h��)行参�?

可用。下面简短的�E�序说明其用�?

[root@local~]#cat showargs.awk

BEGIN{

      print ”ARGC= ”�Q�ARGC

      for (k=0;k
          print "ARGV[”k”]=[”ARGV[k] “

}

再来看看��它用在一般awk 命��o(h��)行上�Q�会(x��)产生什么样的结�?

[root@local~]# awk -v One=1 -v Two=2 -f showargs.awk Three=3 file1 Four=4 filet2 file3

ARGC=6

ARGV[0]=[awk]

ARGV[1]=[Three=3]

ARGV[2]=[file1]

ARGV[3]=[Four=4]

ARGV[4]=[file2]

ARGV[5]=[file3]

9. 环境变量

awk 提供讉K��内徏数组ENV 工RON 中所有的环境变量:

[root@local~]#awk 'BEGIN {print ENVIRON["HOME"];print ENVIRON["USER]} ‘

/home/Jones

hones

通常你应��ENVIRON 看成是一个只��L��l��?

10. 模式

模式由字�W�串�?/ 或数��D��辑ּ�构徏而成。常用的模式如下�Q?

NF==0    选定�I��?

NF>3     选定拥有三个字段以上的记�?

NR<5    选定�W?1 到第 4 条记�?

(FNR==3)&&(FILENAME~/[.] [ch]$/) 来源�?C 源文件中选定记录 3

$1~/Jones/   选定字段 1 里有 . ” jones “的记�?

/[Xx][Mm][Ll]/ 选定含有‘ 'XML' 。的记录�Q��ƈ忽略大小写差�?

$0~/[Xx][Mm][Ll]/ 同上

11. 操作

以最��单的形式来说�Q�纯print 意指在标准输��Z��Q�打印当前的输入记录($0) �Q�接着是输��录分隔字�W?ORS 的��|��默认为单一换行字符。因此，下面�q�些�E�序所做的全是相同的操�?

1    模式为真�Q�默认操作�ؓ(f��)打印

NR>0 {print} 有记录时打印( 恒�ؓ(f��)�?

1    {print} 模式为真。则打印�Q�这是默认�?

{print} 无模式则视�ؓ(f��)真，明确的打华ͼ��q�是默认�?

{print $0} 相同�Q�但打印明确的�?

下面的例子已�l�是完整的awk �E�序。在每一个中�Q�我们都只显�C�前三个输入字段�Q��ƈ通过省略选定模式�Q�选定所有的记录。awk �E�序语句以分号分隔，而且我们�?x��)��用些略微不同的操作代码，以修改输出字�D�分隔字�W?

[root@local~]#echo ‘one two three four'| awk ‘{print $1,$2,$3}’

one two three

[root@local~]#echo ‘one two three four'| awk ‘{OFS=”…”;print $1,$2,$3}’

one…two…three

[root@local~]#echo ‘one two three four'| awk ‘{OFS=”\n”;print $1,$2,$3}’

one

two

three

改变输出字段分隔字符而没有指定�Q何字�D�，不会(x��)改变$0:

[root@local~]#echo ‘one two three four'| awk ‘{OFS=”\n”;print $0}’

one two three four

不过�Q�如果我们更改输出字�D�分隔字�W�，�q�指定至��一个字�D? 即��我们未变更其�? �Q?

强制以新的字�D�分隔字�W�重新组合记录，则结果�ؓ(f��):

[root@local~]#echo ‘one two three four'| awk ‘{OFS=”\n”;$1=$1;print $0}’

one

two

three

four

12. 在awk 中的单行�E�序

1.UNIX 单词计数�E�序wc;

[root@local~]#awk ‘{C+=length($0)+1;w+=NF} END {print NR, W, C}’

2. 撇开NUL 字符问题�Q�awk 其实可以��L��取代cat �Q�下面这两个例子�?x��)��生相同输�?

[root@local~]# cat*.xml

[root@local~]# awk 1*.xml

3. 要将原始数据值及(qi��ng)它们的对数打��Cؓ(f��)单栏的数据文�Ӟ��可��?

[root@local~]# awk ‘{print $1, log($1)}’file(s)

4. 在以�I�白分隔字段的表��g��Q�报告第n 栏的�?

[root@local~]# awk -v COLUMN=n ‘{sum+=$COLUMN} END {print sum} ’file (s)

5. 微调上述报告�Q��生字�D�n 的��^均�?

[root@local~]# awk -v COLUMN=n ‘{sum+=$COLUMN} END {print sum/NR } ’file (s)

6. 针对��p��文�g( 其记录包含描�q�C��金额于最后一个字�D? �Q�打印花�Ҏ(gu��)��L��。可使用内徏变量NF 计算��d�?

[root@local~]# awk’{sum+=$NF; print $0, sum}’files)

7. �q�里是三�U�查找文件内文本的方�?

[root@local~]#egrep ‘pattern|pattern’ file (s)

[root@local~]#awk ‘/pattern|pattern/’file (s)

[root@local~]#awk ‘/pattern}pattern/ {print FILENAME ”: ”FNR ”: ”$0} ’file(s)

8. 如果你要限制仅查�?00 一150 行，可以通过两个工具�E�序�Q�再搭配��道�Q�不�q�这么做�?x��)漏掉位�|�信�?

[root@local~]#sed -n -e 100,150p -s file(s) | egrep 'pattern'

使用GNU sed 要搭�?s 选项�Q�才能�ؓ(f��)每个文�g重新开始行�~�号。另外，你也可以通过awk �Q��用比较花哨的模式来做:

[root@local~]#awk ‘(100<=FNR) && (FNR <= 150) && /pattern/\

          {print FILENAME ”:” FNR ”:”$0}’file(s)

9. 要在一个四栏表格里�Q�调换第二与�W�三栏，假设它们是以制表字符分隔�Q�那么可�?

使用下面三种方式的其中一�U?

[root@local~]#awk -F'\t’-v OFS='\t’{print $1, $3, $2, $4}’old > new

[root@local~]#awk ‘BEGIN{FS=OFS="\t"}{print $1, $3 �Q?2 �Q?4} ’old>new

[root@local~]#awk –F ‘\t’{print $1"\t" $3"\t" $2"\t" $4}’old>new

10. 要将各栏分隔字符由制表字�W? 在此�?#183;昄��) 转换�?amp; �Q�可在以下两�U�方式择一:

[root@local~]#sed -e 's/ ·/&/g' file(s)

[root@local~]#awk ‘{BEGIN{FS="\t";OFS= “& ”}{$1=$1; print} ’file(s)

11. 下面�q�两个管道，都�ؓ(f��)删除已排序流里的重复�?

[root@local~]#sort file(s)|uniq

[root@local~]# sort file(s)|awk ‘Last!=$0 { print }{Last=$0}’

12. ��回车字�W? 换行字符的行�l�结�Q�一致�{换�ؓ(f��)以换行字�W�作��l�结�Q�可在下列方

式中选择一�U?

[root@local~]#sed –e ‘s/\r$//’ file(s)

[root@local~]#sed –e ‘s/^M$//’ file(s)

[root@local~]# mawk ‘BEGIN {RS=“\r\n"} {print}’file(s)

13. 要将单空格的文本行，转换为双�I�格的行�Q�可在下列方式选择一�U?

[root@local~]#sed –e ‘/s/$/\n/ ’file(s)

[root@local~]#awk ‘BEGTN{ ORS = "\n\n"){print}’file(s)

[root@local~]#awk ‘BEGIN{ ORS="\n\n" }1 ’ file(s)

[root@local~]#awk {print $0 “\n”} ’ file(s)

[root@local~]#awk ‘{print;print ” ”} ’ file(s)

13. 语句

13.1. 条�g语句

if(expressionl)

      stateme 刀t1

else if(expression2)

      statement2

else if(expression3)

      statement3

else if(expressionk)

      statementk

else

        statementk+l

13.2. 重复执行

awk 提供�?4 �U�重复执行语�?( 循环 ):

1. 循环在�v始处使用�l�束��试 :

while(expression)

statement

2. 循环在结��֤�使用�l�束��试 :

do

        statement

while (expression)

3. 循环执行可计数的�ơ数 :

for(expr1;expr2; expr3)

statement

4. 循环处理兌��数组里的元素 :

for(key in array)

statement

例如�Q?

for �Q�name in telephone)

print name“\t" telephone[name]

13.3 数组成员?g��u)��?

成员?g��u)��试key in array 是一个表辑ּ�: 如果key 为array 的一个烦(ch��)引元素，则计��ؓ(f��)1( �? 。如果key 不是array 的一个烦(ch��)引元素，�?(key in array) �? �?

对于��h��多下�?subscript) 的数�l�，在测试时�Q�请使用圆括��P��q�以逗点分隔下标列表:(i �Q�j �Q?#8230;�Q�n)in array

成员?g��u)��试不可能徏立数�l�元素，然而引用元素时�Q�如果元素不存在�Q�便�?x��)徏立它。因此你应该�q�么�?

if("Sally" in telephone)

print "Sally is in the directory"

而非:

if (telephone["Sally"]!= ””)

    print "Sally is in the directory"

因�ؓ(f��)�W�二�U��Ş式会(x��)在她(Sally) 不存在时�Q�将其加入到目录里，�q�拥有一个空�?sh��)话��L(f��ng)��?

重点�? 你必��能够区分寻扄��(ch��)�?index) 与寻扄��定�?value) 的差异。烦(ch��)引成员测试需要固定的旉��Q�而值的查找旉��是与数组里元素的个数成正比，�q�点我们在先前已通过break 语句内的for 循环解释�q�了。如果你需要时常用到这两种�q�算�Q�那么构建反索引数组�?x��)比较实�?

for (name in telephone)

name_by_telephone[telephone[name]]=name

接下来，你就可以使用name_by_telephone ["555-0136"] 在一定时间内扑ֈ�”Carol" 。当�?d��ng)��q�里假定所有的值是唯一�? 如果�q�两人共享同一个电(sh��)话，则name_by_telephone 数组只会(x��)记录最后一个名�U�。只要稍做修改就能解册��个问�?

for (name in telephone)

{

      if (telephone[name] in name_by_telephone)

        name_by_telephone[telephone[name]]=\

              name_by_telephone [telephone[name]) “\t”name

e1se

name_by_telephone[telephone[name]]=name

现在�Q�name_by_telephone 卛_��含了以制表字�W�分隔的��h��相同�?sh��)话��L(f��ng)��的�h名列表�?

14. 用户控制输入

awk 也可以通过的getline 语句做这件事。getline �?x��)返回一个��|��当输入被成功��d��Ӟ��它的�q�回��gؓ(f��)++I �Q�而返回��gؓ(f��)0 �Ӟ��则表�C�在文�g�l�尾�Q��?1 则表�C�错误。它的用法很多，见表�?

语法             说明

getline       从当前输入文件中�Q�读取下一条记录，存入$0 �Q��ƈ更新NF, NR 与FNR

getline var   从当前输入文件中�Q�读取下一条记录，存入var �Q��ƈ更新NR 与FNR

getline
getline var
cmd|getline    从外部命令cmd ��d��下一条记录，存入$0 �Q��ƈ更新NF

cmd|getline var 从外部命令cmd ��d��下一条记录，存入var

命��o(h��)��道在awk 里可以发挥强大的功能。管道可以在字符字符串中标明�Q�也可以包含�?

意的Shell 命��o(h��)。这里是与getline 搭配使用�Q�如�?

"date" I getline now

close("date")

print "The current time is".now

接下来说明的�? 如何在��@环里使用命��o(h��)��道:

command="head -n 15 /etc/hosts"

while((command I getline s)>0)

      print s

close(command)

15. 执行外部�E�序

�q�里是解决电(sh��)话名录排序问题较短的�E�序�Ҏ(gu��)��Q��用��(f��)时性文件与systemty �Q�而非awk ��道:

tmpfile= “/tmp/telephone.tmp^

for (name in telephone>

print name "\t" telephone[name]>tmpfile

close(tmpfilej

system("sort < tmpfile “)

临时性文件必��d��调用system() 之前关闭�Q�以��保��M��~�冲��出都正确地记录在文�g内�?

对于被system() 执行的命令�ƈ不需要调用close() �Q�因为close() 仅针对以I/O 重定向运��符所打开的文件或��道�Q�还有getline, print 或printf �?

传递给system[f 的命令可包含数行

system("cat <
它��生的输出和从嵌入文�g复制到标准输��Z��?

Un0

das

tres

16. 用户自定义函�?

函数定义如下:

function name(argl, }rg2, …�Q�argn

{

statements

}

指定的参数在函数体中用来当作局部变量，它们�?x��)隐藏�Q何相同名�U�的全局性变量。函��C��可用于程序它处，调用的�Ş式�ؓ(f��):

name(exprl, expr2, …�Q�expn) 忽略��M��的返回�?

result=name(exprl, expr2, …�Q�exprn) ��返回值存储到result �?

在每个调用点上的表达式，都提供初始值给函数参数型变量。以圆括��h��h��的参敎ͼ�必须紧接于函数名�U�C��后，中间没有��M��I�白�?

�Ҏ(gu��)��量参数所做的变动�Q�调用者无从得知，不过�Ҏ(gu��)��l�的变动��可看见了。换句话��_(d��)��标量��Z��?by vaule ) �Q�而数�l�则��Z��引用(by reference): �q�对C 语言也是�q�样�?

函数体里的return expression 语句�?x��)终止主体的执行�Q��ƈ��expression 的��g��控制权传�l�调用点。如果expression 省略�Q�则�q�回值由实现期定义。我们测试过的所有系�l�，�q�回的不是数字零��是�I�字�W�串�?

17. 字符串函�?

17.1. 子字�W�串提取

提取子字�W�串的函�?substr(string, start, 1en) �Q�会(x��)�q�回一份由string 的start 字符开始，共len 个字�W�长度的子字�W�串副本。字�W�的位置�Q�从1 开始编�?substr("abcde", 2, 3) ��返回。bcd" �?len 参数可省略，省略�Ӟ��则默认�ؓ(f��)length(string)-start+1 �Q�选出字符串的剩余部分�?

17.2. 字符串大��写转换

tolower(string) �?x��)返回将所有字母改为同义的��写的string 副本�Q�而toupper(string) 则返回被改�ؓ(f��)大写字母的string 副本。所以tolower("aBcDeF123") �q�回”abcdef123",toupper("aBcDeF123") �q�回"ABCDEF123" �?

17.3. 字符串大��写转换

index(string, find) 查找string 里是否有字符串find �Q�然后返回string 里find 字符串的起始位置�Q�如果在string 里找不到find �Q�则�q�回0 。例如index("abcdef","de") �?x��)返�? �?

17.4. 字符串匹�?

match �Q�string, regexp) ��string 与正则表辑ּ�regexp 匚w��Q�如果匹配，则返�?

匚w��string 的烦(ch��)引，不匹配，则返�? 。这�U�方式提供了比表辑ּ�(string~regexp) �q�多的信息，后者只能得到计��? �? 。另外match ( ) 也具有一个有用的副作�? 它会(x��)��全局变量RSTART 设�ؓ(f��)在string 中要开始匹配的索引��|��而将RLENGTH 设�ؓ(f��)要匹配的长度。而匹配子字符串则以substr(string, RSTART, RLENGTH) 表示�?

17.5. 字符串替�?

awk 在字�W�串替换功能上，提供两个函数:sub(regexp, replacement, target) 与gsub(regexp, replacement, target), sub() ��target 与正则表辑ּ�regexp �q�行匚w��Q�将最左边最长的匚w��部分替换为字�W�串replacement 。gsub() 的运行则有点�c�M��Q�不�q�它�?x��)替换所有匹配的字符�? 前置g 表示global 全局之意) �?

17.6. 字符串替�?

awk 针对当前输�h记录$0 自动提供了方便的分割为字1, $}, …�?NF �Q�也可以函数来做:split(string, array, regexp) ��string 切割为片�D�，�q�存储到array 里的�q�箋元素。在数组里，片段攄��在匹配正则表辑ּ�regexp 的子字符串之间。如果regexp 省略�Q�则使用内徏字段分隔字符FS 的当前默认倹{��函��C��(x��)�q�回array 里的元素数量�?

17.7. 字符串重�?

join() 可确保参数数�l�不�?x��)被引用刎ͼ�除非索引是在范围之内。否则，一个具有数�l�长度�ؓ(f��)0 的调用可能会(x��)建立arrayfl3 �Q�而修改了调用者的数组。插人的字段分隔字符为普通字�W�串�Q�而非正则表达式，所以针对传递给split() 的一般正则表辑ּ��Q�join() 不会(x��)重徏�_��的原始字�W�串�?

17.8. 字符串格式化

最后一个与字符串相关的函数是在用户控制下格式化数字与字�W�串:sprintf (format,expression1, expression2, …) �Q�它�?x��)返回已格式化的字符串作为其函数倹{��printf() 的运行方式也是这��P��只不�q�它�?x��)在标准输出或重定向的文件上昄��格式化后的字�W�串�Q�而不是返回其函数倹{��较新的�E�序语言以更强大的格式化函数来取代格式控制字�W�串�Q�但相对而言让代码变得很冗长。按照传�l�的文本处理应用来说�Q�sprintf 与printf

18. 数值函�?

函数           说明

atan2(y, x)   y �q�回y/x 的反正切�Q��g��?pai �?pai 之间�?

cos(x)        �q�回x 的余弦�? 以弧�?radians) 计算) �Q�该��g��?1 �?1 之间

exp(x)        �q�回x 的指敎ͼ�ex,

int(x)        �q�回x 的整数部分，截去前置�?

log(x)        �q�回x 的自然对数�?

rand()        �q�回�q�_��分布的虚拟随机r,O<=r
sin(x)        �q�回x 的正弦�? 以弧�?radians] 计算) �Q�该��g��?1 �?1 之间

sqrt(x)       �q�回x 的��^�?

srand(x)      讄��虚拟随机产生器的�U�子为x �Q��ƈ�q�回正确的种子。如果省略x �Q�则使用当前旉��( 以秒�? 。如果。rand ( ) 未被调用�Q�则awk 在每�ơ执行时�?x��)从相同的默认种子开�?mawk 则不�?x��)�?

本文来自CSDN博客�Q��{载请标明出处�Q?a >http://blog.csdn.net/wzhwho/archive/2010/04/21/5513791.aspx

Prayer 2010-08-26 10:26 发表评论

awk中��用的shell命��o(h��)

Prayer — Wed, 25 Aug 2010 10:53:00 GMT

awk中��用的shell命��o(h��)�Q�有2�U�方法：(x��)

一。��用所以system�Q�）(j��)

awk 'BEGIN {system("echo \"Input your name:\\c\""); getline d;print "\nYour name is",d,"\b!\n"}'

用（""�Q�和\"   \"   \\转义�?/p>

system - execute a shell command �Q�）(j��)里面接入命��o(h��)

awk�E�序中我们可以��用system() 函数去调用shell命��o(h��)
如：(x��)awk 'BEGIN{system("echo abc")}' file
echo abc ��׃��(x��)做�ؓ(f��)“命��o(h��)�?#8221;�Q�由shell来执行，所以我们会(x��)得到以下�l�果�Q?br>

root@ubuntu:~# awk 'BEGIN{system("echo abc")}'
abc
root@ubuntu:~#

root@ubuntu:~# awk 'BEGIN{v1="echo";v2="abc";system(v1" "v2)}'
abc
root@ubuntu:~#

root@ubuntu:~# awk 'BEGIN{v1="echo";v2="abc";system(v1 v2)}'
/bin/sh: echoabc: command not found
root@ubuntu:~#

root@ubuntu:~# awk 'BEGIN{v1=echo;v2=abc;system(v1" "v2)}'
root@ubuntu:~#

从上面的例子�Q�我们简单的分析一下awk是怎样调用system的：(x��)
如果system�Q�）(j��)括号里面的参数没有加上双引号的话�Q�awk认�ؓ(f��)它是一个变量，它会(x��)从awk的变量里面把它们先置换�ؓ(f��)帔R��Q�然后再回传�l�shell

如果system�Q�）(j��)括号里面的参数有加上双引��L(f��ng)��话，那么awk��q��接把引号里面的内容回传给shell�Q�作为shell�?#8220;命��o(h��)�?#8221;

二。��用print cmd | “/bin/bash”

root@ubuntu:~# awk 'BEGIN{print "echo","abc"| "/bin/bash"}'
abc
root@ubuntu:~#

root@ubuntu:~# awk 'BEGIN{print "echo","abc",";","echo","123"| "/bin/bash"}'
abc
123
root@ubuntu:~#

三。�ȝ��

无论使用system�Q�）(j��)�q�是print cmd | “/bin/bash”
awk都是新开一个shell�Q�在相应的cmdline参数送回�l�shell�Q�所以要注意当前shell变量与新开shell变量问题

1.1
root@ubuntu:~# abc=12345567890
root@ubuntu:~# awk 'BEGIN{system("echo $abc")}'

root@ubuntu:~#

1.2
root@ubuntu:~# export abc=12345567890
root@ubuntu:~# awk 'BEGIN{system("echo $abc")}'
12345567890
root@ubuntu:~#

2.1
root@ubuntu:~# abc=1234567890
root@ubuntu:~# awk 'BEGIN{print "echo","$abc"| "/bin/bash"}'

root@ubuntu:~#

2.2
root@ubuntu:~# export abc=1234567890
root@ubuntu:~# awk 'BEGIN{print "echo","$abc"| "/bin/bash"}'
1234567890
root@ubuntu:~#

以上例子�Q�没有export的话�Q�那些变量都是只存在于当前shell变量中，所以都是echo不出来的 �Q?br>而��用了 export的都是环境变量，所以awk调用新的shell时候，可以echo出来

Prayer 2010-08-25 18:53 发表评论

Prayer — Wed, 25 Aug 2010 03:08:00 GMT
     �H�然发现到Linux shell命��o(h��)的强大，有时在Windows需要一个��Y件的操作�Q�在ubuntu�l�端执行一条命令就可以�?
比如�Q?/p>
split命��o(h��)

语法:komy@komy-vmware:~$ split [-bl] 输入文�g 输出文�g

参数说明

-b :以文件大��来�?/font>

-l�Q�以行数来分

例如split -l 100 test.txt out

��是把test.txt�?00行输��Z��个文件outaa,outab,outcd以此�c�L��。。。实��C��文本文�g的分剌Ӏ?/font>

split -b 100k test.txt out

��是把test.txt�?00KB输出一个文件outaa,outab,outcd以此�c�L��?/font>

�q�两个命令对于手机看��说有限制的情况下很受用。。�?/font>

不仅仅如此cat 命��o(h��)可将�q�些分割后的文�g合�ƈ��Z��个文�Ӟ��q��定向�?#8220;largefile”文�g中（largefile��定的文�g名）(j��)�?

komy@komy-vmware:~$ cat out* > largeflie

Prayer 2010-08-25 11:08 发表评论

Prayer — Sat, 14 Aug 2010 11:44:00 GMT
#!/usr/bin/ksh
#
# SCRIPT: 12_ways_to_parse.ksh.ksh
#
#
# REV: 1.2.A
#
# PURPOSE:   This script shows the different ways of reading
#    a file line by line.   Again there is not just one way
#    to read a file line by line and some are faster than
#    others and some are more intuitive than others.
#
# REV LIST:
#
#    03/15/2002 - Randy Michael
#    Set each of the while loops up as functions and the timing
#    of each function to see which one is the fastest.
#
#######################################################################
#
#    NOTE: To output the timing to a file use the following syntax:
#
#       12_ways_to_parse.ksh file_to_process   > output_file_name 2>&1
#
#    The actaul timing data is sent to standard error, file
#    descriptor (2), and the function name header is sent
#    to standard output, file descriptor (1).
#
#######################################################################
#
# set -n   # Uncomment to check command syntax without any execution
# set -x   # Uncomment to debug this script
#

FILENAME="$1"
TIMEFILE="/tmp/loopfile.out"
>$TIMEFILE
THIS_SCRIPT=$(basename $0)

######################################
function usage
{
echo "\nUSAGE: $THIS_SCRIPT   file_to_process\n"
echo "OR - To send the output to a file use: "
echo "\n$THIS_SCRIPT   file_to_process   > output_file_name 2>&1 \n"
exit 1
}
######################################
function while_read_LINE
{
cat $FILENAME | while read LINE
do
       echo "$LINE"
       :
done
}
######################################
function while_read_LINE_bottom
{
while read LINE
do
       echo "$LINE"
       :

done < $FILENAME
}
######################################
function while_line_LINE_bottom
{
while line LINE
do
       echo $LINE
       :
done < $FILENAME
}
######################################
function cat_while_LINE_line
{
cat $FILENAME | while LINE=`line`
do
       echo "$LINE"
       :
done
}
######################################
function while_line_LINE
{
cat $FILENAME | while line LINE
do
       echo "$LINE"
       :
done
}
######################################
function while_LINE_line_bottom
{
while LINE=`line`
do
       echo "$LINE"
       :

done < $FILENAME
}
######################################
function while_LINE_line_cmdsub2
{
cat $FILENAME | while LINE=$(line)
do
       echo "$LINE"
       :
done
}
######################################
function while_LINE_line_bottom_cmdsub2
{
while LINE=$(line)
do
       echo "$LINE"
       :

done < $FILENAME
}
######################################
function while_read_LINE_FD
{
exec 3<&0
exec 0< $FILENAME
while read LINE
do
       echo "$LINE"
       :
done
exec 0<&3
}
######################################
function while_LINE_line_FD
{
exec 3<&0
exec 0< $FILENAME
while LINE=`line`
do
       echo "$LINE"
       :
done
exec 0<&3
}
######################################
function while_LINE_line_cmdsub2_FD
{
exec 3<&0
exec 0< $FILENAME
while LINE=$(line)
do
       print "$LINE"
       :
done
exec 0<&3
}
######################################
function while_line_LINE_FD
{
exec 3<&0
exec 0< $FILENAME

while line LINE
do
       echo "$LINE"
       :
done

exec 0<&3
}
######################################
########### START OF MAIN ############
######################################

# Test the Input

# Looking for exactly one parameter
(( $# == 1 )) || usage

# Does the file exist as a regular file?
[[ -f $1 ]] || usage

echo "\nStarting File Processing of each Method\n"

echo "Method 1:"
echo "\nfunction while_read_LINE\n" >> $TIMEFILE
echo "function while_read_LINE"
time while_read_LINE >> $TIMEFILE
echo "\nMethod 2:"
echo "\nfunction while_read_LINE_bottom\n" >> $TIMEFILE
echo "function while_read_LINE_bottom"
time while_read_LINE_bottom >> $TIMEFILE
echo "\nMethod 3:"
echo "\nfunction while_line_LINE_bottom\n" >> $TIMEFILE
echo "function while_line_LINE_bottom"
time while_line_LINE_bottom >> $TIMEFILE
echo "\nMethod 4:"
echo "\nfunction cat_while_LINE_line\n" >> $TIMEFILE
echo "function cat_while_LINE_line"
time cat_while_LINE_line >> $TIMEFILE
echo "\nMethod 5:"
echo "\nfunction while_line_LINE\n" >> $TIMEFILE
echo "function while_line_LINE"
time while_line_LINE >> $TIMEFILE
echo "\nMethod 6:"
echo "\nfunction while_LINE_line_bottom\n" >> $TIMEFILE
echo "function while_LINE_line_bottom"
time while_LINE_line_bottom >> $TIMEFILE
echo "\nMethod 7:"
echo "\nfunction while_LINE_line_cmdsub2\n" >> $TIMEFILE
echo "function while_LINE_line_cmdsub2"
time while_LINE_line_cmdsub2 >> $TIMEFILE
echo "\nMethod 8:"
echo "\nfunction while_LINE_line_bottom_cmdsub2\n" >> $TIMEFILE
echo "function while_LINE_line_bottom_cmdsub2"
time while_LINE_line_bottom_cmdsub2 >> $TIMEFILE
echo "\nMethod 9:"
echo "\nfunction while_read_LINE_FD\n" >> $TIMEFILE
echo "function while_read_LINE_FD"
time while_read_LINE_FD >> $TIMEFILE
echo "\nMethod 10:"
echo "\nfunction while_LINE_line_FD\n" >> $TIMEFILE
echo "function while_LINE_line_FD"
time while_LINE_line_FD >> $TIMEFILE
echo "\nMethod 11:"
echo "\nfunction while_LINE_line_cmdsub2_FD\n" >> $TIMEFILE
echo "function while_LINE_line_cmdsub2_FD"
time while_LINE_line_cmdsub2_FD >> $TIMEFILE
echo "\nMethod 12:"
echo "\nfunction while_line_LINE_FD\n" >> $TIMEFILE
echo "function while_line_LINE_FD"
time while_line_LINE_FD >> $TIMEFILE

Prayer 2010-08-14 19:44 发表评论

shell的效率不如perl或Python?

Prayer — Mon, 07 Jun 2010 04:25:00 GMT

shell文本处理斚w��Q�主要是有sed�Q�awk�q�两把刀�?br>
光给你个shell你进行文本处理是做不到的�Q�当然简单的�q�可以�?br>
perl里有正则表达式引擎，能针�Ҏ(gu��)��本进行拆分替换等复杂操作�Q�关键是�Q�perl不用fork出新的进�E�来处理�q�些事情�Q�而shell需要��用管道等通过�q�些sed�Q�awk的进�E�来处理�Q�至��就多出部分�q�程的开销�?br>
而且�Q�管道这个东西，原本一个工具一�ơ能完成的�Q务，在需要经�q�sed�Q�和awk�{�多�ơ管道。效率可惌��知�?br>
其实你这个问题问的有点弱智，SHELL是什么？

SHELL只是一个接口，大部分的功能全靠外部�E�序来完成�?br>而Perl是一�U�语�a��Q�基本上什么事情都能做�?/td>

老老实实学好一样东西最实际�?br>当你参加面试的时候，如果可以自信的说自己熟练使用Shell或者Perl�Q�那��q��当不错了�?br>效率之类的云云，具体问题具体分析吧，能解军_��作中遇到的问题就行�?br>

看出来楼��L��较关心文本处理，下面�q�个比方不一定恰当，但已�l�很接近了：(x��)

相比较而言�Q�awk、sed��像��L��手，而perl和python是个�z�L��手�?br>
awk和sed专注于文本处理，大部分情冉|��率要优于perl�{�。很��单，比如列文�Ӟ��谁能有cat的效率高�Q?br>
如果你是个懒惰的SA�Q�那��q��shell吧。如果是geek或者你的工作需要复杂的逻辑�Q��ƈ且还�?x��)出现许多无法预知的新要求，那就用perl�{�好了�?br>

没那么多关键字，是打字手误，但是1-10万数量��的关键字�Q�在千万行��文本文�g中搜索，�q�个量还是有的�?br>
来段sed multiple keywords search in batch的代码，�Ƣ迎其他新想法�?

local num_in_batch=300

local batch_counter=0

local log_display_in_batch=1000

local bbl_counter=0

local num_in_bl_counter=0

declare -a bbl_arr=()

local keyword=

local keyword_del

logMsg $debug_flag null "Starting blacklist checking in batch."

for msisdn in `cut -d: -f2 $tmpfile`; do

if [ $batch_counter -eq $num_in_batch ]; then

keyword="${keyword}$msisdn"

bbl_arr=(`sed -rn "/$keyword/p" $filter_file`)

local num=${#bbl_arr[@]}

((num_in_bl_counter+=num))

if [ $num -gt 1 ]; then

keyword_del=`echo ${bbl_arr[@]} | tr " " "|"`

sed -ri "/${keyword_del}/d" $inputfile

fi

keyword=

batch_counter=0

else

keyword="${keyword}$msisdn|"

fi

if [ $((bbl_counter%log_display_in_batch)) -eq 0 ]; then

logMsg $debug_flag null "$bbl_counter MSISDN processed."

fi

((batch_counter++))

((bbl_counter++))

done

复制代码

Prayer 2010-06-07 12:25 发表评论

sort -T

Prayer — Wed, 12 May 2010 06:14:00 GMT
-T Directory
            Places all temporary files that are created into the directory specified by the Directory parameter.

Prayer 2010-05-12 14:14 发表评论

sort 指定排序域的两种�Ҏ(gu��)��

Prayer — Wed, 12 May 2010 06:12:00 GMT

       The -k KeyDefinition flag uses the following form:

       -k [ FStart [ .CStart ] ] [ Modifier ] [ , [ FEnd [ .CEnd ] ][ Modifier ] ]

       The sort key includes all characters beginning with the field specified by the FStart variable and the column specified by
       the CStart variable and ending with the field specified by the FEnd variable and the column specified by the CEnd variable.
       If Fend is not specified, the last character of the line is assumed. If CEnd is not specified the last character in the
       FEnd field is assumed. Any field or column number in the KeyDefinition variable may be omitted. The default values are:
       FStart
            Beginning of the line
       CStart
            First column in the field

       FEnd
            End of the line
       CEnd
            Last column of the field

       If there is any spaces between the fields, sort considers them as separate fields.

       The value of the Modifier variable can be one or more of the letters b, d, f, i, n, or r. The modifiers apply only to the
       field definition they are attached to and have the same effect as the flag of the same letter. The modifier letter b
       applies only to the end of the field definition to which it is attached. For example:

       -k 3.2b,3r

       specifies a sort key beginning in the second nonblank column of the third field and extending to the end of the third
       field, with the sort on this key to be done in reverse collation order. If the FStart variable and the CStart variable fall
       beyond the end of the line or after the FEnd variable and the CEnd variable, then the sort key is ignored.

       A sort key can also be specified in the following manner:

       [+[FSkip1] [.CSkip1] [Modifier] ] [-[FSkip2] [.CSkip2] [Modifier]]

       The +FSkip1 variable specifies the number of fields skipped to reach the first field of the sort key and the +CSkip
       variable specifies the number of columns skipped within that field to reach the first character in the sort key. The -FSkip
       variable specifies the number of fields skipped to reach the first character after the sort key, and the -CSkip variable
       specifies the number of columns to skip within that field. Any of the field and column skip counts may be omitted. The
       defaults are:
       FSkip1
            Beginning of the line
       CSkip1
            Zero
       FSkip2
            End of the line
       CSkip2
            Zero

       The modifiers specified by the Modifier variable are the same as in the -k flag key sort definition.

       The field and column numbers specified by +FSkip1.CSkip1 variables are generally one less than the field and column number
       of the sort key itself because these variables specify how many fields and columns to skip before reaching the sort key.
       For example:

       +2.1b -3r

       specifies a sort key beginning in the second nonblank column of the third field and extending to the end of the third
       field, with the sort on this key to be done in reverse collation order. The statement +2.1b specifies that two fields are
       skipped and then the leading blanks and one more column are skipped. If the +FSkip1.CSkip1 variables fall beyond the end of

       the line or after the -FSkip2.CSkip2 variables, then the sort key is ignored.

       Note: The maximum number of fields on a line is 10.

Prayer 2010-05-12 14:12 发表评论

Prayer — Wed, 12 May 2010 05:34:00 GMT

本原创文章属�?a target=_blank>《Linux大棚�?/font>博客�Q�博客地址�?a target=_blank>http://roclinux.cn。文章作者�ؓ(f��)rocrocket�?/strong>

��Z��防止某些�|�站的恶性�{载，特在每篇文章前加入此信息�Q�还望读者体谅�?/strong>

===

[正文开始]
有时候学�?f��n)脚本，你�?x��)发现sort命��o(h��)后面跟了一堆类�?k1,2�Q�或�?k1.2 -k3.4的东东，有些匪夷所思。今天，我们��来搞定它�?k选项�Q?/p>
1 准备素材

$ cat facebook.txt
google 110 5000
baidu 100 5000
guge 50 3000
sohu 100 4500

�W�一个域是公司名�U�ͼ��W�二个域是公�思h敎ͼ��W�三个域是员工��^均工资。（除了公司名称�Q�其他的别信�Q�都瞎写的^_^�Q?/p>
2 我想让这个文件按公司的字母顺序排序，也就是按�W�一个域�q�行排序�Q�（�q�个facebook.txt文�g有三个域�Q?/strong>

$ sort -t ‘ ‘ -k 1 facebook.txt
baidu 100 5000
google 110 5000
guge 50 3000
sohu 100 4500

看到了吧�Q�就直接�?k 1讑֮��可以了。（其实此处�q�不严格�Q�稍后你��׃��(x��)知道�Q?/p>
3 我想让facebook.txt按照公司人数排序

$ sort -n -t ‘ ‘ -k 2 facebook.txt
guge 50 3000
baidu 100 5000
sohu 100 4500
google 110 5000

不用解释�Q�我�怿�你能懂�?/p>
但是�Q�此处出��C��问题�Q�那��是baidu和sohu的公�思h数相同，都是100人，�q�个时候怎么办呢�Q�按照默认规矩，是从�W�一个域开始进行升序排序，因此baidu排在了sohu前面�?/p>
4 我想让facebook.txt按照公司人数排序 �Q��h数相同的按照员工�q�_��工资升序排序�Q?/strong>

$ sort -n -t ‘ ‘ -k 2 -k 3 facebook.txt
guge 50 3000
sohu 100 4500
baidu 100 5000
google 110 5000

看，我们加了一�?k2 -k3��p��决了问题。对��_(d��)��sort支持�q�种讑֮��Q�就是说讑֮�域排序的优先�U�，先以�W?个域�q�行排序�Q�如果相同，再以�W?个域�q�行排序。（如果你愿意，可以一直这么写下去�Q�设定很多个排序优先�U�）(j��)

5 我想让facebook.txt按照员工工资降序排序�Q�如果员工�h数相同的�Q�则按照公司人数升序排序�Q�（�q�个有点隑ֺ�喽）(j��)

$ sort -n -t ‘ ‘ -k 3r -k 2 facebook.txt
baidu 100 5000
google 110 5000
sohu 100 4500
guge 50 3000

此处有��用了一些小技巧，你仔�l�看看，�?k 3后面偷偷加上了一个小写字母r。你��x��Q�再�l�合我们上一��文�?/font>�Q�能得到�{�案么？揭晓�Q�r�?r选项的作用是一��L(f��ng)��Q�就是表�C�逆序。因为sort默认是按照升序排序的�Q�所以此处需要加上r表示�W�三个域�Q�员工��^均工资）(j��)是按照降序排序。此处你�q�可以加上n�Q�就表示对这个域�q�行排序�Ӟ��要按照数值大��进行排序，举个例子吧：(x��)

$ sort -t ‘ ‘ -k 3nr -k 2n facebook.txt
baidu 100 5000
google 110 5000
sohu 100 4500
guge 50 3000

看，我们��L��了最前面�?n选项�Q�而是��它加入��C��每一�?k选项中了�?/p>
6 -k选项的具体语法格�?/strong>

要��l�往下深入的话，��׃��得不来点理论知识。你需要了�?k选项的语法格式，如下�Q?/p>
[ FStart [ .CStart ] ] [ Modifier ] [ , [ FEnd [ .CEnd ] ][ Modifier ] ]

�q�个语法格式可以被其中的逗号�Q?#8220;�Q?#8221;�Q�分��Z��大部分，Start部分和End部分�?/p>
先给你灌输一个思想�Q�那��是“如果不设定End部分�Q�那么就认�ؓ(f��)End被设定�ؓ(f��)行尾”。这个概念很重要的，但往往你不�?x��)重视它�?/p>
Start部分也由三部分组成，其中的Modifier部分��是我们之前说过的类似n和r的选项部分。我们重点说说Start部分的FStart和C.Start�?/p>
C.Start也是可以省略的，省略的话��p��C�Z��本域的开头部分开始。之前例子中�?k 2�?k 3��是省略了C.Start的例子喽�?/p>
FStart.CStart�Q�其中FStart��是表示使用的域�Q�而CStart则表�C�在FStart域中从第几个字符开始算“排序首字�W?#8221;�?/p>
同理�Q�在End部分中，你可以设定FEnd.CEnd�Q�如果你省略.CEnd�Q�则表示�l�尾�?#8220;域尾”�Q�即本域的最后一个字�W�。或者，如果你将CEnd讑֮��?(�?�Q�也是表�C�结��ֈ�“域尾”�?/p>
7 �H�发奇想�Q�从公司英文名称的第二个字母开始进行排序：(x��)

$ sort -t ‘ ‘ -k 1.2 facebook.txt
baidu 100 5000
sohu 100 4500
google 110 5000
guge 50 3000

看，我们使用�?k 1.2�Q�这��p��C�对�W�一个域的第二个字符开始到本域的最后一个字�W��ؓ(f��)止的字符串进行排序。你�?x��)发现baidu因�ؓ(f��)�W�二个字母是a而名列榜首。sohu和google�W�二个字�W�都是o�Q�但sohu的h在google的o前面�Q�所以两者分别排在第二和�W�三。guge只能屈居�W�四了�?/p>
8 又突发奇惻I��Q�只针对公司英文名称的第二个字母�q�行排序�Q�如果相同的按照员工工资�q�行降序排序�Q?/strong>

$ sort -t ‘ ‘ -k 1.2,1.2 -k 3,3nr facebook.txt
baidu 100 5000
google 110 5000
sohu 100 4500
guge 50 3000

�׃��只对�W�二个字母进行排序，所以我们��用了-k 1.2,1.2的表�C�方式，表示我们“�?#8221;对第二个字母�q�行排序。（如果你问“我��?k 1.2怎么不行�Q?#8221;�Q�当然不行，因�ؓ(f��)你省略了End部分�Q�这��意味着你将对从�W�二个字母�v到本域最后一个字�W��ؓ(f��)止的字符串进行排序）(j��)。对于员工工资进行排序，我们也��用了-k 3,3�Q�这是最准确的表�q�ͼ�表示我们“�?#8221;�Ҏ(gu��)��域进行排序，因�ؓ(f��)如果你省略了后面�?�Q�就变成了我�?#8220;对第3个域开始到最后一个域位置的内容进行排�?#8221;了�?/p>
9 在modifier部分�q�可以用到哪些选项�Q?/strong>

可以用到b、d、f、i、n �?r�?/p>
其中n和r你肯定已�l�很熟�?zh��n)�了�?/p>
b表示忽略本域的签到空白符受��?/p>
d表示�Ҏ(gu��)��域按照字兔R��序排序（卻I��只考虑�I�白和字母）(j��)�?/p>
f表示�Ҏ(gu��)��域忽略大��写�q�行排序�?/p>
i表示忽略“不可打印字符”�Q�只针对可打印字�W�进行排序。（有些ASCII��是不可打印字符�Q�比如\a是报警，\b是退��|��\n是换行，\r是回车等�{�）(j��)

10 思考思考关�?k�?u联合使用的例子：(x��)

$ cat facebook.txt
google 110 5000
baidu 100 5000
guge 50 3000
sohu 100 4500

�q�是最原始的facebook.txt文�g�?/p>
$ sort -n -k 2 facebook.txt
guge 50 3000
baidu 100 5000
sohu 100 4500
google 110 5000

$ sort -n -k 2 -u facebook.txt
guge 50 3000
baidu 100 5000
google 110 5000

当设定以公司员工域进行数值排序，然后�?u后，sohu一行就被删除了�Q�原�?u只识别用-k讑֮�的域�Q�发现相同，��将后箋相同的行都删除�?/p>
$ sort -k 1 -u facebook.txt
baidu 100 5000
google 110 5000
guge 50 3000
sohu 100 4500

$ sort -k 1.1,1.1 -u facebook.txt
baidu 100 5000
google 110 5000
sohu 100 4500

�q�个例子也同理，开头字�W�是g的guge��没有幸免于难�?/p>
$ sort -n -k 2 -k 3 -u facebook.txt
guge 50 3000
sohu 100 4500
baidu 100 5000
google 110 5000

咦！�q�里讄��了两层排序优先��的情况下�Q��?u��没有删除�Q何行。原�?u是会(x��)权衡所�?k选项�Q�将都相同的才会(x��)删除�Q�只要其中有一�U�不同都不会(x��)��L��删除�?)�Q�不信，你可以自己加一行sina 100 4500试试看）(j��)

11 最诡异的排序：(x��)

$ sort -n -k 2.2,3.1 facebook.txt
guge 50 3000
baidu 100 5000
sohu 100 4500
google 110 5000

以第二个域的�W�二个字�W�开始到�W�三个域的第一个字�W�结束的部分�q�行排序�?/p>
�W�一行，�?x��)提�? 3�Q�第二行提取00 5�Q�第三行提取00 4�Q�第四行提取10 5�?/p>
又因为sort认�ؓ(f��)0��于00��于000��于0000….

因此0 3肯定是在�W�一个�?0 5肯定是在最后一个。但��Z��?0 5却在00 4前面呢？�Q�你可以自己做实验思考一下。）(j��)

�{�案揭晓�Q�原�?#8220;跨域的设定是个假�?#8221;�Q�sort只会(x��)比较�W�二个域的第二个字符到第二个域的最后一个字�W�的部分�Q�而不�?x��)把�W�三个域的开头字�W�纳入比较范围。当发现00�?0相同�Ӟ��sort��׃��(x��)自动比较�W�一个域��M��。当然baidu在sohu前面了。用一个范例即可证实：(x��)

$ sort -n -k 2.2,3.1 -k 1,1r facebook.txt
guge 50 3000
sohu 100 4500
baidu 100 5000
google 110 5000

12 有时候在sort命��o(h��)后会(x��)看到+1 -2�q�些�W�号�Q�这是什么东东？

关于�q�种语法�Q�最新的sort是这么进行解释的�Q?/p>
On older systems, `sort’ supports an obsolete origin-zero syntax `+POS1 [-POS2]‘ for specifying sort keys. POSIX 1003.1-2001 (*note Standards conformance::) does not allow this; use `-k’ instead.

原来�Q�这�U�古老的表示方式已经被淘��C��Q�以后可以理直气壮的鄙视使用�q�种表示�Ҏ(gu��)��的脚本喽�Q?/p>
�Q��ؓ(f��)了防止古老脚本的存在�Q�在�q�再说一下这�U�表�C�方法，加号表示Start部分�Q�减可��C�End部分。最最重要的一�Ҏ(gu��)��Q�这�U�方式方法是�?开始计数的�Q�以前所说的�W�一个域�Q�在此被表示为第0个域。以前的�W?个字�W�，在此表示为第1个字�W�。明白？�Q?/p>
�l�束语：(x��)

本文是互联网上仅有的比较全的关于sort的k选项的论�q�文章，如需转蝲请务必注�?#8220;转自Linux大棚-Linux主题博客”�Q�谢谢各�?)

sort�?k选项基本��是�q�堆内容了，如果大家有什么补充，��q��a��?) �Ƣ迎交流�Q?/strong>

Prayer 2010-05-12 13:34 发表评论

《sort帮你排序�?linux命��o(h��)五分钟系列之二十�?-o选项

Prayer — Wed, 12 May 2010 05:32:00 GMT

sort是在Linux里非常常用的一个命令，��排序的�Q�集中精力，五分钟搞定sort�Q�现在开始！

1 sort的工作原�?/strong>

sort��文件的每一行作��Z��个单位，�怺�比较�Q�比较原则是从首字符向后�Q�依�ơ按ASCII码��D��行比较，最后将他们按升序输出�?/p>
[rocrocket@rocrocket programming]$ cat seq.txt
banana
apple
pear
orange
[rocrocket@rocrocket programming]$ sort seq.txt
apple
banana
orange
pear

2 sort�?u选项

它的作用很简单，��是在输��中去除重复行�?/p>
[rocrocket@rocrocket programming]$ cat seq.txt
banana
apple
pear
orange
pear
[rocrocket@rocrocket programming]$ sort seq.txt
apple
banana
orange
pear
pear
[rocrocket@rocrocket programming]$ sort -u seq.txt
apple
banana
orange
pear

pear�׃��重复�?u选项无情的删除了�?/p>
3 sort�?r选项

sort默认的排序方式是升序�Q�如果想�Ҏ(gu��)��降序�Q�就加个-r��搞定了�?/p>
[rocrocket@rocrocket programming]$ cat number.txt
1
3
5
2
4
[rocrocket@rocrocket programming]$ sort number.txt
1
2
3
4
5
[rocrocket@rocrocket programming]$ sort -r number.txt
5
4
3
2
1

4 sort�?o选项

�׃��sort默认是把�l�果输出到标准输出，所以需要用重定向才能将�l�果写入文�g�Q��Ş如sort filename > newfile�?/p>
但是�Q�如果你��x��排序�l�果输出到原文�g中，用重定向可就不行了�?/p>
[rocrocket@rocrocket programming]$ sort -r number.txt > number.txt
[rocrocket@rocrocket programming]$ cat number.txt
[rocrocket@rocrocket programming]$
看，竟然��number清空了�?/p>
��在�q�个时候，-o选项出现了，它成功的解决了这个问题，让你攑ֿ�的将�l�果写入原文件。这或许也是-o比重定向的唯一优势所在�?/strong>

[rocrocket@rocrocket programming]$ cat number.txt
1
3
5
2
4
[rocrocket@rocrocket programming]$ sort -r number.txt -o number.txt
[rocrocket@rocrocket programming]$ cat number.txt
5
4
3
2
1

5 sort�?n选项

你有没有遇到�q?0�?��的情况。我反正遇到�q�。出现这�U�情冉|��׃��排序�E�序��这些数字按字符来排序了�Q�排序程序会(x��)先比�?�?�Q�显�?��，所以就��?0攑֜�2前面喽。这也是sort的一贯作风�?/p>
我们如果��x��变这�U�现�Ӟ��p��使用-n选项�Q�来告诉sort�Q?#8220;要以数值来排序”�Q?/p>
[rocrocket@rocrocket programming]$ cat number.txt
1
10
19
11
2
5
[rocrocket@rocrocket programming]$ sort number.txt
1
10
11
19
2
5
[rocrocket@rocrocket programming]$ sort -n number.txt
1
2
5
10
11
19

6 sort�?t选项�?k选项

如果有一个文件的内容是这��P��(x��)

[rocrocket@rocrocket programming]$ cat facebook.txt
banana:30:5.5
apple:10:2.5
pear:90:2.3
orange:20:3.4

�q�个文�g有三列，列与列之间用冒号隔开了，�W�一列表�C�水果类型，�W�二列表�C�水果数量，�W�三列表�C�水果�h(hu��n)根{�?/p>
那么我想以水果数量来排序�Q�也��是以第二列来排序，如何利用sort实现�Q?/p>
�q�好�Q�sort提供�?t选项�Q�后面可以设定间隔符。（是不是想起了cut和paste�?d选项�Q�共鸣～～）(j��)

指定了间隔符之后�Q�就可以�?k来指定列��C��?/p>
[rocrocket@rocrocket programming]$ sort -n -k 2 -t : facebook.txt
apple:10:2.5
orange:20:3.4
banana:30:5.5
pear:90:2.3

我们使用冒号作�ؓ(f��)间隔�W�，�q��对第二列来进行数值升序排序，�l�果很��o(h��)人满意�?/p>
7 其他的sort常用选项

-f�?x��)将��写字母都�{换�ؓ(f��)大写字母来进行比较，亦即忽略大小�?/p>
-c�?x��)检查文件是否已排好序，如果乱序�Q�则输出�W�一个�ؕ序的行的相关信息�Q�最后返�?

-C�?x��)检查文件是否已排好序，如果乱序�Q�不输出内容�Q�仅�q�回1

-M�?x��)以月䆾来排序，比如JAN��于FEB�{�等

-b�?x��)忽略每一行前面的所有空白部分，从第一个可见字�W�开始比较�?/p>
未完待箋�Q�敬��h��待：(x��)《sort命��o(h��)的k选项大讨论�?/strong>

Prayer 2010-05-12 13:32 发表评论

Prayer — Mon, 12 Apr 2010 11:11:00 GMT
预定义变量和环境变量相类��|��也是在Shell一开始时��定义了的变量。所不同的是�Q�用户只能根据Shell的定义来使用�q�些变量�Q�而不能重定义它。所有预定义变量都是�?�W�和另一个符��L(f��ng)��成的�Q�常用的Shell预定义变量有�Q?br> $# 位置参数的数量�?br> $* 所有位�|�参数的内容�?br> $? 命��o(h��)执行后返回的状态�?br> $$ 当前�q�程的进�E�号�?br> $! 后台�q�行的最后一个进�E�号�?br> $0 当前执行的进�E�名�?br> 其中�Q??用于��(g��)查上一个命令执行是否正��。（在Linux中，命��o(h��)退出状态�ؓ(f��)0表示该命令正��执行，��M��?��D��C�命令出错。）(j��)
$$变量最常见的用途是用做暂存文�g的名字以保证暂存文�g不会(x��)重复�?img src ="http://www.shnenglu.com/prayer/aggbug/112366.html" width = "1" height = "1" />

Prayer 2010-04-12 19:11 发表评论

Prayer — Mon, 12 Apr 2010 11:10:00 GMT

假设当前目录下有a.log b.log二个文�g�Q�利用awk打印出其文�g名，脚本如下�Q?/p>
#! /bin/bash
for file in *.log
do
        awk 'BEGIN{var=" ' "$file" ' "}END{print var;}' "$file"
done

在这里最让�h��h��的是单引号和双引�?/span>

我们可以利用bash -x test.sh来执行脚本，其会(x��)��脚本中的shell变量展开�Q�便于调�?/strong>

’单引号中除（’�Q�都为原本字�W�，没有�Ҏ(gu��)��意义

"双引号中除（ $`"�Q?/strong> 都�ؓ(f��)原本字符�Q�没有特�D�意�?/strong>

因此�Q�上�q�可以展开�?

�W�一�ơ：(x��)

awk 'BEGIN{var="a.log"}END{print var;}‘ a.log

�W�二�ơ：(x��)

awk 'BEGIN{var="b.log"}END{print var;}‘ b.log

如果��其写成 awk 'BEGIN{var=' "$file" '}END{print var;}' "$file"�Q�则展开为：(x��)

�W�一�ơ：(x��)

awk 'BEGIN{var=a.log}END{print var;}‘ a.log

�W�二�ơ：(x��)

awk 'BEGIN{var=b.log}END{print var;}‘ b.log

�?x��)报错，因��?f��)awk中字�W�串要用双引��h��h��

��其分解成以下这��P��便于理解�Q?/strong>

'BEGIN{var=" '    "$file" ' "}END{print var;}' �q�三部分为字�W�串�q�接关系

Prayer 2010-04-12 19:10 发表评论

Prayer — Sun, 28 Mar 2010 09:49:00 GMT

## eval用法三例 ##
## shell:/bin/sh ##
## yhc 2002.09.26 18:00 ##

#例一:
#��L��合符条�g的变量名,然后��该变量的��D��予另一变量
v1=aaa
v2=bbb
c=1
if [ $c -eq 1 ]
then
vname=v$c   #扑ֈ��W�合条�g的变量名为v1
eval vvv="$"$vname ; echo vvv: $vvv    #��变量v1的��D��予vvv,�?使vvv=aaa
eval vvv='$'$vname ; echo vvv: $vvv    #��变量v1的��D��予vvv,�?使vvv=aaa
#eval vvv=$$vname   ; echo vvv: $vvv    #错误用法
fi

#例二:#以变量v1的值aaa作�ؓ(f��)变量�?��变量vaaa的��D��予这一新定义的变量aaa
v1=aaa ; vaaa="This is aaa"
#eval $v1=$vaaa    ; echo aaa: $aaa    #错误用法
#eval $v1="$vaaa" ; echo aaa: $aaa    #错误用法
eval $v1='$vaaa'   ; echo aaa: $aaa

#例三:
#以变量v1的值aaa作�ؓ(f��)变量�?�q�将变量名字串作为��D��予自�w?br>v1=aaa ; vaaa="This is aaa"
eval $v1=$v1   ; echo aaa: $aaa    #与例二的错误用法不同,�q�一用法是正��的
eval $v1="$v1" ; echo aaa: $aaa    #与例二的错误用法不同,�q�一用法是正��的
eval $v1='$v1' ; echo aaa: $aaa

该文章�{载自[�E�序人生]�Q?lt;a href="http://www.procedurelife.com/technical/SHELL/content/lbkjf.html

Prayer 2010-03-28 17:49 发表评论

shell中trap捕捉��C��L(f��ng)��处理

Prayer — Sun, 28 Mar 2010 09:42:00 GMT

一. trap捕捉��C��号之后，可以有三�U�反应方式：(x��)

　　(1)执行一�D늨�序来处理�q�一信号

　　(2)接受信号的默认操�?br>
　　(3)忽视�q�一信号

　　�? trap对上面三�U�方式提供了三种基本形式�Q?br>
　　�W�一�U��Ş式的trap命��o(h��)在shell接收到signal list清单中数值相同的信号�Ӟ��执行双

　　引号中的命��o(h��)丌Ӏ?br>
　　trap 'commands' signal-list

　　trap "commands" signal-list

　　��Z��恢复信号的默认操作，使用�W�二�U��Ş式的trap命��o(h��)�Q?br>
　　trap signal-list

　　�W�三�U��Ş式的trap命��o(h��)允许忽视信号

　　trap " " signal-list

注意�Q?br>
　　(1) 对信�?1(�D�违�?不能捕捉�Q�因为shell本��n需要捕捉该信号去进行内存的转储�?br>
　　(2) 在trap中可以定义对信号0的处�?实际上没有这个信�?�Q?shell�E�序在其�l�止(�?br>
　　执行exit语句)时发��信号�?br>
　　(3) 在捕捉到signal-list中指定的信号�q�执行完相应的命令之后，如果�q�些命��o(h��)没有

　　��shell�E�序�l�止的话�Q�shell�E�序��l�执行收��C��h��所执行的命令后面的命��o(h��)�Q�这样将

　　很容易导致shell�E�序无法�l�止�?br>
　　另外�Q�在trap语句中，单引号和双引��h��不同的，当shell�E�序�W�一�ơ碰到trap语句�Ӟ��

　　��把commands中的命��o(h��)扫描一遍。此时若commands是用单引��h��h��的话�Q�那么shell不会(x��)

　　对commands中的变量和命令进行替换，否则commands中的变量和命令将用当时具体的值来

kill -l可以列出�pȝ��的信�?/p>
通常我们需要忽略的信号有四个，卻I��(x��)HUP, INT, QUIT, TSTP�Q�也��是信号1, 2, 3, 24
使用�q�样的语句可以�ɘq�些中断信号被忽略：(x��)
trap "" 1 2 3 24 �?trap "" HUP INT QUIT TSTP
�?trap �Q? 2 3 24 �?trap HUP INT QUIT TSTP使其回复默认倹{�?
用stty -a可以列出中断信号与键盘的对应�Q�分别执行上面的命��o(h��)后，�q�行
tail -f /etc/passwd, 然后��试用键盘中断，试试两种情况�Q�默认和忽略�Q�下有何不同�?
更方便的是我们可以用在shell中用trap定义我们自己的信号处理程�?/p>

#!/bin/bash
#scriptname: trapping
#can use the singnal numbers of bash abbreviations seen
#below. Cannot use SIGINT ,SIGOUIT ,etc

trap 'echo Control-c will not terminate $0. ' INT
trap 'echo Control-\ will not terminate $0. ' QUIT
trap 'echo Control-Z will not terminate $0. ' TSTP

echo "Enter any string after the prompt. When you are ready to exit ,type \"stop\"."

while true
do

echo -n "Go ahead ...>"
read
if [[ $reply==[sS]top ]]
then
   break
fi
done

Prayer 2010-03-28 17:42 发表评论

Prayer — Sun, 28 Mar 2010 09:14:00 GMT

awk提供了许多强大的字符串函敎ͼ�见下表：(x��)
awk内置字符串函�?br>

gsub(r,s) 在整�?0中用s替代r

gsub(r,s,t) 在整个t中用s替代r

index(s,t)
�q�回s中字�W�串t的第一位置

length(s)
�q�回s长度

match(s,r)
��试s是否包含匚w��r的字�W�串

split(s,a,fs) 在fs上将s分成序列a

sprint(fmt,exp) �q�回�l�fmt格式化后的exp

sub(r,s)
�?0中最左边最长的子串代替s

substr(s,p) �q�回字符串s中从p开始的后缀部分

substr(s,p,n)
�q�回字符串s中从p开始长度�ؓ(f��)n的后�~�部分

详细说明一下各个函数的使用�Ҏ(gu��)��?br>
gsub函数有点�c�M��于sed查找和替换。它允许替换一个字�W�串或字�W��ؓ(f��)另一个字�W�串或字�W�，�q�以正则表达式的形式执行。第一个函��C��用于记录$0�Q�第二个gsub函数允许指定目标�Q�然而，如果未指定目标，�~�省�?0�?br>index(s,t)函数�q�回目标字符串s中查询字�W�串t的首位置。length函数�q�回字符串s字符
长度。match函数��试字符串s是否包含一个正则表辑ּ�r定义的匹配。split使用域分隔符fs��?br>字符串s划分为指定序列a。sprint函数�c�M��于printf函数(以后涉及(qi��ng))�Q�返回基本输出格式fmt�?br>�l�果字符串exp。sub(r,s)函数��用s替代$0中最左边最长的子串�Q�该子串�?r)匚w��?br>sub(s,p)�q�回字符串s在位�|�p后的后缀。substr(s,p,n)同上�Q��ƈ指定子串长度为n�?br>现在看一看awk中这些字�W�串函数的功能�?br>
1.gsub
要在整个记录中替换一个字�W�串为另一个，使用正则表达式格式，/目标模式/�Q�替换模�?br>/。例如改变学生序�?842�?899�Q?br>
$ awk 'gsub('4842/, 4899) {print $0}' grade.txt
J.Troll 07/99 4899 Brown-3 12 26 26

2.index
查询字符串s中t出现的第一位置。必��ȝ��双引号将字符串括��h��。例如返回目标字�W�串
Bunny中ny出现的第一位置�Q�即字符个数�?br>
$ awk 'BEGIN {print index("Bunny", "ny")} grade.txt
4

3.length
�q�回所需字符串长度，例如��(g��)验字�W�串J.Troll�q�回名字�?qi��ng)其长度�Q�即人名构成的字�W�个
数�?br>
$ awk '$1=="J.Troll" {print length($1) " "$1}' grade.txt
7 J.Troll

�q�有一�U�方法，�q�里字符串加双引受��?br>
$ awk 'BEGIN {print length("A FEW GOOD MEN")}'
14

4.match
match��试目标字符串是否包含查扑֭��W�的一部分。可以对查找部分使用正则表达�?�q?br>回��gؓ(f��)成功出现的字�W�排列数。如果未扑ֈ�,�q�回0,�W�一个例子在ANCD中查找d。因其不
存在,所以返�?。第二个例子在ANCD中查找D。因其存�?所以返回ANCD中D出现的首�?br>�|�字�W�数。第三个例子在学生J.Lulu中查找u�?br>
$ awk '{BEGIN {print match("ANCD", /d/)}'
0
$ awk '{BEGIN {print match("ANCD", /C/)}'
3
$ awk '$1=="J.Lulu" {print match($1, "u")} grade.txt
4

5.split
使用split�q�回字符串数�l�元素个数。工作方式如下：(x��)如果有一字符�?包含一指定分隔
�W?,例如AD2-KP9-JU2-LP-1,��之划分成一个数�l�。��用split,指定分隔�W�及(qi��ng)数组名。此
例中,命��o(h��)格式�?"AD2-KP9-JU2-LP-1",parts_array,"-"),split然后�q�回数组下标�?�q?br>里结果�ؓ(f��)4�?br>�q�有一个例子��用不同的分隔�W��?br>
$ awk '{BEGIN {print split("123#456#678", myarray, "#")}'
3

�q�个例子�?split�q�回数组myarray的下标数。数�l�myarray取值如下：(x��)

Myarray[1]="123"
Myarray[2]="456"
Myarray[3]="789"

6.sub
使用sub发现�q�替换模式的�W�一�ơ出��C��|�。字�W�串STR包含‘popedpopopill’,执行�?br>列sub命��o(h��)sub(/op/,"op",STR)。模式op�W�一�ơ出现时,�q�行替换操作,�q�回�l�果如下�Q?br>‘pOPedpopepill’�?br>假如grade.txt文�g�?学生J.Troll的记录有两个��g��?“目前�U�别�?#8221;�?#8220;最高��别分”。只
改变�W�一个�ؓ(f��)29,�W�二个仍�?4不动,操作命��o(h��)为sub(/26/,"29",$0),只替换第一个出�?br>24的位�|��?br>
$ awk '$1=="J.Troll" sub(/26/, "29", $0)' grade.txt
L.Troll 07/99 4842 Brown-3 12 29 26
L.Transley 05/99 4712 Brown-2 12 30 28

7.substr
substr是一个很有用的函数。它按照起始位置�?qi��ng)长度返回字�W�串的一部分。例子如下：(x��)

$ awk '$1=="L.Transley" {print substr($1, 1,5)}' grade.txt
L.Tan
上面例子�?指定在域1的第一个字�W�开�?�q�回其前�?个字�W��?br>如果�l�定长度��D��大于字符串长度， awk��从起始位置�q�回所有字�W�，要抽取L.Tansley的姓,只需从第3个字�W�开始返回长度�ؓ(f��)7。可以输入长�?9,awk�q�回�l�果相同�?br>
$ awk '{$1=="L.Transley" {print substr($1, 3,99)}' grade.txt
Transley

substr的另一�U��Ş式是�q�回字符串后�~�或指定位�|�后面字�W�。这里需要给出指定字�W�串�?qi��ng)其�q�回字串的�v始位�|�。例�?从文本文件中抽取姓氏,需操作�?,�q�从�W�三个字�W�开始：(x��)

$ awk '{print substr($1, 3)}' grade.txt
Troll
Transley

�q�有一个例�?在BEGIN部分定义字符�?在END部分�q�回从第t个字�W�开始抽取的子串�?br>
$ awk '{BEGIN STR="A FEW GOOD MEN"} END {print substr(STR,7)) grade.txt
GOOD MEN

8.从shell中向awk传入字符�?
awk脚本大多只有一�?其中很少是字�W�串表示�?�q�一炚w��过��变量传入awk命��o(h��)行会(x��)变得很容易。现��其基本原理讲述一些例子�?br>使用��道��字�W�串stand-by传入awk,�q�回光��度�?br>
$ echo "Stand-by" | awk '{print length($0)}'
8

讄��文�g名�ؓ(f��)一变量,��道输出到awk,�q�回不带扩展名的文�g名�?br>
$ STR="mydoc.txt"
$ echo $STR | awk '{print subst($STR, 1, 5)}'
mydoc

讄��文�g名�ؓ(f��)一变量,��道输出到awk,只返回其扩展名�?br>$ STR="mydoc.txt"
$ echo $STR | awk '{print substr($STR, 7)}'
txt

Prayer 2010-03-28 17:14 发表评论

gsub(r,s)	在整�?0中用s替代r
gsub(r,s,t)	在整个t中用s替代r
index(s,t)	�q�回s中字�W�串t的第一位置
length(s)	�q�回s长度
match(s,r)	��试s是否包含匚w��r的字�W�串
split(s,a,fs)	在fs上将s分成序列a
sprint(fmt,exp)	�q�回�l�fmt格式化后的exp
sub(r,s)	�?0中最左边最长的子串代替s
substr(s,p)	�q�回字符串s中从p开始的后缀部分
substr(s,p,n)	�q�回字符串s中从p开始长度�ؓ(f��)n的后�~�部分

国产精品嫩草影院久久,久久亚洲美女精品国产精品,国产99久久久国产精品小说

sed -i命��o(h��)详解

linux 比较两个文�g夹不�?(diff命��o(h��), md5列表)

如果知道行号可以用下面的�Ҏ(gu��)��

如果不知道行��P��可以用正則匹�?/h3>sed -i '/regex/ r b.txt' a.txt # regex是正则表辑ּ� awk '/target/{system("cat b.file")}' a.file > c.file

sed的話如果不改变源文�g�Q�可以去�?i开养I��修改�?x��)输出到STDOUT

Linux Sftp 下蝲整个文�g目录

shell数组详解

sed的一���强例子集锦的翻�?�?

sed学习(f��n)�W�记�?-高��命��o(h��)

使用shell提供的命令行�~�辑功能, 选择set -o vi �q�是 set -o emacs

awk的next使用

AWK高��~�程

awk中��用的shell命��o(h��)

shell的效率不如perl或Python?

sort -T

sort 指定排序域的两种�Ҏ(gu��)��

《sort帮你排序�?linux命��o(h��)五分钟系列之二十�?-o选项

shell中trap捕捉��C����L(f��ng)��处理

如果不知道行��P��可以用正則匹�?/h3>
`sed -i '/regex/ r b.txt' a.txt # regex是正则表辑ּ� awk '/target/{system("cat b.file")}' a.file > c.file`

sed的一��强例子集锦的翻�?�?

shell中trap捕捉��C��L(f��ng)��处理