在日常生活中,經(jīng)常有大量的文本需要處理,正則表達(dá)式正是基于此提出的。本文將結(jié)合一些具體的實(shí)例來解釋它。雖然在不同的語言環(huán)境中,正則表達(dá)式有不同的語法規(guī)則,但其基本語義卻是一致的。http://en.wikipedia.org/wiki/Regular_expression。這將是一個(gè)系列教程。本節(jié)只是一個(gè)開胃菜:)
某一次同學(xué)很無聊,然后問我電腦上有無小說。這是顯然的,我是網(wǎng)絡(luò)小說迷嘛!從起點(diǎn)down下無數(shù)小說存在電腦上,名字都懶得改,都是以數(shù)字打頭,然后以“.txt”結(jié)尾,比如23432.txt之類的。當(dāng)然,文件查找還是得用Everything,要不然電腦上的上百萬個(gè)文件,手會(huì)抽筋的。
(注:我以為Everything是史上最快的文件查找工具,強(qiáng)烈推薦!)
先用"*.txt"嘗試一下,:(,給出一大堆文本文件呀。范圍太廣。還是得用正則表達(dá)式來。
^[0-9]*\.txt
Yes!給出了我電腦上存儲(chǔ)的所有小說了。
解釋一下:
^[0-9]表示文件名以0-9之間的數(shù)字開頭,^是開頭的意思($結(jié)尾)
*表示它前面的字符(這里是數(shù)字)要重復(fù)若干次(>=0)
\.匹配139869.txt中的那個(gè)小數(shù)點(diǎn)。因?yàn)檎齽t表達(dá)式中,‘.’被占用了,表示任意字符,所以要轉(zhuǎn)義一下
txt,這就不說了,緊接著小數(shù)點(diǎn)的是‘txt’三個(gè)字符。
Everything只支持部分正則表達(dá)式, | () ? * + . [] [^] ^ $ {m,n} 不過已經(jīng)完全夠用了。
http://xbeta.info/everything/faq.htm#How_do_I_use_regex
考慮這樣一個(gè)問題:項(xiàng)目組在驗(yàn)收的時(shí)候,被指出代碼的注釋量不夠,需要達(dá)到至少30%才行,也就是至少需要添加6500行注釋。此時(shí)老師提出,要將所有的函數(shù)加上注釋,函數(shù)的名稱、功能、參數(shù)、返回值。這個(gè)時(shí)候,考慮能不能用正則表達(dá)式,提取源代碼中的函數(shù)信息,然后自動(dòng)生成注釋模板?比如:
int foo(int x, int y);
替換為:
/**
* @method foo
* @para x
* @para y
* @return
*/
int foo(int x, int y);
注意到,這個(gè)函數(shù)參數(shù)的個(gè)數(shù)和類型可以是變動(dòng)的,返回值限定符的個(gè)數(shù)和類型也是變動(dòng)的,比如static類型函數(shù),有兩個(gè)限定符,而構(gòu)造函數(shù),則沒有限定符,還有部分virtual類型函數(shù)。
posted on 2009-03-11 20:01
ronliu 閱讀(649)
評(píng)論(1) 編輯 收藏 引用