在我們平時寫代碼過程中,有時候想知道我們完成的程序到底有多少行代碼(據說很多面試的童鞋會被面試官問到這個問題)。在這里,我分享一下我自己統計代碼的方法。 我們這里以統計“.h”和“.cpp”為后綴的源碼文件為例,但是同樣可以用于統計“.hpp”、“.cc”、“.c”、“.py”、“.java”、“.html”等所有后綴名文件。
首先看一下目錄結構
要統計代碼行數,我們需要用到wc命令。“wc -l filename”可以用來統計filename的行數。比如

要統計所有的“.h”和".cpp"的文件行數,還需要使用find命令。
方法一:
分別統計“.h”和“.cpp”的行數,再把它們加起來。
- wc -l `find . -name '*.h'`; wc -l `find . -name '*.cpp'`
結果如下:
雖然得到了結果,但是“.h”、“.cpp”代碼行數是分別統計的。
方法二:
使用-or命令連接多個表達式。
- wc -l `find . -name '*.h' -or -name '*.cpp'`
結果如下:
方法三:
使用正則表達式。
- wc -l `find ./ -name "*.[hc]*" `
結果如下:

附常用正則表達式意義:
- \ 將下一個字符標記為一個特殊字符、或一個原義字符、或一個后向引用、或一個八進制轉義符。
- ^ 匹配輸入字符串的開始位置。如果設置了 RegExp 對象的Multiline 屬性,^ 也匹配 ’\n’ 或 ’\r’ 之后的位置。
- $ 匹配輸入字符串的結束位置。如果設置了 RegExp 對象的Multiline 屬性,$ 也匹配 ’\n’ 或 ’\r’ 之前的位置。
- * 匹配前面的子表達式零次或多次。
- + 匹配前面的子表達式一次或多次。+ 等價于 {1,}。
- ? 匹配前面的子表達式零次或一次。? 等價于 {0,1}。
- {n} n 是一個非負整數,匹配確定的n 次。
- {n,} n 是一個非負整數,至少匹配n 次。
- {n,m} m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。在逗號和兩個數之間不能有空格。
- ? 當該字符緊跟在任何一個其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面時,匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜索的字符串,而默認的貪婪模式則盡可能多的匹配所搜索的字符串。
- . 匹配除 “\n” 之外的任何單個字符。要匹配包括 ’\n’ 在內的任何字符,請使用象 ’[.\n]’ 的模式。
- (pattern) 匹配pattern 并獲取這一匹配。
- (?:pattern) 匹配pattern 但不獲取匹配結果,也就是說這是一個非獲取匹配,不進行存儲供以后使用。
- (?=pattern) 正向預查,在任何匹配 pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以后使用。
- (?!pattern) 負向預查,與(?=pattern)作用相反
- x|y 匹配 x 或 y。
- [xyz] 字符集合。
- [^xyz] 負值字符集合。
- [a-z] 字符范圍,匹配指定范圍內的任意字符。
- [^a-z] 負值字符范圍,匹配任何不在指定范圍內的任意字符。
- \b 匹配一個單詞邊界,也就是指單詞和空格間的位置。
- \B 匹配非單詞邊界。
- \cx 匹配由x指明的控制字符。
- \d 匹配一個數字字符。等價于 [0-9]。
- \D 匹配一個非數字字符。等價于 [^0-9]。
- \f 匹配一個換頁符。等價于 \x0c 和 \cL。
- \n 匹配一個換行符。等價于 \x0a 和 \cJ。
- \r 匹配一個回車符。等價于 \x0d 和 \cM。
- \s 匹配任何空白字符,包括空格、制表符、換頁符等等。等價于[ \f\n\r\t\v]。
- \S 匹配任何非空白字符。等價于 [^ \f\n\r\t\v]。
- \t 匹配一個制表符。等價于 \x09 和 \cI。
- \v 匹配一個垂直制表符。等價于 \x0b 和 \cK。
- \w 匹配包括下劃線的任何單詞字符。等價于’[A-Za-z0-9_]’。
- \W 匹配任何非單詞字符。等價于 ’[^A-Za-z0-9_]’。
- \xn 匹配 n,其中 n 為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長。
- \num 匹配 num,其中num是一個正整數。對所獲取的匹配的引用。
- \n 標識一個八進制轉義值或一個后向引用。如果 \n 之前至少 n 個獲取的子表達式,則 n 為后向引用。否則,如果 n 為八進制數字 (0-7),則 n 為一個八進制轉義值。
- \nm 標識一個八進制轉義值或一個后向引用。如果 \nm 之前至少有is preceded by at least nm 個獲取得子表達式,則 nm 為后向引用。如果 \nm 之前至少有 n 個獲取,則 n 為一個后跟文字 m 的后向引用。如果前面的條件都不滿足,若 n 和 m 均為八進制數字 (0-7),則 \nm 將匹配八進制轉義值 nm。
- \nml 如果 n 為八進制數字 (0-3),且 m 和 l 均為八進制數字 (0-7),則匹配八進制轉義值 nml。
- \un 匹配 n,其中 n 是一個用四個十六進制數字表示的Unicode字符。