正則表達式是查找和替換文本模式的一種簡潔而靈活的表示法。Visual Studio“查找和替換”窗口的“查找內容”字段中可使用一組特定的正則表達式。
在“快速查找”、“在文件中查找”、“快速替換”或“在文件中替換”操作中,要在“查找內容”字段中使用正則表達式,請選擇“查找選項”下的“使用”選項然后選擇“正則表達式”。
“查找內容”字段旁的三角形“表達式生成器”按鈕將可用。單擊此按鈕顯示最常用正則表達式的列表。當從“表達式生成器”中選擇任何項時,該項將插入到“查找內容”字符串中。
注意 |
“查找內容”字符串中可使用的正則表達式與 .NET Framework 編程中的有效正則表達式有語法上的區別。例如,在“查找和替換”中,大括號表示法 {} 用于帶標記的表達式。因此,表達式 zo{1} 匹配所有 zo 后跟有標記 1 的搜索項,例如 Alonzo1 和 Gonzo1。但在 .NET Framework 中,{} 表示法用做限定符。因此表達式 zo{1} 匹配所有 z 后僅跟有一個 o 的搜索項,例如 zone,而 zoo 則不匹配。 |
以下是“表達式生成器”中可用的正則表達式。
表達式 |
語法 |
說明 |
任一字符 |
. |
匹配除分行符外的任何一個字符。 |
零個或更多個 |
* |
匹配前面表達式的零個或多個搜索項,尋找所有可能匹配。 |
一個或更多個 |
+ |
匹配前面表達式的至少一個搜索項。 |
行首 |
^ |
將匹配字符串錨定到行首。 |
行尾 |
$ |
將匹配字符串錨定到行尾。 |
詞首 |
< |
僅當詞在文本中的此位置開始時才匹配。 |
詞尾 |
> |
僅當詞在文本中的此位置結束時才匹配。 |
換行符 |
\n |
匹配與平臺無關的換行符。在“替換”表達式中,插入換行符。 |
集中的任何一個字符 |
[] |
匹配 [] 內的任何一個字符。要指定字符的范圍,請列出由短劃線 (-) 分隔的起始字符和結束字符,如 [a-z] 中所示。 |
集中沒有的任何一個字符 |
[^...] |
匹配跟在 ^ 之后的不在字符集中的任何字符。 |
或 |
| |
匹配 OR 符號 (|) 之前或之后的表達式。最常用在分組中。例如,(sponge|mud) bath 匹配“sponge bath”和“mud bath”。 |
轉義符 |
\ |
按原義匹配反斜杠 (\) 之后的字符。這使您可以查找在正則表達式表示法中使用的字符,如 { 和 ^。例如,\^ 搜索 ^ 字符。 |
帶標記的表達式 |
{} |
匹配以帶括號的表達式標記的文本。 |
C/C++ 標識符 |
:i |
匹配表達式
([a-zA-Z_$][a-zA-Z0-9_$]*)。 |
帶引號的字符串 |
:q |
匹配表達式 (("[^"]*")|('[^']*'))。 |
空格或制表符 |
:b |
匹配空格或制表符。 |
整數 |
:z |
匹配表達式
([0-9]+)。 |
“查找”和“替換”操作中所有有效正則表達式的列表,比“表達式生成器”中可顯示的列表長。您還可將以下任意正則表達式插入到“查找內容”字符串中:
表達式 |
語法 |
說明 |
最少 — 零個或更多個 |
@ |
匹配前面表達式的 0 個或更多搜索項,匹配盡可能少的字符。 |
最少 — 一個或更多個 |
# |
匹配前面表達式的一個或更多搜索項,匹配盡可能少的字符。 |
重復 n 次 |
^n |
匹配前面表達式的 n 次出現。例如,[0-9]^4 匹配任意 4 位數字的序列。 |
分組 |
() |
用于將一組表達式組合在一起。如果要在一次搜索中搜索兩個不同的表達式,可以使用分組表達式組合這兩個表達式。
例如,如果要搜索 - [a-z][1-3] 或 - [1-10][a-z],應按如下方式組合這兩個表達式:([a-z][1-3]) | ([1-10][a-z])。 |
第 n 個帶標記的文本 |
\n |
在“查找”或“替換”表達式中,指示第 n 個帶標記的表達式所匹配的文本,其中 n 是從 1 至 9 的數字。
在“替換”表達式中,\0 插入整個匹配的文本。 |
右對齊字段 |
\(w,n) |
在“替換”表達式中,將字段中第 n 個帶標記的表達式右對齊至少 w 字符寬。 |
左對齊字段 |
\(-w,n) |
在“替換”表達式中,將字段中第 n 個帶標記的表達式左對齊至少 w 字符寬。 |
禁止匹配 |
~(X) |
當 X 出現在表達式中的此位置時禁止匹配。例如,real~(ity) 匹配“realty”和“really”中的“real”,而不匹配“reality”中的“real”。 |
字母數字字符 |
:a |
匹配表達式
([a-zA-Z0-9])。 |
字母字符 |
:c |
匹配表達式
([a-zA-Z])。 |
十進制數字 |
:d |
匹配表達式
([0-9])。 |
十六進制數 |
:h |
匹配表達式
([0-9a-fA-F]+)。 |
有理數 |
:n |
匹配表達式 (([0-9]+.[0-9]*)|([0-9]*.[0-9]+)|([0-9]+))。 |
字母字符串 |
:w |
匹配表達式
([a-zA-Z]+)。 |
轉義符 |
\e |
Unicode U+001B。 |
Bell |
\g |
Unicode U+0007。 |
Backspace |
\h |
Unicode U+0008。 |
制表符 |
\t |
匹配制表符,Unicode U+0009。 |
Unicode 字符 |
\x#### 或 \u#### |
匹配 Unicode 值給定的字符,其中 #### 是十六進制數。可以用 ISO 10646 代碼點或兩個提供代理項對的值的 Unicode 碼位指定基本多語種平面(即一個代理項)外的字符。 |
下表列出按標準 Unicode 字符屬性進行匹配的語法。兩個字母的縮寫詞與 Unicode 字符屬性數據庫中所列的一樣。可將這些指定為字符集的一部分。例如,表達式 [:Nd:Nl:No] 匹配任何種類的數字。
表達式 |
語法 |
說明 |
大寫字母 |
:Lu |
匹配任何一個大寫字母。例如,:Luhe 匹配“The”但不匹配“the”。 |
小寫字母 |
:Ll |
匹配任何一個小寫字母。例如,:Llhe 匹配“the”但不匹配“The”。 |
詞首大寫字母 |
:Lt |
匹配將大寫字母和小寫字母結合的字符,例如,Nj 和 Dz。 |
修飾符字母 |
:Lm |
匹配字母或標點符號,例如逗號、交叉重音符和雙撇號,用于表示對前一字母的修飾。 |
其它字母 |
:Lo |
匹配其他字母,如哥特體字母 ahsa。 |
十進制數字 |
:Nd |
匹配十進制數(如 0-9)和它們的雙字節等效數。 |
字母數字 |
:Nl |
匹配字母數字,例如羅馬數字和表意數字零。 |
其它數字 |
:No |
匹配其他數字,如舊斜體數字一。 |
開始標點符號 |
:Ps |
匹配開始標點符號,例如左方括號和左大括號。 |
結束標點符號 |
:Pe |
匹配結束標點符號,例如右方括號和右大括號。 |
左引號 |
:Pi |
匹配左雙引號。 |
右引號 |
:Pf |
匹配單引號和右雙引號。 |
破折號 |
:Pd |
匹配破折號標記。 |
連接符號 |
:Pc |
匹配下劃線標記。 |
其他標點符號 |
:Po |
匹配 (,)、?、"、!、@、#、%、&、*、\、(:)、(;)、' 和 /。 |
空白分隔符 |
:Zs |
匹配空白。 |
行分隔符 |
:Zl |
匹配 Unicode 字符 U+2028。 |
段落分隔符 |
:Zp |
匹配 Unicode 字符 U+2029。 |
無間隔標記 |
:Mn |
匹配無間隔標記。 |
組合標記 |
:Mc |
匹配組合標記。 |
封閉標記 |
:Me |
匹配封閉標記。 |
數學符號 |
:Sm |
匹配 +、=、~、|、< 和 >。 |
貨幣符號 |
:Sc |
匹配 $ 和其他貨幣符號。 |
修飾符號 |
:Sk |
匹配修飾符號,如抑揚音、抑音符號和長音符號。 |
其它符號 |
:So |
匹配其他符號,如版權符號、段落標記和度數符號。 |
其他控制 |
:Cc |
匹配類似 TAB 和 NEWLINE 這樣的 Unicode 控制字符。 |
其他格式 |
:Cf |
格式控制字符,例如雙向控制字符。 |
代理項 |
:Cs |
匹配代理項對的一半。 |
其他私用 |
:Co |
匹配私用區域的任何字符。 |
其它未分配字符 |
:Cn |
匹配未映射到 Unicode 字符的字符。 |
除標準 Unicode 字符屬性外,還可以指定下列附加屬性作為字符集的一部分。
表達式 |
語法 |
說明 |
Alpha |
:Al |
匹配任何一個字符。例如,:Alhe 匹配“The”、“then”、“reached”等單詞。 |
Numeric |
:Nu |
匹配任何一個數或數字。 |
標點 |
:Pu |
匹配任何一個標點符號,如 ?、@、' 等等。 |
空白 |
:Wh |
匹配所有類型的空格,包括印刷和表意文字的空格。 |
Bidi |
:Bi |
匹配諸如阿拉伯文和希伯來文這類從右向左書寫的字符。 |
朝鮮文 |
:Ha |
匹配朝鮮文和組合朝鮮文字母。 |
平假名 |
:Hi |
匹配平假名字符。 |
片假名 |
:Ka |
匹配片假名字符。 |
表意文字/漢字/日文漢字 |
:Id |
匹配表意文字字符,如漢字和日文漢字 |