• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            教程精選:正則表達式快速入門(三)

            作者:開心石頭

              在上文里,我們介紹了正則表達式的子模式,逆向引用和量詞,在這篇文章里,我們將重點介紹正則表達式中的斷言(Assertions)。

              斷言(Assertions)

              斷言(Assertions)是在目標(biāo)字符串的當(dāng)前匹配位置進行的一種測試但這種測試并不占用目標(biāo)字符串,也即不會移動模式在目標(biāo)字符串中的當(dāng)前匹配位置。

              讀起來似乎有點拗口,我們還是舉幾個簡單的例子。

              兩個最常見的斷言是元字符“^”和“$”,它們檢查匹配模式是否出現(xiàn)在行首或行尾。

              我們來看這個模式/^\d\d\d$/,試著用它來匹配目標(biāo)字符串“123”。“\d\d\d”表示三個數(shù)字字符,匹配了目標(biāo)字符串的三個字符,而模式中的^和$分別表示這三個字符同時出現(xiàn)在行首和行尾,而它們本身并不與目標(biāo)字符串中的任何字符相對應(yīng)。

              其它還有一些簡單的斷言\b, \B, \A, \Z, \z,它們都以反斜線開頭,前面我們已經(jīng)介紹過反斜線的這個用法。這幾個斷言的含義如下表。

            斷言
            含義
            \b
            字分界線
            \B
            非字分界線
            \A
            目標(biāo)的開頭(獨立于多行模式)
            \Z
            目標(biāo)的結(jié)尾或位于結(jié)尾的換行符前(獨立于多行模式)
            \z
            目標(biāo)的結(jié)尾(獨立于多行模式)
            \G
            目標(biāo)中的第一個匹配位置

              注意這些斷言不能出現(xiàn)在字符類中,如果出現(xiàn)了也是其它的含義,例如\b在字符類中表示反斜線字符0x08。

              前面介紹的這些斷言的測試都是一些基于當(dāng)前位置的測試,斷言還支持更多復(fù)雜的測試條件。更復(fù)雜的斷言以子模式方式來表示,它包括前向斷言(Lookahead assertions)和后向斷言(Lookbehind assertions)。

              前向斷言(Lookahead assertions)

              前向斷言從目標(biāo)字符串的當(dāng)前位置向前測試斷言條件是否成立。前向斷言又可分為前向肯定斷言和前向否定斷言,分別用(?=和{?!表示。例如模式/ \w+(?=;)/用來表示一串文本字符后面會有一個分號,但是這個分號并不包括在匹配結(jié)果中。一件有趣的事看起來差不多的模式/ (?=;)\w+/并不是表示一串前面不是分號的alpha字符串,事實上,不論這串a(chǎn)lpha字符的前面是否是一個分號它總是匹配的,要完成這個功能需要我們下面提到的后向斷言(Lookbehind assertions)。

              后向斷言(Lookbehind assertions)

              后向斷言分別用(?<=和(?<!表示肯定的后向斷言與否定后向斷言。例如,/ (?<!foo)bar/將尋找一個前面不是foo的bar字符串。一般而言,后向斷言使用的子模式需要有確定的長度值,否則會產(chǎn)生一個編譯錯誤。

              使用后向斷言與一次性子模式搭配使用可以有效的文本的結(jié)束部分進行匹配,這里來看一下例子。

              考慮一下如果用/abcd$/這樣一個簡單的模式來匹配一長段以abcd結(jié)尾的文本,因為模式的匹配過程是從左向右進行的,正則表達式引擎將在文本中尋找每一個a字符并嘗試匹配剩余的模式,如果在這長段文本里僅好有不少的a字符,這樣做明顯是非常低效的,而如果把以上模式換成為樣/^.*abcd$/,這時前面的“^.*”部分將匹配整個文本,然后它發(fā)現(xiàn)下一個模式a無法匹配,這時會發(fā)生前面提到過的回溯過程,解析器會逐次縮短“^.*”匹配的字符長度從右向左逐次查找剩余的子模式,也要產(chǎn)生多次的嘗試過程。現(xiàn)在,我們用一次性子模式與后向斷言重寫所用的模式,改為/^(?>.*)(?<=abcd)/,這時,一次性子模式一次匹配了整段文本,然后用后向斷言檢查前面四個字符是否為abcd,只需要一次檢測就可以立刻確定整個模式是否匹配。在遇到需要匹配一個很長的文本時,這種方法可以非常顯著的提高處理效率。

              一個模式中可以包含多個相繼的斷言,斷言也可以嵌套。另外,斷言使用的子模式也是非捕獲的,不能被逆向引用。

              斷言的一個重要應(yīng)用領(lǐng)域就是做為條件子模式的條件。那什么是條件子模式呢?

              條件子模式(Conditional subpatterns)

              正則表達式允許在模式中根據(jù)不同的條件使用不同的匹配子模式。也就是條件子模式(Conditional subpatterns)。它的格式如下:(?(condition)yes-pattern)或者 (?(condition)yes-pattern|no-pattern)。如果條件滿足,采用yes-pattern,否則,采用no-pattern(如果在模式中提供了話)。

              條件子模式中的條件有兩種,一種是斷言結(jié)果,另一種是看是否捕獲一個前面提供的子模式。

              如果在表示條件的圓括號里的內(nèi)容是一個數(shù)字,它表示當(dāng)此數(shù)字代表的子模式被成功匹配時條件為真。看看下面這個例子,/( \( )? [^()]+ (?(1) \) )/x,(注意“x”模式修正符表示忽略字符類外的空白字符和#符號之后的內(nèi)容)。

              這個模式的第一部分“( \( )?”匹配了一個可選的左圖括號“(”,第二部分“[^()]+”匹配了一個以上的非圓括號字符,最后一部分“(?(1) \) )”是個條件子模式,表示如果捕獲到\1也即那個可選的左圓括號,第三部分應(yīng)該會出現(xiàn)一個右圓括號“)”。

              如果在表示條件的圓括號內(nèi)是一個“R”字符,表示在這個模式或子模式被遞歸調(diào)用時條件為真,在遞歸調(diào)用的頂層,這個條件為假。關(guān)于正則表達式中的遞歸,我們會在后面的部分專題介紹。

              如果條件不是一個數(shù)字或R字符,則它必需是一個斷言。斷言可以是肯定或否定的前身或后向斷言。讓我們看下面這個例子。

              /(?(?=[^a-z]*[a-z])

              \d{2}-[a-z]{3}-\d{2} | \d{2}-\d{2}-\d{2} )/x

              為了讓這個正則表達式更容易閱讀,我們特意采用了x模式修正符,這樣我們可以在用模式中加入空格對符式進行格式上的分隔并分行表示而不影響模式的解析。

              第一行的條件子模式使用了一個肯定的前向斷言,表示一串可選的非小寫字母后面跟隨著一個小寫字母。換句話說,它查看目標(biāo)字符串是否至少包含一個小寫字母,如果是,它用“|”前的模式對目標(biāo)進行匹配,看目標(biāo)是否為看目標(biāo)是否為兩個數(shù)字-三個小寫字母-兩個數(shù)字這種格式,否則,用“|”來匹配目標(biāo),看目標(biāo)字符串是否為由“-”分隔的三段二位十進制數(shù)字。

              正則表達式中的注釋

              為了讓正則表達式更容易閱讀,可以在其中加入注釋語句。通常注釋由左圓括號和井號——“(#“開始,當(dāng)遇到下一個右圓括號”)“結(jié)束。注釋是禁止嵌套的。

              如果設(shè)定了“x”模式修正符,任何字符類之外(也即[]之外)的井號(#)和下一個新行標(biāo)記之間的部分也被作為注釋看待。

              未完待續(xù)

            posted on 2007-04-22 17:17 PeakGao 閱讀(340) 評論(0)  編輯 收藏 引用 所屬分類: php

            <2025年8月>
            272829303112
            3456789
            10111213141516
            17181920212223
            24252627282930
            31123456

            導(dǎo)航

            統(tǒng)計

            常用鏈接

            留言簿(9)

            隨筆分類(67)

            隨筆檔案(65)

            搜索

            最新評論

            閱讀排行榜

            評論排行榜

            久久久精品国产sm调教网站 | 伊人色综合久久天天人手人婷| 久久久久18| 综合网日日天干夜夜久久| 久久精品国产清高在天天线| 久久国产精品国语对白| 日产精品久久久一区二区| 国产午夜福利精品久久| 亚洲精品无码久久久久| 久久综合成人网| 久久久久久综合一区中文字幕| 伊人久久大香线蕉综合热线| 久久91精品国产91久久户| 久久WWW免费人成一看片| 国产女人aaa级久久久级| 久久成人国产精品| 欧美黑人激情性久久| 精品熟女少妇aⅴ免费久久| 国产一区二区精品久久| 久久亚洲中文字幕精品有坂深雪| 国产成人久久精品麻豆一区| 九九久久自然熟的香蕉图片| 无码国内精品久久综合88| 狠狠人妻久久久久久综合蜜桃| 成人妇女免费播放久久久| 亚洲精品无码久久久久去q| 精品久久久无码21p发布| 久久久SS麻豆欧美国产日韩| 久久综合视频网| 亚洲中文久久精品无码ww16| 超级97碰碰碰碰久久久久最新| 欧美性猛交xxxx免费看久久久| 久久久精品无码专区不卡| 欧美日韩精品久久久免费观看| 国产成人精品久久综合| 国产伊人久久| 韩国三级中文字幕hd久久精品| 久久天天躁狠狠躁夜夜2020 | 性高湖久久久久久久久AAAAA| 久久97久久97精品免视看| 三级韩国一区久久二区综合 |