• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            逛奔的蝸牛

            我不聰明,但我會很努力

               ::  :: 新隨筆 ::  ::  :: 管理 ::

            import java.util.regex.Matcher;

            import java.util.regex.Pattern;


            public class Test {

            public static void main(String[] args) {

            String str = "<biao><>c<b>";

            Pattern pattern;

            Matcher matcher;

            // 貪婪: 最長匹配 .* : 輸出: <biao><>c<b>

            pattern = Pattern.compile("<.*>");

            matcher = pattern.matcher(str);

            while (matcher.find()) {

            System.out.println(matcher.group());

            }

            // 不知是否非貪婪 .*? : 輸出: <biao>, <>, <b>

            pattern = Pattern.compile("<.*?>");

            matcher = pattern.matcher(str);

            while (matcher.find()) {

            System.out.println(matcher.group());

            }

            // 使用組, 輸出<>里的內容, 輸出: 'biao', ' ', 'b'

            // 0組代表整個表達式, 子組從1開始

            pattern = Pattern.compile("<(.*?)>");

            matcher = pattern.matcher(str);

            while (matcher.find()) {

            System.out.println(matcher.group(1));

            }

            }

            }

            貪婪、勉強和侵占量詞間的不同
              在貪婪、勉強和侵占三個量詞間有著細微的不同。

              貪婪(*, ?, +):讀入整個串,從后往前匹配

              勉強(*?, ??, +?):從前往后匹配

              侵占(*+, ?+, ++):讀入整個串,從前往后匹配,匹配的是整個串
              貪婪量詞之所以稱之為“貪婪的”,這是由于它們強迫匹配器讀入(或者稱之為吃掉)整個輸入的字符串,來優先嘗試第一次匹配,如果第一次嘗試匹配(對于整個輸入的字符串)失敗,匹配器會通過回退整個字符串的一個字符再一次進行嘗試,不斷地進行處理直到找到一個匹配,或者左邊沒有更多的字符來用于回退了。賴于在表達式中使用的量詞,最終它將嘗試地靠著 1 或 0 個字符的匹配。
              但是,勉強量詞采用相反的途徑:從輸入字符串的開始處開始,因此每次勉強地吞噬一個字符來尋找匹配,最終它們會嘗試整個輸入的字符串。
              最后,侵占量詞始終是吞掉整個輸入的字符串,嘗試著一次(僅有一次)匹配。不像貪婪量詞那樣,侵占量詞絕不會回退,即使這樣做是允許全部的匹配成功。
              為了說明一下,看看輸入的字符串是 xfooxxxxxxfoo 時。

            Enter your regex: .*foo  // 貪婪量詞
            Enter input string to search: xfooxxxxxxfoo
            I found the text "xfooxxxxxxfoo" starting at index 0 and ending at index 13.
            
            Enter your regex: .*?foo  // 勉強量詞
            Enter input string to search: xfooxxxxxxfoo
            I found the text "xfoo" starting at index 0 and ending at index 4.
            I found the text "xxxxxxfoo" starting at index 4 and ending at index 13.
            
            Enter your regex: .*+foo // 侵占量詞
            Enter input string to search: xfooxxxxxxfoo
            No match found.
              第一個例子使用貪婪量詞.*,尋找緊跟著字母“f”“o”“o”的“任何東西”零次或者多次。由于量詞是貪婪的,表達式的.*部分第一次“吃掉”整個輸入的字符串。在這一點,全部表達式不能成功地進行匹配,這是由于最后三個字母(“f”“o”“o”)已經被消耗掉了。那么匹配器會慢慢地每次回退一個字母,直到返還的“foo”在最右邊出現,這時匹配成功并且搜索終止。
              然而,第二個例子采用勉強量詞,因此通過首次消耗“什么也沒有”作為開始。由于“foo”并沒有出現在字符串的開始,它被強迫吞掉第一個字母(“x”),在 0 和 4 處觸發了第一個匹配。測試用具會繼續處理,直到輸入的字符串耗盡為止。在 4 和 13 找到了另外一個匹配。
              第三個例子的量詞是侵占,所以在尋找匹配時失敗了。在這種情況下,整個輸入的字符串被.*+消耗了,什么都沒有剩下來滿足表達式末尾的“foo”。
              你可以在想抓取所有的東西,且決不回退的情況下使用侵占量詞,在這種匹配不是立即被發現的情況下,它將會優于等價的貪婪量詞。

            posted on 2010-02-05 20:19 逛奔的蝸牛 閱讀(4572) 評論(1)  編輯 收藏 引用 所屬分類: Java

            評論

            # re: Java:正則匹配的不同情況(貪婪,勉強): greedy, reluctant, possesive 2011-08-03 10:33 張葦
            寫的很生動  回復  更多評論
              

            亚洲AV乱码久久精品蜜桃| 久久激情亚洲精品无码?V| 热久久最新网站获取| 精品国产乱码久久久久软件| 99久久99久久精品国产片果冻| 久久超乳爆乳中文字幕| 久久国产精品波多野结衣AV| 波多野结衣久久一区二区| 国产欧美久久一区二区| 综合久久给合久久狠狠狠97色| 国产V亚洲V天堂无码久久久| 久久久WWW成人免费毛片| 久久精品国产99国产精品导航| 精品久久香蕉国产线看观看亚洲 | 国内精品久久久久久久coent| 色婷婷噜噜久久国产精品12p | 久久综合久久综合久久| 日本精品一区二区久久久 | 久久夜色精品国产亚洲| 久久综合鬼色88久久精品综合自在自线噜噜 | 精品久久一区二区| 亚洲成色WWW久久网站| 久久久久久一区国产精品| avtt天堂网久久精品| 亚洲AV乱码久久精品蜜桃| 久久一区二区三区免费| 国产午夜电影久久| 99精品久久久久中文字幕| 亚洲va国产va天堂va久久| 四虎国产精品成人免费久久| 久久九色综合九色99伊人| 99久久亚洲综合精品网站| 人妻丰满AV无码久久不卡| 色8久久人人97超碰香蕉987| 久久久噜噜噜久久中文字幕色伊伊| 久久久91人妻无码精品蜜桃HD| 久久综合久久综合久久综合| 久久国产亚洲精品麻豆| 久久精品免费观看| 99久久精品国产一区二区蜜芽 | 久久久久99精品成人片三人毛片|