• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            發(fā)布一個正則表達(dá)式測試工具

            最近寫一個小的搜索引擎,涉及到Html內(nèi)容的提取,所以開發(fā)了這個基于pcre的正則表達(dá)式測試工具,基本兼容Perl和PHP,除了沒有實現(xiàn)模式,如perl支持/your regex/i  模式,這個工具必須寫成2個表達(dá)式,一個是"your regex",另一個是"i",工具用VC8開發(fā),依賴庫自己找。

            下載地址:
            http://www.shnenglu.com/Files/PeakGao/xregex.rar

            被匹配的文本文件支持鼠標(biāo)拖曳

            正則表達(dá)式文本框說明:
            本文本框支持n個正則表達(dá)式描述,你可以只啟用選擇的某一個正則表達(dá)式(依賴上方的復(fù)選框),也支持批處理每個正則表達(dá)式(只因我是為了測試清除HTML的垃圾內(nèi)容而開發(fā)的,所以提供了這個功能);

            幾個按鈕的功能解釋一下:

            加載默認(rèn)表達(dá)式:就是將input_regex.txt文件內(nèi)容讀入到正則表達(dá)式文本框;
            加載默認(rèn)內(nèi)容:就是將input.txt文件讀入內(nèi)容文本框;
            執(zhí)行匹配:就是一項一項的進(jìn)行匹配,就像記事本的查找功能一樣;
            替換選擇文本:不用介紹了吧;
            單正則全部替換:表示使用正則表達(dá)式中的某個正則表達(dá)式(如果存在多行),和替換文本來對內(nèi)容文本框中的內(nèi)容進(jìn)行全部替換;
            多正則全部替換:表示使用正則表達(dá)式中的所有表達(dá)式和替換文本中的所有文本串(與表達(dá)式對應(yīng),有10個表達(dá)式,就寫10個替換文本)對內(nèi)容文本框中的文本進(jìn)行依序替換。

            如果有錯誤發(fā)生不要找我,我只是臨時開發(fā)了給自己測試用的,望見諒。

            演示:
            如果你正確下載了,程序能運行起來的話,點“多正則全部替換”看看效果。

            btw:
            我用正在表達(dá)式清除Html無用信息發(fā)現(xiàn)速度慢的不行,自己寫了個Html的專用解析器,發(fā)現(xiàn)速度比他快上上百倍,真是無話可說。。。

            posted on 2007-06-01 13:22 PeakGao 閱讀(3082) 評論(8)  編輯 收藏 引用 所屬分類: C++技術(shù)

            評論

            # re: 發(fā)布一個正則表達(dá)式測試工具 2007-06-04 00:44 shiningstar

            你好,我試用了一下您開發(fā)的正則表達(dá)式匹配工具,感覺不錯,正好我現(xiàn)在也正在編寫一個支持正則表達(dá)式查找替換的編輯工具,能否提供一下源碼讓我參考一下。多謝。  回復(fù)  更多評論   

            # re: 發(fā)布一個正則表達(dá)式測試工具 2007-06-04 09:08 PeakGao

            @shiningstar
            你好,已經(jīng)上傳,下載地址:
            http://www.shnenglu.com/Files/PeakGao/xregex_source.rar  回復(fù)  更多評論   

            # re: 發(fā)布一個正則表達(dá)式測試工具 2007-06-04 14:07 picasa

            下載看看  回復(fù)  更多評論   

            # re: 發(fā)布一個正則表達(dá)式測試工具 2007-09-22 15:35 jojo

            你好,能請教下怎么build pcre嗎
            可以的話發(fā)到我郵箱 xuhui122000@yahoo.com.cn  回復(fù)  更多評論   

            # re: 發(fā)布一個正則表達(dá)式測試工具 2007-10-28 22:16 Minidx全文檢索

            這個……還是寫一個專用的HTML內(nèi)容提取程序/模塊比較好吧。  回復(fù)  更多評論   

            # re: 發(fā)布一個正則表達(dá)式測試工具 2007-10-28 22:17 Minidx全文檢索

            “小的搜索引擎”呢?能不能放出來show一下?  回復(fù)  更多評論   

            # re: 發(fā)布一個正則表達(dá)式測試工具 2007-11-10 13:28 PeakGao

            @Minidx全文檢索
            我最后是自己解析的html,這里提供一組測試數(shù)據(jù)供參考:

            三個URL提取器的性能比較,均連續(xù)進(jìn)行3次,
            測試新華網(wǎng)主頁的url提取: parse www.xinhuanet.com

            提取器名稱 url數(shù)目 耗時(連續(xù)3組)
            正則表達(dá)式(RegexUrlProber) 854 767/561/598 ms
            微軟DOM(MsDomUrlProber) 952 1132/629/605 ms
            我們的(MyDomUrlProber) 952 16/18/15 ms

            從數(shù)據(jù)看,我自己寫的html解析程序速度是相當(dāng)不錯的 :)  回復(fù)  更多評論   

            # re: 發(fā)布一個正則表達(dá)式測試工具 2009-11-06 00:02 xL

            這個工具不錯
            http://www.pagecolumn.com/tool/regtest.htm  回復(fù)  更多評論   

            <2007年6月>
            272829303112
            3456789
            10111213141516
            17181920212223
            24252627282930
            1234567

            導(dǎo)航

            統(tǒng)計

            常用鏈接

            留言簿(9)

            隨筆分類(67)

            隨筆檔案(65)

            搜索

            最新評論

            閱讀排行榜

            評論排行榜

            欧美久久综合九色综合| 无码超乳爆乳中文字幕久久| 久久精品国产91久久麻豆自制| 久久久无码一区二区三区 | 中文字幕亚洲综合久久2| 久久亚洲国产精品五月天婷| 亚洲精品tv久久久久久久久| 热久久国产精品| 久久毛片一区二区| 69国产成人综合久久精品| 国产成人久久精品麻豆一区| 亚洲精品乱码久久久久久自慰| 久久99精品国产一区二区三区| 亚洲国产高清精品线久久 | 亚洲精品tv久久久久| 久久久久亚洲精品天堂| 久久影视综合亚洲| 国产精品久久一区二区三区| 久久久高清免费视频| 中文字幕成人精品久久不卡| 精品人妻久久久久久888| 久久无码AV一区二区三区| 99久久婷婷国产一区二区| 久久天天躁狠狠躁夜夜网站| 中文字幕无码av激情不卡久久| 国产激情久久久久影院| 久久精品亚洲一区二区三区浴池| 久久久这里有精品| 一本久久a久久精品综合香蕉| 品成人欧美大片久久国产欧美| 成人资源影音先锋久久资源网| 久久丫精品国产亚洲av| 国产亚洲精久久久久久无码77777| 久久久久亚洲av毛片大| 激情综合色综合久久综合| 久久青青草原综合伊人| 久久99中文字幕久久| 国产精品美女久久久| 国产91久久精品一区二区| 国产成人久久激情91| 99久久国产综合精品网成人影院 |