青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

隨筆-341  評(píng)論-2670  文章-0  trackbacks-0
    有個(gè)同學(xué)近來(lái)一直在做一個(gè)魔獸世界戰(zhàn)況分析(名字好像叫DeusCraft),說(shuō)是很火。只是用C#覺得不是很爽,想移植到C++上面來(lái)。但是那個(gè)東西在分析的時(shí)候用了好多正則表達(dá)式,于是只好找了些正則表達(dá)式引擎來(lái)測(cè)。

    測(cè)試的文件一共有27萬(wàn)多行,首先通過(guò)一個(gè)檢查時(shí)間的正則表達(dá)式。如果成功,則在接下來(lái)的20幾條正則表達(dá)式中驗(yàn)證字符串命中哪一條,然后開始做剩余的工作。原先在C#上花了12秒分析,后來(lái)?yè)Q了boost的正則表達(dá)式花費(fèi)40秒,然后從MSR上找了一個(gè)號(hào)稱比boost快4倍的正則表達(dá)式引擎,結(jié)果還是40秒(都是微軟的,咋差距這么大……)。于是同學(xué)用他自己做的正則表達(dá)式引擎花了23秒(此數(shù)據(jù)不太記得),我用我以前那個(gè)東西花費(fèi)108秒(-_-|||)。

    于是我們這幾天就在優(yōu)化正則表達(dá)式引擎,到了今天同學(xué)那個(gè)花費(fèi)13秒,我那個(gè)12秒。Visual Studio 2008 Team System上有一個(gè)Performance Wizard,用于在程序執(zhí)行的過(guò)程中統(tǒng)計(jì)各個(gè)函數(shù)所占用的時(shí)間,可以方便定位,看出效率瓶頸,非常好用。

    我之前的正則表達(dá)式為了保持很多語(yǔ)法上的一致性(譬如選擇操作符“|”需要遵守交換律等等),使用了一種花費(fèi)很大的辦法來(lái)對(duì)字符串進(jìn)行分析。這種分析方法找出所有符合正則表達(dá)式要求的所有匹配的路徑然后進(jìn)行篩選。篩選的過(guò)程中浪費(fèi)了很多new和delete的操作,而且做了很多計(jì)算,維護(hù)了一個(gè)非常復(fù)雜的數(shù)據(jù)結(jié)構(gòu)。后來(lái)想到有些事情是可以讓人來(lái)操心的,于是在原來(lái)的接口上加了一個(gè)option,添加了一種叫做“貪婪式”的分析方法。現(xiàn)在就同時(shí)有兩種分析方法用了。第二種分析方法的優(yōu)點(diǎn)是快,缺點(diǎn)是喪失了一些語(yǔ)法上的優(yōu)美(不過(guò)這個(gè)對(duì)于大部分人來(lái)說(shuō)應(yīng)該是沒什么關(guān)系的了。要是正則表達(dá)式的執(zhí)行過(guò)程不復(fù)雜的話,《精通正則表達(dá)式》也就賣不出去了,反正別人的正則表達(dá)式大多都是貪婪的)。貪婪式的分析方法不同時(shí)掃描所有路徑,而是使用回溯的方法。不過(guò)這種方法最大的優(yōu)點(diǎn)在于數(shù)據(jù)結(jié)構(gòu)可以大幅度簡(jiǎn)化為三個(gè)堆棧(NFA狀態(tài)、已捕獲子串、捕獲狀態(tài)),從而大量減少包括申請(qǐng)和釋放等的指針操作。

    上文中的測(cè)試是在同學(xué)他自己進(jìn)行的。我在我自己的電腦上使用了一條表達(dá)式(而不是20幾條)來(lái)跑相同的文件,非貪婪式用了23秒,貪婪式用了3.5秒。

    雖然這個(gè)正則表達(dá)式引擎的接口跟現(xiàn)在C#或Java流行的那些差不多,只是這東西屬于Syngram的一部分,所以不是很想單獨(dú)分隔成一個(gè)dll發(fā)布。至于代碼就要等Vczh Free Script 3.0或者Vczh Lazy Script 1.0發(fā)布的時(shí)候再一起開放了,因?yàn)槭褂肧yngram做編譯器是很爽的。到時(shí)候再考慮如何將正則表達(dá)式和上下文無(wú)關(guān)文法兩個(gè)強(qiáng)大的字符串分析庫(kù)封裝成dll用吧。嘿嘿。
posted on 2008-05-07 05:21 陳梓瀚(vczh) 閱讀(15487) 評(píng)論(21)  編輯 收藏 引用 所屬分類: C++

評(píng)論:
# re: 正則表達(dá)式——一點(diǎn)小插曲 2008-05-07 19:19 | xiaolige
你自己寫的那個(gè)功能有boost的全嗎,能夠全面實(shí)現(xiàn)boost.regex功能并且性能上超越它這么多就很厲害了  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2008-05-07 20:13 | 空明流轉(zhuǎn)
現(xiàn)在MSR的不一定有boost好了,你用的是regex還是xpressive的那個(gè),我都分不清有什么區(qū)別,囧  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2008-05-07 20:39 | Fox
正要看看正則表達(dá)式,不妨寫詳細(xì)點(diǎn),參考一下:D  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2008-05-07 21:39 | eXile
boost::xpressive有兩種使用方式, 一種就是和boost::regex一樣的動(dòng)態(tài)解析,一種是靜態(tài)解析,類似于boost::spirit .
如果你使用的正則式是硬編碼的字符串(大多數(shù)情況下都是如此), 那么使用 xpressive的靜態(tài)解析具有更高的效率, 因?yàn)樗慕馕瞿0迨窃诰幾g期生成的.  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2008-05-08 05:10 | 陳梓瀚(vczh)
boost::regex不能命名捕獲,只能匿名捕獲,我的可以,這是功能上的唯一區(qū)別。其他的特性我全有。畢竟是參考過(guò)他和.net兩邊的語(yǔ)法然后自己改了一下的。

至于spirit,那個(gè)不是正則表達(dá)式,是上下文無(wú)關(guān)文法。這個(gè)就是另外一個(gè)問(wèn)題了。我那套syngram有一個(gè)東西是用來(lái)處理上下文無(wú)關(guān)文法的,這兩個(gè)我還沒比。不過(guò)以前的spirit是不能處理左遞歸的,不知道現(xiàn)在的行不行。

不過(guò)xpressive寫的正則表達(dá)式在boost的主頁(yè)上號(hào)稱快了15%,估計(jì)有所限制。把文本的正則表達(dá)式換成那種直接寫代碼的東西,本質(zhì)上并沒有改變什么。因?yàn)闋顟B(tài)機(jī)還是狀態(tài)機(jī),操作符重載是不可能靜態(tài)編譯的,只有直接用模板才行。這樣的話會(huì)變成類似
seq_p<
ch_p<'a'>,
opt_p<
ch_p<'b'>,
ch_p<'c'>
>
>
的,用于表達(dá)a(b|c)。這種形式才有可能達(dá)到編譯器編譯出分析字符串的代碼。  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2008-05-09 06:20 | 路人甲
不知天高地厚,你和你同學(xué)竟然都超過(guò)了regex,真是太有才了
  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2008-05-09 06:24 | 路人甲
原先在C#上花了12秒分析,后來(lái)?yè)Q了boost的正則表達(dá)式花費(fèi)40秒,然后從MSR上找了一個(gè)號(hào)稱比boost快4倍的正則表達(dá)式引擎,結(jié)果還是40秒(都是微軟的,咋差距這么大……)。
=======================
C++比C#慢這么多,差距怎么這么大啊,為什么C++比C#慢這么多啊?哦,原來(lái)使用者是頭豬喲  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2008-05-09 07:27 | eXile
@陳梓瀚(vczh)
你所寫的模板形式和xpressive的表達(dá)式模板并沒有太大的差別, 因?yàn)楸磉_(dá)式模板最終生成的也是類似于這樣的東西.
另外, 程序庫(kù)為了實(shí)現(xiàn)功能的全面性和通用性, 必然要損失一部分效率, 樓上的對(duì)此也不用大驚小怪, 還是要注意素質(zhì).....
  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2008-05-09 09:40 | 陳梓瀚(vczh)
@路人甲
C#的正則表達(dá)式也是C++寫的,謝謝合作。
至于速度問(wèn)題,好像沒人規(guī)定我就不能比boost做得好吧。

不過(guò)路人甲想必是沒有寫過(guò)正則表達(dá)式引擎了。在測(cè)試的過(guò)程中,瓶頸不在分析,而在于分析完了之后產(chǎn)生的數(shù)據(jù)結(jié)構(gòu)。正則表達(dá)式分析字符串的過(guò)程本身是很快的,分析完了制造那些數(shù)據(jù)出來(lái)給你用的時(shí)候,就會(huì)消耗大量的時(shí)間。明白?不過(guò)話說(shuō)回來(lái),我那個(gè)庫(kù)是沒有用到stl的。  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2008-05-11 19:53 | 胡人
鼓勵(lì)原創(chuàng),鼓勵(lì)創(chuàng)新,鼓勵(lì)提高,一個(gè)字,好!
期待能早些見到東西,而不是一些有點(diǎn)自吹自擂的數(shù)據(jù)!
  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2008-05-11 21:45 | 陳梓瀚(vczh)
東西不能著急。做是做出來(lái)了。改進(jìn)前的代碼其實(shí)已經(jīng)發(fā)布了,改進(jìn)后的還沒有。只是以前沒做廣告到大家不知道罷了。現(xiàn)在還不拿出來(lái)的原因有三:

1:沒充分測(cè)試。因?yàn)槠綍r(shí)還要上課做作業(yè)。
2:我用的庫(kù)是我自己開發(fā)的,沒有stl,跟大家的代碼要接上不是那么容易。所以就算看到了,也就只能看。想用的話還得再花一些功夫。因?yàn)檫@個(gè)正則表達(dá)式當(dāng)初只是想給自己用的。
3:正則表達(dá)式隸屬于我自己的那套文法工具,按照計(jì)劃是在下一個(gè)編譯器發(fā)布的時(shí)候一起給出來(lái)。  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2008-05-11 22:03 | 空明流轉(zhuǎn)
鄙視造車輪啊造車輪。。。  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2008-05-24 07:04 | missdeer
我有一個(gè)項(xiàng)目里用MSR的greta全文匹配5種模式,一個(gè)3萬(wàn)行的文件,占用CPU99%可能要1分鐘左右。最近發(fā)現(xiàn),用lex和yacc來(lái)做,達(dá)到同樣的效果,可能不會(huì)超過(guò)3秒鐘。正則表達(dá)式要用好,還是很有文章可作的。  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2008-05-24 09:10 | 陳梓瀚(vczh)
當(dāng)然,你用lex生成代碼,是不能動(dòng)態(tài)修改的。當(dāng)然快了。  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2009-03-20 02:20 | 林林
不知到能不能把你的測(cè)試數(shù)據(jù)與程序公布一下,不用提供正則庫(kù)的源碼
我也寫了一個(gè),想比較一下?  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2009-03-20 02:54 | 陳梓瀚(vczh)
那個(gè)在舊電腦里面,而且是一個(gè)100多M的文本文件……你去比較C#那個(gè)吧,我的速度是它的96%(比率較穩(wěn)定)  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2009-03-22 01:38 | 白開水
LSS的,你把一份C文件,用gcc -E 跑一次后,在粘貼個(gè)幾十次,基本就OK了  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2009-03-24 08:29 | wow
@路人甲
毫無(wú)水準(zhǔn)  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2010-07-27 17:57 | 路人癸
要鼓勵(lì)~而不是諷刺~支持國(guó)產(chǎn)~打到小日本~  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2010-09-02 00:45 | yoco
@路人甲

boost::regex 的效能本來(lái)就是慢的,這是常識(shí)。

切莫妄自菲薄,您自己實(shí)現(xiàn)一個(gè),效能也是有可能比 boost::regex 好的。  回復(fù)  更多評(píng)論
  
# re: 正則表達(dá)式——一點(diǎn)小插曲 2016-08-03 11:24 | Bread
明天開工。
來(lái)踩一下輪子哥的腳印。  回復(fù)  更多評(píng)論
  
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲国产精品电影在线观看| 欧美女同视频| 麻豆精品一区二区av白丝在线| 狠狠v欧美v日韩v亚洲ⅴ| 久久影院亚洲| 亚洲人妖在线| 午夜一区二区三区不卡视频| 国产亚洲精品久久久久婷婷瑜伽| 久久久久亚洲综合| 亚洲狼人综合| 久久久99爱| 一本到高清视频免费精品| 国产精品乱码妇女bbbb| 久久久久久亚洲精品不卡4k岛国| 亚洲欧洲久久| 久久精品国产一区二区三| 亚洲国产婷婷| 国产精品久久久久免费a∨大胸| 久久成人精品一区二区三区| 亚洲激情自拍| 久久久www成人免费精品| 亚洲人永久免费| 国产精品一区三区| 免费黄网站欧美| 亚洲小说欧美另类社区| 欧美激情一区二区三区蜜桃视频| 亚洲欧美一区二区视频| 亚洲精品欧美日韩专区| 国产伊人精品| 国产精品久久久久久亚洲毛片| 裸体歌舞表演一区二区| 亚洲图片欧美一区| 亚洲国产婷婷香蕉久久久久久99| 欧美一区二区在线视频| 99国产精品视频免费观看一公开 | 欧美日本在线播放| 久久黄色级2电影| 亚洲无线视频| 亚洲毛片一区二区| 欧美激情五月| 久久综合九色欧美综合狠狠| 亚洲欧美视频一区二区三区| 最新日韩欧美| 国产噜噜噜噜噜久久久久久久久| 久久人人爽人人爽| 亚洲人成小说网站色在线| 久久久久久高潮国产精品视| 亚洲一区二区网站| 日韩一二三区视频| 亚洲国产精品一区二区尤物区| 国产亚洲欧美一区二区三区| 国产精品进线69影院| 欧美精品www在线观看| 久久久久综合| 久久久噜噜噜久久久| 欧美制服丝袜| 久久精品二区| 久久精品av麻豆的观看方式| 性欧美超级视频| 亚洲欧美在线免费观看| 亚洲一区日韩在线| 亚洲性感美女99在线| 在线视频你懂得一区二区三区| 日韩视频在线观看免费| 亚洲理伦在线| 一区二区三区成人精品| 一区二区三区欧美日韩| 在线视频亚洲一区| 中文精品视频一区二区在线观看| 一本色道久久加勒比精品| 夜夜嗨av色综合久久久综合网| 亚洲日本成人网| 99视频精品全部免费在线| 亚洲精品一区二区三区樱花| 亚洲精品国产系列| 在线视频日韩| 欧美亚洲综合网| 久久精品中文字幕一区二区三区 | 久久超碰97人人做人人爱| 性欧美暴力猛交另类hd| 久久伊人一区二区| 欧美成人官网二区| 欧美精品一区二区三区久久久竹菊 | 久久国产一二区| 久久久久国产精品一区| 免费在线国产精品| 亚洲国产日韩欧美在线99| 亚洲最新合集| 欧美亚洲视频在线观看| 久久久五月婷婷| 欧美精品粉嫩高潮一区二区| 国产精品videosex极品| 国产日产欧美a一级在线| 亚洲成色www久久网站| 一本色道久久综合亚洲精品按摩| 亚洲一区bb| 久久综合中文字幕| 亚洲免费观看| 久久精品国产欧美激情| 国产精品久久久久久亚洲调教| 午夜国产精品视频免费体验区| 一区二区三区.www| 久久九九国产精品怡红院| 久久久久免费| 国产精品久久久久aaaa樱花| 亚洲国产日本| 999亚洲国产精| 欧美香蕉视频| 99热免费精品| 性xx色xx综合久久久xx| 中文久久精品| 亚洲一级在线观看| 国产主播一区| 欧美成人一二三| 在线亚洲自拍| 欧美激情片在线观看| 亚洲午夜在线观看| 国产精品免费观看视频| 美女网站久久| 欧美一区免费| 亚洲精品中文字| 久久精品一区二区国产| 亚洲人成欧美中文字幕| 狠狠综合久久av一区二区老牛| 国产精品theporn| 欧美激情亚洲| 亚洲尤物在线| 嫩草成人www欧美| 亚洲精品欧美日韩| 国产视频一区免费看| 欧美一区三区三区高中清蜜桃 | 香蕉视频成人在线观看| 亚洲剧情一区二区| 噜噜噜噜噜久久久久久91| 亚洲精品一区在线观看香蕉| 日韩午夜高潮| 欧美在线国产| 夜夜嗨av一区二区三区免费区| 国产精品国产三级欧美二区 | 久久久久久久久蜜桃| 亚洲午夜av在线| 夜夜嗨网站十八久久| 亚洲美女啪啪| 午夜一级久久| 9色国产精品| 国产综合精品| 国产精品日韩精品| 国产日韩综合一区二区性色av| 久久精品国产69国产精品亚洲| 欧美成人三级在线| 1769国产精品| 最新69国产成人精品视频免费| 欧美日韩国产欧美日美国产精品| 免费影视亚洲| 欧美日韩成人网| 麻豆乱码国产一区二区三区| 久久精彩免费视频| 激情欧美一区| 亚洲国产婷婷香蕉久久久久久99| 国产精品毛片大码女人| 欧美日韩亚洲一区在线观看| 国产精品人人爽人人做我的可爱| 国产精品分类| 一本色道久久综合| 久久亚洲不卡| 亚洲精品激情| 午夜精品视频在线观看一区二区| 亚洲欧美日韩国产中文在线| 欧美韩日亚洲| 国产亚洲第一区| 亚洲精品一区二区三区蜜桃久| 在线中文字幕不卡| 一区二区三区久久| 免费看亚洲片| 猛男gaygay欧美视频| 国产精品另类一区| 亚洲国产女人aaa毛片在线| 亚洲国产天堂久久综合| 香蕉久久精品日日躁夜夜躁| 亚洲最新在线视频| 久久久www成人免费精品| 欧美午夜精品久久久久免费视 | 欧美阿v一级看视频| 欧美视频在线一区| 亚洲欧美日韩成人| 欧美国产91| 米奇777在线欧美播放| 欧美一级一区| 亚洲欧美精品在线| 久久久久国产精品厨房| 午夜精品亚洲| 国内精品嫩模av私拍在线观看| 亚洲欧美日韩一区二区三区在线| 一区二区三区四区国产| 美女尤物久久精品| 欧美freesex交免费视频| 国产综合色精品一区二区三区| 亚洲图片自拍偷拍| 欧美激情精品久久久久久久变态 | 亚洲欧美日韩一区二区在线|