• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            woaidongmao

            文章均收錄自他人博客,但不喜標(biāo)題前加-[轉(zhuǎn)貼],因其丑陋,見(jiàn)諒!~
            隨筆 - 1469, 文章 - 0, 評(píng)論 - 661, 引用 - 0
            數(shù)據(jù)加載中……

            用Flex/Bison分析c代碼的經(jīng)歷

            這些日子花了不少時(shí)間在一個(gè)c語(yǔ)言的語(yǔ)法分析程序上,這個(gè)程序要能識(shí)別變量、函數(shù)的定義、聲明和引用,簡(jiǎn)而言之就是找出sourceinsight所能提供的信息(比si還要精確)。

            分析代碼和編譯代碼一樣,都要做語(yǔ)法分析。但是因?yàn)榉治龃a不做預(yù)處理,所以就會(huì)遇到一些麻煩,比如處理一些定義的稀奇古怪的宏,無(wú)法判斷一個(gè)identifier是變量還是類型。這么一來(lái),嚴(yán)格的用C語(yǔ)言語(yǔ)法來(lái)分析代碼就沒(méi)法通過(guò)。

            考慮到這個(gè)問(wèn)題,一開(kāi)始決定用lex作詞法分析,生寫語(yǔ)法分析。進(jìn)行到中間,代碼復(fù)雜度越來(lái)越高,感覺(jué)力不從心。又決定通過(guò)修改標(biāo)準(zhǔn)的C語(yǔ)言語(yǔ)法規(guī)則,用bisonyaccGNU實(shí)現(xiàn))來(lái)完成語(yǔ)法分析。

            所謂“工欲善其事,必先利其器”,bison在做語(yǔ)法分析上,果然很方便。但是很快就遇到上面所說(shuō)的問(wèn)題:不做預(yù)處理,無(wú)法得到一個(gè)token的類型。標(biāo)準(zhǔn)的yacc支持的是LALR語(yǔ)法,LALR語(yǔ)法只預(yù)讀一個(gè)token,無(wú)法解決這個(gè)問(wèn)題。

            好在GNUYacc實(shí)現(xiàn)bison支持GLR語(yǔ)法,GLR沒(méi)有只預(yù)讀一個(gè)token的限制,它用狀態(tài)分裂來(lái)解決無(wú)法判斷token類型的問(wèn)題。采用GLR,寫語(yǔ)法規(guī)則就基本上沒(méi)有什么限制了。

            但是GLR有個(gè)問(wèn)題,它用狀態(tài)分裂解決問(wèn)題,如果所有分裂的狀態(tài)只有一個(gè)能分析成功,那自然OK;如果不能,就叫產(chǎn)生了ambiguity(不確定),分析就失敗了。

            解決ambiguity,可以用%dprec來(lái)指定規(guī)則的優(yōu)先級(jí)。當(dāng)兩個(gè)狀態(tài)發(fā)生ambiguity時(shí),根據(jù)它們對(duì)應(yīng)的reduce規(guī)則的優(yōu)先級(jí),選擇優(yōu)先級(jí)高的那個(gè)狀態(tài)。

            但還有一類ambiguity的情況,用%dprec也沒(méi)發(fā)解決。那就是兩個(gè)產(chǎn)生ambiguity的狀態(tài)它們對(duì)應(yīng)的reduce規(guī)則是同一條。這類問(wèn)題很棘手,我只好采用重寫規(guī)則來(lái)避免。但這就導(dǎo)致規(guī)則的可讀性很差,而且往往是解決一個(gè)ambiguity又引入另外一個(gè)。

            無(wú)奈,往bisonmail list里發(fā)了一封信求救,第二天收到一哥們回信,信中說(shuō):

            “用merge啊。我也遇到過(guò)類似的問(wèn)題?!?span lang="EN-US">

            merge是啥呢?merge就正好是處理上面這類問(wèn)題的,相當(dāng)于把多個(gè)狀態(tài)合并。因?yàn)槭潜容^新的特性,在bison的文檔里并沒(méi)有很明顯的提及。

            這樣,用bison分析c代碼就基本沒(méi)有問(wèn)題了;)

             

            備注

            Flex:詞法分析器

            Bison:語(yǔ)法分析器

            GNU bison是一個(gè)自由軟件,用于自動(dòng)生成語(yǔ)法分析器程序,實(shí)際上可用于所有常見(jiàn)的操作系統(tǒng)。Bison把LALR形式的上下文無(wú)關(guān)文法描述轉(zhuǎn)換為可做語(yǔ)法分析的CC++程序。在新近版本中,Bison增加了對(duì)GLR語(yǔ)法分析算法的支持。

            GNU bison基本兼容Yacc,并做了一些改進(jìn)。它一般與flex一起使用。

            posted on 2008-11-22 00:02 肥仔 閱讀(7861) 評(píng)論(1)  編輯 收藏 引用 所屬分類: LEX & YACC

            評(píng)論

            # re: 用Flex/Bison分析c代碼的經(jīng)歷[未登錄](méi)  回復(fù)  更多評(píng)論   

            果然想到一起了,最近也在做提取C變量、函數(shù)的定義之類的程序想用lex和yacc,也郁悶在預(yù)處理上了,不知項(xiàng)目能否開(kāi)源參考一下?
            2012-11-19 15:45 | 逗你玩
            国产精品伊人久久伊人电影| 色综合久久久久综合体桃花网| 久久男人AV资源网站| 亚洲欧美国产日韩综合久久| 性高湖久久久久久久久| 国产精品热久久无码av| 久久精品国产99国产精品导航 | 久久夜色精品国产亚洲| 亚洲精品久久久www| 夜夜亚洲天天久久| 欧洲人妻丰满av无码久久不卡| 久久精品免费大片国产大片| 久久国产精品99精品国产987| 色婷婷噜噜久久国产精品12p| 99久久精品影院老鸭窝| 亚洲精品无码专区久久久| 久久免费99精品国产自在现线| 久久91综合国产91久久精品| 久久精品国产久精国产一老狼| 香蕉久久影院| 一本色综合久久| 国产亚洲精久久久久久无码AV| 久久精品国产亚洲77777| 亚洲AV无码1区2区久久 | 久久久久人妻一区精品性色av | 久久久久亚洲av无码专区导航 | 日本精品久久久久中文字幕8| 久久久久亚洲AV无码观看| 99久久精品国内| 99久久久精品免费观看国产| 无码人妻久久一区二区三区| 伊人久久大香线蕉亚洲| 久久福利资源国产精品999| 久久无码精品一区二区三区| 国产精品无码久久四虎| 99久久久久| 香蕉久久影院| 久久亚洲国产成人精品性色| 国产高潮国产高潮久久久| 久久91精品国产91久久户| 青青青青久久精品国产|