新建網(wǎng)頁 1 #if 0
在通常的情況下,我們只關(guān)心文本中的一部分信息,但是為了編寫詞法和語法分析程
序,又不得不將所有的結(jié)構(gòu)信息全部描寫出來,例如:我們僅僅關(guān)心C++源文檔中的類名字
信息,而不關(guān)心類是否有成員變量,是否有成員函數(shù)以及是否有其它的一些C++內(nèi)容。將結(jié)
構(gòu)信息全部描述出來的做法是費(fèi)時(shí)費(fèi)力的,通常的情況往往導(dǎo)致項(xiàng)目的不可完成或者延期
完成。另外,作為程序設(shè)計(jì)者和代碼編寫者,都希望將功能局域化而不擴(kuò)散難度,也非常
希望編寫的代碼能夠簡單的不予理睬還沒有理解的內(nèi)容,專心處理自己關(guān)心的內(nèi)容。本篇
文檔就以著重考慮處理C/C++類名稱信息為例,忽略其它的一切沒有進(jìn)行語法描述的C/C++
信息。這就是Lex和Yacc的錯(cuò)誤(error)處理的一個(gè)應(yīng)用:)我非常喜歡:)
下面給出詞法和語法分析器的源代碼,因?yàn)檫@么簡單的程序,看源代碼是學(xué)習(xí)的最好
方法:)
#endif
////////////////////////////////////////////////////////////////////////////////
// 詞法掃描器文件:lex.l
%{
#include <string>
// 將yylval的值類型由默認(rèn)的int修改為std::string類型,實(shí)際上可以修改為你認(rèn)為的任
// 何類型,僅僅只是需要定一個(gè)這樣YYSTYPE宏即可,特別注意,這個(gè)宏定義必須在后面
// 的標(biāo)記文件yacc.tab.h之前定義,并且在yacc文件中也要有這個(gè)YYSTYPE定義,并且必
// 須和這里的保持一致。實(shí)際上YYSTYPE的定義在生成的標(biāo)記文件yacc.tab.h中有一個(gè)宏
// 判斷,如果用戶也就是我們定義了YYSTYPE宏,那么就用我們定義的YYSTYPE,否則就用
// 默認(rèn)的YYSTYPE,也就是int類型:)
#define YYSTYPE std::string
#include "yacc.tab.h"
#define LEX_RETURN(arg) yylval=yytext;return arg
%}
d [0-9]
l [a-z]
u [A-Z]
a {l}|{u}
%%
[;{}] {LEX_RETURN(yytext[0]);}
"class" {LEX_RETURN(CLASS);}
(_|{a})(_|{a}|{d})* {LEX_RETURN(IDENTIFIER);}
[ \t\n] /* 忽略空白 */
. /* 忽略其它一切沒有被處理的文本 */
%%
int yywrap()
{
return 1;
}
////////////////////////////////////////////////////////////////////////////////
////////////////////////////////////////////////////////////////////////////////
// 語法分析器文件:yacc.y
%{
#include <iostream>
#define YYSTYPE std::string
extern int yylex();
void yyerror(const char*msg);
%}
%token CLASS IDENTIFIER
%%
program:/* 空 */
| program class //處理C++ 類
| program error ';' // 一旦出現(xiàn)錯(cuò)誤直接跳到最近的分號(hào)處,回復(fù)正常的掃描過程
// 特別注意這里的標(biāo)記符號(hào)error,它是由yacc自動(dòng)生成的標(biāo)記
// 和上面的CLASS和IDENTIFIER標(biāo)記一樣都可以直接應(yīng)用到語法
// 描述中
;
class:// 特別注意一下下面的class語法描述又調(diào)用了program,這是一種嵌套結(jié)構(gòu)的常見做法
CLASS IDENTIFIER '{' program '}' ';' {std::cout<<"發(fā)現(xiàn)類名:"<<$2<<std::endl;}
;
%%
void yyerror(const char*msg)
{
// 錯(cuò)誤處理,僅僅是簡單的輸出一個(gè)錯(cuò)誤標(biāo)記,在具體應(yīng)用中應(yīng)當(dāng)能夠分析出這種錯(cuò)
// 誤是否已經(jīng)被處理了,這里為了說明上面的錯(cuò)誤信息過濾沒有進(jìn)行這種識(shí)別
std::cerr<< "發(fā)現(xiàn)錯(cuò)誤" << std::endl;
}
int main()
{
yyparse();
return 0;
}
////////////////////////////////////////////////////////////////////////////////
////////////////////////////////////////////////////////////////////////////////
// Makefile文件
CC=g++
CFLAGS=
LEX=flex
YACC=bison
YACCFLAGS=-d
TARGET=lexyacc
$(TARGET):lex.yy.c yacc.tab.h yacc.tab.c
$(CC) $(CFLAGS) lex.yy.c yacc.tab.c -o $(TARGET)
lex.yy.c:lex.l
$(LEX) lex.l
yacc.tab.c yacc.tab.h:yacc.y
$(YACC) $(YACCFLAGS) yacc.y
clean:
rm -f lex.yy.c yacc.tab.h yacc.tab.c
////////////////////////////////////////////////////////////////////////////////
// 從上面的代碼中可以看出,通過容錯(cuò)處理之后,我們就可以專心于特定的功能代碼編寫
// 而不需要考慮其它的信息,這樣就可以極大的降低解決問題的難度。在后續(xù)的文檔中都
// 會(huì)采用這種技巧來實(shí)現(xiàn)特定的功能。如果對(duì)上面的一些描述還不是很清晰的話,可以參
// 見我之前已經(jīng)寫出來的系列文檔,在本章中值得說明的只有兩點(diǎn):
// 1:yacc自動(dòng)生成的error標(biāo)記的使用
// 2:改變默認(rèn)的yylval的int類型為std::string類型
// 其實(shí)我是在盡可能的使用C++庫,目的當(dāng)然是降低編寫代碼的難度,減少代碼,便于說
// 明問題;)
//
// 好了,本篇文檔到此就已經(jīng)說明了本文開始所提出的問題:D,后續(xù)的文檔正在努力給出
// 。其實(shí)編寫Lex和Yacc程序非常簡單,只需要注意幾個(gè)常見錯(cuò)誤就可以完成一般的任務(wù)
// 了,在下一篇里面將會(huì)講解常見的錯(cuò)誤及其處理方法:)敬請(qǐng)關(guān)注:)
// 下面是實(shí)例應(yīng)用
////////////////////////////////////////////////////////////////////////////////
// 測(cè)試文件:sample.cpp
class Point
{
int x;
int y;
int GetX();
int GetY();
};
class Rect
{
int x;
int y;
int w;
int h;
int GetX();
int GetY();
int GetW();
int GetH();
};
class Wrapper
{
class Inner1{};
class Inner2{
class InnerInner1{float f;};
class InnerInner2{};
std::string name;
};
bool sex;
};
////////////////////////////////////////////////////////////////////////////////
////////////////////////////////////////////////////////////////////////////////
// 編譯并運(yùn)行過程
D:\home\blog\lexyacc>make
flex lex.l
bison -d yacc.y
g++ lex.yy.c yacc.tab.c -o lexyacc
D:\home\blog\lexyacc>lexyacc.exe < sample.cpp
發(fā)現(xiàn)錯(cuò)誤
發(fā)現(xiàn)類名:Point
發(fā)現(xiàn)錯(cuò)誤
發(fā)現(xiàn)類名:Rect
發(fā)現(xiàn)類名:Inner1
發(fā)現(xiàn)錯(cuò)誤
發(fā)現(xiàn)類名:InnerInner1
發(fā)現(xiàn)類名:InnerInner2
發(fā)現(xiàn)錯(cuò)誤
發(fā)現(xiàn)類名:Inner2
發(fā)現(xiàn)錯(cuò)誤
發(fā)現(xiàn)類名:Wrapper
D:\home\blog\lexyacc>