新建網頁 1 #if 0
在通常的情況下,我們只關心文本中的一部分信息,但是為了編寫詞法和語法分析程
序,又不得不將所有的結構信息全部描寫出來,例如:我們僅僅關心C++源文檔中的類名字
信息,而不關心類是否有成員變量,是否有成員函數以及是否有其它的一些C++內容。將結
構信息全部描述出來的做法是費時費力的,通常的情況往往導致項目的不可完成或者延期
完成。另外,作為程序設計者和代碼編寫者,都希望將功能局域化而不擴散難度,也非常
希望編寫的代碼能夠簡單的不予理睬還沒有理解的內容,專心處理自己關心的內容。本篇
文檔就以著重考慮處理C/C++類名稱信息為例,忽略其它的一切沒有進行語法描述的C/C++
信息。這就是Lex和Yacc的錯誤(error)處理的一個應用:)我非常喜歡:)
下面給出詞法和語法分析器的源代碼,因為這么簡單的程序,看源代碼是學習的最好
方法:)
#endif
////////////////////////////////////////////////////////////////////////////////
// 詞法掃描器文件:lex.l
%{
#include <string>
// 將yylval的值類型由默認的int修改為std::string類型,實際上可以修改為你認為的任
// 何類型,僅僅只是需要定一個這樣YYSTYPE宏即可,特別注意,這個宏定義必須在后面
// 的標記文件yacc.tab.h之前定義,并且在yacc文件中也要有這個YYSTYPE定義,并且必
// 須和這里的保持一致。實際上YYSTYPE的定義在生成的標記文件yacc.tab.h中有一個宏
// 判斷,如果用戶也就是我們定義了YYSTYPE宏,那么就用我們定義的YYSTYPE,否則就用
// 默認的YYSTYPE,也就是int類型:)
#define YYSTYPE std::string
#include "yacc.tab.h"
#define LEX_RETURN(arg) yylval=yytext;return arg
%}
d [0-9]
l [a-z]
u [A-Z]
a {l}|{u}
%%
[;{}] {LEX_RETURN(yytext[0]);}
"class" {LEX_RETURN(CLASS);}
(_|{a})(_|{a}|{d})* {LEX_RETURN(IDENTIFIER);}
[ \t\n] /* 忽略空白 */
. /* 忽略其它一切沒有被處理的文本 */
%%
int yywrap()
{
return 1;
}
////////////////////////////////////////////////////////////////////////////////
////////////////////////////////////////////////////////////////////////////////
// 語法分析器文件:yacc.y
%{
#include <iostream>
#define YYSTYPE std::string
extern int yylex();
void yyerror(const char*msg);
%}
%token CLASS IDENTIFIER
%%
program:/* 空 */
| program class //處理C++ 類
| program error ';' // 一旦出現錯誤直接跳到最近的分號處,回復正常的掃描過程
// 特別注意這里的標記符號error,它是由yacc自動生成的標記
// 和上面的CLASS和IDENTIFIER標記一樣都可以直接應用到語法
// 描述中
;
class:// 特別注意一下下面的class語法描述又調用了program,這是一種嵌套結構的常見做法
CLASS IDENTIFIER '{' program '}' ';' {std::cout<<"發現類名:"<<$2<<std::endl;}
;
%%
void yyerror(const char*msg)
{
// 錯誤處理,僅僅是簡單的輸出一個錯誤標記,在具體應用中應當能夠分析出這種錯
// 誤是否已經被處理了,這里為了說明上面的錯誤信息過濾沒有進行這種識別
std::cerr<< "發現錯誤" << std::endl;
}
int main()
{
yyparse();
return 0;
}
////////////////////////////////////////////////////////////////////////////////
////////////////////////////////////////////////////////////////////////////////
// Makefile文件
CC=g++
CFLAGS=
LEX=flex
YACC=bison
YACCFLAGS=-d
TARGET=lexyacc
$(TARGET):lex.yy.c yacc.tab.h yacc.tab.c
$(CC) $(CFLAGS) lex.yy.c yacc.tab.c -o $(TARGET)
lex.yy.c:lex.l
$(LEX) lex.l
yacc.tab.c yacc.tab.h:yacc.y
$(YACC) $(YACCFLAGS) yacc.y
clean:
rm -f lex.yy.c yacc.tab.h yacc.tab.c
////////////////////////////////////////////////////////////////////////////////
// 從上面的代碼中可以看出,通過容錯處理之后,我們就可以專心于特定的功能代碼編寫
// 而不需要考慮其它的信息,這樣就可以極大的降低解決問題的難度。在后續的文檔中都
// 會采用這種技巧來實現特定的功能。如果對上面的一些描述還不是很清晰的話,可以參
// 見我之前已經寫出來的系列文檔,在本章中值得說明的只有兩點:
// 1:yacc自動生成的error標記的使用
// 2:改變默認的yylval的int類型為std::string類型
// 其實我是在盡可能的使用C++庫,目的當然是降低編寫代碼的難度,減少代碼,便于說
// 明問題;)
//
// 好了,本篇文檔到此就已經說明了本文開始所提出的問題:D,后續的文檔正在努力給出
// 。其實編寫Lex和Yacc程序非常簡單,只需要注意幾個常見錯誤就可以完成一般的任務
// 了,在下一篇里面將會講解常見的錯誤及其處理方法:)敬請關注:)
// 下面是實例應用
////////////////////////////////////////////////////////////////////////////////
// 測試文件:sample.cpp
class Point
{
int x;
int y;
int GetX();
int GetY();
};
class Rect
{
int x;
int y;
int w;
int h;
int GetX();
int GetY();
int GetW();
int GetH();
};
class Wrapper
{
class Inner1{};
class Inner2{
class InnerInner1{float f;};
class InnerInner2{};
std::string name;
};
bool sex;
};
////////////////////////////////////////////////////////////////////////////////
////////////////////////////////////////////////////////////////////////////////
// 編譯并運行過程
D:\home\blog\lexyacc>make
flex lex.l
bison -d yacc.y
g++ lex.yy.c yacc.tab.c -o lexyacc
D:\home\blog\lexyacc>lexyacc.exe < sample.cpp
發現錯誤
發現類名:Point
發現錯誤
發現類名:Rect
發現類名:Inner1
發現錯誤
發現類名:InnerInner1
發現類名:InnerInner2
發現錯誤
發現類名:Inner2
發現錯誤
發現類名:Wrapper
D:\home\blog\lexyacc>