亚洲免费网站,亚洲人成人99网站,伊人久久综合97精品

Kevin Lynx — Mon, 15 Mar 2010 13:33:00 GMT

LL(1)分析法和递归下降分析法同属于自顶向下分析法。相对于递归下降而言�Q�LL通过昄��
地维护一个栈来进行语法分析，递归下降则是利用了函数调用栈�?

LL分析法主要由分析栈、分析表和一个驱动算法组成。其实LL的分析算法还是很�Ҏ��懂的�Q?br>主要��是一个匹配替换的�q�程。而要构造这里的分析表，则还涉及计算first集和follow�?br>的算法�?

个�h觉得龙书在解释这些算法和概念旉��非常清楚�l�致�Q�虽然也有�h说它很晦涩�?

first集和follow集的计算�Q�抛开书上�l�的严密��法�Q�用人的思维�ȝ��解（对于compiler
compiler则需要用�E�序��L��造这些集合，�q�是让计��机�ȝ��解）�Q�其实很��单：

1、对于某个非�l�结�W�A的first集（first(A)�Q�，��单地说就是由A推导得到的串的首�W�号�?br>集合�Q�A->aB�Q�那么这里的a��属于first(A)�Q�很形象�?br>2、follow(A)�Q�则是紧随A的终�l�符号集合，例如B->Aa�Q�这里的a��属于follow(A)�Q�也很�Ş
象�?

当然�Q�因为文法符号中有epsilon�Q�所以在计算上面两个集合时则会涉及到一�U�传递性。例
如，A->Bc, B->epsilon�Q�B可以推导出epsilon�Q�也��是基本�{�同于没有，那么first(A)�?br>��׃��包含c�W�号�?

在了解了first集和follow集的计算�Ҏ��后，则可以通过另一些规则构造出LL需要的分析表�?

�~�译原理里��L��很多很多的理论和��法。但正是�q�些理论和算法，使得�~�译器的实现变得��
单，代码易维护�?

在某个特定的�~�程语言中，因�ؓ其文法一定，所以对于其LL(1)实现中的分析表就是确定的
。我们也不需要在�E�序里动态构造first和follow集合�?

那么�Q�要实现一个LL(1)分析法，大致步骤��集中于�Q�设计文�?>建立该文法的分析�?>�~?br>码�?

LL分析法是不能处理左递归文法的，例如�Q�expr->expr + term�Q�因为左递归文法会让对应
的分析表里某一��存在多个候选式。这里，又会涉及到消除左递归的方法。这个方法也很简
单，只需要把文法推导式代入如下的公式卛_��Q?

A -> AB | C �{��h于：A -> CX, X -> BX | epsilon

最后一个问题是�Q�如何在LL分析�q�程中徏立抽象语法树呢？虽然�q�里的LL分析法可以检查文
法对应的语言是否合法有效�Q�但是似乎还不能做�Q何有意义的事情。这个问题归�l�于语法�?br>导翻译，一般在�~�译原理教程中语法分析后的章节里�?

LL分析法最大的悲剧在于��一��在人看来清晰直白的语法树分割了。在递归下降分析法中�Q?br>一个树节点所需要的属性（例如��术�q�算�W�所需要的操作敎ͼ�可以直接由其子节点得到。但
是，在�ؓ了消除左递归而改变了的文法式子中�Q�一个节�Ҏ��需要的属性可能跑到其兄弟节点
或者父节点中去了。貌��D��里可以参�?#8220;�l�承属�?#8221;概念�?

不过�Q�综合而言�Q�我们有很多业余的手�D�|��处理�q�种问题�Q�例如徏立属性堆栈。具体来��_��
例如对于例子代码中计��算术表辑ּ��Q�就可以把表辑ּ�中的数放��C��个栈里�?

例子中，通过在文法表辑ּ�中插入动作符��h��标识一个操作。例如对于文法：
expr2->addop term expr2�Q�则可以改�ؓ�Q�expr2->addop term # expr2。当发现分析栈的�?br>��元素是'#'�Ӟ��则在属性堆栈里取出操作数做计算。例子中�q�将操作�W�压入了堆栈�?

下蝲例子�Q�例子代码最好对照arith_expr.txt中写的文法和分析表来看�?

PS�Q�最�q�在云风博客中看��C��l�的一句评�?/a>�Q�我觉得很有道理�Q��ƈ且�g伸开来可以说明我�?br>周围的很多现象：

”很多东西�Q�意识不到问题比找不到解��x��法要严重很多。比如one-pass �q�个�Q�觉得实�?br>�ȝ��不去实现�Q�和觉得实现没有意义不去实现��是不同的�?#8220;

对于以下现象�Q�这句话都可以指明问题：
1、认为造轮子没有意义，从不考虑自己是否能造出�Q?br>2、常告诉别�h某个技术复杂晦涩不利于团队使用�Q�却�q�不懂这个技术；
3、笼�l�来��_��【觉得】太多东西没有意义，虽然�q�不真正懂这个东�ѝ�?

Kevin Lynx 2010-03-15 21:33 发表评论

Kevin Lynx — Sat, 20 Feb 2010 06:53:00 GMT

之所以说�?#8220;��要实�?#8221;一斚w��是因为算法不��高深，��法的实��C��不精��_��甚至�q�我对其的理解也不够本质�?/font>

我只不过不想在工作若�q�年后还是一个只会打字的�E�序员。学点什么东西，真正�_�N��点什么东西才对得起喜��?/font>

技术的自己�?/font>

附�g中的代码�_�略实现了《编译原理》龙书中的几个算法。包括解析正则表辑ּ��Q�徏立NFA�Q�然后用NFA��d��

配目标字�W�串�Q�或者从NFA建立DFA�Q�然后匹配。解析正则表辑ּ�我用了比较繁琐的�Ҏ��Q�有词法和语法分�?/font>

�q�程。词法分析阶�D�将字符和一些操作符整理出来�Q�语法分析阶�D�在建立语法树的�q�程中对应地建立NFA�?/font>

当然�Q�因��法树在这里�ƈ没有用处�Q�所以�ƈ没有真正地徏立�?/font>

从正则表辑ּ�到NFA比较��单，很多�~�译原理书里都提到过�Q�如�Q�s|t表达式对应于下面的NFA:

代码中用如下的结构描�q�状态和状态机中的转换�Q?/p>

#define E_TOK (0)

/* transition */
struct tran
{
    char c;
    struct state *dest;
    struct tran *next;
};

struct state
{
    /* a list of transitions */
    struct tran *trans;
    /* inc when be linked */
    int ref;
};

卻I��每一个状态都有一个�{换列表，每个转换都有一个目标状态（卌��转换指向的状态）以及转换字符�?/p>

貌似通过以上�Ҏ��建立出来的状态机每个状态最多只会有2个�{换？

建立好NFA后，由NFA匚w��目标字符串��用了一�U�构造子集法�Q�《编译原理�?.7.2节）�Q?/p>

�q�个��法里针对NFA的几个操作，如e-closure、move�{�在由NFA转换DFA时也被用刎ͼ�因此代码里单�?/p>

做了��装�Q�state_oper.c�Q�。这个算法本质上貌似��是一�ơ步�q�（step�Q�多个状态�?/p>

至于由NFA转DFA,则是相对��单的子集构造法�Q?/p>

在我以前�~�译原理课考试的前一天晚上（你懂的）我就对这些算法颇为疑惑。在以后看各�U�编�?/p>

原理教材�Ӟ��我始�l�不懂NFA是怎么转到DFA的。就��懂了操作步骤（我大学同学曾告诉我这些步骤，虽然

不知道�ؓ什么要那样做）�Q�一�D�|��间后依然搞忘。很喜欢《编译原理》龙书里对这个算法最本质的说明：

源代码我是用GCC手工�~�译的，�q�makefile也没有。三个test_XXX.c文�g分别��试几个模块。test_match.c

基本依赖除掉test外所有c文�g�Q�全部链接在一块即可。当�Ӟ��q��验而言我知道是没几个�h会去折腾我的�q�些

代码的。这些在china的领导看来对工作有个鸟用的代码读��h��我自�׃��觉得费力�Q�何况，我还不��u不类地用�?/p>

不知道算哪个标准的c写了�q�些�?/p>

你不是真�?a href="http://www.shnenglu.com/Files/kevinlynx/reg_expr_match.zip">下蝲�?/a>对于�q�种代码�Q�有BUG是必然的�Q�你也不用在此文若干个月后问我多��行是什么意思，因�ؓ

那个时候我也忘�?D�?/p>

Kevin Lynx 2010-02-20 14:53 发表评论

kl中的错误处理

Kevin Lynx — Thu, 26 Mar 2009 09:17:00 GMT

kl中的错误处理

之前我一直说错误处理是kl里的软肋�Q�由于一直在��x��一些具体功能的改进�Q�也没有�?br>�q�方面进行改善�?

我这里所说的错误处理�Q�包括语�a�本��n和作为库本��n两方面�?br> 语言本��n指的是对于脚本代码里的各�U�语法错误、运行时错误�{�的处理。好的处理应�?br>不仅仅可以报告错误，而且�q�能忽视错误让处理过�E��l��?br> 而把kl解释器作��Z��个库使用�Ӟ��库本�w�也应该对一些错误情况进行报告�?

整体上，kl��单地通过回调函数指针来把错误信息传给库的应用层。而因为我希望整个
kl实现的几层（词法分析、语法分析、符可��、解释器�{�）可以��可能地独立。例如虽然语
法分析依赖于词法分析�Q�依赖于词法分析提供的接口）�Q�但是因��法分析�ƈ不对语法分析
依赖�Q�所以完全可以把词法分析模块拿出来单独��用。所以，在日志方面，我几乎�ؓ每一�?br>都附加了个error_log函数指针�?br> 而用户层在通过kllib层��用整个库�Ӟ��传入的回调函��C��被间接地传到词法分析层�?br>实际上，当kl作�ؓ一个库�Ӟ��kllib正是用于桥接库本�w�和用户层的bridge�?

另一斚w��Q�语�a�本��n在处理错误的脚本代码�Ӟ��错误分�ؓ几大�c�d��层次�Q?br> 1.词法错误 lex error�Q�如扫描字符串出�?br> 2.语法错误 syntax error�Q�整理语法树时出�?br> 3.�q�行旉��?runtime error�Q�在解释执行代码时出�?br> 4.库错�?lib error�Q�发生在kllib�q�个bridge层的错误
kl在报告错误信息时�Q�会首先附加该错误是什么类型的错误�?

�q�里最�ȝ��的是语法错误的处理。因��法分析时发生错误的可能性最大，错误�c�d��?br>有很多。例如你��写了分��P��写了括��P��都会��D��错误。这个阶�D�发生错误不仅要求能�?br>��报告错误，�q�需要忽略错误让整个�q�程��量正确��C��厅R�?

    语法分析阶段最�Ҏ��的就是符��h��|��单就kl的实现而言�Q�，所谓的�W�号推导是这样一
个过�E�，例如有赋��D��句：a = 1;语法分析�Ӟ��语法分析器希望（所谓的推导�Q�等号后面会
是一个表辑ּ��Q�当分析完了表达式后�Q�又希望接下来的�W�号(token)是分号作��语句的结
束�?br>    所以，klparser.c中的syn_match正是完成�q�个�q�程。每�ơ你传入你希望的�W�号�Q�例�?br>分号�Q�该函数��检查词法分析中当前�W�号(token)是否是分受��当�Ӟ��对于正确的脚本代码，
它是一个分��P��但是如果是错误的代码�Q�syn_match��׃��打印诸如�Q?br>    >>syntax error->unexpected token-> ....
    卛_��前的�W�号是不被期望的�?

    上面完成了错误的��。对于错误的忽略�Q�或者更高��点地寚w��误的校正�Q�kl中处理得
比较��单，卻I��直接消耗掉�q�个不是期望中的�W�号。例如：
    a = 1 /* 忘加了分�?*/
    b = 1;
    上面两句代码被处理时�Q�在处理完a=1后，发现当前的符�?token)b(是一个ID token)�?br>是期�?expect)中的分号�Q�首先报告b不是期望的符��P��然后kl直接掠过b�Q�获取下个符�?�?br>然后处理a=1�q�个�q�程�l�束。当�Ӟ��下次处理其他语句�Ӟ��发现=�W�号�Q�又会��l�发生错误�?

错误信息中比较重要的�q�有行号信息。之前kl�q�方面一直存在BUG�Q�我在写贪食蛇例�?br>的时候每�ơ新加代码都不敢加太多。因��释器报告的错误行��h��L��错误的，我只能靠有没
有错误来��N��误，而不能通过错误信息��N��误�?br> 行号信息被保存在词法分析状态中(lexState:lineno)�Q�语法分析中获取token�Ӟ��会取
出当前的行号�Q�保存到语法树树节点中。因为包括解释模块都是基于树节点的，所以词法分
析语法分析解释器三层都可以准��报告行受��?

    但是之前解释器报告的行号始终很诡异。症�l�在于我在蝲入脚本代码文件时�Q�以rb方式
载入�Q�即二进制�Ş式。于是，在windows下，每行文本��N��会有\r\n两个字符。而在词法�?br>析阶�D�对于行��L��增加是：
    case '\n':
    case '\r':
        ls->lineno ++;
    不同OS对于文本文�g的换行所��d��的字�W�都不一��P��例如windows用\r\n�Q�unix�pȝ��\n
�Q�貌似Mac用\r。所以，词法分析�q�里写应该可以准��地处理行号�?

但是对于windows�Q�这里就直接��行号增加了两次�Q�所以也��导致了行号出错的问题。查
了下文档�Q�发��C��文本方式打开文�g("r")�Q�调用fread函数��d��文�g内容�Ӟ��׃��自动�?br>\r\n替换为\n�?

代码改后�Q�又出问题。这个时候，通过fseek和ftell获取到的文�g��寸�Q�貌似包括了
\r\n�Q�而fread出来的内容却因�ؓ替换\r\n为\n而没有这么多�?br> 不过文�g载入不属于kl库本�w�，kl只接收以字符串�Ş式表�C�的脚本代码�Q�所以也��不�?br>核心问题�?

同样�Q�最��C��码可以从google SVN获取。当�Ӟ��我也在考虑是否换一个新的项目地址�?

Kevin Lynx 2009-03-26 17:17 发表评论

Kevin Lynx — Wed, 25 Mar 2009 13:17:00 GMT

貌似最�q�CPPBLOG写一门脚本语�a�比较��行�Q�连我这�U�山寨程序员都搞��Z��个像C又像
BASIC的所谓脚本语�a��Q�可见其��行�E�度�?/font>

�q�个kl脚本例子�Q�是一个具有基本功能的贪食蛇游戏。这个例子中使用了两个插�Ӟ��
HGE引擎、以及一个撇脚的二维数组插�g。因为kl对于数组的实��C��是那么漂亮，而我实在
不想因�ؓ加入二维数组的支持而让代码看�v来更乱，所以直接不支持�q�个�Ҏ��。考虑��C��l?br>数组的应用在一些小游戏中还是比较重要（例如�q�个贪食蛇，总需要个容器��M��存游戏区�?br>的属性）�Q�所以撇脚地加了个支持number的二�l�数�l�插件�?

HGE插�g我只port了部分接口，也就是注册了一部分函数到脚本里�Q�提供基本的贴图�?br>能。（port--我实在找不到一个合适的词语来�Ş容这�U�行�?--HGE��C��门脚本语�a�里，我似
乎做�q�几�ơ）

不知道有没必要提供贪食蛇的实现算法，�q�似乎说出来有点弱智�? - 不过��Z��方便�?br>人阅读kl脚本代码�Q�我�q�是�E�微讲一下。游戏中使用一个二�l�数�l�保存整个游戏区域，所�?br>的游戏区域就是蛇可以�z�d��到的地方。每一个二�l�数�l�元素对应游戏区域中的一个格子，�?br>且称为tile。每个tile有一个整数��D��C�其属性，如BODY、WALL、FOOD、NONE。蛇体的�U�d��
归根�l�底��是蛇头和蛇��U�d��。蛇头和蛇尾属性一��P��但是蛇头负责把所�l�过的tile讄��
为BODY�Q�而蛇��ֈ�把经�q�的tile讄��为NONE。蛇头的�U�d��方向靠玩家控�Ӟ��每次蛇头转弯�?br>�Q�都会记录一个�{弯点��C��个队列。�{弯点包括转弯XY坐标以及转向的方向。蛇��每�ơ移�?br>旉��会检查是否到达了一个�{弯点�Q�是的话��p��|�自��q��U�d��方向��转弯点记录的方向�?

虽然我写了kl�q�个脚本语言�Q�但是语�a��Ҏ��ƈ不是我设计的。我只是取了C语言的一�?br>�Ҏ��。所以在写这个sample的时候，我对于kl�q�个脚本语言的感觉，��是一个像basic的C�?br>因�ؓ它太单一�Q�就像BASIC一样只拥有语言的一些基本功能，不能定义复杂的结构，没有�?br>生的对各�U�数据结构的支持�Q�例如某些语�a�直接有list, tuple之类�Q��?

以前中学的时候在电子词典上用GVBASIC写小游戏�Q�当旉��了BASIC什么也不知道。今�?br>写这个贪食蛇例子�Q�感觉就像以前用BASIC�?

回头说说一些kl脚本里的�Ҏ��。从�q�个例子里（见下载包里的snake.kl�Q�，诸如while�Q?br>for�Q�if...else if...被支持（之前发布的版本里�q�不支持for和else if�Q�。全局变量支持
赋初��|��上个版本不支持）。当�Ӟ��q�演�C�Z��如何使用插�g函数�?

但是�Q�仍有一些特性在我的懒惰之下被置之不理。例如return后必��跟一个表辑ּ��Q�这
意味着单纯的return;��被视�ؓ语法错误。对于if( a && b )�Q�kl会计��所有的表达式，�?br>别的语言也许会在a会false后不计算b�Q�这也许不算个问题，但�v码我�q�没修正。还有，kl
内部对于错误的报告依然没被修复，��打一个分号你会得��C��p�d��错误的报告，但是却没�?br>准确的行受��甚臻I��你会看到解释器崩掉。不要紧�Q�在我心里，它作为当�q�电子词�怸�那个
GVBASIC而言�Q�已�l�很强大的了�?DD

最�q�接触了很多UNIX和GNU之类的东西，发觉没有提供版权说明�?#8216;开�?#8217;�Q�原来都是伪
开源。虽然我也想按照GNU�~�码标准里所说�ؓkl的发布包里附加Changelog之类的说明，但是
��Z��懒惰�Q�还是以后再说吧。同��P��q�次提供的下载里包含了一些编译好的东西，所以我�?br>保证它在你的机器上依然可以运行。我使用了MingW来编译这些，�q�且提供有点丑陋的Makefile�?br>HGE使用�?.81版本�?br> 贴张囄��懒得下蝲的�h�Q?

下蝲例子�Q�包含脚本代码�?

如果要获取kl实现代码�Q�徏议从我在google的SVN获取�Q?br>http://code.google.com/p/klcommon/

Kevin Lynx 2009-03-25 21:17 发表评论

Kevin Lynx — Thu, 12 Mar 2009 01:35:00 GMT

author: Kevin Lynx email: zmhn320#163.com date: 3.12.2009

脚本与C语言交互

    �q�其实是�q�一�p�d��的最后一��，因�ؓ我觉得没什么其他需要写的了�?br>    一般而言�Q�脚本语�a�同C语言交互�Q�包括在C语言中注册C函数到脚本，从而扩展脚本的
功能�Q�以及在C语言中调用脚本函数�?br>    ��Z��扩展脚本的功能，�q�里引入插�g的概��c��kl在这斚w��大致上实现得和lua�怼�。kl
支持静态插件和动态插件�?br>    在C语言中调用脚本函敎ͼ�kl中提供了一些简单的接口用于满��需求�?

静态插�?/strong>

    静态插件其意思是在C代码中注册函数到脚本中，�q��脚本库一��L��译链接成最�l�执�?br>�E�序。因为其�l�定是在开发一个程序的�q�程中，所以被�U�Cؓ静态的�?br>    一个插件函敎ͼ�指的是可以被注册�q�脚本的C函数。这�U�函数必��d��型一��P��在kl中这
个函数的原型为：typedef struct TValue (*kl_func)( ArgType arg_list );
    当你定义了一个这��L��原型的函数时�Q�可以通过kl库提供的:
    int kl_register( struct klState *kl, kl_func f, const char *name )来注册该
函数到kl脚本中。该函数参数很简单，�W�三个参数指定注册进脚本中时的名字�?

原理比较��单：在解释器中保存着一个插件符可��Q�该�W�号表的�W�号名就是这个函数提
供的名字�Q�符号对应的值就是第二个参数�Q�也��是插�g函数的函数地址�?br> 解释器解释到函数调用�Ӟ��先从插�g�W�号表中查找�Q�如果找到符��P��将�W�号的��D�{�?br>为插件函敎ͼ��q�调用之�?

插�g函数的参数其实是一个参数链表。脚本里调用插�g函数�Ӟ��所传递的参数��被解释
器整理成参数链表�q�传递给插�g函数。kl库中(集中在kllib.h�?提供了一些方便的接口�?br>于获取每个参数�?br> 插�g函数的返回��g��被解释器�{换�ؓ脚本内部识别的格式，�q�在必要的时候参与运��?br>�?

动态插�?/strong>

动态插件同静态插件的�q�作方式相同�Q�所不同的是动态插件的插�g函数被放在动态运�?br>时库里，例如windows下的dll�?br> kl插�g�~�写标准里要求每个动态插件必��L��供一个lib_open函数。kl解释器（或者kl�?br>--当被用作库时�Q�蝲入一个动态插件时�Q�会直接调用lib_open函数。lib_open函数的主要目
的就是把该插件中的所有函数都注册�q�脚本里�?

因�ؓ动态插件在设计之初没有被考虑�Q�所以我�q�没有�ؓkl加入一些原生的关键字用于导
入动态插�Ӟ��例如import、require之类。我在静态插件层�ơ提供了�q�个功能。即我提供了
一个libloader静态插�Ӟ��链接�q�kl解释器程序。该静态插件提供脚本一个名为import的函
数。该函数负责动态蝲入dll之类的动态库�Q��ƈ调用里面的lib_open函数完成动态插件的�?br>册�?

C�E�序里调用脚本函�?/strong>

�q�个比较��单，通常C语言惌��用一个脚本函数时�Q�会传入脚本函数名。因��本函数名
都保存在全局�W�号表里�Q�kl库从全局�W�号表找到该函数�W�号�Q��ƈ转换其��gؓ语法树节�Ҏ��?br>�Q�然后传入解释器模块解释执行�?br> kl库提供struct TValue kl_call( struct klState *kl, const char *name, ArgType args );
用于在C里调用脚本函数�?

代码��D��

kllib.h/kllib.c作�ؓ一个桥接层�Q�用于封装其他模块可以提供给外部模块使用的接口，
如果��kl作�ؓ一个库使用�Q�用户代码大部分时候只需要��用kllib.h中提供出来的接口�?br> 源码目录plugin下的kllibbase.c中提供了静态插件的例子�Q�kllibloader.c提供了装�?br>动态插件的功能�?br> 源码目录plugin/hge目录下是一个封�?D游戏引擎HGE部分接口到kl脚本中的动态插�?br>例子�?br> 源码目录test/kl.c是一个简单的kl解释�E�序�Q�它用于执行一�D�kl代码。这个程序同之前
说的解释器不是同一回事。当我说到解释器�Ӟ��它通常指的是klinterpret.c中实现的解释
模块�Q�而解释器�E�序则指的是一个��用了kl库的独立解释器可执行�E�序�?/font>

Kevin Lynx 2009-03-12 09:35 发表评论

Kevin Lynx — Wed, 11 Mar 2009 01:12:00 GMT

author: Kevin Lynx email: zmhn320#163.com date: 3.11.2009
解释�?/strong>
    整理��法树后，我们��可以根据语法树�Q��ƈ配合�W�号表开始解释执行脚本代码。这��?br>是接下来要涉及到的解释器�?
工作原理
    在第四节中讲语法树时�Q�其实就已经提到解释器的大致工作原理�?br>    一个kl的hello world例子代码大致为：
    function main()
    {
        print( "hello world\n" );
    }
    在第二节中我描述了kl代码整体上的�l�构�Q�是以函��Cؓ单位的。因此，对于一个完整的
kl脚本代码�Q�其�l�过语法处理后，��徏立一��大的语法树�Q�该语法树大致结构�ؓ�Q?br>    fn1_node
        stmt_node1
        stmt_node2
        ...
    fn2_node
        stmt_node1
        stmt_node2
        ...
    fn1_node和fn2_node同属于同一个作用域�Q�fn1_node的sibling指针指向fn2_node�Q�即�?br>整个树结构中�Q�每一个node通过child[3]成员�q�接其子节点�Q�通过sibling指针�q�接其相�?br>的节炏V�?nbsp;
    解释器解释执行时�Q�就是从main函数所对应的节点开始递归执行的。对于每个节点，�?br>可以知道该节点对应了哪种�E�序逻辑�Q�是加法�q�算、比较运��、还是一些控制语句等�{��?br>    以这��L��控制语句举例�Q?br>    if( 1 ) print( "true" );
    对if语句而言�Q�其语法树结构�ؓ�Q?br>          if_node
         /   |    \
        /    |     \
    con_exp    then_stmt else_stmt
    卻I��if语句有最多有三个子节�?child[3])�Q�child[0]指向if的条件表辑ּ��Q�child[1]
指向条�g表达式�ؓ真时执行的语句序列，如果if有else部分�Q�那么child[2]��指向else部分
的语句序列�?br>    那么�Q�在发现某个节点是if节点�Ӟ��首先计��其条�g表达式节炏V��这个节点的计算�?br>式同脚本中其他所有表辑ּ�的计��方式相同，当然�Q�它也是一个递归操作。计��完后判断该
表达式的值是否�ؓ真，为真则递归执行if节点的child[1]节点�Q�否则检查是否有else节点�Q?br>有的话就执行child[2]节点�?
    其他所有节点的解释方式都是相同的�?/font>

解释器环�?/strong>

    解释器环境指的是解释器在解释执行脚本代码�Ӟ��所需要的�q�行时环境。kl中主要是�W?br>可��信息。一个解释器环境会有三个�W�号表：全局�W�号表，主要保存全局变量以及脚本函数
�W�号�Q�函数局部符可��Q�在解释调用一个脚本函数时�Q�会建立临时的符可��Q�插件符可��Q?br>用于保存插�g注册的函数�?
如何解释执行函数
    函数主要有两大类型：脚本内定义的函数以及插�g注册�q�符可��的函数。无论是哪种�?br>敎ͼ�都会在符可��中徏立对应的�W�号。对于前者，�W�号被保存于全局�W�号表，其保存的内容
是该函数节点的节�Ҏ��针；而对于后者，则保存的插�g函数的函数地址倹{�?
    每一�ơ解释器解释��C��个函数调用节�Ҏ��Q�会优先在插件符可��中查找该函数�W�号。如
果找刎ͼ��将其��D�{换�ؓ�U�定的插件函数类型（如同lua里注册的C函数一��P��Q�然后整理参
数调用之。这个时候代码执行权转接到插件函数里。如果没扑ֈ��Q�就在全局�W�号表里查找�Q?br>扑ֈ�后就��{��法树节点指针�Q��ƈ解释执行该节点下的语句�?
代码��D��
    解释器的代码位于klinterpret.h/klinterpret.c中。整体上而言没什么特别的地方�Q?br>主要是利用语法树的特炏V�?br>    完成了这一节后�Q�kl��已�l�可以解释执行所有的脚本语句。当�Ӟ��因�ؓ没有输出功能�Q?br>只能在调试器里看看计��结果。下一节里会讲到将脚本�l�合�q�C语言�Q�从而可以让C语言注册
所谓的插�g函数到脚本里�Q�也��可以让脚本��h��print�q�样的输出函数�?

Kevin Lynx 2009-03-11 09:12 发表评论

Kevin Lynx — Tue, 10 Mar 2009 00:58:00 GMT

author: Kevin Lynx email: zmhn320#163.com date: 3.10.2009
�W�号�?/strong>
    在上一节中�Q�当我们的解释器解释执行age=age+1�q�个语法树时�Q�会涉及到变量age的�?br>。实际上我们�q�需要个保存脚本中相兛_��量的模块�Q�当我们的解释器获取��C��个ID树节�Ҏ��
�Q�需要从�q�个模块中获取出该变量的��|��q�参与运��?br>    �q�个我称之�ؓ�W�号表。我惛_��q�里�Q�我所说的概念很可能和教科书有点不一样了�?
什么是�W�号表？
    �W�号�?symbol table)��如同其字面意思一��P��是一个表�Q�更宽泛地说是一个保存符�?br>的容器�?br>    脚本中诸如变量函��C��cȝ��东西都算作符��P��例如age。符可��是保存�q�些�W�号的容
器�?br>    在kl中，�W�号表保存着某一个作用域里的变量。其全局�W�号表还保存着函数�W�号�Q�对�?br>函数�W�号而言�Q�其��gؓ语法树树节点的指针倹{��当调用一个函数时�Q�将该��D�{换�ؓ树节点，
然后执行。当�Ӟ��q�应该算做解释执行一节的�l�节�Q�不多说�?
    再明��下�W�号表的作用�Q��D例，在上一节中�Q�涉及到�q�么一个例子函敎ͼ�
    value factor( TreeNode *node )
    {
        switch( node->type )
        {
            case ID:
                /* 在这里，发现一个树节点�c�d��为ID�Q�就需要根据ID对应的名字，也就
                 是age�Q�在�W�号表中查找age的�?*/
                return age�Q?nbsp;
        /* ... */
        }
    }
    以上注释阐述了符可��的作用�?
�W�号表的实现
    其实不管�W�号表如何实玎ͼ�对于其他模块而言�Q�对�W�号表的唯一要求��是提供几个�c�M��
�q�样的接口：
    value sym_lookup( const char *name );
    void sym_insert( const char *name, value val );
    也就是说�Q�提供查扄��号��|��以及插入新符��L��接口�?
    在kl中，使用�?lt;�~�译原理与实�?gt;中相同的�W�号表数据结构实现。即使用了hash表，
hash数组中每个元素保存的是一个链表头节点。每一个符号字�W�串通过散列函数得到hash�?br>�l�烦引，然后在该索引里进行一�ơ线性查找。很典型的hash�l�构�?
    另一斚w��Q�因为kl支持全局和函数局部两个作用域。所以kl中有一个全局�W�号表，用于
保存全局变量以及所有的函数�W�号�Q�同时每一�ơ进入一个函数时�Q�就会创��Z��个��时的局�?br>�W�号表，用于存储局部变量；后来�Q��ؓ了支持插�Ӟ��插�g函数被特定地保存在另一个全局�W?br>可��里�?
代码��D��
    kl中的�W�号表实��C��码在klsymtab.h/klsymtab.c中，实现比较��单，无需多言�?

Kevin Lynx 2009-03-10 08:58 发表评论

Kevin Lynx — Mon, 09 Mar 2009 03:12:00 GMT

author: Kevin Lynx email: zmhn320#163.com date: 3.9.2009
语法分析
    语法分析接收词法分析阶段的token集合��入，��这些没有关�pȝ��tokens整理为相�?br>之间有关�pȝ��l�构。书面点的说法叫语法树�?br>    每一�ơ让我写�q�些文绉�l�的概念真让我受不了:D�?
语法�?/strong>
    语法树简单来说就是一个以token作�ؓ每个节点的树型结构。例如我们有表达式age =
age + 1;�Q�在词法阶段它被整理为token集合�Q�age, =, age, +, 1。那么在�l�过语法分析�?br>�Q�这些tokens��被整理为大致如下的树�Ş�l�构�Q?br>        =
      /   \
    age    +
         /   \
       age     1
    整理成这��L��l�构有什么好处？��kl解释器而言�Q�最直接的好处就是我可以递归地解�?br>�q�棵树执行。例如：
    value compute( TreeNode *root )
    {
        /* child[0]保存�l�果值age�Q�child[1]是那�?表达�?*/
        return op_exp( root->child[1] );
    }
    value op_exp( TreeNode *node )
    {
        switch( node->op )
        {
            case '+':
            {
                /* + 表达式必然有左右操作�?*/
                value left = factor( node->child[0] );
                value right = factor( node->child[1] );
                return left + right;
            }
        }
    }
    value factor( TreeNode *node )
    {
        switch( node->type )
        {
            case ID:
                /* 查找age的�?*/
                return age;
            case CONST:
                /* 1 是常�?*/
                return node->cvalue;
        }
    }
    如你所见，当我们完成了语法分析阶段�Q�我们就可以完成我们的解释器了。后面我会单
独讲解下整个解释�q�程�Q�包括每个模块是如何协作的。我不知道其他解释器是怎么做的�Q�但
是我�q�样做，��L��l�果是对的�?
如何整理��法树�Q?/strong>
    �q�里不得不提到所谓的BNF文法�Q�很明显你还是无法从我这里获取编译原理里某个概念
的讲解。我�q�里提这个概念完全是方便我提到这个东�ѝ�?br>    每一�U�语�a�都有其自��q��BNF文法�Q�因��Z��恶的先知告诉我们�Q�每一门语�a�都需要徏�?br>其语法树�? -!
    ��像词法分析一��P��因�ؓ大部分语�a�的结构都差不多，所以我觉得词法分析和语法分�?br>基本上都没有��M��特别之处。也��是��_��别的语言的BNF你可以直接拿来改改用�?br>    抄个BNF如下�Q?br>    exp -> exp adop term | term
    addop -> + | -
    term -> term mulop factor | factor
    mulop -> *
    factor -> (exp) | number
    �q�个BNF用来描述一般的��数表达�?+-*/)。简单来��_��一门语�a�的BNF��是用于描述�?br>语言所有语句的东西�Q�包括if、while、函数定义之�c�R��徏议你google一下C语言的BNF�Q��ƈ
攚w��之用于你自��q��语言�?
    那么有了BNF之后�Q�该如何整理��法树呢？
    通常�Q�我们的代码里都会直接有对应exp、term、addop之类的函数。按照我�q�句话的�?br>思，上面抄的BNF被翻译�ؓ�E�序代码后，��可能�ؓ�Q?br>    exp()
    {
        if( ... ) left = exp()
        right = term();
        left addop right;
    }
    term()
    {
        if( ... ) left = term()
        right = factor();
        left mulop right;
    }
    factor()
    {
        if( ... ) return exp();
        else return number;
    }
    (可能�q�会涉及到EBNF�Q�用于处理重复和选择的一些情�?--不用��这句话)
    每一个函数基本上都会�q�回一个树节点�Q�当�Ӟ��该节点下可能会有很多子节炏V�?nbsp;
�ȝ��
    语法分析基本上就是以上信息。它��词法分析输出的token集合整理成一颗语法树。�ؓ
了整理出�q�棵语法树，你需要找一份用于描�q�C��语言的BNF�Q�然后根据BNF��译成处理代码�?
代码��D��
    kl中的整个语法分析代码位于klparser.c/klparser.h中，其BNF基本上取�?lt;�~�译原理�?br>实践>附录中的C_语言�?/font>

Kevin Lynx 2009-03-09 11:12 发表评论

Kevin Lynx — Sat, 07 Mar 2009 05:43:00 GMT

author: Kevin Lynx email: zmhn320#163.com date: 3.7.2009
词法分析
    词法分析属于整个�~�译��程中的�W�一个阶�D�c��ؓ什么要把编译过�E�分为多个阶�D�，�q�就
如同软�g分层一��P��个�h觉得是出于降低复杂性的考虑�?br>    再次声明我不会告诉你��M��~�译原理的理论知识，因�ؓ坦率地说我也不会:D。所以我�?br>力将我们需要了解的概念��可能简单地告诉你。当�Ӟ��可能会与教科书不��d��?
什么是词法分析?
    词法分析��是把一�D�话整理成单词集合。�D个简单的例子�Q�例如有代码:age = age + 1;�Q?br>�l�过词法分析后，��得刎ͼ�age�?、age�?�?�?几个�W�号。�ؓ了方便，我称每个单词��Z��
个token�?
词法分析的作�?/strong>
    词法分析分析出来的单词集合，直接作�ؓ�~�译��程中接下来的语法分析的输入。那么语
法分析阶�D�面对的��是一个一个的token�Q�而不是单个的字符�?br>    例如�Q�在处理age = age + 1;�q�种语句�Ӟ��当我们获取到token "="�Ӟ��我们直接期望�?br>下来的token应该是个表达式。以单词为单位地处理�Q�比直接处理单个字符��单很多�?
词法分析的过�E?/strong>
    词法分析的输入是单个字符��，一般我们fopen一个源代码文�g�Q�保存在一个char�~�存
里，�q�就是词法分析的输入。而词法分析的最�l�输出结果就是一个一个的token�?br>    ��Z��处理方便�Q�token�q�不是单�U�的单词。通常我们会将源代码中的所有单词分�c�，�?br>如变量名其实都属于一�c�token。简单的token可定义�ؓ�Q?br>    struct Token
    {
        int type;
        char value[256];
    };
    type用于表示token的类型，例如一个变量名token的类型是一个标识符。value可以�?br>来具体地保存�q�个变量的名字�?
    对于type的处理，通常会事先定义一�l�枚丑ր�|��例如�Q?br>    enum    {    ID, NUM, STRING, IF, ELSE, WHILE, RETURN, FUNCTION }�{�等用于标示
在一个源代码中可能出现的所有token�?
    虽然说词法分析的�l�果是一个token集合�Q�但事实上我们�ƈ不是一�ơ做完词法分析。通常
词法分析模块提供一个get_token函数。每�ơ调用该函数�Ӟ��都返回源代码中下一个token�?br>例如�Q�有源代码：age = age + 1;
    �W�一�ơ调用get_token��获�?{ ID, "age" }�Q�第二次获得 { ASSIGN, "=" }�Q�第三次
获得{ ID, "age" }�Q�等�{��?
    那么�Q�词法分析该如何实现�Q�也��是struct Token get_token()函数如何实现�Q�其实很
��单，你告诉我�Q�给你一个字�W�串�Q�你如何判断�q�个字符串全部是数字�Q?br>    int is_num( const char *str )
    {
        while( *str != 0 )
        {
            if( !isdigit( *str++ ) ) return 0;
        }
        return 1;
    }
    所以，基本上，词法分析的过�E�也��是�q�个�q�程。就拿标识符举例�Q�典型的标识�W�一�?br>以字�W�开��_��然后接着是数字或字符或_�Q�当遇到非法字符�Ӟ��q�个标识�W�的扫描即结束�?br>    词法分析一般是个while+switch�Q?br>    struct Token get_token()
    {
        while( current_char != 0 )
        {
            switch( current_char )
            {
                case CHARACTER:
                    /* 扫描一个标识符 token */
                    break;
                case '=':
                    /* 获得一�?ASSIGN token */
                    break;
                    ...
            }
        }
    }
    现在�Q�试着��L�ȝ��一门语�a�里的每一个token的规则，然后自己��d��写看�?
代码��D��
    在本节我��提供kl在googlecode的SVN上的代码�Q�先不要�ȝ��代码包中的其他东�ѝ��关�?br>词法的代码可以在kllex.c kllex.h中找到。lex_token是提供给其他模块的接口，用于获取
当前扫描的token。扫描结果可以通过lexState�l�构体获取�?br>    再次提下版权问题�Q�代码文件以及代码包中我�q�没有加入�Q何版权说明，哪怕是GPL�?br>但是如同我之前说的一��P��我不介意你传播、改动此代码�Q�但是请保留原作者信息。当�Ӟ��
我�ƈ不介意你加上@modified by xxx:)�?
    下蝲kl源代码：http://klcommon.googlecode.com/files/kllan_0.1.0.zip

Kevin Lynx 2009-03-07 13:43 发表评论

Kevin Lynx — Fri, 06 Mar 2009 08:01:00 GMT

author: Kevin Lynx email: zmhn320#163.com date: 3.6.2009
语言�Ҏ�?/strong>
    在正式讨论实现细节前明确下这个脚本语�a�的一些语�a��Ҏ��，基本上可以让我们预见��?br>来会遇到哪些��N��。�ȝ��来说�Q�它�Q�脚本）��同我们�q�x��接触的如lua一��L��脚本语言�Q�拥
有一般的�~�程语言�Ҏ��，如变量、各�U�控制流�E�、也许还有函敎ͼ�另一斚w��它还应该和它�?br>宿主语言�l�合�Q�如作�ؓ一个库被用�q�C�Q�这�q�涉及到�l�这门语�a�设计一�U�插件方式，最好能
通过独立的解释程序让脚本载入一些插件运行�?
    以下在描�q�我写的�q�个脚本语言�Ӟ��以kl表示它的名字�Q�以方便描述�?
代码块：
    首先从整体风��g��Q�kl如同C语言一栯��划分为函数块�Q�如�Q?br>    function func1()
    {
    }
    function func2()
    {
    }
    ...
    kl支持以{}隔离代码块，但是�q��ƈ不意味着kl有多个独立的局部堆栈，如同C语言一栗��?br>�q�些�l�节暂不讨论。本节描�q�的所有内容你都不必深�IӞ��因�ؓ我只要求你对kl有个感性上�?br>认识�?br>    函数块之外没有可执行的语�?statement)。那么你可能会想到程序的入口点也�怼��?br>main。事实上从kl提供的库来看�Q��ƈ没有�q�种��性要求。但是，kl的独立解释程序是�q�样�?br>求的�?nbsp;
变量�Q?/strong>
    kl允许你在��M��地方使用一个变量。变量不需要事先定义，��M��地方出现一个合
法的标识�W�时�Q�就意味着kl内部会增加这个变量，�q�给予初倹{��变量也没有静态类型，也不
会固定�ؓ某一�c�d��。就一门最��单的语言来看�Q�我觉得数据�c�d��无非��是字符串和数字�c�d��
�?br>    所以，kl的变量在某一时刻必然是数字，或者字�W�串。在脚本里，你无法获知一个变�?br>的类型，事实上也没这个必要。说变量拥有一个类型属性，倒不如说�?value)有一�U�类�?br>属性�?br>    当字�W�串��g��数字值参与运��时�Q�如1+"a"�Q�其�q�算�l�果��自动�{换�ؓ字符�Ԍ��也就�?br>"1a"�?br>    一个只有标识符的语�?statement)通常意味着你想定义一个变量。这�U�无聊的手段�?br>常被用于定义全局变量�?
�q�算�W�：
    kl支持一般的C语言风格的算术、比较、逻辑�q�算�W�。例如加减乘除、大于小于、逻辑
与逻辑或�?
作用域：
    kl脚本里只有两个作用域�Q�全局的和局部的�?br>    位于所有函数块外的变量处于全局作用域；位于函数内的变量处于局部作用域�Q�位于函
数块内的代码块变量，�q�是处于局部作用域�?br>    当局部作用域内出��C��个全局里的同名变量�Ӟ��优先取局部作用域里的变量。这同C�?br>�a�一栗��?
控制语句if�Q?br>    if的语法同C语言一��P��如：
    if( a > 10 )
    {
    }
    else
    {
    }
    if( a > 10 )中的a>10被我成�ؓ条�g语句�Q�所有条件语句，包括下面的while�Q�都不能
为字�W�串。例如if( "a" )��被视�ؓ非法语句。（我�ؓ什么要�q�样考虑�Q? -!�Q?
控制语句while:
    c-like while:
    while( a > 10 )
    {
    }
    很遗憾，我暂时没有加入对for的支持。因为我觉得既然有了while�Q�有了��@环控�Ӟ��?br>没有更多无聊旉��的前提下�Q�我没有必要加入for�?
函数�Q?/strong>
    很遗憾，函数的定义和调用和C语言有点不一栗��这是因为kl没有变量�c�d��Q�那��意�?br>着函数定义如果和C语言一��P��׃��出现语法歧义�Q�如�Q?br>    func( a )
    {
    }
    ��׃��和函数调用func(a)出现��h��。所以，我加入了function关键字。定义函数的语法
为：
    function func( a, b )
    {
    }
    如你所见，函数支持参数传递，当然也支持return a;�q�回倹{��kl是简陋的�Q�因为它�?br>有指针之�cȝ��概念�Q�所以你无法为函��C��递一块数据。当�Ӟ��kl也不能像lua一栯��函数�?br>以返回多个倹{�?br>    函数调用的语法相对熟悉：
    func( 1, 3 );
数组�Q?/strong>
    从一开始我��没考虑为kl加入数组。事实证明加入数�l�是一个不明智的做法。数�l�的�?br>持让代码在很多地方变得脏乱。无论如何，kl后来支持一�l�数�l�了。�ؓ了让代码保持那么一
点点的干净�Q�我甚至为定义数�l�加入dim的关键字。这意味着�Q�在kl里，数组和一般的变量
��L��点不一��P��变量无需定义�Q�数�l�却必须事先定义�?br>    数组的长度不支持动态扩充。如果支持，我得让kl内部更好地去��理内存�?br>    数组元素的类型没有硬性的规定�Q�这意味着a[0] = 1; a[1] = "a";是允许的�?
    语言�Ҏ��上��描�q�这些，在本节末��我军_��贴一�D�kl计算阶乘的代码：
/* fac.kl */
function main()
{
    n = input( "%d" );
    print( "fac(" + n + ") = " + fac( n ) );
}
function fac( n )
{
    if( n == 1 )
    {
        return 1;
    }
    else
    {
        return fac( n - 1 ) * n;
    }
}

Kevin Lynx 2009-03-06 16:01 发表评论

Kevin Lynx — Fri, 06 Mar 2009 07:58:00 GMT

author: Kevin Lynx email: zmhn320#163.com date: 3.6.2009
    �Q�相信我�Q�这一节全是废话。）
    我不是标题党�Q�但是有必要解释下这个标题。综合来说我��是想与你分享我所学到的�?br>我会��我实现的这个简单的脚本语言的实现细节展�C�给你。它��涵盖：词法分析、语法分�?br>、符可��理、语法树解释执行、插件管理等内容�?br>    我�ƈ不擅长传授编译原理知识。我没有听过�~�译原理课，所以我也不会编译原理（也许
即��我听了也不会:D�Q�。所以对于这斚w��的能手而言�Q�我口中�?#8216;DFA‘可能会贻�W�大斏V�?br>    昄��Q�CPPBLOG上有�~�译原理上的大牛。如果你惛_��习更深入的知识，可以去请教他们�?br>vczh(http://www.shnenglu.com/vczh/) 看�v来是我所说的�q�个人。在致谢名单里我��真诚地
写上他的名字。他�?#8217;手把手xxx脚本‘�p�d��多多��少�q�是�l�了我一些有用的信息�?br>    其次是FOX�Q�在词法分析的DFA和NFA那里我请教了他一些问题。虽然我现在又忘了。如
你们所知，理论和实��C��间��M��隔着鸿沟�?
    推荐《编译原理与实践�?
Kenneth C. Louden)�q�本书。在你将来阅��L��的脚本语�a�的实��C��码时�Q�你会发现有很一些地
方同�q�本书里的TINY语言实现代码有相��g��处。徏议你阅读TINY的代码�?br>    感谢VIM、GCC、GDB、MingW�Q�我用这些��Y件在工作之余写出了这个东西的几千行C代码�?br>很明显我是个开源文化的爱好者。但是我不会告诉你unix有多么多么好�Q�因为我也是个初�?br>者，我还不懂unix。开源在我看来更是一�U�分享知识的�_��。让�q�种�_��如同GPL一��L��?br>式地传染下去�?br>    �q�有版权问题。但也许它不是个问题。我不会��d��M��版权信息。我允许你�Q意传播�?br>改动我所散播的东西，但是唯一的基本条件是�Q�保留作者的信息---不要告诉别�h�Q�这东西
是你做的�?
    在所有的文章发布后，我都可能会再�ơ修攏V��也讔R��过RSS或者日志日期之�c�M��可以�?br>得修�Ҏ��醒�?

Kevin Lynx 2009-03-06 15:58 发表评论

Kevin Lynx — Wed, 10 Dec 2008 08:22:00 GMT

    开始用FLEX做词法分析，然后在此基础上稍微做些符号匹配（实在�U�C��上语法分析）�Q�即完成了XML
文�g的简单解析�?br>    我把XML文�g拆分成：<, >, />, 分析�E�序。每一�ơgetToken��p��回这些token。上层的语法匚w��变得比较简单。例如当得到"/>"token
�Ӟ��我就可以判断�q�是一个节点的�l�束�Q�当得到ID token�Ӟ��可以推��下一个token�?="�Q�再下一�?br>是个STRING。不�q�对于部分token�Q�也需要做一两个token的回溯，例如当遇�?<"�Ӟ��q�不一定表�C�Z��?br>新节点的开始，它可能是新节点的开始，同样也可能是上一个节点的�l�束("    以我薄弱的编译原理知识来看，解析XML变得非常�Ҏ��。除此之外，�q�需要写一些上层代码来保存
XML�l�构�Q�以斚w��更上层代码获取XML文�g的配�|�信息。因为我打算用纯C来写�q�个东西�Q�所以数据结构方
面只有自己处理。这里我以一�U�变相的树结构来保存�Q�每一个节�Ҏ��两个域：first child, sibling�?br>其实�q�样做是一个很明显的通用做法�Q�因为XML�U�每一个节炚w��可能拥有不定数量的children节点�Q�如�?br>让parent直接��M��存，昄��很笨。例如：




    可以使用�q�样的数据结构来存储�Q?br>    struct xmlNode
    {
        ...
        struct xmlNode *child;
        struct xmlNode *sibling;
    };
    对于Resource�q�个node而言�Q�其child域指向第一个bmp节点(file属性�ؓ1.bmp那个节点)�Q�对于第一
个bmp节点而言�Q�其sibling域则指向了第二个bmp节点�?br>    �q�个��单的xml解析器是在公司外�|�机器上写的�Q�没有VC�Q�没有�Q何IDE。代码我是用VIM敲的�Q�敲�?br>后写makefile�Q�用mingw里的gcc、make来生成程序，用gdb来调试程序。这��是�W�一�ơ离开VC写的一个非
�l�习�E�序(��L��用makefile来组�l�工�E?�? -| makefile写的比较烂，gdb用得很不熟，不过好歹调试出来
了。越来越��x��个��^収ͼ�只可惜工作还是得在windows vc下，很扫兴�?br>    后来发觉词法分析也很��单，用FLEX的时候正则表辑ּ�都写出来了。前�D�|��间一直在看编译原理，虽然�?br>用功。但是就�q�里而言�Q�基本可以直接根据正则表辑ּ��d��DFA。终于不用接触那恶心的从NFA转DFA�?br>�q�程�Q�因为我至今不会�Q�更不会写代码�{�? - 总而言之，自己手写了词法分析。边写边参考编译原�?br>与实践中附带的tiny-c�~�译器的词法分析部分�Q�最�l�发现我抄了一遍。MD�Q�一�Ҏ��术含量都没有�?

附上全部源代码（对于代码我还是比较满意的:D�Q�，下蝲

Kevin Lynx 2008-12-10 16:22 发表评论