另类春色校园亚洲,欧美怡红院视频,久久久久久久久蜜桃

ngaut — Sun, 10 Aug 2008 08:56:00 GMT

摘要: 阅读全文

ngaut 2008-08-10 16:56 发表评论

ngaut — Fri, 08 Aug 2008 09:23:00 GMT

摘要: 阅读全文

ngaut 2008-08-08 17:23 发表评论

最�q�写了个��工��P��自动往代码里面加入垃圾代码

ngaut — Mon, 28 Jul 2008 17:32:00 GMT

摘要: 阅读全文

ngaut 2008-07-29 01:32 发表评论

antlr�W�记

ngaut — Sun, 15 Jun 2008 07:32:00 GMT

请勿��Q何相关的文�g攑֜�中文目录下，如语法文�?*.g

ngaut 2008-06-15 15:32 发表评论

antlr资料

ngaut — Fri, 30 May 2008 10:28:00 GMT

http://www.antlr.org/wiki/display/ANTLR3/Interfacing+AST+with+Java
http://www.cnblogs.com/RicCC/archive/2008/03/17/antlr-notepad.html
http://llf.javaeye.com/blog/157507
http://llf.javaeye.com/blog/156170

http://www.bearcave.com/software/antlr/antlr_examples.html

ngaut 2008-05-30 18:28 发表评论

EBNF Grammar for Mini-Java

ngaut — Mon, 28 Apr 2008 12:25:00 GMT

EBNF Grammar for Mini-Java

Goal	=	MainClass, { ClassDeclaration }, EOF;

MainClass	=	"class", Identifier, "{", "public", "static", "void", "main", "(", "String", "[", "]", Identifier, ")", "{", Statement, "}", "}";

ClassDeclaration	=	"class", Identifier, [ "extends", Identifier ], "{", { VarDeclaration }, { MethodDeclaration } "}";

VarDeclaration	=	Type, Identifier, ";";

MethodDeclaration	=	"public", Type, Identifier, "(", [ Type, Identifier, { ",", Type, Identifier }, ], ")", "{", { VarDeclaration }, { Statement }, "return", Expression, ";", "}";

Type	=	"int", "[", "]"
	\|	"boolean"
	\|	"int"
	\|	Identifier
	;

Statement	=	"{", { Statement }, "}"
	\|	"if", "(", Expression, ")", Statement, "else", Statement
	\|	"while", "(", Expression, ")", Statement
	\|	"System.out.println", "(" , Expression, ")", ";"
	\|	Identifier, "=", Expression, ";"
	\|	Identifier, "[", Expression, "]", "=", Expression, ";"
	;

Expression	=	Expression , ( "&&" \| "<" \| "+" \| "-" \| "*" ) , Expression
	\|	Expression, "[", Expression, "]"
	\|	Expression, ".", "length"
	\|	Expression, ".", Identifier, "(", [ Expression { ",", Expression } ], ")"
	\|	IntegerLiteral
	\|	"true"
	\|	"false"
	\|	Identifier
	\|	"this"
	\|	"new", "int", "[", Expression, "]"
	\|	"new", Identifier ,"(" ,")"
	\|	"!", Expression
	\|	"(", Expression, ")"
	;

Identifier	is	one or more letters, digits, and underscores, starting with a letter
IntegerLiteral	is	one or more decimal digits
EOF	is	a distinguished token returned by the scanner at end-of-file

Comments

Comments are // to end of line and /* ... */, just as in Java. The /* ... */ comments do not nest in Java. For example,

/*
            One commment
            /*  Nested comment */
            Bad things will happen
            */

The second /* will be ignored (it is in a comment), and the first */ will terminate the comment. Now, "bad things will happen" as the remaining text is not a comment.

Appel, 2nd edition, page 484, describes comments in MiniJava as being nestable. This is an interesting exercise for the scanner, but is not required.

EBNF

ISO/IEC 14977: 1996(E)

Terminal symbols are quoted
[ and ] indicate optional symbols
{ and } indicate repetition
( and ) group items together; the other brackets do too

ngaut 2008-04-28 20:25 发表评论

ngaut — Sun, 23 Mar 2008 11:31:00 GMT

ngaut 2008-03-23 19:31 发表评论

inger BNF

ngaut — Sun, 23 Mar 2008 11:30:00 GMT

Subcollections

  SET_TYPES = { "bool", "char", "float", "int", "string" }
  SET_LITERALS = { , , , ,  }
  SET_INSTRUCTIONS = { "label", "break", "continue", "if", "goto", "while", "do", "switch", "return", ";" }
  SET_UNARIES = { "&", "*", "~", "+", "-", "!" }

module

    module:               "module"  ";" globals.

globals

    globals:              e.
    globals:              global globals.
    globals:              "extern" global globals.

global

    global:               function.
    global:               declaration.

function

    function:             functionheader functionrest.

functionheader

    functionheader:       modifiers  ":" paramlist "->" returntype.

functionrest

    functionrest:         ";".
    functionrest:         block.

modifiers:

    modifiers:            e.
    modifiers:            "start".

paramlist

    paramlist:            "void".
    paramlist:            paramblock moreparamblocks.

moreparamblocks

    moreparamblocks:      e.
    moreparamblocks:      ";" paramblock moreparamblocks.

paramblock

    paramblock:           type param moreparams.

moreparams

    moreparams:           e.
    moreparams:           "," param moreparams.

param

    param:                reference  dimensionblock.

returntype

    returntype:           type reference dimensionblock.

reference

    reference:            e.
    reference:            "*" reference.

dimensionblock

    dimensionblock:       e.
    dimensionblock:       "[" "]" dimensionblock.

block

    block:                "{" code "}".

code

    code:                 e.
    code:                 block code
    code:                 statement code.

statement

    statement:            "label"  ";"
    statement:            ";"
    statement:            "break" ";"
    statement:            "continue" ";"
    statement:            expression ";"
    statement:            declarationblock ";"
    statement:            "if" "(" expression ")" block elseblock
    statement:            "goto"  ";"
    statement:            "while" "(" expression ")" "do" block
    statement:            "do" block "while" "(" expression ")" ";"
    statement:            "switch" "(" expression ")" "{" switchcases "default" block "}"
    statement:            "return" returnarg ";".

returnarg

    returnarg:            "(" expression ")".
    returnarg:            e.

elseblock

    elseblock:            e.
    elseblock:            "else" block.

switchcases

    switchcases:          e.
    switchcases:          "case"  block swithcases.

declarationblock

    declarationblock:     type declaration restdeclarations.

restdeclarations

    restlocals:           e.
    restlocals:           "," declaration restdeclarations.

declaration

    local:                reference  indexblock initializer.

indexblock

    indexblock:           e.
    indexblock:           "["  "]" indexblock.

initializer

    initializer:          e.
    initializer:          "=" expression.

expression

    expression:           logicalor restexpression.

restexpression

    restexpression:       e.
    restexpression:       "=" logicalor restexpression.

logicalor

    logicalor:            logicaland restlogicalor.

restlogicalor

    restlogicalor:        e.
    restlogicalor:        "||" logicaland restlogicalor.

logicaland

    logicaland:           bitwiseor restlogicaland.

restlogicaland

    restlogicaland:       e.
    restlogicaland:       "&&" bitwiseor restlogicaland.

bitwiseor

    bitwiseor:            bitwisexor restbitwiseor.

restbitwiseor

    restbitwiseor:        e.
    restbitwiseor:        "|" bitwisexor restbitwiseor.

bitwisexor

    bitwisexor:           bitwiseand restbitwisexor.

restbitwisexor

    restbitwisexor:       e.
    restbitwisexor:       "^" bitwiseand restbitwisexor.

bitwiseand

    bitwiseand:           equality restbitwiseand.

restbitwiseand

    restbitwiseand:       e.
    restbitwiseand:       "&" equality restbitwiseand.

equality

    equality:             relation restequality.

restequality

    restequality:         e.
    restequality:         equalityoperator relation restequality.

equalityoperator

    equalityoperator:     "==".
    equalityoperator:     "!=".

relation

    relation:             shift restrelation.

restrelation

    restrelation:         e.
    restrelation:         relationoperator shift restrelation.

relationoperator

    relationoperator:     "<".
    relationoperator:     "<=".
    relationoperator:     ">".
    relationoperator:     ">=".

shift

    shift:                addition restshift.

restshift

    restshift:            e.
    restshift:            shiftoperator addition restshift.

shiftoperator

    shiftoperator:        "<<".
    shiftoperator:        ">>".

addition

    addition:             multiplication restaddition.

restaddition

    restaddition:         e.
    restaddition:         additionoperator multiplication restaddition.

additionoperator

    additionoperator:     "+".
    additionoperator:     "-".

multiplication

    multiplication:       unary3 restmultiplication.

restmultiplication

    restmultiplication:   e.
    restmultiplication:   multiplicationoperator unary3 restmultiplication.

multiplicationoperator

    multiplicationoperator: "*".
    multiplicationoperator: "/".
    multiplicationoperator: "%".

unary3

    unary3:               unary2
    unary3:               unary3operator unary3.

unary3operator:

    unary3operator:       "&".
    unary3operator:       "*".
    unary3operator:       "~".

unary2

    unary2:               factor.
    unary2:               unary2operator unary2.

unary2operator

    unary2operator:       "+".
    unary2operator:       "-".
    unary2operator:       "!".

factor

    factor:                application.
    factor:               immediate.
    factor:               "(" expression ")".

application

    application:          e.
    application:          "[" expression "]" application.
    application:          "(" expression moreexpressions ")".

moreexpressions

    moreexpressions:      e.
    moreexpressions:      "," expression morexpressions.

type

    type:                 "bool".
    type:                 "char".
    type:                 "float".
    type:                 "int".
    type:                 "string".

immediate

    immediate:            .
    immediate:            .
    immediate:            .
    immediate:            .
    immediate:            .

ngaut 2008-03-23 19:30 发表评论

inger EBNF

ngaut — Sun, 23 Mar 2008 11:04:00 GMT

Modules

module

    module:               "module"  ";" {[extern] global}.

global

    global:               function | declaration.

Functions

function

    function:             functionheader [ ";" | block ].

functionheader

    functionheader:       ["start"]  ":" paramlist "->" returntype.

paramlist

    paramlist:            "void" | paramblock {";" paramblock}.

paramblock

    paramblock:           type param {"," param}.

param

    param:                {"*"}  {"[" "]"}.

returntype

    returntype:           type {"*"} {"[" "]"}.

Blocks and statements

block

    block:                "{" { statement | block } "}".

statement

    statement:            "label"  ";"
    statement:            ";"
    statement:            "break" ";"
    statement:            "continue" ";"
    statement:            expression ";"
    statement:            declarationblock ";"
    statement:            "if" "(" expression ")" block [ "else" block ].
    statement:            "goto"  ";"
    statement:            "while" "(" expression ")" "do" block
    statement:            "do" block "while" "(" expression ")" ";"
    statement:            "switch" "(" expression ")" "{" { "case"  block } "default" block "}"
    statement:            "return" "(" expression ")"

 ";".

declarationblock

    declarationblock:     type declaration {"," declaration}.

declaration

    local:                {"*"}  {"["  "]"} [ "=" expression ].

Expressions

Assignment

    expression:           logicalor {"=" logicalor expression}.

Logical OR

    logicalor:            logicaland {"||" logicaland logicalor}.

Logical AND

    logicaland:           bitwiseor {"&&" bitwiseor logicaland}.

Bitwise OR

    bitwiseor:            bitwisexor {"|" bitwisexor bitwiseor}.

Bitwise XOR

    bitwisexor:           bitwiseand {"^" bitwiseand bitwisexor}.

Bitwise AND

    bitwiseand:           equality {"&" equality bitwiseand}.

Equality

    equality:             relation {("==" | "!=") relation equality}.

Relation

    relation:             shift {("<" | "<=" | ">" | ">=") shift relation}.

Bitwise shift

    shift:                addition {("<<" | ">>") addition shift}.

Addition/subtraction

    addition:             multiplication {("+" | "-") multiplication addition}

Multiplication/division

    multiplication:       unary3 {("*" | "/" | "%") unary3 multiplication}.

Unary operations

Reference, indirection and bitwise complement

    unary3:               {("&" | "*" | "~")} unary2.

Unary negation, unary plus and logical NOT

    unary2:               {("+" | "-" | "!")} factor.

Factor and application

factor

    factor:                [application] | immediate | "(" expression ")".

application

    application:          "[" expression "]" application | "(" expression {"," expression } ")".

Types and immediates

type

    type:                 "bool" | "char" | "float" | "int" | "string".

immediate

    immediate:             |  |  |  | .

ngaut 2008-03-23 19:04 发表评论

ngaut — Sat, 05 Jan 2008 14:01:00 GMT

         preprocessorFilename = (char *) malloc( strlen( argv[optind] ) + 3 );
        strcpy( preprocessorFilename, argv[optind] );
        strcat( preprocessorFilename, "_p" );

        /* Call the preprocessor. It will store its result in
         * preprocessorFilename. If the preprocessor could not
         * open the input file, skip this file.
         * 建立一个新文�g�Q�文件名为原来的.i文�g加上.p,如果输入�?br>            文�g名是while.i,则生成的�l�过预处理的文�g名�ؓwhile.i_p�Q?br>            �q�里说的预处理和c语言是一��L��Q�即��相应的头文件拷贝过来，
            �?import "printint.ih"�Q�则��?import "printint.ih"替换�?br>            printint.ih文�g的内�?br>         */
        result = Preprocess( argv[optind], preprocessorFilename );

ngaut 2008-01-05 22:01 发表评论

inger源码�W�记杂�ؕ

ngaut — Thu, 03 Jan 2008 15:14:00 GMT

先记在这里，有时间再来仔�l�整理：

词法分析�Q?br>关键字定�?

/* This enum contains all the keywords and operators
* used in the language.
*/
enum
{
    /* Keywords */
    KW_BREAK            = 1000, /* "break" keyword */
    KW_CASE,                    /* "case" keyword */
    KW_CONTINUE,                /* "continue" keyword */
    KW_DEFAULT,                 /* "default" keyword */
    KW_DO,                      /* "do" keyword */
    KW_ELSE,                    /* "else" keyword */
    KW_EXTERN,                  /* "extern" keyword */
    KW_GOTO,                    /* "goto" keyword */
    KW_IF,                      /* "if" keyword */
    KW_LABEL,                   /* "label" keyword */
    KW_MODULE,                  /* "module" keyword */
    KW_RETURN,                  /* "return"keyword */
    KW_START,                   /* "start" keyword */
    KW_SWITCH,                  /* "switch" keyword */
    KW_WHILE,                   /* "while" keyword */

    /* Type identifiers */
    KW_BOOL,                    /* "bool" identifier */
    KW_CHAR,                    /* "char" identifier */
    KW_FLOAT,                   /* "float" identifier */
    KW_INT,                     /* "int" identifier */
    KW_UNTYPED,                 /* "untyped" identifier */
    KW_VOID,                    /* "void" identifier */

    /* Variable lexer tokens */
    LIT_BOOL,                   /* bool constant */
    LIT_CHAR,                   /* character constant */
    LIT_FLOAT,                  /* floating point constant */
    LIT_INT,                    /* integer constant */
    LIT_STRING,                 /* string constant */
    IDENTIFIER,                 /* identifier */

    /* Operators */
    OP_ADD,                     /* "+" */
    OP_ASSIGN,                  /* "=" */
    OP_BITWISE_AND,             /* "&" */
    OP_BITWISE_COMPLEMENT,      /* "~" */
    OP_BITWISE_LSHIFT,          /* "<<" */
    OP_BITWISE_OR,              /* "|" */
    OP_BITWISE_RSHIFT,          /* ">>" */
    OP_BITWISE_XOR,             /* "^" */
    OP_DIVIDE,                  /* "/" */
    OP_EQUAL,                   /* "==" */
    OP_GREATER,                 /* ">" */
    OP_GREATEREQUAL,            /* ">=" */
    OP_LESS,                    /* "<" */
    OP_LESSEQUAL,               /* "<=" */
    OP_LOGICAL_AND,             /* "&&" */
    OP_LOGICAL_OR,              /* "||" */
    OP_MODULUS,                 /* "%" */
    OP_MULTIPLY,                /* "*" */
    OP_NOT,                     /* "!" */
    OP_NOTEQUAL,                /* "!=" */
    OP_SUBTRACT,                /* "-" */
    OP_TERNARY_IF,              /* "?" */

    /* Delimiters */
    ARROW,                      /* "->" */
    LBRACE,                     /* "{" */
    RBRACE,                     /* "}" */
    LBRACKET,                   /* "[" */
    RBRACKET,                   /* "]" */
    COLON,                      /* ":" */
    COMMA,                      /* "," */
    LPAREN,                     /* "(" */
    RPAREN,                     /* ")" */
    SEMICOLON                   /* ";" */
}
tokens;

处理inger中的各种数据�c�d��和标识符�Q�如BOOL, unsigned long, float, char*,标识�W�等
typedef union
{
    unsigned long uintvalue;
    BOOL    boolvalue;
    char   *stringvalue;
    char    charvalue;
    float   floatvalue;
    char   *identifier;
} Tokenvalue;

树节点结�?注意�Q�树节点和抽象语法树节点是不同的)�Q?br>typedef struct TreeNode
{
    void            *data;
    int              screenX;
    struct TreeNode *parent;
    List            *children; //一�p�d��孩子
} TreeNode;

抽象语法树节点结构：
typedef struct AstNode
{
    int         id;  //表示节点的类型，如while节点�Q�module节点
    Tokenvalue val;
    Type       *type;
    int         lineno;
} AstNode;

抽象语法树的AstNode作�ؓTreeNode的data成员保存�Q�参考如下函敎ͼ�
//参数id表示节点名，如：NODE_MODULE,NODE_GLOBAL�{�见nodenames.h
TreeNode *CreateAstNode( int id, int lineno )
{
TreeNode *treeNode;
AstNode *astNode;

    astNode = (AstNode *) MallocEx( sizeof( AstNode ) );
    astNode->id = id;
    astNode->lineno = lineno;
    astNode->val.uintvalue = 0;
    astNode->type = NULL;
    treeNode = CreateTreeNode( astNode );

    return( treeNode );
}
或者：
TreeNode *CreateAstNodeVal( int id, Tokenvalue val, int lineno )
{
    TreeNode *treeNode;
    AstNode *astNode;

    astNode = (AstNode *) MallocEx( sizeof( AstNode ) );
    astNode->id = id;
    astNode->lineno = lineno;
    astNode->val = val;
    astNode->type = NULL;
    treeNode = CreateTreeNode( astNode );

return( treeNode );
}

//抽象语法树节点名
enum NodeNames
{
    NODE_MODULE = 0,
    NODE_START,
    NODE_EXTERN,
    NODE_GLOBAL,
    NODE_FUNCTION,
    NODE_FUNCTIONHEADER,
    NODE_MODIFIERS,
    NODE_PARAMLIST,
    NODE_PARAMBLOCK,
    NODE_PARAM,
    NODE_RETURNTYPE,
    NODE_DIMENSION,
    NODE_DIMENSIONBLOCK,
    NODE_BLOCK,
    NODE_STATEMENT,
    NODE_SWITCH,
    NODE_CASES,
    NODE_CASE,
    NODE_WHILE,
    NODE_GOTO,
    NODE_LABEL,
    NODE_IF,
    NODE_IDENT,
    NODE_RETURN,
    NODE_CONTINUE,
    NODE_BREAK,
    NODE_DECLBLOCK,
    NODE_DECLARATION,
    NODE_INITIALIZER,
    NODE_INDEXBLOCK,
    NODE_REFERENCE,
    NODE_INDEX,
    NODE_EXPRESSION,
    NODE_LOGICAL_OR,
    NODE_LOGICAL_AND,
    NODE_BITWISE_OR,
    NODE_BITWISE_XOR,
    NODE_BITWISE_AND,
    NODE_EQUAL,
    NODE_NOTEQUAL,
    NODE_GREATER,
    NODE_GREATEREQUAL,
    NODE_LESS,
    NODE_LESSEQUAL,
    NODE_BITWISE_LSHIFT,
    NODE_BITWISE_RSHIFT,
    NODE_ASSIGN,
    NODE_BINARY_ADD,
    NODE_BINARY_SUBTRACT,
    NODE_UNARY_ADD,
    NODE_UNARY_SUBTRACT,
    NODE_MULTIPLY,
    NODE_DIVIDE,
    NODE_MODULUS,
    NODE_BITWISE_COMPLEMENT,
    NODE_ADDRESS,
    NODE_DEREFERENCE,
    NODE_NOT,
    NODE_APPLICATION,
    NODE_INDEXER,
    NODE_ARGUMENTS,
    NODE_FACTOR,

    NODE_BOOL,
    NODE_CHAR,
    NODE_FLOAT,
    NODE_INT,
    NODE_UNTYPED,
    NODE_VOID,

    NODE_LIT_BOOL,
    NODE_LIT_CHAR,
    NODE_LIT_FLOAT,
    NODE_LIT_INT,
    NODE_LIT_STRING,
    NODE_LIT_IDENTIFIER,

    NODE_INT_TO_FLOAT,
    NODE_CHAR_TO_INT,
    NODE_CHAR_TO_FLOAT,

NODE_UNKNOWN = -1
};

输出抽象语法树：
/*
* PRINTING ROUTINES
*/
void PrintAst( TreeNode *source )
{
    PrintTree( source, GetAstNodeData, 4 );
}
PrintTree的实现如下，�q�里传递的参数levels�{�于4
void PrintTree( TreeNode *source, DataFunction dataFunction, int levels )
{
    int printDepth = 0;
    BOOL loop;
    char *str;
    int i;

    /* TODO: We're going to have to make a new macro.
     * Don't use DEBUG for this.
     */
    DEBUG( "Called\n" );

    /* If tree is empty, abort. */
    if( source == NULL )
    {
        return;
    }

    /* Walk through tree to determine x-offsets for
     * each node.
     */
    LayoutTree( source, LEFT_OFFSET );

/* Print nodes. */
依次通过调用函数指针dataFunction所指向的函�?实际上是函数GetAstNodeData)
来输出每个节点的节点名，节点的token的��|��c�d��名，以及行号�Q�参考下面的GetAstNodeData函数

    for( i = 0; i < levels; i++ )
    {
        str = dataFunction( source, i );
        PrintChars( source->screenX - strlen( str ) / 2, ' ' );
        printf( "%s\n", str );
    }
    PrintChars( source->screenX, ' ' );
    printf( "%c", VERTBAR );

    printDepth = 0;
    do
    {
        currentX = 0;
        printf("\n");
        PrintNode( source, 0, printDepth, 0, dataFunction, 0 );
        currentX = 0;
        printf("\n");
        PrintNode( source, 0, printDepth, 1, dataFunction, 0 );
        currentX = 0;
        printf("\n");
        for( i = 0; i < levels; i++ )
        {
            PrintNode( source, 0, printDepth, 2, dataFunction, i );
            currentX = 0;
            printf("\n");
        }
        loop = PrintNode( source, 0, printDepth, 3, dataFunction, 0 );
        printDepth++;
    }
    while( loop );
}

��d��一个孩子的操作只需要将新节�Ҏ��入到孩子链表��N��卛_��
void AddTreeChild( TreeNode *parentnode, TreeNode *node )
{
/* Do not act on an empty node. */
if( node == NULL ) return;

    /* If the tree is empty, add the first root node. */
    if( parentnode == NULL )
    {
       node->parent = NULL;
    }
    else
    /* Tree is not empty. Add the new node to [parentnode]'s
     * children list. */
    {
       node->parent = parentnode;

ListAppend( parentnode->children, node );
}
}

而RemoveAstNode则删除整个子�?br>/* Remove node [node] from ast. The node contents
* and its children get deleted.
*
* Pre: [node] is not NULL.
*/
void RemoveAstNode( TreeNode *node );

inger�~�译��程�Q?br>1. 预处理，关键函数为Preprocess
2. 语法分析�Q�构建抽象语法树�Q�关键函数Parse�Q�Parse也是构造抽象语法树的入口函敎ͼ�如果语法分析没有发现错误则蟩到第3�?br>3. �Ҏ��抽象语法树来建立�W�号表关键函��CؓCreateSymbolTable( ast );
4. 语义分析�Q�关键函敎ͼ�
a) CheckLeftValues( ast );
b) CheckArgCount( ast );
c) CheckSwitchStatements( ast );
d) CheckFunctionReturns( ast );

5. �Ҏ��抽象语法树生成代码，关键函数GenerateCode( ast );

ngaut 2008-01-03 23:14 发表评论

一个简单的递归下降分析表达式的例子

ngaut — Tue, 25 Dec 2007 11:36:00 GMT

摘要: 好友学习递归时无法理解用递归下降的方式分析表辑ּ��Q�所以写了个��单的例子�Q��ؓ了��代码��可能简单，省略了此法分析模块，直接使用��分析的词法^_^�׃��好友不懂c++�Q�所以这里虽然用的c++�Q�但�q�是按照c的方式写的代码�?#include #include #include usi... 阅读全文

ngaut 2007-12-25 19:36 发表评论

常用的正则表辑ּ�(�?

ngaut — Tue, 13 Mar 2007 04:54:00 GMT

常用的正则表辑ּ�(�?

" ^\d+$ " 　　 // 非负整数�Q�正整数 + 0�Q��?/span>
" ^[0-9]*[1-9][0-9]*$ " 　　 // 正整敊W?/span>
" ^((-\d+)|(0+))$ " 　　 // 非正整数�Q�负整数 + 0�Q��?/span>
" ^-[0-9]*[1-9][0-9]*$ " 　　 // 负整敊W?/span>
" ^-?\d+$ " 　　　　 // 整数
" ^\d+(\.\d+)?$ " 　　 // 非负��点敎ͼ�正��Q�Ҏ�� + 0�Q��?/span>
" ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$ " 　　 // 正��Q�Ҏ��
" ^((-\d+(\.\d+)?)|(0+(\.0+)?))$ " 　　 // 非正��点敎ͼ�负��Q�Ҏ�� + 0�Q��?/span>
" ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$ " 　　 // 负��Q�Ҏ��
" ^(-?\d+)(\.\d+)?$ " 　　 // ��点敊W?/span>
" ^[A-Za-z]+$ " 　　 // �?6个英文字母组成的字符串�?/span>
" ^[A-Z]+$ " 　　 // �?6个英文字母的大写�l�成的字�W�串
" ^[a-z]+$ " 　　 // �?6个英文字母的��写�l�成的字�W�串
" ^[A-Za-z0-9]+$ " 　　 // 由数字和26个英文字母组成的字符串�?/span>
" ^\w+$ " 　　 // 由数字�?6个英文字母或者下划线�l�成的字�W�串
" ^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$ " 　　　　 // email地址
" ^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$ " 　　 // url
/^ (d { 2 } | d { 4 } ) - (( 0 ([ 1 - 9 ] { 1 } )) | ( 1 [ 1 | 2 ])) - (([ 0 - 2 ]([ 1 - 9 ] { 1 } )) | ( 3 [ 0 | 1 ]))$ /     //   �q?�?�?/span>
/^ (( 0 ([ 1 - 9 ] { 1 } )) | ( 1 [ 1 | 2 ])) / (([ 0 - 2 ]([ 1 - 9 ] { 1 } )) | ( 3 [ 0 | 1 ])) / (d { 2 } | d { 4 } )$ /     // �?�?�q?/span>
" ^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$ "     // Emil
" (d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)? "       // 电话��L��
" ^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$ "     // IP地址

匚w��中文字符的正则表辑ּ��Q?[\u4e00-\u9fa5]
匚w��双字节字�W?包括汉字在内)�Q�[^\x00-\xff]
匚w��I��的正则表辑ּ��Q�\n[\s| ]*\r
匚w��HTML标记的正则表辑ּ��Q?<(.*)>.*<\/\1>|<(.*) \/>/
匚w��首尾�I�格的正则表辑ּ��Q?^\s*)|(\s*$)
匚w��Email地址的正则表辑ּ��Q�\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匚w��|�址URL的正则表辑ּ��Q�^[a-zA-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)?$
匚w��帐号是否合法(字母开��_��允许5-16字节�Q�允许字母数字下划线)�Q�^[a-zA-Z][a-zA-Z0-9_]{4,15}$
匚w��国内电话��L��Q?\d{3}-|\d{4}-)?(\d{8}|\d{7})?
匚w��腾讯QQ��P��^[1-9]*[1-9][0-9]*$

下表是元字符及其在正则表辑ּ�上下文中的行为的一个完整列表：

\ ��下一个字�W�标��Cؓ一个特�D�字�W�、或一个原义字�W�、或一个后向引用、或一个八�q�制转义�W��?br />
^ 匚w��输入字符串的开始位�|�。如果设�|�了 RegExp 对象的Multiline 属性，^ 也匹�?’\n�?�?’\r�?之后的位�|��?

$ 匚w��输入字符串的�l�束位置。如果设�|�了 RegExp 对象的Multiline 属性，$ 也匹�?’\n�?�?’\r�?之前的位�|��?

* 匚w��前面的子表达式零�ơ或多次�?

+ 匚w��前面的子表达式一�ơ或多次�? �{��h�?{1,}�?

? 匚w��前面的子表达式零�ơ或一�ơ�? �{��h�?{0,1}�?

{n} n 是一个非负整敎ͼ�匚w��定的n �ơ�?br />
{n,} n 是一个非负整敎ͼ�臛_��匚w��n �ơ�?

{n,m} m �?n 均�ؓ非负整数�Q�其中n <= m。最��匹�?n �ơ且最多匹�?m �ơ。在逗号和两个数之间不能有空根{�?br />
? 当该字符紧跟在�Q何一个其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面�Ӟ��匚w��模式是非贪婪的。非贪婪模式��可能少的匹配所搜烦的字�W�串�Q�而默认的贪婪模式则尽可能多的匚w��所搜烦的字�W�串�?

. 匚w��?"\n" 之外的�Q何单个字�W�。要匚w��包括 ’\n�?在内的�Q何字�W�，请��用象 ’[.\n]�?的模式�?
(pattern) 匚w��pattern �q�获取这一匚w��?

(?:pattern) 匚w��pattern 但不获取匚w��l�果�Q�也��是说这是一个非获取匚w��Q�不�q�行存储供以后��用�?

(?=pattern) 正向预查�Q�在��M��匚w�� pattern 的字�W�串开始处匚w��查找字符丌Ӏ�这是一个非获取匚w��Q�也��是��_��该匹配不需要获取供以后使用�?

(?!pattern) 负向预查�Q�与(?=pattern)作用相反

x|y 匚w�� x �?y�?

[xyz] 字符集合�?

[^xyz] 负值字�W�集合�?

[a-z] 字符范围�Q�匹配指定范围内的�Q意字�W��?

[^a-z] 负值字�W�范��_��匚w��M��不在指定范围内的��L��字符�?

\b 匚w��一个单词边界，也就是指单词和空格间的位�|��?br />
\B 匚w��非单词边界�?

\cx 匚w��由x指明的控制字�W��?

\d 匚w��一个数字字�W�。等价于 [0-9]�?

\D 匚w��一个非数字字符。等价于 [^0-9]�?

\f 匚w��一个换��늬�。等价于 \x0c �?\cL�?

\n 匚w��一个换行符。等价于 \x0a �?\cJ�?

\r 匚w��一个回车符。等价于 \x0d �?\cM�?

\s 匚w��M��I�白字符�Q�包括空根{��制表符、换��늬��{�等。等价于[ \f\n\r\t\v]�?

\S 匚w��M��非空白字�W�。等价于 [^ \f\n\r\t\v]�?

\t 匚w��一个制表符。等价于 \x09 �?\cI�?

\v 匚w��一个垂直制表符。等价于 \x0b �?\cK�?

\w 匚w��包括下划�U�的��M��单词字符。等价于’[A-Za-z0-9_]’�?

\W 匚w��M��非单词字�W�。等价于 ’[^A-Za-z0-9_]’�?

\xn 匚w�� n�Q�其�?n 为十六进制�{义倹{��十六进制�{义值必��Mؓ��定的两个数字长�?br />
\num 匚w�� num�Q�其中num是一个正整数。对所获取的匹配的引用�?

\n 标识一个八�q�制转义值或一个后向引用。如�?\n 之前臛_�� n 个获取的子表辑ּ��Q�则 n 为后向引用。否则，如果 n 为八�q�制数字 (0-7)�Q�则 n ��Z��个八�q�制转义倹{�?

\nm 标识一个八�q�制转义值或一个后向引用。如�?\nm 之前臛_��有is preceded by at least nm 个获取得子表辑ּ��Q�则 nm 为后向引用。如�?\nm 之前臛_��?n 个获取，�?n ��Z��个后跟文�?m 的后向引用。如果前面的条�g都不满��Q�若 n �?m 均�ؓ八进制数�?(0-7)�Q�则 \nm ��匹配八�q�制转义�?nm�?

\nml 如果 n 为八�q�制数字 (0-3)�Q�且 m �?l 均�ؓ八进制数�?(0-7)�Q�则匚w��八进制�{义�?nml�?

\un 匚w�� n�Q�其�?n 是一个用四个十六�q�制数字表示的Unicode字符�?

匚w��中文字符的正则表辑ּ��Q?[u4e00-u9fa5]

匚w��双字节字�W?包括汉字在内)�Q�[^x00-xff]

应用�Q�计��字�W�串的长度（一个双字节字符长度�?�Q�ASCII字符�?�Q?/p>

String.prototype.len=function(){return this.replace([^x00-xff]/g,"aa").length;}

匚w��I��的正则表辑ּ��Q�n[s| ]*r

匚w��HTML标记的正则表辑ּ��Q?<(.*)>.*|<(.*) />/

匚w��首尾�I�格的正则表辑ּ��Q?^s*)|(s*$)

应用�Q�javascript中没有像vbscript那样的trim函数�Q�我们就可以利用�q�个表达式来实现�Q�如下：

String.prototype.trim = function()
{
return this.replace(/(^s*)|(s*$)/g, "");
}

利用正则表达式分解和转换IP地址�Q?/p>

下面是利用正则表辑ּ�匚w��IP地址�Q��ƈ��IP地址转换成对应数值的Javascript�E�序�Q?/p>

function IP2V(ip)
{
re=/(d+).(d+).(d+).(d+)/g //匚w��IP地址的正则表辑ּ�
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error("Not a valid IP address!")
}
}

不过上面的程序如果不用正则表辑ּ��Q�而直接用split函数来分解可能更��单，�E�序如下�Q?/p>

var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是�Q?+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))

匚w��Email地址的正则表辑ּ��Q�w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

匚w��|�址URL的正则表辑ּ��Q�http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?

利用正则表达式去除字串中重复的字�W�的��法�E�序�Q?/p>

var s="abacabefgeeii"
var s1=s.replace(/(.).*1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //�l�果为：abcefgi

我原来在CSDN上发贴寻求一个表辑ּ�来实现去除重复字�W�的�Ҏ��Q�最�l�没有找刎ͼ��q�是我能惛_��的最��单的实现�Ҏ��。思�\是��用后向引用取出包括重复的字符�Q�再以重复的字符建立�W�二个表辑ּ��Q�取��C��重复的字�W�，两者串�q�。这个方法对于字�W�顺序有要求的字�W�串可能不适用�?/p>

得用正则表达式从URL地址中提取文件名的javascript�E�序�Q�如下结果�ؓpage1

s="http://www.9499.net/page1.htm"
s=s.replace(/(.*/){0,}([^.]+).*/ig,"$2")
alert(s)

利用正则表达式限制网��表单里的文本框输入内容�Q?/p>

�? 正则表达式限制只能输入中文：onkeyup="value=value.replace(/[^u4E00-u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^u4E00-u9FA5]/g,''))"

�? 正则表达式限制只能输入全角字�W�： onkeyup="value=value.replace(/[^uFF00-uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^uFF00-uFFFF]/g,''))"

�? 正则表达式限制只能输入数字：onkeyup="value=value.replace(/[^d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^d]/g,''))"

�? 正则表达式限制只能输入数字和英文�Q�onkeyup="value=value.replace(/[W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^d]/g,''))"

ngaut 2007-03-13 12:54 发表评论

�~�译器inger源码分析(�? �Q?词法分析辅助模块

ngaut — Mon, 05 Feb 2007 12:53:00 GMT

摘要: 真正的词法分析是用lex完成的，�q�里只是一些辅助定义和辅助函数阅读全文

ngaut 2007-02-05 20:53 发表评论

�~�译器inger源码分析(�? 抽象双链表－具体实现

ngaut — Mon, 05 Feb 2007 12:39:00 GMT

摘要: 双链表本�w�不难，但是写一个没有错误的双链表就有点难了阅读全文

ngaut 2007-02-05 20:39 发表评论

�~�译器inger源码分析(�? 抽象双链表－接口

ngaut — Mon, 05 Feb 2007 10:45:00 GMT

摘要: inger源码分析(�? 抽象双链表－接口定义阅读全文

ngaut 2007-02-05 18:45 发表评论

�~�译器inger源码分析(一) 错误报告模块

ngaut — Sun, 04 Feb 2007 08:20:00 GMT

摘要: 错误报告模块分析阅读全文

ngaut 2007-02-04 16:20 发表评论

从今天开始分析编译器inger的源代码

ngaut — Sun, 04 Feb 2007 07:36:00 GMT

版本inger 0.3, windows�q�_��采用Code::Blocks�~�译, 底层使用gcc.

先简单说几句, 从代码上看，inger代码清晰�Q�优��，注释充��Q�是隑־�的阅��d��析佳品�?br />
整个�~�译器��用c语言�~�写�Q�从隑ֺ�和清晰度来看�Q�是我见�q�的最漂亮的c代码(实际上我读过的代码很��，�?�Q?br />
词法分析部分使用了lex。好像也不比手写��L��多少^_^

ngaut 2007-02-04 15:36 发表评论

[转]词法分析器采取的操作

ngaut — Tue, 16 Jan 2007 20:53:00 GMT

词法分析器采取的操作

当词法分析器与说明文件规则部分中的一个扩展正则表辑ּ�匚w��Ӟ��它执行与扩展正则表达式相对应�?em>操作。没有��够的规则匚w��输入��中的所有字�W�串�Q�词法分析器则将输入复制到标准输出。因此，不要创徏仅将输入复制到输出的规则。缺省的输出能够帮助在规则中查找间隔�?/p>

当��?lex 命��o处理�?yacc 命��o产生的解析器的输入时�Q�请提供与所有输入字�W�串匚w��的规则。那些规则必��ȝ��?yacc 命��o能够解释的输出�?/p>

�I�操�?/h3>

要忽略与扩展正则表达式关联的输入�Q�请使用 ;�Q�C 语言�I��句）作�ؓ操作。下面的�C�Z��忽略了三个间隔字�W�（�I�白、制表符和换行）�Q?/p>

[ \t\n] ;

与下一个操作相�?/h3>

要避免反复写相同的操作，请��?|�Q�管道符��P��。此字符指示此规则的操作与下一条规则的操作相同。例如，先前忽略�I�白、制表符和换行字�W�的�C�Z��也可写成�Q?/p>

" "                     |
"\t"                    |
"\n"                    ;

\n �?\t 两边的引号�ƈ不需要�?/p>

打印匚w��字符�?/h3>

要确定哪个文本与说明文�g的规则部分的表达式匹配，您可以包�?C 语言 printf 子例�E�调用作��表达式的一个操作。当词法分析器在输入��中扑ֈ�匚w��Q�程序将匚w��字符串放入外部字�W�（char�Q�和宽字�W�（wchar_t�Q�数�l�中�Q�分别称�?yytext �?yywtext。例如，您能使用下面的规则打印匹配字�W�串�Q?/p>

[a-z]+            printf("%s",yytext);

C 语言 printf 子例�E�接受格式参数和要打印的数据。在此示例中�Q?strong>printf 子例�E�的参数��h��下面的含义：

%s	在打��C��前将数据转换为类型字�W�串的符�?/td>
%S	在打��C��前将数据转换为宽字符�Ԍ��wchar_t�Q�的�W�号
yytext	包含要打印的数据的数�l�的名称
yywtext	包含要打印的多字节类型（wchar_t�Q�数据的数组名称

lex 命��o定义 ECHO�Q�作��打印 yytext 的内容的�Ҏ��操作。例如，下面的两条规则是�{��h的：

[a-z]+       ECHO;
[a-z]+       printf("%s",yytext);

您可以在 lex 说明文�g的定义部分��?%array 或�?%pointer 如下更改 yytext 的说明：

%array	��?yytext 定义��Z�� null �l�束的字�W�数�l�。这是缺省操作�?/td>
%pointer	��?yytext 定义为指向以 null �l�束的字�W�串的指针�?/td>

查找匚w��字符串的长度

要查找词法分析器与特定的扩展正则表达式所匚w��的字�W�数�Q�请使用 yyleng 或�?yywleng 外部变量�?/p>

yyleng	跟踪匚w��的字节数�?/td>
yywleng	跟踪匚w��字符串中的宽字符数。多字节字符的长度大�?1�?/td>

要对输入的字数和字中的字�W�数�q�行计数�Q�请使用下面的操作：

[a-zA-Z]+       {words++;chars += yyleng;}

此操作总计匚w��的字中的字符敎ͼ��q�将该数字赋�?chars�?/p>

下面的表辑ּ�在匹配字�W�串中查找最后一个字�W�：

yytext[yyleng-1]

匚w��字符串中的字�W�串

lex 命��o对输入流�q�行分区�Q��ƈ不搜索每个表辑ּ�的所有可能的匚w��字符丌Ӏ�每个字�W�仅计算一�ơ。要覆盖此选项�q�搜索可能重叠或者互相包含的��，请��?REJECT 操作。例如，要对 she �?he 的所有实例（包括包含�?she 中的 he�Q�计敎ͼ�请��用下面的操作�Q?/p>

she              {s++; REJECT;}
he               {h++}
\n          |.           ;

在对 she 的出现次数进行计数后�Q?strong>lex 命��o拒绝输入字符�Ԍ��然后�?he 的出现次数进行计数。因�?he �q�不包括 she�Q�所�?REJECT 操作不必�?he 上�?/p>

��结果添加到 yytext 数组

典型情况下，来自输入��的下一个字�W�串覆盖 yytext 数组中的当前��V��如果您使用 yymore 子例�E�，来自输入��的下一个字�W�串��被��d��?yytext 数组的当前项的尾部�?/p>

例如�Q�下面的词法分析器搜索字�W�串�Q?/p>

%s instring
%%
\"     {  /* start of string */
         BEGIN instring;
         yymore();
        }
\"    {  /* end of string */
         printf("matched %s\n", yytext);
         BEGIN INITIAL;
        }
.     {
         yymore();
        }
\n    {
         printf("Error, new line in string\n");
         BEGIN INITIAL;
        }

��管通过匚w��多个规则�Q�字�W�串可能被识别，但是反复调用 yymore 子例�E�可以确�?yytext 数组包含整个字符丌Ӏ?/p>

��字�W�返回到输入��?/h3>

要将字符�q�回�l�输入流�Q�请使用下面的调用：

yyless(n)

其中 n 是当前字�W�串中要保持的字�W�数。字�W�串中超�q�此数目的字�W�被�q�回到输入流�?strong>yyless 子例�E�提供的先行函数�c�d��?/�Q�斜杠）�q�算�W�所使用的相同，但是它允许更多对其用法的控制�?/p>

不止一�ơ��?yyless 子例�E�处理文本。例如，当语法分�?C 语言�E�序�Ӟ��诸如 x=-a 之类的表辑ּ�很难理解。它表示 x�{�于-a�Q�还�?x -= a 的旧的表�q��Ş式（意味着��?x减去�?/em>a�Q�？要将此表辑ּ�作�ؓ x�{�于-a 处理�Q�但是要打印警告消息则请使用如下的规则：

=-[a-zA-Z] { printf("Operator (=-) ambiguous\n"); yyless(yyleng-1); ... action for = ... }

输入�Q�输出子例程

lex �E�序允许�E�序使用下述输入�Q�输出（I/O�Q�子例程�Q?/p>

input() �q�回下一个输入字�W?/td>

output(c) ��字�W?c 写到输出

unput(c) ��字�W?c 推回输入��，�E�后再通过 input 子例�E�读�?/td>

winput() �q�回下一个多字节输入字符

woutput(C) ��多字节字符 C 写回输出��?/td>

wunput(C) ��多字节字符 C 推回输入��，以通过 winput 子例�E�读�?/td>

lex �E�序提供�q�些子例�E�作为宏定义。子例程的代码在 lex.yy.c 文�g中。您能覆盖它们�ƈ提供其他版本�?/p>
定义 winput�?strong>wunput �?woutput 宏以使用 yywinput�?strong>yywunput �?yywoutput 子例�E�。考虑到兼�Ҏ��，yy 子例�E�随后��?input�?strong>unput �?output 子例�E�来诅R��写和替换完全多字节字符中需要数目的字节�?/p>
�q�些子例�E�定义外部文件和内部字符之间的关�p�R��如果您更改子例�E�，请以相同的方式将它们全部更改。这些子例程应该遵��@�q�些规则�Q?/p>

所有的子例�E�必��M��用相同的字符集�?

input 子例�E�必��返�?0 ��g��指示文�g的末��?

不要更改 unput 子例�E�和 input 子例�E�的关系�Q�否则先行函��C��不�v作用�?/li>

lex.yy.c 文�g允许词法分析器最多备�?200 个字�W��?/p>
要读包含 NULL 的文�Ӟ��请创��Z��同版本的 input 子例�E�。在 input 子例�E�的正常版本中，�Q�从�I�字�W�）�q�回的�?0 表明�q�是文�g的末��，且将�l�止输入�?/p>
字符�?/h3>
lex 命��o生成的词法分析器通过 input、output �?unput 子例�E�处理字�W?I/O。因此，要在 yytext 子例�E�中�q�回��|��lex 命��o使用�q�些子例�E��用的字符说明。但是，在内�?lex 命��o使用��整��C��表每一个字�W�。当使用标准库时�Q�此整数是计��机用来表示字符的位模式的倹{��正常情况下�Q�字�?a 用与字符帔R�� a 相同的格式表�C�。如果您使用不同�?I/O 子例�E�更�Ҏ��解释�Q�请��{换表攑ֈ�说明文�g的定义部分。�{换表在包含下�q�条目的行开始和�l�束�Q?/p>
%T

转换表包含指�C�Z��每个字符兌��的值的其他行。例如：

%T {integer} {character string} {integer} {character string} {integer} {character string} %T

文�g末尾处理

当词法分析器到达文�g末尾�Ӟ��它调�?yywrap 库子例程�Q�此调用�q�回�?1�Q�指�C��法分析器应该�l�箋在输入末��正常结束�?/p>
但是�Q�如果词法分析器从多个源接收到输入，��h��?yywrap 子例�E�。新的函数必��获取新的输入�ƈ��?0 �q�回�l�词法分析器。返回�?0 指示�E�序应该�l�箋处理�?/p>
您也可以包含代码�Q�以在词法分析器在新版本�?yywrap 子例�E�中�l�止�Ӟ��打印摘要报告和表�?strong>yywrap 子例�E�是强制 yylex 子例�E�识别输入末��唯一途径�?/p>

ngaut 2007-01-17 04:53 发表评论

ngaut — Fri, 14 Jul 2006 06:54:00 GMT

词法分析主要完成的工作有�Q?br />1.�q��o源程序中的空白字�W�和注释�?br />2.识别各种帔R��Q��ƈ且把字符形式的表�C��{化�ؓ�~�译器的内部标识(如：int a = 6,在编译器看来�Q�这些都是以字符形式表示�?
3.识别标识�W?ID)和关键字(keyword)
4.识别源程序中的各�U�符�?如："+", "-", "(", "]"�{?

java(gjc)词法分析器优点：
1.所有的源文件一�ơ读入到内存�~�冲区buf[]中，寚w��后的操作有一定的��化作用，
    �q��得词法分析速度有一定的提高�?br /> 2.词法分析的出错点报告�_��到具体的行和列：line, col。觉得没有必要精��到列�?br /> 3.通过scanChar()来预��M��个字�W�，然后�Ҏ��预读的字�W�来推测该token可能的类�?br />    然后调用相应的函数来处理。抽象程度更高，值得学习�?br />

ngaut 2006-07-14 14:54 发表评论

【实习收莗��如果遇到这��L��错误�Q�lex.yy.c: undefined reference to `yywrap'

ngaut — Wed, 05 Jul 2006 10:52:00 GMT
可以在lex.c加入如下的行来解决问题�?br />#define yywrap() 1

更好的办法是定义:
int yywrap()
{
   return(1);
}

关于yywrap更详�l�的信息可以参考unix的lex manual
http://www.scit.wlv.ac.uk/cgi-bin/mansec?1+lex

int yywrap(void)
           Called by yylex at end-of-file; the default yywrap
           always will return 1. If the application requires
           yylex to continue processing with another source of
           input, then the application can include a function
           yywrap, which associates another file with the exter-
           nal variable FILE *yyin and will return a value of
           zero.

或flex的参考手�?�q�个貌似更广泛一�?�Q?br />http://www.gnu.org/software/flex/manual/html_mono/flex.html

When the scanner receives an end-of-file indication from YY_INPUT, it then checks the `yywrap()' function. If `yywrap()' returns false (zero), then it is assumed that the function has gone ahead and set up yyin to point to another input file, and scanning continues. If it returns true (non-zero), then the scanner terminates, returning 0 to its caller. Note that in either case, the start condition remains unchanged; it does not revert to INITIAL.
If you do not supply your own version of `yywrap()', then you must either use `%option noyywrap' (in which case the scanner behaves as though `yywrap()' returned 1), or you must link with `-lfl' to obtain the default version of the routine, which always returns 1.

ngaut 2006-07-05 18:52 发表评论

input()	�q�回下一个输入字�W?/td>
output(c)	��字�W?c 写到输出
unput(c)	��字�W?c 推回输入��，�E�后再通过 input 子例�E�读�?/td>
winput()	�q�回下一个多字节输入字符
woutput(C)	��多字节字符 C 写回输出��?/td>
wunput(C)	��多字节字符 C 推回输入��，以通过 winput 子例�E�读�?/td>

另类春色校园亚洲,欧美怡红院视频,久久久久久久久蜜桃

最�q�写了个���工��P��自动往代码里面加入垃圾代码

antlr�W�记

antlr资料

EBNF Grammar for Mini-Java

EBNF Grammar for Mini-Java

Comments

EBNF

inger BNF

module

globals

global

function

functionheader

functionrest

modifiers:

paramlist

moreparamblocks

paramblock

moreparams

param

returntype

reference

dimensionblock

block

code

statement

returnarg

elseblock

switchcases

declarationblock

restdeclarations

declaration

indexblock

initializer

expression

restexpression

logicalor

restlogicalor

logicaland

restlogicaland

bitwiseor

restbitwiseor

bitwisexor

restbitwisexor

bitwiseand

restbitwiseand

equality

restequality

equalityoperator

relation

restrelation

relationoperator

shift

restshift

shiftoperator

addition

restaddition

additionoperator

multiplication

restmultiplication

multiplicationoperator

unary3

unary3operator:

unary2

unary2operator

factor

application

moreexpressions

type

immediate

inger EBNF

module

global

Functions

function

functionheader

paramlist

paramblock

param

最�q�写了个��工��P��自动往代码里面加入垃圾代码

inger源码�W�记杂�ؕ

�I�操�?/h3>
要忽略与扩展正则表达式关联的输入�Q�请使用 ;�Q�C 语言�I��句）作�ؓ操作。下面的�C�Z��忽略了三个间隔字�W�（�I�白、制表符和换行）�Q?/p>
[ \t\n] ;

��结果添加到 yytext 数组

【实习收莗��如果遇到这��L��错误�Q�lex.yy.c: undefined reference to `yywrap'