青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

隨筆-91  評論-137  文章-0  trackbacks-0
以下所說的文法文件均為QParserGenerator的文法文件

產生式
我們將文法文件中形如
strings             -> strings "{String}"
                    |  "{String}"
                    ;
形式的式子稱為產生式,它由它的左端非終結符(strings)和右端終結符和非終結符組成。

非終結符:非終結符總是出現在產生式的左端,它表示這個條目是由右側的一些終結符和非終結符推導而來的。
終結符:終結符總是出現在產生式的右端,一般的它總是一個常量字符串或Regex,在文法文件中由最頂端的%token定義出來,內部有一些內置的Regex比如"{Digit}"對應正則表達式為[0-9]+。

上面的文法可分解為兩條產生式
strings             -> strings "{String}";
strings             ->  "{String}";
在文法文件中遇到或的關系就可將這條產生式分為若干條左端相同的產生式,只是為了書寫形式上的好看,所以在QParserGenerator中支持了|符號。

產生式的結構
首先我們定義出一種結構來描述一個終結符或非終結符
        struct Item
        {
            enum Type
            {
                TerminalSymbol,
                NoTerminalSymbol,
            }type;

            Rule rule;
            uint index;
#if defined(_DEBUG) && DEBUG_LEVEL == 3
            string name;
#endif

            Item() : type(NoTerminalSymbol), index(inc()) {}
            Item(Rule::Context* pContext) : type(TerminalSymbol), rule(pContext), index(0) {}
#if defined(_DEBUG) && DEBUG_LEVEL == 3
            Item(const string& name) : type(NoTerminalSymbol), index(inc()), name(name) {}
#endif
            Item(const Item& i)
                : type(i.type)
                , rule(i.rule)
                , index(i.index)
#if defined(_DEBUG) && DEBUG_LEVEL == 3
                , name(i.name)
#endif
            {
            }
            Item(const Rule& rule) : type(TerminalSymbol), rule(rule), index(inc()) {}

            inline Item& operator=(const Item& i)
            {
                if (&i != this)
                {
                    type  = i.type;
                    rule  = i.rule;
                    index = i.index;
#if defined(_DEBUG) && DEBUG_LEVEL == 3
                    name  = i.name;
#endif
                }
                return *this;
            }

            inline const bool operator<(const Item& x)const
            {
                return index < x.index;
            }

            inline const bool operator==(const Item& x)const
            {
                return index == x.index && type == x.type && (type == TerminalSymbol ? rule == x.rule : true);
            }

            inline const bool operator!=(const Item& x)const
            {
                return (index != x.index || type != x.type) || (type == TerminalSymbol ? rule != x.rule : false);
            }

            inline const bool isNoTerminalSymbol()const
            {
                return type == NoTerminalSymbol;
            }

            inline const bool isTermainalSymbol()const
            {
                return type == TerminalSymbol;
            }

            static uint inc()
            {
                static uint i = 0;
                return i++;
            }
        };
只有一個非終結符對象才會用到rule成員對象。

有了這個基本類型之后,讓我們來構造出一條產生式的結構
    class Production
    {
    public:
        Production() {}
        Production(const Item& left) : left(left), index(inc()) {}
        Production(const Item& left, const Item& item) : left(left), index(inc()) { right.push_back(item); }
        Production(const Item& left, const vector<Item>& right) : left(left), right(right), index(inc()) {}
        Production(const Production& p) : left(p.left), right(p.right), index(p.index) {}

        inline const bool operator<(const Production& p)const
        {
            return index < p.index;
        }
    protected:
        static uint inc()
        {
            static uint i = 0;
            return i++;
        }
    public:
        Item left;
        vector<Item> right;
        uint index;
    };
正如前面所說,每條產生式的左端總是一個非終結符,而右端是若干的終結符或非終結符,應此我們有了以上結構。

LALR1的產生式
在LALR1中由于每條產生式是帶若干個展望符和圓點的,應此我們設計另外一個繼承自Production的結構LALR1Production
    class LALR1Production : public LR0Production
    {
        typedef LR0Production parent;
    public:
        class Item
        {
        public:
            enum { Rule, End }type;
            regex::Rule rule;

            Item() : type(End) {}
            Item(const regex::Rule& rule) : type(Rule), rule(rule) {}

            inline const bool operator==(const Item& x)const
            {
                return type == x.type && (type == End ? true : rule == x.rule);
            }

            inline const bool operator==(const Production::Item& x)const
            {
                return type == End ? false : rule == x.rule;
            }

            inline const bool operator!=(const Item& x)const
            {
                return type != x.type || (type == End ? true : rule != x.rule);
            }

            Item& operator=(const Item& x)
            {
                if (&x == thisreturn *this;

                type = x.type;
                if (type == Rule) rule = x.rule;
                return *this;
            }
        };

        LALR1Production() : LR0Production() {}
        LALR1Production(const Production::Item& left, const vector<Production::Item>& right) : LR0Production(left, right) {}
        LALR1Production(const Production::Item& left, const Production::Item& right, size_t pos) : LR0Production(left, right, pos) {}
        LALR1Production(const LALR1Production& p) : LR0Production(p), wildCards(p.wildCards) {}
        LALR1Production(const LR0Production& p) : LR0Production(p) {}
        LALR1Production(const Production& p, size_t pos) : LR0Production(p, pos) {}

        inline const bool operator==(const LALR1Production& p)const
        {
            return static_cast<LR0Production>(*this) == static_cast<LR0Production>(p);
        }

        inline LALR1Production stepUp()
        {
            LALR1Production x(*this);
            ++x.idx;
            return x;
        }
    public:
        vector<Item> wildCards;
    };
由于歷史上的原因我們讓LALR1Production繼承自LR0Production而不是Production,在LR0Production中只是增加了idx域來表示圓點的位置。而對于增廣的產生式(指begin->. 開始符號)總是只帶展望符$的,應此我們有了其中的Item結構來表示它是結束符$或是其他的rule。

有了上面兩個結構之后,我們便可以開始實現從產生式轉換到DFA的過程了。

LALR1的狀態和邊
LALR1的每個狀態中包含有若干條LALR1的產生式應此它的結構就很簡單了
        class Item
        {
        public:
            vector<LALR1Production> data;
            uint idx;

            Item() : idx(0) {}

            void mergeWildCards(Item* pItem)
            {
#if defined(_DEBUG) && DEBUG_LEVEL == 3
                if (data.size() != pItem->data.size()) throw error<const char*>("compare size error", __FILE__, __LINE__);
#endif
                for (size_t i = 0, m = data.size(); i < m; ++i)
                {
                    data[i].wildCards.add_unique(pItem->data[i].wildCards);
                }
            }

            inline const bool operator==(const Item& x)const
            {
                return data == x.data;
            }

            static uint inc()
            {
                static uint i = 0;
                return i++;
            }
        };

        struct Edge 
        {
            Item* pFrom;
            Item* pTo;
            Production::Item item;

            Edge(Item* pFrom, Item* pTo, const Production::Item& item) : pFrom(pFrom), pTo(pTo), item(item) {}

            inline const bool operator==(const Edge& x)const
            {
                return pFrom == x.pFrom && pTo == x.pTo && item == x.item;
            }
        };
而LALR1的一條邊是由一個狀態通過一個文法符號抵達另一個狀態的,所以它也非常形象。

LALR1 DFA生成算法
網上流傳著非常多的LALR1 DFA生成算法,其中有比較費時的先生成LR1狀態機然后合并同心集來轉化到LALR1 DFA的算法,也有較快的展望符傳播算法,出于性能的考慮,我們在這里選用的是第二種算法。

算法描述:
首先是自生展望符的計算過程和DFA的生成過程
1.拓廣文法begin->. 開始符號,并求取它的closure閉包,并將生成的LALR1項目加入到隊列q和items列表中。
2.從隊列q中拿出一個項目item,并求出這個item中所有的狀態轉移符號s。
3.對這個item和每個狀態轉移符號應用go函數求出由這個item可以轉換到的其他狀態newItem。
4.若轉移到的狀態newItem不在items列表當中將其加入到隊列q和items列表中,否則合并新生成狀態newItem和items中原有的對應狀態oldItem的展望符列表,并將原有狀態oldItem加入到changes列表中。
5.添加一條從item到newItem或oldItem的邊,它通過一個文法符號x來轉換。
6.循環2直到隊列q為空。
下面是傳播展望符的部分
7.遍歷changes列表,并求出每個狀態的狀態轉移符號s。
8.遍歷每個狀態轉移符號并應用go函數求出新產生的狀態newItem,由于新計算出來的狀態newItem必定在items列表中,我們只需要將它的展望符做合并即可。

LALR1的核
LALR1的核是由增廣項目"begin->. 開始符號“通過某些文法所產生的一些LALR1的最小狀態,比如有文法
begin -> start
start -> start "a"
start -> "a"
它的核為
K0:
begin -> . start

K1:
begin -> start .
start -> start . "a"

K2:
start -> "a" .

K3:
start -> start "a" .
K0通過文法符號start到達K1,K1通過其中的另外一條產生式到達K2(通過closure函數可求出這個產生式,將會在下文介紹),K1中第二條表達式通過文法符號"a"到達核K3。應此我們說LALR1的核就是增廣文法通過一些文法符號所產生的一些最小狀態,然后通過閉包函數closure可求出這個狀態包含的所有產生式集。

closure(閉包)函數
通過閉包函數可求出LALR1最小狀態中拓展出來的其他產生式,應此它有一個核作為輸入和一個LALR1狀態作為輸出,它的算法描述如下
1.將核中的所有產生式加入輸出狀態item中,并將每條產生式加入隊列q中。
2.從隊列q中取出一個元素p。
3.若p是一個待約項目(圓點右邊是一個非終結符)那么繼續執行4,否則循環到2。
4.求這個產生式的AFirst集合記作v。
5.遍歷所有左側是p圓點之后非終結符且圓點不在最左側的產生式i。
6.若求出的AFirst集合v為空,則將p的展望符集中的所有元素插入到i中,否則將v中的每個元素插入到i中。
7.若i已存在于輸出狀態item則將它的展望符合并到原產生式中,否則將這個產生式i插入到輸出狀態item和隊列q中。
8.循環2知道隊列q為空為止。
通過以上函數便可求出每個核K所對應的LALR1狀態item。

AFirst函數
AFirst函數其實就是求這個產生式圓點后第二個符號的First集合。

First函數
First函數返回的是一些終結符的集合,應此若輸入的是一個非終結符,它會去查看所有左端是這個非終結符的產生式的右側第一個符號,若它仍然是一個非終結符則繼續遞歸下去,否則將這個終結符加入到輸出集合中。而為了不產生死循環,它不會處理左遞歸的產生式。

go(狀態轉移)函數
狀態轉移函數有兩個輸入分別為某個狀態item和一個文法符號x以及一個輸出newItem,表明item狀態通過文法符號x達到newItem狀態。它的算法描述如下
1.遍歷item中的每條產生式i。
2.若i不是一個歸約項目(圓點在最后)則將其加入集合j中。
3.若集合j不為空,則求取j的閉包作為輸出狀態newItem。
當然通過go函數求出來的新狀態是有可能已經存在的。

通過上面這些算法的描述,我們已經可以求出一個完整的LALR1 DFA了。下面我們來看看這些算法的代碼會是什么樣的。
    bool LALR1::make()
    {
        vector<LALR1Production> v;
        v.push_back(inputProductions[begin][0]);
        pStart = closure(v);
        pStart->idx = Item::inc();
        context.states.insert(pStart);
        items.push_back(pStart);

        queue<Item*> q;
        q.push(pStart);

        vector<Item*> changes;

        while (!q.empty())
        {
            Item* pItem = q.front();
            vector<Production::Item> s;
            symbols(pItem, s);
            select_into(s, vts, compare_production_item_is_vt, push_back_unique_vector<Production::Item>);
            select_into(s, vns, compare_production_item_is_vn, push_back_unique_vector<Production::Item>);
            for (vector<Production::Item>::const_iterator i = s.begin(), m = s.end(); i != m; ++i)
            {
                Item* pNewItem = NULL;
                if (go(pItem, *i, pNewItem))
                {
                    long n = itemIndex(pNewItem);
                    if (n == -1)
                    {
                        pNewItem->idx = Item::inc();
                        q.push(pNewItem);
                        items.push_back(pNewItem);
                        context.states.insert(pNewItem);
                    }
                    else
                    {
                        items[n]->mergeWildCards(pNewItem);
                        changes.push_back_unique(items[n]);
                        destruct(pNewItem, has_destruct(*pNewItem));
                        Item_Alloc::deallocate(pNewItem);
                    }
                    edges[pItem].push_back_unique(Edge(pItem, n == -1 ? pNewItem : items[n], *i));
                }
            }
            q.pop();
        }
        for (vector<Item*>::const_iterator i = changes.begin(), m = changes.end(); i != m; ++i)
        {
            vector<Production::Item> s;
            symbols(*i, s);
            for (vector<Production::Item>::const_iterator j = s.begin(), n = s.end(); j != n; ++j)
            {
                Item* pNewItem = NULL;
                if (go(*i, *j, pNewItem))
                {
                    long n = itemIndex(pNewItem);
                    if (n == -1) throw error<const char*>("unknown item", __FILE__, __LINE__);
                    else items[n]->mergeWildCards(pNewItem);
                    destruct(pNewItem, has_destruct(*pNewItem));
                    Item_Alloc::deallocate(pNewItem);
                }
            }
        }
        return true;
    }

    LALR1::Item* LALR1::closure(const vector<LALR1Production>& kernel)
    {
        Item* pItem = Item_Alloc::allocate();
        construct(pItem);

        queue<LALR1Production> q;

        for (vector<LALR1Production>::const_iterator i = kernel.begin(), m = kernel.end(); i != m; ++i)
        {
            pItem->data.push_back(*i);
            q.push(*i);
        }

        while (!q.empty())
        {
            const LALR1Production& p = q.front();
            if (p.idx < p.right.size() && p.right[p.idx].isNoTerminalSymbol()) // 待約項目
            {
                vector<Production::Item> v;
                firstX(p, v, p.idx + 1);
                for (vector<LALR1Production>::iterator i = inputProductions[p.right[p.idx]].begin(), m = inputProductions[p.right[p.idx]].end(); i != m; ++i)
                {
                    if (i->idx > 0) continue;
                    LALR1Production& item = *i;
                    if (v.empty()) item.wildCards.add_unique(p.wildCards);
                    else
                    {
                        for (vector<Production::Item>::const_iterator j = v.begin(), n = v.end(); j != n; ++j)
                        {
                            item.wildCards.push_back_unique(LALR1Production::Item(j->rule));
                        }
                    }
                    vector<LALR1Production>::iterator j = find(pItem->data.begin(), pItem->data.end(), item);
                    if (j == pItem->data.end())
                    {
                        q.push(item);
                        pItem->data.push_back(item);
                    }
                    else j->wildCards.add_unique(item.wildCards);
                }
            }
            q.pop();
        }

        return pItem;
    }

    void LALR1::firstX(const LALR1Production& p, vector<Production::Item>& v, size_t idx)
    {
        if (idx >= p.right.size()) return;

        first(p, v, idx);
    }

    void LALR1::first(const LALR1Production& p, vector<Production::Item>& v, size_t idx)
    {
#ifdef _DEBUG
        if (idx >= p.right.size())
        {
            throw error<const char*>("position out of right size", __FILE__, __LINE__);
            return;
        }
#endif
        if (p.right[idx].isTermainalSymbol())
        {
            v.push_back_unique(p.right[idx]);
            return;
        }

        for (vector<LALR1Production>::const_iterator i = inputProductions[p.right[idx]].begin(), m = inputProductions[p.right[idx]].end(); i != m; ++i)
        {
            if (i->left == i->right[0]) continue;
            if (i->right[0].isTermainalSymbol())
            {
                v.push_back_unique(i->right[0]);
                continue;
            }
            else
            {
                first(*i, v, 0);
            }
        }
    }

    void LALR1::symbols(Item* pItem, vector<Production::Item>& v)
    {
        for (vector<LALR1Production>::const_iterator i = pItem->data.begin(), m = pItem->data.end(); i != m; ++i)
        {
            if (i->idx < i->right.size()) v.push_back_unique(i->right[i->idx]);
        }
    }

    bool LALR1::go(Item* pItem, const Production::Item& x, Item*& newItem)
    {
        vector<LALR1Production> j;
        for (vector<LALR1Production>::iterator i = pItem->data.begin(), m = pItem->data.end(); i != m; ++i)
        {
            if (i->idx < i->right.size() && i->right[i->idx] == x) j.push_back_unique(i->stepUp());// fromItoJ(*i, j);
        }
        if (j.empty()) return false;

        newItem = closure(j);
        return true;
    }
其實代碼并不算多,只是描述起來有些麻煩罷了。

QParserGenerator就先介紹到這里,接下來一篇文章將會介紹一個例子來說明某個文法是如何變成LALR1 DFA的。最后完整的代碼可到http://code.google.com/p/qlanguage/下載。
posted on 2013-05-12 22:32 lwch 閱讀(2602) 評論(1)  編輯 收藏 引用 所屬分類: QLanguage

評論:
# re: QParserGenerator代碼分析一(生成LALR1 DFA) 2013-05-16 11:28 | Zblc(邱震鈺)
先坐沙發 有空滿足你被噴的欲望.../.  回復  更多評論
  
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美视频免费看| 欧美高清视频| 一本一本久久a久久精品综合麻豆 一本一本久久a久久精品牛牛影视 | 欧美激情久久久久久| 国产精品一区二区久久国产| 亚洲欧洲精品一区二区| 很黄很黄激情成人| 亚洲一区二区精品在线| 亚洲精品国产精品乱码不99| 欧美一区二区三区在线| 亚洲综合视频网| 久久最新视频| 久热精品视频| 国产日韩欧美综合在线| 亚洲精品中文字幕女同| 亚洲伦理自拍| 能在线观看的日韩av| 免费久久99精品国产自在现线| 国产亚洲欧洲一区高清在线观看| 亚洲午夜黄色| 日韩小视频在线观看专区| 久久久久久久999精品视频| 久久riav二区三区| 国产精品免费一区二区三区在线观看| 亚洲精品久久久久中文字幕欢迎你 | 久久一区免费| 在线欧美不卡| 欧美成人精品福利| 最新日韩精品| 亚洲一区二区动漫| 国产精品女同互慰在线看| 亚洲综合好骚| 久久这里只精品最新地址| 在线免费观看视频一区| 欧美精品乱人伦久久久久久| 亚洲精品婷婷| 欧美在线电影| 亚洲第一福利社区| 欧美黄色日本| 亚洲一区二区三区中文字幕| 欧美一区二区三区四区夜夜大片| 国产色综合天天综合网| 久久综合国产精品| 亚洲国产清纯| 午夜国产精品影院在线观看| 国产亚洲成年网址在线观看| 老鸭窝毛片一区二区三区 | 欧美成人免费观看| 亚洲少妇自拍| 国产亚洲欧美中文| 欧美成人一区二区在线| 亚洲婷婷在线| 欧美成人国产| 亚洲欧美日韩国产一区二区三区 | 一区二区在线视频| 欧美精品一区二区视频| 午夜精品一区二区三区四区| 欧美xxx成人| 亚洲欧美卡通另类91av| 亚洲成人在线免费| 欧美亚洲不卡| 免费在线欧美视频| 亚洲欧美日韩人成在线播放| 欧美激情精品久久久久久| 午夜免费在线观看精品视频| 亚洲国产精品女人久久久| 欧美视频日韩| 欧美不卡福利| 欧美伊人久久久久久久久影院| 亚洲国产日韩综合一区| 久久免费午夜影院| 亚洲一区二区三区精品在线观看| 亚洲高清网站| 国产亚洲综合精品| 国产精品video| 欧美高清视频免费观看| 久久久综合精品| 亚洲欧美欧美一区二区三区| 亚洲黄色尤物视频| 久久深夜福利| 欧美一区二区精品在线| 一片黄亚洲嫩模| 91久久黄色| 影音先锋久久资源网| 国产午夜精品久久久久久久| 欧美色欧美亚洲高清在线视频| 欧美成人四级电影| 久久综合久久久久88| 欧美专区一区二区三区| 亚洲综合日本| 亚洲永久视频| 亚洲私人黄色宅男| 亚洲最新在线视频| 亚洲精品久久久久久下一站| 欧美激情第8页| 亚洲福利专区| 亚洲黄色在线观看| 亚洲欧洲一二三| 亚洲激情欧美激情| 亚洲欧洲日夜超级视频| 亚洲激情在线激情| 日韩网站在线看片你懂的| 亚洲三级色网| 亚洲日本黄色| 日韩亚洲在线观看| 一本色道88久久加勒比精品 | 亚洲精品九九| 日韩小视频在线观看专区| 亚洲毛片在线观看| 亚洲视频在线观看免费| 亚洲一区二区三区在线播放| 亚洲欧美日韩在线不卡| 久久av红桃一区二区小说| 欧美一站二站| 开心色5月久久精品| 麻豆精品传媒视频| 欧美精品激情在线观看| 欧美日韩三级| 国产欧美精品一区二区三区介绍| 国产欧美综合在线| 亚洲成色www久久网站| 亚洲韩国精品一区| 99在线|亚洲一区二区| 亚洲免费视频中文字幕| 欧美一区深夜视频| 欧美大片在线观看一区| 亚洲三级国产| 午夜久久久久| 麻豆九一精品爱看视频在线观看免费| 免费观看成人| 欧美性色aⅴ视频一区日韩精品| 国产精品福利久久久| 国产一区二区观看| 亚洲片国产一区一级在线观看| 亚洲婷婷在线| 久久蜜臀精品av| 亚洲激情视频在线观看| 亚洲人成亚洲人成在线观看| 亚洲一二三区视频在线观看| 久久精品在线播放| 欧美日韩视频一区二区| 国产亚洲精品aa午夜观看| 亚洲日本电影在线| 欧美一区二区网站| 亚洲国产日韩一级| 欧美一区二区日韩一区二区| 欧美电影在线播放| 国产亚洲毛片在线| 亚洲午夜激情在线| 欧美成人精品在线观看| 亚洲一区二区在线视频| 欧美jjzz| 狠狠色狠色综合曰曰| 亚洲视频久久| 欧美成人精品在线| 欧美在线视频观看免费网站| 欧美精品一区二区三区四区| 国产一区二区在线免费观看| 亚洲视频狠狠| 亚洲电影自拍| 欧美中文字幕| 国产伦精品一区二区三区高清版| 亚洲区欧美区| 老**午夜毛片一区二区三区| 一区二区av| 欧美日韩国产系列| 日韩午夜在线| 亚洲国产高清视频| 久久一区二区三区国产精品| 国产欧美韩日| 亚洲欧美日韩在线不卡| 日韩一级精品| 欧美日本亚洲韩国国产| 亚洲人成人一区二区在线观看| 久久久久久久波多野高潮日日| 亚洲永久在线观看| 国产精品福利片| 亚洲欧美www| 中文久久乱码一区二区| 欧美系列电影免费观看| 这里只有精品丝袜| 日韩亚洲欧美综合| 欧美理论片在线观看| 亚洲精品欧美| 亚洲日本欧美天堂| 欧美精品电影在线| 一本色道久久综合狠狠躁篇怎么玩| 亚洲大片精品永久免费| 欧美不卡三区| 日韩午夜精品| 一区二区三区欧美亚洲| 国产精品成人一区二区三区吃奶| 亚洲一区二区高清| 亚洲欧美日韩一区在线观看| 国产亚洲二区| 另类综合日韩欧美亚洲| 另类亚洲自拍| 99精品视频一区| 9久re热视频在线精品| 国产精品日本一区二区|