• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 76,  comments - 621,  trackbacks - 0
            編輯器制作之語(yǔ)法加亮基本原理在上一篇文章里,我簡(jiǎn)單的提及了語(yǔ)法加亮的基本思路,下面在總結(jié)概括一下。

            筆者認(rèn)為,對(duì)于編輯器而言,如果支持非常嚴(yán)格的語(yǔ)法加亮的話,那么擴(kuò)展性是很低的。那么在擴(kuò)展性和正確性之間,我們應(yīng)該取得一個(gè)平衡。這個(gè)平衡就是既要保證編輯器的高效率運(yùn)轉(zhuǎn),又要保持文本配置文件的可編輯性。

            首先,幾乎所有的編程語(yǔ)言都具有某種共性,這些共性概括如下:
            1.關(guān)鍵字
            2.注釋
            3.字符串
            4.Delimiters
            5.普通字符
            那么對(duì)于一個(gè)字符串序列,我們應(yīng)該如何做呢?任何一個(gè)人都會(huì)很自然的想到:從前往后掃描。對(duì),那么如何掃描呢?我用的手段是狀態(tài)機(jī)。或者不能完全稱之為狀態(tài)機(jī),因?yàn)樵谖业臓顟B(tài)機(jī)里面用到了預(yù)先判斷,對(duì)于一個(gè)長(zhǎng)度為N的字符串,最壞的情況下會(huì)掃描M*N*L次(其中M為某些塊的起始或者結(jié)束標(biāo)記的長(zhǎng)度,L為塊的個(gè)數(shù),關(guān)于什么是塊,參加我的上一篇文章),所以對(duì)于我的這個(gè)狀態(tài)機(jī),稱之為狀態(tài)模式更貼切一些。狀態(tài)模式是個(gè)好東西,對(duì)于狀態(tài)模式乃何物以及如何構(gòu)造,本文不作詳細(xì)闡述。

            如果僅僅是識(shí)別上面這些東西的話,那么語(yǔ)法加亮是非常容易實(shí)現(xiàn)的。但事與愿違,事情并不是如此簡(jiǎn)單。舉個(gè)例子html.在最開(kāi)始的時(shí)候html的確讓我傷透了腦筋,因?yàn)樗梢郧度敫鞣N各樣的語(yǔ)言,并且每種語(yǔ)言的schema并不一樣,比如可以嵌入css,或者js,或者vbs,當(dāng)然還有php, java, c#代碼等等。這個(gè)時(shí)候該如何做呢? 我用的手段是分塊之后,對(duì)于不同的子語(yǔ)言應(yīng)用不同的schema,這么做并不是完全對(duì)的(和Lex分析相比),或多或少會(huì)出現(xiàn)某種問(wèn)題,不過(guò)大多數(shù)情況下表現(xiàn)的都非常好,這個(gè)點(diǎn)就叫平衡。

            再說(shuō)一下?tīng)顟B(tài)分析,定義如下函數(shù): 偽代碼
            //根據(jù)起始狀態(tài),分析字符串line的第index字符應(yīng)該是何種狀態(tài)
            state NextState( string line, int index, state start_state ){
             switch( start_state ){
              case .
              return some_state;
              case .
              return some_state;
              case .
              return some_state;
              case .
              return some_state;
             }
            }
            
            //分析一行字符串的某一個(gè)字符應(yīng)該是何種狀態(tài),并預(yù)存入cache
            state ParseLine( string line, int index, state start_state ){
             for( i=index; i<line.Length; i++ ){
              start_state = NextState( line, i, start_state );
              siwtch( start_state ){
               //set text attributes
              }
             }
             //分析完之后,在進(jìn)行分析一遍,進(jìn)行一些細(xì)節(jié)匹配
             DetailMatch(...)
             //分析完之后,我們要返回該行的最后的狀態(tài),用來(lái)作為下一行的起始狀態(tài)
             return start_state;
            }
            
            //這個(gè)函數(shù)主要用來(lái)對(duì)于分完塊之后的代碼進(jìn)行細(xì)節(jié)匹配,比如匹配注釋中的email和url
            //或者普通字符中的數(shù)字等等
            void DetailMatch(...){
             //use regex to match some details, such as number or email
            }
            上面這幾個(gè)函數(shù)都簡(jiǎn)單明了,比較容易理解,對(duì)于ParseLine我們發(fā)現(xiàn)在進(jìn)行行跳轉(zhuǎn)的時(shí)候DetailMatch并不是必須的。什么叫行跳轉(zhuǎn)呢?比如打開(kāi)一個(gè)代碼文件,現(xiàn)在我要跳轉(zhuǎn)到第5000行,那么很顯然第5000行需要放到屏幕上頭,這個(gè)時(shí)候我怎么知道第5000行的起始狀態(tài)呢?當(dāng)然也得從第一航開(kāi)始分析,但是我們發(fā)現(xiàn)DetailMatch其實(shí)并不是必須的,因?yàn)槲覀冎恍枰鲏K狀識(shí)別就夠了,所以速度是非??陀^的。

            先寫(xiě)這么多了,等我以后老了,我打算把這些東西寫(xiě)成一本書(shū),名字就叫編輯器制作基本原理,呵呵.

            不敢妄自菲薄,下面貼兩個(gè)代碼片段和上面的偽代碼均是按照上述方法生成的,還算美觀.
            C++代碼
            #include <stdio.h>
            // line comment email test@test.com 
            // url:http://www.shnenglu.com/megax in comment over
            /*
            block comment
            email test@test.com url:http://www.shnenglu.com/megax in comment over
            */
            int main(int argc, char *argv[])
            {
            emailtest@test.com   http://www.shnenglu.com/megax in comment over int a = Class::Somfunction(); // function char * p = "abcdef string to new line"; // string can continue, just test char* p = "abcef\"\\"; //escpae char* p = 'abcef\"\\'; //escpae, just test; asm{ ; test sub lan ; line comment email test@test.com ; url:http://www.shnenglu.com/megax in comment over mov ax, 10 add ax, 0x12AD add ax, 123L jump loop1 } // number test int a = 1234; int b = 0xA12D; int c = 1234L; float a = 123.456; return 0; }
            HTML代碼嵌入css,js
            <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
            <html xmlns="http://www.w3.org/1999/xhtml" lang="zh-CN">
            <head>
            <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
            <link href="images/favicon.ico" rel="SHORTCUT ICON" />
            <title>test</title>
            <script type="text/javascript">
            function setTab(m,n){
             var tli=document.getElementById("menu"+m).getElementsByTagName("a");
             var mli=document.getElementById("main"+m).getElementsByTagName("div");
             for(i=0;i<tli.length;i++){
              tli[i].className=i==n?"current1 current2":"";
              mli[i].style.display=i==n?"block":"none";
             } 
             var a = 0x012345678;
             var a = 0xABCDEF12345;
             // line comment test@test.com in comment  http://www.shnenglu.com/megax in comment over
             /*
             block comment in js
             test@test.com in comment
             http://www.shnenglu.com/megax in comment
             over
             */
            }
            </script> function style var
            <style>
            body{
             function style var
             font-size: 12px;
             font-family: "sfdsfdsf";
             /*
             block comment in css
             test@test.com in comment
             http://www.shnenglu.com/megax in comment
             over
             */
            }
            
            </style>
            </head>
            <body>
            <table>
            </table>
            function style var /*sdfdsfdsf*/ return var
            <!-- 
            block comment in html
             test@test.com in comment
             http://www.shnenglu.com/megax in comment
             over
            -->
            </body>
            </html>
            
            下面看一下cppblog自帶的代碼加亮,沒(méi)有c++的,用c#代替

            #include <stdio.h>
            // line comment email test@test.com 
            // url:http://www.shnenglu.com/megax in comment over
            /*

            block comment
            email test@test.com url:
            http://www.shnenglu.com/megax in comment over
            */
            int main(int argc, char *argv[])
            {
                
            int a = Class::Somfunction(); // function
                char * p = "abcdef
                string to new line"; // string can continue, just test
                char* p = "abcef\"\\"; //escpae
                char* p = 'abcef\"\\'//escpae, just test;
                asm{
                    ; test sub lan
                    ; line comment email test@test.com 
                    ; url:http:
            //www.shnenglu.com/megax in comment over
                    mov ax, 10
                    add ax, 
            0x12AD
                    add ax, 
            123L
                    jump loop1
                }
                
            // number test
                int a = 1234int b = 0xA12D;
                
            int c = 1234Lfloat a = 123.456;
                
                
            return 0;
            }

            HTML的

            <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
            <html xmlns="http://www.w3.org/1999/xhtml" lang="zh-CN">
            <head>
            <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
            <link href="images/favicon.ico" rel="SHORTCUT ICON" />
            <title>test</title>
            <script type="text/javascript">
            function setTab(m,n){
                
            var tli=document.getElementById("menu"+m).getElementsByTagName("a");
                
            var mli=document.getElementById("main"+m).getElementsByTagName("div");
                
            for(i=0;i<tli.length;i++){
                    tli[i].className
            =i==n?"current1 current2":"";
                    mli[i].style.display
            =i==n?"block":"none";
                }    
                
            var a = 0x012345678;
                
            var a = 0xABCDEF12345;
                
            // line comment test@test.com in comment  http://www.shnenglu.com/megax in comment over
                /*
                block comment in js
                test@test.com in comment
                http://www.shnenglu.com/megax in comment
                over
                
            */
            }
            </script> function style var
            <style>
            body
            {
                function style var
                font-size
            : 12px;
                font-family
            : "sfdsfdsf";
                
            /*
                block comment in css
                test@test.com in comment
                http://www.shnenglu.com/megax in comment
                over
                
            */
            }

            </style>
            </head>
            <body>
            <table>
            </table>
            function style var /*sdfdsfdsf*/ return var
            <!-- 
            block comment in html
                test@test.com in comment
                http://www.shnenglu.com/megax in comment
                over
            -->
            </body>
            </html>

            posted on 2008-07-09 20:23 megax 閱讀(2140) 評(píng)論(4)  編輯 收藏 引用
            精品国产乱码久久久久软件| 久久久久亚洲精品无码网址| 久久精品国产亚洲av高清漫画| 欧美va久久久噜噜噜久久| 91久久精品91久久性色| 国产成人99久久亚洲综合精品| 色8激情欧美成人久久综合电| 免费久久人人爽人人爽av| 久久精品蜜芽亚洲国产AV| 色综合色天天久久婷婷基地| 亚洲午夜精品久久久久久app| 久久精品一区二区三区AV| 国产精品久久永久免费| 欧美日韩精品久久久免费观看| 久久人人爽人人爽人人片av麻烦| 久久av无码专区亚洲av桃花岛| 国产精品狼人久久久久影院| 久久久久久亚洲精品影院| 国产韩国精品一区二区三区久久| 久久国产免费| 日韩精品久久久肉伦网站 | 久久发布国产伦子伦精品| 久久综合久久久| 国产精品久久久久久久人人看| 97久久精品无码一区二区天美 | 99精品久久久久久久婷婷| 久久91精品国产91久久麻豆| 日本亚洲色大成网站WWW久久| 成人国内精品久久久久一区| 欧美日韩精品久久久免费观看| www久久久天天com| 久久人妻无码中文字幕| 国产综合成人久久大片91| 国产精品免费看久久久| 久久亚洲精品无码aⅴ大香 | 久久免费大片| 99久久精品毛片免费播放| 久久国产免费直播| 思思久久99热免费精品6| 国产日韩欧美久久| 久久99精品综合国产首页|