一、緣起
一直很想做一個自己的動態語言了,記得三年前學習Compiler的時候做了不成器的Tiny++和語法全部按足《編譯原理實踐》的C--,其中C--還做得非常不好(基本只能看看用不了),然后上次看了《游戲腳本高級編程》,里面介紹的XScript雖然非常簡單,但已經有語言的影子。然后又看了《python源碼剖析》,看了python的源碼,學習了很多python的內部機理,感覺python雖強大巧妙但由于源碼是C語言的,讀上去總覺得拗口。
在這些基礎下,我鼓足勇氣,實現一個動態語言,名字叫AnyC,名字怎么起的忘記了(好像是看了三星手機。。。),反正先這樣吧。
二、語言特性
這個語言語法上模仿C++和Java(其實更像javascript),以后打算模仿其他語言的優秀特性,支持動態類型、面向對象OOP和函數式編程,內置整形、浮點、array、string、表等類型,支持繼承、異常處理、子段數組、lambda表達式、尾遞歸等。內存管理方面稍差,目前采用引用計數。。。。
例子1:動態特性
function _Main()


{
var k = "hello world";//string類
write_console(k+"\n");
k = 10; //int類
write_console(k+"\n");
k = [1,2,3,4,5]; //數組類
for(var i = 0; i < 5; ++i)
write_console(k[i]+" ");
write_console("\n");
}

例子2:快速排序
function Divide(arr,low,high)


{
var tmp = arr[low];
var left = low;
var right = high+1;
while(left < right)

{
while(left < high && arr[++left] < tmp);
while(right >low && arr[--right] > tmp);
if(left < right)

{
var kk = arr[left];
arr[left] = arr[right];
arr[right] = kk;
}
}
var kk = arr[low];
arr[low] = arr[right];
arr[right] = kk;
return right;
}

function qsort(arr,low,high)


{
if(low < high)

{
var mid = Divide(arr,low,high);
qsort(arr,low,mid-1);
qsort(arr,mid+1,high);
}
}

function Main()


{
write_console("快速排序演示: \n");
var datas = [-9,0,0,98,-576,98,74,34,5,3,7,8,1];
write_console("排序前:\n");
foreach(idx,val in datas)

{
write_console(val + " ");
}
qsort(datas,0,12);
write_console("\n排序后:\n");
foreach(idx,val in datas)

{
write_console(val + " ");
}
write_console("\n");
}

例子3: 橋接模式
class Log


{
protected:
implementor = null;
public:
function set(value)

{
implementor = value;
}
function write(log);
};

class DatabaseLog : Log


{
public:
function write(log)

{
write_console("日志寫入數據庫
\n");
implementor.execute(log);
}
};

class TextFileLog : Log


{
public:
function write(log)

{
write_console("日志寫入文件
\n");
implementor.execute(log);
}
};

class ImpLog


{
public:
function execute(_string_);
};

class DotNetPlatfrom : ImpLog


{
public:
function execute(_string_)

{
write_console(".net 平臺中
\n");
write_console("寫入 " + _string_ + "\n");
}
};

class JavaPlatfrom : ImpLog


{
public:
function execute(_string_)

{
write_console("Java 平臺中
\n");
write_console("寫入 " + _string_ + "\n");
}
};

function _Main()


{
write_console("面向對象編程--設計模式--橋接模式演示例子!\n");
//.NET平臺下的Database Log
var dblog = DatabaseLog();
dblog.set(DotNetPlatfrom ());
dblog.write("今天完成了XXX任務\n");

//Java平臺下的Text File Log
var txtlog = TextFileLog();
txtlog.set(JavaPlatfrom());
txtlog.write("今天學會用Java了\n");

}

例子4: 數組操作
function _Main()


{
var k = [1,2,3,4];
var q = [4,5,6];
q[0 -> 1] = k[0:2];
write_console("---結果為【1,2,6】--\n");
foreach(val in q)
write_console(val + "\n");
q[2 <- 0] = k[1:3];
write_console("---結果為【4,3,2】--\n");
foreach(val in q)
write_console(val + "\n");
q[0:3] = k[0:3];
write_console("---結果為【1,2,3】--\n");
foreach(val in q)
write_console(val + "\n");
write_console("---結果為【2,1】--\n");
q[2 <- 0] = k[0:2];
foreach(val in q)
write_console(val + "\n");
}
function _Main()


{
var a = ["spam", "eggs",123,1234];
a[0:2] = [];
foreach(val in a)
write_console(val + "\n");
write_console("------------\n");
a[1:0] = ["bletch","xyzzy"];
foreach(val in a)
write_console(val + "\n");
a[a.length() : 0] = a;
write_console("------------\n");
foreach(val in a)
write_console(val + "\n");
}


例子5 lambda for sort
function sort(arr,len,cmpFun)


{
var tmp = 0;
var i ,j;
for(i = 0; i < len; ++i)

{
for(j = 0;j < len-i-1;++j)

{
if(cmpFun(arr[j],arr[j+1]))

{
tmp = arr[j];
arr[j] = arr[j+1];
arr[j+1] = tmp;
}
}
}
}

function Main()


{
var datas = [3,4,1,6,8];
var len = 5;
write_console("開始排序:\n");
sort(datas,len,lambda(a,b) a > b);

for(var k = 0; k < len; ++k)

{
write_console(datas[k] + " ");
}
write_console("\n");
}

例子6 函數式
function outerFunction()


{
var outVar=0;
return function()

{
outVar++;
write_console(outVar+"\n");
}
}
function _Main()


{
var instance=outerFunction();
instance();

var instance2=outerFunction();
instance2();

instance();

instance2();
}


三、實現心得
這個語言的主要思想很大一部分參考了python,是基于虛擬機的腳本語言,首先進行lexer提取token,然后手寫遞歸下降器解析生成語法樹,
然后用visitor訪問語法樹生成字節碼,最后啟動虛擬機運行。
我認為實現動態語言主要分4個環節:
1. 基本庫的建立
這個并不是指腳本的庫,是指C++的庫,用到的一些東西如智能指針、鏈表等數據結構(也可用STL)、文件類等是必須的。
2. 動態對象環境
主要是在C++層面上實現一個“動態對象”,它是一個基于引用計數的指針對象,可以指向指定的對象,并實現內置動態對象的一些功能接口。
3. 詞法語法分析及語義翻譯
此過程比較規則化,前兩者可以用lexer和yacc做,我覺得不復雜的話手寫也不錯,畢竟手寫靈活性大一點,成功生成語法樹后就是語法翻譯成
字節碼,翻譯是比較困難的環節,難的話還會考慮各種代碼優化計算、編譯成本地的JIT等。
4. 虛擬機
虛擬機負責分析字節碼,自己創建一個虛擬的運行環境,提供HostAPI插件接口和調用規則。可以說虛擬機是比較復雜的一部分,因為它涉及的東西很雜,當然也可以很簡單(如果虛擬機低效和功能小的話)。
四、結語
接下來還要做很多去完善這個東西,包括如何和C++進行良好對接,豐富腳本API以及豐富語言特性如提供正則表達式內置對象等。
posted on 2012-03-08 11:05
bennycen 閱讀(709)
評論(4) 編輯 收藏 引用 所屬分類:
Windows Programming