Lua中的函數(shù)是一階類型值(first-class value),定義函數(shù)就象創(chuàng)建普通類型值一樣(只不過函數(shù)類型值的數(shù)據(jù)主要是一條條指令而已),所以在函數(shù)體中仍然可以定義函數(shù)。假設(shè)函數(shù)f2定義在函數(shù)f1中,那么就稱f2為f1的內(nèi)嵌(inner)函數(shù),f1為f2的外包(enclosing)函數(shù),外包和內(nèi)嵌都具有傳遞性,即f2的內(nèi)嵌必然是f1的內(nèi)嵌,而f1的外包也一定是f2的外包。內(nèi)嵌函數(shù)可以訪問外包函數(shù)已經(jīng)創(chuàng)建的所有局部變量,這種特性便是所謂的詞法定界(lexical scoping),而這些局部變量則稱為該內(nèi)嵌函數(shù)的外部局部變量(external local variable)或者upvalue(這個詞多少會讓人產(chǎn)生誤解,因?yàn)閡pvalue實(shí)際指的是變量而不是值)。試看如下代碼:
function f1(n)
-- 函數(shù)參數(shù)也是局部變量
local function f2()
print(n) -- 引用外包函數(shù)的局部變量
end
return f2
end
g1 = f1(1979)
g1() -- 打印出1979
g2 = f1(500)
g2() -- 打印出500
當(dāng)執(zhí)行完g1 = f1(1979)后,局部變量n的生命本該結(jié)束,但因?yàn)樗呀?jīng)成了內(nèi)嵌函數(shù)f2(它又被賦給了變量g1)的upvalue,所以它仍然能以某種形式繼續(xù)“存活”下來,從而令g1()打印出正確的值。
可為什么g2與g1的函數(shù)體一樣(都是f1的內(nèi)嵌函數(shù)f2的函數(shù)體),但打印值不同?這就涉及到一個相當(dāng)重要的概念——閉包(closure)。事實(shí)上,Lua編譯一個函數(shù)時,會為它生成一個原型(prototype),其中包含了函數(shù)體對應(yīng)的虛擬機(jī)指令、函數(shù)用到的常量值(數(shù),文本字符串等等)和一些調(diào)試信息。在運(yùn)行時,每當(dāng)Lua執(zhí)行一個形如function...end 這樣的表達(dá)式時,它就會創(chuàng)建一個新的數(shù)據(jù)對象,其中包含了相應(yīng)函數(shù)原型的引用、環(huán)境(environment,用來查找全局變量的表)的引用以及一個由所有upvalue引用組成的數(shù)組,而這個數(shù)據(jù)對象就稱為閉包。由此可見,函數(shù)是編譯期概念,是靜態(tài)的,而閉包是運(yùn)行期概念,是動態(tài)的。g1和g2的值嚴(yán)格來說不是函數(shù)而是閉包,并且是兩個不相同的閉包,而每個閉包可以保有自己的upvalue值,所以g1和g2打印出的結(jié)果當(dāng)然就不一樣了。雖然閉包和函數(shù)是本質(zhì)不同的概念,但為了方便,且在不引起混淆的情況下,我們對它們不做區(qū)分。
使用upvalue很方便,但它們的語義也很微妙,需要引起注意。比如將f1函數(shù)改成:
function f1(n)
local function f2()
print(n)
end
n = n + 10
return f2
end
g1 = f1(1979)
g1() -- 打印出1989
內(nèi)嵌函數(shù)定義在n = n + 10這條語句之前,可為什么g1()打印出的卻是1989?upvalue實(shí)際是局部變量,而局部變量是保存在函數(shù)堆??蚣苌?stack frame)的,所以只要upvalue還沒有離開自己的作用域,它就一直生存在函數(shù)堆棧上。這種情況下,閉包將通過指向堆棧上的upvalue的引用來訪問它們,一旦upvalue即將離開自己的作用域(這也意味著它馬上要從堆棧中消失),閉包就會為它分配空間并保存當(dāng)前的值,以后便可通過指向新分配空間的引用來訪問該upvalue。當(dāng)執(zhí)行到f1(1979)的n = n + 10時,閉包已經(jīng)創(chuàng)建了,但是n并沒有離開作用域,所以閉包仍然引用堆棧上的n,當(dāng)return f2完成時,n即將結(jié)束生命,此時閉包便將n(已經(jīng)是1989了)復(fù)制到自己管理的空間中以便將來訪問。弄清楚了內(nèi)部的秘密后,運(yùn)行結(jié)果就不難解釋了。
upvalue還可以為閉包之間提供一種數(shù)據(jù)共享的機(jī)制。試看下例:
function Create(n)
local function foo1()
print(n)
end
local function foo2()
n = n + 10
end
return foo1,foo2
end
f1,f2 = Create(1979)
f1() -- 打印1979
f2()
f1() -- 打印1989
f2()
f1() -- 打印1999
f1,f2這兩個閉包的原型分別是Create中的內(nèi)嵌函數(shù)foo1和foo2,而foo1和foo2引用的upvalue是同一個,即Create的局部變量n。前面已說過,執(zhí)行完Create調(diào)用后,閉包會把堆棧上n的值復(fù)制出來,那么是否f1和f2就分別擁有一個n的拷貝呢?其實(shí)不然,當(dāng)Lua發(fā)現(xiàn)兩個閉包的upvalue指向的是當(dāng)前堆棧上的相同變量時,會聰明地只生成一個拷貝,然后讓這兩個閉包共享該拷貝,這樣任一個閉包對該upvalue進(jìn)行修改都會被另一個探知。上述例子很清楚地說明了這點(diǎn):每次調(diào)用f2都將upvalue的值增加了10,隨后f1將更新后的值打印出來。upvalue的這種語義很有價值,它使得閉包之間可以不依賴全局變量進(jìn)行通訊,從而使代碼的可靠性大大提高。
閉包在創(chuàng)建之時其upvalue就已經(jīng)不在堆棧上的情況也有可能發(fā)生,這是因?yàn)閮?nèi)嵌函數(shù)可以引用更外層外包函數(shù)的局部變量:
function Test(n)
local function foo()
local function inner1()
print(n)
end
local function inner2()
n = n + 10
end
return inner1,inner2
end
return foo
end
t = Test(1979)
f1,f2 = t()
f1() -- 打印1979
f2()
f1() -- 打印1989
g1,g2 = t()
g1() -- 打印1989
g2()
g1() -- 打印1999
f1() -- 打印1999
執(zhí)行完t = Test(1979)后,Test的局部變量n就“死”了,所以當(dāng)f1,f2這兩個閉包被創(chuàng)建時堆棧上根本找不到n的蹤影,這叫它們?nèi)绾稳〉胣的值呢?呵呵,不要忘了Test函數(shù)的n不僅僅是inner1和inner2的upvalue,同時它也是foo的upvalue。t = Test(1979)之后,t這個閉包一定已經(jīng)把n妥善保存好了,之后f1、f2如果在當(dāng)前堆棧上找不到n就會自動到它們的外包閉包(姑且這么叫)的upvalue引用數(shù)組中去找,并把找到的引用值拷貝到自己的upvalue引用數(shù)組中。仔細(xì)觀察上述代碼,可以判定g1和g2與f1和f2共享同一個upvalue。這是為什么呢?其實(shí),g1和g2與f1和f2都是同一個閉包(t)創(chuàng)建的,所以它們引用的upvalue(n)實(shí)際也是同一個變量,而剛才描述的搜索機(jī)制則保證了最后它們的upvalue引用都會指向同一個地方。
posted on 2007-04-02 23:21
清源游民 閱讀(2487)
評論(11) 編輯 收藏 引用 所屬分類:
Lua