表達(dá)式值的存儲(chǔ)
LLVM中基本數(shù)據(jù)類(lèi)型及存儲(chǔ)類(lèi)型
值是編譯器所需要處理的基本數(shù)據(jù)。它出現(xiàn)在各個(gè)角落,條件分支、表達(dá)式、返回語(yǔ)句。甚至是函數(shù)地址也可以被視作是值類(lèi)型。
對(duì)于編譯器而言,最基本的值是整數(shù)和浮點(diǎn)。其他的值都可以用這兩者來(lái)表達(dá),例如布爾和指針。如果你是從一個(gè)最基本的指令集開(kāi)始寫(xiě)起,那么整數(shù)和浮點(diǎn)的數(shù)值運(yùn)算、轉(zhuǎn)換、基于整數(shù)寄存器的跳轉(zhuǎn)和地址取值是一個(gè)寄存器機(jī)的最基本操作。所有更加高級(jí)的操作,例如數(shù)組、結(jié)構(gòu)體、指針、函數(shù)、對(duì)象等,都可以建立在這一基礎(chǔ)上。
如果一個(gè)指令系統(tǒng)在整數(shù)和浮點(diǎn)數(shù)之外,額外提供了布爾、分支、函數(shù)調(diào)用和結(jié)構(gòu)體的支持,那么它與高級(jí)語(yǔ)言將會(huì)貼近更多,生成代碼的方式也更加簡(jiǎn)單。
在高級(jí)語(yǔ)義的數(shù)據(jù)結(jié)構(gòu)上,LLVM提供了相當(dāng)良好的支持。它支持的原生類(lèi)型(First class)包括: 各種精度的整型和浮點(diǎn)數(shù),指針、向量,結(jié)構(gòu)體和數(shù)組。這些類(lèi)型的數(shù)據(jù)存取和運(yùn)算都是有指令直接支撐,而不需要自行計(jì)算并生成更加原始的指令。
在存儲(chǔ)類(lèi)型上,LLVM提供了Value, Argument, Alloca, GlobalVariable, Pointer五種存儲(chǔ)類(lèi)型。Value是右值,它不可取引用,不可更改。Argument表示了函數(shù)實(shí)參,它是Value的一個(gè)派生類(lèi)。所以對(duì)參數(shù)的任何更改行為實(shí)際上都是不被允許的。Alloca保存了棧地址,GlobalVariable保存了全局變量的地址,Pointer則是一般意義上的指針。
除了存儲(chǔ)指令,LLVM所有的指令都是針對(duì)Value的操作,并返回一個(gè)Value。所以
Var a = Alloca int
Var b = Alloca int
Var c = Alloca int
c = ADD a, b
這樣的操作,在LLVM中實(shí)際上是將a和b的地址相加,并把C從變量替換成一個(gè)左值(注意,是替換,變量的值沒(méi)有任何變化)。
在LLVM中,正確的做法應(yīng)當(dāng)類(lèi)似于下面這樣:
a = Alloca int
b = Alloca int
c = Alloca int
a_v = load a
b_v = load b
c_v = ADD a, b
store c, c_v
要先將值從變量中讀出,進(jìn)行操作,再保存到另外一個(gè)變量中。
表達(dá)式值的數(shù)據(jù)結(jié)構(gòu)
一個(gè)的表達(dá)式參數(shù)或結(jié)果可能是左值或右值。例如++x輸入一個(gè)左值返回一個(gè)左值,而x++就返回一個(gè)右值。A+B則是需要兩個(gè)右值并返回一個(gè)右值。
一個(gè)左值可以很方便的轉(zhuǎn)化為右值,但是右值轉(zhuǎn)化成左值通常是很困難的。地址信息被丟棄了,或者它根本就是一個(gè)字面常量,都會(huì)導(dǎo)致一個(gè)右值將永遠(yuǎn)是右值。將右值構(gòu)造成左值的唯一辦法,就是構(gòu)造臨時(shí)對(duì)象并將右值賦予左值。當(dāng)這個(gè)左值被讀取時(shí),如果臨時(shí)對(duì)象除了初始化之外從未被寫(xiě)過(guò),并且它關(guān)聯(lián)的右值依然有效,那么這個(gè)操作會(huì)被優(yōu)化成直接返回那個(gè)原始的右值,從而避免臨時(shí)左值的讀寫(xiě)操作。
在Clang(一個(gè)C++編譯器的前端)中對(duì)左值和右值進(jìn)行了嚴(yán)格的區(qū)分。這是由于C++需要額外的處理臨時(shí)對(duì)象。臨時(shí)對(duì)象意味著盡管它有右值的語(yǔ)義,但是實(shí)際上是左值的存儲(chǔ)。這是需要將真正的左值和臨時(shí)的左值區(qū)分開(kāi),并提供特定語(yǔ)境下的轉(zhuǎn)化。
SASL沒(méi)有處理復(fù)雜的臨時(shí)對(duì)象問(wèn)題,因此它使用了一個(gè)相對(duì)簡(jiǎn)單的辦法來(lái)解決左右值的判定和存儲(chǔ)。
我們?cè)O(shè)計(jì)了一個(gè)數(shù)據(jù)結(jié)構(gòu),用于保存任何可能的值。
struct Data{
bool isRef;
Value* rval;
Alloca* local;
GlobalVariable* global;
struct Aggregated{
Data* parent;
int index;
} agg;
};
rval用于處理Argument和右值時(shí)的情況。Local意味著它是一個(gè)局部變量,global說(shuō)明它是一個(gè)全局變量,agg則用于處理structure member。Parent指向包含當(dāng)前變量的聚合變量,index則指明了當(dāng)前變量在聚合變量中的位次。
SASL提供了load, load_ptr 和 store 來(lái)數(shù)據(jù)的存取,而不要關(guān)心它的具體存儲(chǔ)類(lèi)型。
左值/右值語(yǔ)義
在Data這個(gè)結(jié)構(gòu)中,rval, local, global和agg四個(gè)值是互斥的。當(dāng)然這里的我們也可以選擇union+enum的方式來(lái)表達(dá)。
首先來(lái)看,這個(gè)結(jié)構(gòu)如何表達(dá)左值/右值語(yǔ)義。
來(lái)看isRef,這是一個(gè)標(biāo)記位。它表示了data存儲(chǔ)的值究竟是值本身還是地址。如果是isref為真,那么data便可以被認(rèn)為是一個(gè)左值。Isref為假,那么當(dāng)它是rval的時(shí)候,它就是一個(gè)真正的右值了。如果是Alloca或者GlobalVariable,因?yàn)樗鼈儽旧砭痛砹说刂罚敲此匀皇且粋€(gè)右值。如果是agg,那么要取決于它的聚合量是左值還是右值。
如果參數(shù)需要左值,那么可以直接從data拷貝,或者使用load_ptr + isRef創(chuàng)建一個(gè)新的右值Data。如果參數(shù)需要右值,那么可以通過(guò)load的方式獲取一個(gè)右值。
數(shù)據(jù)存取的實(shí)現(xiàn)
llvm::Value* load( cgllvm_sctxt* data ){
assert(data);
Value* val = data->val;
do{
if( val ){ break; }
if( data->local ){ val = builder()->CreateLoad( data->local );
break;
}
if( data->global ){
val = builder()->CreateLoad( data->global );
break;
}
if( data.agg.parent ){
val = load( data->agg.parent );
val = builder()->CreateExtractValue( val, data->agg.index );
break;
}
} while(0);
if( data->is_ref ){val = builder()->CreateLoad( val );}
return val;
}
llvm::Value* load_ptr( cgllvm_sctxt* data ){
Value* addr = NULL;
if( data->val ){ addr = NULL; }
if( data->local ){
addr = data->local;
}
if( data->global ){
addr = data->global;
}
if( data->agg.parent ){
addr = builder()->CreateGEP( load_ptr(data->agg.parent), 0, data->arg.index );
}
if( data->is_ref ){
if( !addr ){
addr = data->val;
} else {
addr = builder()->CreateLoad( addr );
}
}
return addr;
}
void store( llvm::Value* v, cgllvm_sctxt* data ){
Value* addr = load_ptr( data );
builder()->CreateStore( v, addr );
}