1. 概述
Executable and linking format(ELF)文件是x86
Linux系統(tǒng)下的一種常用目標(biāo)文件(object file)格式,有三種主要類型:
(1)適于連接的可重定位文件(relocatable
file),可與其它目標(biāo)文件一起創(chuàng)建可執(zhí)行文件和共享目標(biāo)文件。
(2)適于執(zhí)行的可執(zhí)行文件(executable
file),用于提供程序的進(jìn)程映像,加載的內(nèi)存執(zhí)行。
(3)共享目標(biāo)文件(shared object
file),連接器可將它與其它可重定位文件和共享目標(biāo)文件連接成其它的目標(biāo)文件,動(dòng)態(tài)連接器又可將它與可執(zhí)行文件和其它共享目標(biāo)文件結(jié)合起來創(chuàng)建一個(gè)進(jìn)程映像。
ELF文件格式比較復(fù)雜,本文只是簡(jiǎn)要介紹它的結(jié)構(gòu),希望能給想了解ELF文件結(jié)構(gòu)的讀者以幫助。具體詳盡的資料請(qǐng)參閱專門的ELF文檔。
2.
文件格式
為了方便和高效,ELF文件內(nèi)容有兩個(gè)平行的視角:一個(gè)是程序連接角度,另一個(gè)是程序運(yùn)行角度,如圖1所示。
ELF
header在文件開始處描述了整個(gè)文件的組織,Section提供了目標(biāo)文件的各項(xiàng)信息(如指令、數(shù)據(jù)、符號(hào)表、重定位信息等),Program
header
table指出怎樣創(chuàng)建進(jìn)程映像,含有每個(gè)program header的入口,Section
header
table包含每一個(gè)section的入口,給出名字、大小等信息。

圖1
3. 數(shù)據(jù)表示
ELF數(shù)據(jù)編碼順序與機(jī)器相關(guān),數(shù)據(jù)類型有六種,見表1。

4.
ELF文件頭
象bmp、exe等文件一樣,ELF的文件頭包含整個(gè)文件的控制結(jié)構(gòu)。它的定義如下:
#define EI_NIDENT
16
typedef struct{
unsigned char e_ident[EI_NIDENT];
Elf32_Half
e_type;
Elf32_Half e_machine;
Elf32_Word e_version;
Elf32_Addr
e_entry;
Elf32_Off e_phoff;
Elf32_Off e_shoff;
Elf32_Word
e_flags;
Elf32_Half e_ehsize;
Elf32_Half e_phentsize;
Elf32_Half
e_phnum;
Elf32_Half e_shentsize;
Elf32_Half e_shnum;
Elf32_Half
e_shstrndx;
}Elf32_Ehdr;
其中E_ident的16個(gè)字節(jié)標(biāo)明是個(gè)ELF文件
(7F+'E'+'L'+'F'+class
+data+version+pad)。E_type表示文件類型,2表示可執(zhí)行文件。E_machine說明機(jī)器類別,3表示386機(jī)器,8表示
MIPS機(jī)器。E_entry給出進(jìn)程開始的虛地址,即系統(tǒng)將控制轉(zhuǎn)移的位置。E_phoff指出program
header
table的文件偏移,e_phentsize表示一個(gè)program
header表中的入口的長(zhǎng)度(字節(jié)數(shù)表示),e_phnum給出program
header表中的入口數(shù)目。類似的,e_shoff,e_shentsize,e_shnum
分別表示section
header表的文件偏移,表中每個(gè)入口的的字節(jié)數(shù)和入口數(shù)目。E_flags給出與處理器相關(guān)的標(biāo)志,e_ehsize給出ELF文件頭的長(zhǎng)度(字節(jié)數(shù)
表示)。E_shstrndx表示section名表的位置,指出在section
header表中的索引。
下面有個(gè)elf文件頭的例子,可以對(duì)照理解,見圖2。

圖2
5.
section header
目標(biāo)文件的section header
table可以定位所有的section,它是一個(gè)Elf32_Shdr結(jié)構(gòu)的數(shù)組,Section頭表的索引是這個(gè)數(shù)組的下標(biāo)。有些索引號(hào)是保留的,目標(biāo)文件不能使用這些特殊的索引。
Section包含目標(biāo)文件除了ELF文件頭、程序頭表、section頭表的所有信息,而且目標(biāo)文件section滿足幾個(gè)條件:
(1)目標(biāo)文件中的每個(gè)section都只有一個(gè)section頭項(xiàng)描述,可以存在不指示任何section的section頭項(xiàng)。
(2)每個(gè)section在文件中占據(jù)一塊連續(xù)的空間。
(3)Section之間不可重疊。
(4)目標(biāo)文件可以有非活動(dòng)空間,各種headers和sections沒有覆蓋目標(biāo)文件的每一個(gè)字節(jié),這些非活動(dòng)空間是沒有定義的。
Section
header結(jié)構(gòu)定義如下:
typedef struct{
Elf32_Word sh_name;
Elf32_Word
sh_type;
Elf32_Word sh_flags;
Elf32_Addr sh_addr;
Elf32_Off
sh_offset;
Elf32_Word sh_size;
Elf32_Word sh_link;
Elf32_Word
sh_info;
Elf32_Word sh_addralign;
Elf32_Word
sh_entsize;
}Elf32_Shdr;
其中sh_name指出section的名字,它的值是后面將會(huì)講到的
section
header
string
table中的索引,指出一個(gè)以null結(jié)尾的字符串。Sh_type是類別,sh_flags指示該section在進(jìn)程執(zhí)行時(shí)的特性。Sh_addr
指出若此section在進(jìn)程的內(nèi)存映像中出現(xiàn),則給出開始的虛地址。Sh_offset給出此section在文件中的偏移。其它字段的意義不太常用,
在此不細(xì)述。
文件的section含有程序和控制信息,系統(tǒng)使用一些特定的section,并
有其固定的類型和屬性(由sh_type和sh_info指出)。下面介紹幾個(gè)常用到的section:“.bss”段含有占據(jù)程序內(nèi)存映像的未初始化數(shù)
據(jù),當(dāng)程序開始運(yùn)行時(shí)系統(tǒng)對(duì)這段數(shù)據(jù)初始為零,但這個(gè)section并不占文件空間。“.data.”和“data1”段包含占據(jù)內(nèi)存映像的初始化數(shù)據(jù)。
“.rodata”和“.rodata1”段含程序映像中的只讀數(shù)據(jù)。“.shstrtab”段含有每個(gè)section的名字,由section入口結(jié)構(gòu)
中的sh_name索引。“.strtab”段含有表示符號(hào)表(symbol
table)名字的字符串。“.symtab”段含有文件的符號(hào)表,在后文專門介紹。“.text”段包含程序的可執(zhí)行指令。
6.
symbol table
目標(biāo)文件的符號(hào)表包含定位或重定位程序符號(hào)定義和引用時(shí)所需要的信息。符號(hào)表入口結(jié)構(gòu)定義如下:
typedef
struct{
Elf32_Word st_name;
Elf32_Addr st_value;
Elf32_Word
st_size;
Unsigned char st_info;
Unsigned char st_other;
Elf32_Half
st_shndx;
}Elf32_Sym;
其中st_name包含指向符號(hào)表字符串表(strtab)中的索引,從而可以獲得
符號(hào)名。St_value指出符號(hào)的值,可能是一個(gè)絕對(duì)值、地址等。St_size指出符號(hào)相關(guān)的內(nèi)存大小,比如一個(gè)數(shù)據(jù)結(jié)構(gòu)包含的字節(jié)數(shù)等。
St_info規(guī)定了符號(hào)的類型和綁定屬性,指出這個(gè)符號(hào)是一個(gè)數(shù)據(jù)名、函數(shù)名、section名還是源文件名;并且指出該符號(hào)的綁定屬性是local、
global還是weak。