a.out 格式在不同的機(jī)器平臺(tái)和不同的 UNIX 操作系統(tǒng)上有輕微的不同,例如在 MC680x0 平臺(tái)上有 6 個(gè) section。下面我們討論的是最"標(biāo)準(zhǔn)"的格式。
a.out 文件包含 7 個(gè) section,格式如下:exec header(執(zhí)行頭部,也可理解為文件頭部)
text segment(文本段)
data segment(數(shù)據(jù)段)
text relocations(文本重定位段)
data relocations(數(shù)據(jù)重定位段)
symbol table(符號(hào)表)
string table(字符串表)
執(zhí)行頭部的數(shù)據(jù)結(jié)構(gòu):struct exec {
unsigned long a_midmag; /* 魔數(shù)和其它信息 */
unsigned long a_text; /* 文本段的長(zhǎng)度 */
unsigned long a_data; /* 數(shù)據(jù)段的長(zhǎng)度 */
unsigned long a_bss; /* BSS段的長(zhǎng)度 */
unsigned long a_syms; /* 符號(hào)表的長(zhǎng)度 */
unsigned long a_entry; /* 程序進(jìn)入點(diǎn) */
unsigned long a_trsize; /* 文本重定位表的長(zhǎng)度 */
unsigned long a_drsize; /* 數(shù)據(jù)重定位表的長(zhǎng)度 */
};
文件頭部主要描述了各個(gè) section 的長(zhǎng)度,比較重要的字段是 a_entry(程序進(jìn)入點(diǎn)),代表了系統(tǒng)在加載程序并初試化各種環(huán)境后開(kāi)始執(zhí)行程序代碼的入口。這個(gè)字段在后面討論的 ELF 文件頭部中也有出現(xiàn)。由 a.out 格式和頭部數(shù)據(jù)結(jié)構(gòu)我們可以看出,a.out 的格式非常緊湊,只包含了程序運(yùn)行所必須的信息(文本、數(shù)據(jù)、BSS),而且每個(gè) section 的順序是固定的。這種結(jié)構(gòu)缺乏擴(kuò)展性,如不能包含"現(xiàn)代"可執(zhí)行文件中常見(jiàn)的調(diào)試信息,最初的 UNIX 黑客對(duì) a.out 文件調(diào)試使用的工具是 adb,而 adb 是一種機(jī)器語(yǔ)言調(diào)試器!
a.out 文件中包含符號(hào)表和兩個(gè)重定位表,這三個(gè)表的內(nèi)容在連接目標(biāo)文件以生成可執(zhí)行文件時(shí)起作用。在最終可執(zhí)行的 a.out 文件中,這三個(gè)表的長(zhǎng)度都為 0。a.out 文件在連接時(shí)就把所有外部定義包含在可執(zhí)行程序中,如果從程序設(shè)計(jì)的角度來(lái)看,這是一種硬編碼方式,或者可稱為模塊之間是強(qiáng)藕和的。在后面的討論中,我們將會(huì)具體看到ELF格式和動(dòng)態(tài)連接機(jī)制是如何對(duì)此進(jìn)行改進(jìn)的。
a.out 是早期UNIX系統(tǒng)使用的可執(zhí)行文件格式,由 AT&T 設(shè)計(jì),現(xiàn)在基本上已被 ELF 文件格式代替。a.out 的設(shè)計(jì)比較簡(jiǎn)單,但其設(shè)計(jì)思想明顯的被后續(xù)的可執(zhí)行文件格式所繼承和發(fā)揚(yáng)。可以參閱 參考資料 16 和閱讀 參考資料 15 源代碼加深對(duì) a.out 格式的理解。 參考資料 12 討論了如何在"現(xiàn)代"的紅帽LINUX運(yùn)行 a.out 格式文件。
COFF 文件格式分析
COFF 格式比 a.out 格式要復(fù)雜一些,最重要的是包含一個(gè)節(jié)段表(section table),因此除了 .text,.data,和 .bss 區(qū)段以外,還可以包含其它的區(qū)段。另外也多了一個(gè)可選的頭部,不同的操作系統(tǒng)可一對(duì)此頭部做特定的定義。
COFF 文件格式如下:File Header(文件頭部)
Optional Header(可選文件頭部)
Section 1 Header(節(jié)頭部)
………
Section n Header(節(jié)頭部)
Raw Data for Section 1(節(jié)數(shù)據(jù))
Raw Data for Section n(節(jié)數(shù)據(jù))
Relocation Info for Sect. 1(節(jié)重定位數(shù)據(jù))
Relocation Info for Sect. n(節(jié)重定位數(shù)據(jù))
Line Numbers for Sect. 1(節(jié)行號(hào)數(shù)據(jù))
Line Numbers for Sect. n(節(jié)行號(hào)數(shù)據(jù))
Symbol table(符號(hào)表)
String table(字符串表)
文件頭部的數(shù)據(jù)結(jié)構(gòu):struct filehdr
{
unsigned short f_magic; /* 魔數(shù) */
unsigned short f_nscns; /* 節(jié)個(gè)數(shù) */
long f_timdat; /* 文件建立時(shí)間 */
long f_symptr; /* 符號(hào)表相對(duì)文件的偏移量 */
long f_nsyms; /* 符號(hào)表?xiàng)l目個(gè)數(shù) */
unsigned short f_opthdr; /* 可選頭部長(zhǎng)度 */
unsigned short f_flags; /* 標(biāo)志 */
};
COFF 文件頭部中魔數(shù)與其它兩種格式的意義不太一樣,它是表示針對(duì)的機(jī)器類型,例如 0x014c 相對(duì)于 I386 平臺(tái),而 0x268 相對(duì)于 Motorola 68000系列等。當(dāng) COFF 文件為可執(zhí)行文件時(shí),字段 f_flags 的值為 F_EXEC(0X00002),同時(shí)也表示此文件沒(méi)有未解析的符號(hào),換句話說(shuō),也就是重定位在連接時(shí)就已經(jīng)完成。由此也可以看出,原始的 COFF 格式不支持動(dòng)態(tài)連接。為了解決這個(gè)問(wèn)題以及增加一些新的特性,一些操作系統(tǒng)對(duì) COFF 格式進(jìn)行了擴(kuò)展。Microsoft 設(shè)計(jì)了名為 PE(Portable Executable)的文件格式,主要擴(kuò)展是在 COFF 文件頭部之上增加了一些專用頭部,具體細(xì)節(jié)請(qǐng)參閱 參考資料 18,某些 UNIX 系統(tǒng)也對(duì) COFF 格式進(jìn)行了擴(kuò)展,如 XCOFF(extended common object file format)格式,支持動(dòng)態(tài)連接,請(qǐng)參閱 參考資料 5。
緊接文件頭部的是可選頭部,COFF 文件格式規(guī)范中規(guī)定可選頭部的長(zhǎng)度可以為 0,但在 LINUX 系統(tǒng)下可選頭部是必須存在的。下面是 LINUX 下可選頭部的數(shù)據(jù)結(jié)構(gòu):typedef struct
{
char magic[2]; /* 魔數(shù) */
char vstamp[2]; /* 版本號(hào) */
char tsize[4]; /* 文本段長(zhǎng)度 */
char dsize[4]; /* 已初始化數(shù)據(jù)段長(zhǎng)度 */
char bsize[4]; /* 未初始化數(shù)據(jù)段長(zhǎng)度 */
char entry[4]; /* 程序進(jìn)入點(diǎn) */
char text_start[4]; /* 文本段基地址 */
char data_start[4]; /* 數(shù)據(jù)段基地址 */
}
COFF_AOUTHDR;
字段 magic 為 0413 時(shí)表示 COFF 文件是可執(zhí)行的,注意到可選頭部中顯式定義了程序進(jìn)入點(diǎn),標(biāo)準(zhǔn)的 COFF 文件沒(méi)有明確的定義程序進(jìn)入點(diǎn)的值,通常是從 .text 節(jié)開(kāi)始執(zhí)行,但這種設(shè)計(jì)并不好。
前面我們提到,COFF 格式比 a.out 格式多了一個(gè)節(jié)段表,一個(gè)節(jié)頭條目描述一個(gè)節(jié)數(shù)據(jù)的細(xì)節(jié),因此 COFF 格式能包含更多的節(jié),或者說(shuō)可以根據(jù)實(shí)際需要,增加特定的節(jié),具體表現(xiàn)在 COFF 格式本身的定義以及稍早提及的 COFF 格式擴(kuò)展。我個(gè)人認(rèn)為,節(jié)段表的出現(xiàn)可能是 COFF 格式相對(duì) a.out 格式最大的進(jìn)步。下面我們將簡(jiǎn)單描述 COFF 文件中節(jié)的數(shù)據(jù)結(jié)構(gòu),因?yàn)楣?jié)的意義更多體現(xiàn)在程序的編譯和連接上,所以本文不對(duì)其做更多的描述。此外,ELF 格式和 COFF格式對(duì)節(jié)的定義非常相似,在隨后的 ELF 格式分析中,我們將省略相關(guān)討論。struct COFF_scnhdr
{
char s_name[8]; /* 節(jié)名稱 */
char s_paddr[4]; /* 物理地址 */
char s_vaddr[4]; /* 虛擬地址 */
char s_size[4]; /* 節(jié)長(zhǎng)度 */
char s_scnptr[4]; /* 節(jié)數(shù)據(jù)相對(duì)文件的偏移量 */
char s_relptr[4]; /* 節(jié)重定位信息偏移量 */
char s_lnnoptr[4]; /* 節(jié)行信息偏移量 */
char s_nreloc[2]; /* 節(jié)重定位條目數(shù) */
char s_nlnno[2]; /* 節(jié)行信息條目數(shù) */
char s_flags[4]; /* 段標(biāo)記 */
};
有一點(diǎn)需要注意:LINUX系統(tǒng)中頭文件coff.h中對(duì)字段s_paddr的注釋是"physical address",但似乎應(yīng)該理解為"節(jié)被加載到內(nèi)存中所占用的空間長(zhǎng)度"。字段s_flags標(biāo)記該節(jié)的類型,如文本段、數(shù)據(jù)段、BSS段等。在COFF的節(jié)中也出現(xiàn)了行信息,行信息描述了二進(jìn)制代碼與源代碼的行號(hào)之間的對(duì)映關(guān)系,在調(diào)試時(shí)很有用。
轉(zhuǎn)自:
http://www.360doc.com/content/080313/18/59039_1115300.html
posted on 2009-12-05 23:34
chatler 閱讀(613)
評(píng)論(0) 編輯 收藏 引用 所屬分類:
FileFormat