posts - 71, comments - 41, trackbacks - 0

上一篇文章介紹了COFF目標(biāo)文件的結(jié)構(gòu)。如果你試著做一個(gè)應(yīng)用程序的連接器（Linker），就會(huì)發(fā)現(xiàn)，僅僅有目標(biāo)文件是不夠的。我們?cè)谶B接程序時(shí)，不僅僅要用到目標(biāo)文件，庫(kù)文件也是必不可少的。
    庫(kù)文件是怎么樣的結(jié)構(gòu)呢？
    其實(shí)，庫(kù)文件的結(jié)構(gòu)也很簡(jiǎn)單。它就是“一堆”目標(biāo)文件的集合。把目標(biāo)文件做成庫(kù)以后，我們?cè)谑褂媚繕?biāo)文件中所實(shí)現(xiàn)的功能時(shí)，連接程序會(huì)自動(dòng)在庫(kù)文件里查找相應(yīng)的目標(biāo)文件，并使用它。這大大減少了我們對(duì)目標(biāo)文件的管理工作，減輕了代碼重用的負(fù)擔(dān)。
    Lib文件中的節(jié)
    COFF格式中所用到的“節(jié)”的概念再次出現(xiàn)在Lib格式中。不過(guò)，Lib文件的節(jié)要簡(jiǎn)單得多。先讓我們來(lái)看看它的整體結(jié)構(gòu)：

    如右圖所示：
    Lib格式只有四種類(lèi)型的節(jié)（Section），即First Sec，Second Sec，Longname Sec和Obj Sec；其中Second Sec與Longname Sec是可選節(jié)，很多Lib文件中都沒(méi)有。而開(kāi)頭的Singature只是一個(gè)標(biāo)識(shí)，它相當(dāng)于COFF目標(biāo)文件中的魔法數(shù)字。它是一個(gè)長(zhǎng)度為8的字符串，值為“!<arch>\n”。
    First Sec，顧名思義，就是第一個(gè)節(jié)。它包含了庫(kù)中所有的符號(hào)名以及這些符號(hào)所在的目標(biāo)文件在庫(kù)中的位置（絕對(duì)偏移）。
    Second Sec就是第二節(jié)。它的內(nèi)容和First Sec是相同的。不同的是，Second Sec是一個(gè)有序表，通過(guò)它來(lái)查找?guī)熘械姆?hào)比通過(guò)First Sec來(lái)查找要快很多。

Signature

First Sec

Second Sec

Longname Sec

Obj Sec1

Obj Sec2

……

Longname Sec是長(zhǎng)名稱(chēng)節(jié)。這一節(jié)是一個(gè)字符串表。它包含了所有長(zhǎng)目標(biāo)文件名。如果后面的Obj Sec中沒(méi)有給出相應(yīng)的目標(biāo)文件名，我們就要到這一節(jié)中來(lái)查找。
Obj Sec就是目標(biāo)文件節(jié)。這些節(jié)中存儲(chǔ)著不同的目標(biāo)文件的原始數(shù)據(jù)。

    在庫(kù)文件中，每一節(jié)都有兩個(gè)部分。一個(gè)部分是頭，另一個(gè)部分才是該節(jié)的數(shù)據(jù)；數(shù)據(jù)緊跟在頭的后面。頭描述了該節(jié)數(shù)據(jù)的類(lèi)型、長(zhǎng)度等信息。這些頭的格式都是相同的。其結(jié)構(gòu)用C語(yǔ)言描述如下：
    typedef struct {
        char Name[16];      // 名稱(chēng)
        char Time[12];      // 時(shí)間
        char UserID[6];     // 用戶(hù)ID
        char GroupID[6];    // 組ID
        char Mode[8];       // 模式
        char Size[10];      // 長(zhǎng)度
        char EndOfHeader[2];// 結(jié)束符
    } SectionHeader;
    可以看到，頭中的數(shù)據(jù)全都是字符串。用字符串的好處是可以提高格式的兼容性，因?yàn)樵诓煌臋C(jī)器上，數(shù)據(jù)的排列方式是不同的。有的機(jī)器是以L(fǎng)ittle-Endian方式工作，還有的是以Big-Endian方式工作，它們互不兼容（這兩種方式的區(qū)別！？請(qǐng)看我的《COFF格式》一文，其中的文件頭一節(jié)有說(shuō)明）。用字符串就不會(huì)有這種問(wèn)題（后面我們將會(huì)遇到）。但它也有不方便的地方，就是必須把字符串轉(zhuǎn)換成數(shù)值，多了一個(gè)步驟。
    在這個(gè)結(jié)構(gòu)中，最常用的Name、Size以及EndOfHeader三個(gè)成員。Name就是節(jié)的名稱(chēng)啦！Size也很好理解，就是該節(jié)數(shù)據(jù)的長(zhǎng)度。現(xiàn)在要注意的就是這個(gè)EndOfHeader成員了！這個(gè)成員標(biāo)志著頭的結(jié)束，其內(nèi)容為“`\n”（注意，這里沒(méi)有打錯(cuò)，是兩個(gè)字符“`”和“\n”）。怎么樣？有點(diǎn)奇怪吧？為什么要有這個(gè)結(jié)束符？每一節(jié)的頭長(zhǎng)度一定，每節(jié)中的數(shù)據(jù)長(zhǎng)度也知道。按順序向下讀不行嗎？答案是：不行！因?yàn)槊恳还?jié)之間存在間隙！通常是一個(gè)字節(jié)或零個(gè)字節(jié)。如果是零個(gè)字節(jié)倒好，按順序向下讀是OK的。可是如果不為零的話(huà)，這樣讀就要錯(cuò)位了。要知道錯(cuò)位沒(méi)有，只好用一個(gè)結(jié)束符來(lái)定位了。如果在讀頭的時(shí)候發(fā)現(xiàn)結(jié)束符不對(duì)，那就要一個(gè)字節(jié)一個(gè)字節(jié)地向下查找，直到找到結(jié)束符，才能算是對(duì)齊了。切記！切記！
    當(dāng)然，通過(guò)First Sec或Second Sec中給出的偏移來(lái)讀數(shù)據(jù)就不存在這個(gè)問(wèn)題。不會(huì)發(fā)生錯(cuò)位，放心讀吧！
    現(xiàn)在讓我們來(lái)看看每一節(jié)中的數(shù)據(jù)是什么樣子。

    First Sec
    第一節(jié)，通常就是Lib中的每一個(gè)小節(jié)。它的名稱(chēng)是“/”。其數(shù)據(jù)部分的結(jié)構(gòu)如下：
    typedef struct {
        unsigned long SymbolNum;         // 庫(kù)中符號(hào)的數(shù)量
        unsigned long SymbolOffset[n];   // 符號(hào)所在目標(biāo)節(jié)的偏移
        char StrTable[m];                // 符號(hào)名稱(chēng)字符串表
    }FirstSec;
    第一個(gè)成員SymbolNum是符號(hào)的數(shù)量。注意！它是以Big-Endian方式儲(chǔ)存的（x86平臺(tái)上的數(shù)據(jù)是以L(fǎng)ittle-Endian方式儲(chǔ)存的。這里應(yīng)該注意轉(zhuǎn)換。后面給出的convert函數(shù)可以在Little-Endian格式與Big-Endian格式之間進(jìn)行相互轉(zhuǎn)換）。
    第二個(gè)成員SymbolOffset是一個(gè)數(shù)組，它的長(zhǎng)度n就是符號(hào)的數(shù)量，也就是SymbolNum。這個(gè)數(shù)組儲(chǔ)存了每一個(gè)符號(hào)所在的目標(biāo)節(jié)的偏移。我們可以方便地通過(guò)它來(lái)查找符號(hào)所在的目標(biāo)文件。注意！它也是以Big-Endian格式儲(chǔ)存的。
    第三個(gè)成員StrTable是一個(gè)字符串表，它的長(zhǎng)度m就是SectionHeader.Size的值減去（SymbolNum+1）*4。其結(jié)構(gòu)很簡(jiǎn)單，就是一堆以‘\0’結(jié)尾的字符串（和COFF文件中的字符串表結(jié)構(gòu)相同）。在有的系統(tǒng)中，它還可能是以“/\n”這兩個(gè)字符結(jié)尾的字符串的集合。
    很簡(jiǎn)單的一個(gè)結(jié)構(gòu)，不過(guò)有兩個(gè)成員的長(zhǎng)度是不定的。怎么才能方便地從Lib中讀出這些數(shù)據(jù)，留給大家自己想吧！下面我只給出一個(gè)進(jìn)行Little-Endian與Big-Endian互轉(zhuǎn)的函數(shù)。
    inline void convert(void * p          // 要轉(zhuǎn)換的數(shù)據(jù)的指針
                        ,size_t size = 4  // 數(shù)據(jù)的長(zhǎng)度，long為4，short為2
                        ) {
        char * buf=(char*)p;
        char temp;
        for ( size_t i=0;i<size/2;i++ ) {
            temp=buf[i];
            buf[i]=buf[size-i-1];
            buf[size-i-1]=temp;
        }
    }

Second Sec
    現(xiàn)在看看第二節(jié)。
    這一節(jié)與第一節(jié)很相似！它通常也就是Lib文件的第二個(gè)節(jié)。它的名字也是“/”（注意：文件中第一個(gè)叫“/”的節(jié)是第一節(jié)，第二個(gè)就是第二節(jié)）。不過(guò)它的結(jié)構(gòu)與第一節(jié)有些不同，如下：
    typedef struct {
        unsigned long ObjNum;        // Obj Sec的數(shù)量
        unsigned long ObjOffset[x];  // 每一個(gè)Obj Sec的偏移
        unsigned long SymbolNum;    // 庫(kù)中符號(hào)的數(shù)量
        unsigned short SymbolIdx[n]; // 符號(hào)在ObjOffset表中的索引
        char StrTable[m];            // 符號(hào)名稱(chēng)字符串表
    }SecondSec;
    第一個(gè)成員ObjNum是庫(kù)中Obj Sec的數(shù)量。
    第二個(gè)成員ObjOffset是一個(gè)偏移表，它記錄了庫(kù)中所有Obj Sec的偏移。這個(gè)表的記錄數(shù)x就是ObjNum。
    第三個(gè)成員SymbolNum與First Sec中的SymbolNum意義相同。
    第四個(gè)成員SymbolIdx變成了一個(gè)索引，它記錄了相應(yīng)名稱(chēng)字符串在ObjOffset這個(gè)表中的位置，我們要通過(guò)兩次索引才能找到我們所要符號(hào)的Obj Sec位置。它的項(xiàng)目數(shù)n為SymbolNum。但請(qǐng)注意，這個(gè)索引是unsigned short型，不再是unsigned long型。
    第五個(gè)成員StrTable結(jié)構(gòu)與First Sec中的一樣。不過(guò)，它的長(zhǎng)度m為SectionHeader.Size的值減去((ObjNum+1)*4+(SymbolNum+2)*2)。
    值得注意的是，這里的所有數(shù)據(jù)都是Little-Endian格式的。千萬(wàn)不要弄錯(cuò)了！

Longname Sec
    這個(gè)小節(jié)就是一個(gè)字符串表，它的名稱(chēng)為“//”，其結(jié)構(gòu)同F(xiàn)irstSec.StrTable。這里就不多說(shuō)了。

Obj Sec
    這一節(jié)中的數(shù)據(jù)就是COFF文件的原始數(shù)據(jù)，把它讀出來(lái)存成文件，就是一個(gè)COFF文件。它的格式請(qǐng)參考《COFF格式》一文。
    要指出的是它的命名方式有些特殊。如果Obj文件的名稱(chēng)少于16個(gè)字符，它就會(huì)被保存在SectionHeader的Name成員中，以‘/’字符結(jié)尾。如果無(wú)法保存在Name成員中，則Name成員的第一個(gè)字符就為‘/’，之后再跟上這個(gè)名稱(chēng)在Longname Sec中的偏移。

例如：
!<arch>\n
……
LongName Sec:
This_Is_Long_Name0001\0
This_Is_Long_Name0002\0
……
Obj Sec1:
Name[16]：“shortname/”
……
Obj Sec2:
Name[16]：“/0”  // 這里使用了第一個(gè)長(zhǎng)文件名This_Is_Long_Name0001
……
Obj Sec3:
Name[16]：“/22”  // 這里使用了第二個(gè)長(zhǎng)文件名This_Is_Long_Name0002
……

OK！現(xiàn)在已經(jīng)介紹完了Lib文件的結(jié)構(gòu)。大家的連接器可以加新功能了。不過(guò)這里只給出了最基本的Lib文件結(jié)構(gòu)，動(dòng)態(tài)連接庫(kù)（DLL）的導(dǎo)出庫(kù)有點(diǎn)特別，我將在PE文件格式中進(jìn)行詳細(xì)介紹。

posted on 2007-07-19 16:54 Charles 閱讀(2293) 評(píng)論(1) 編輯收藏引用所屬分類(lèi): 拿來(lái)主義

FeedBack:

# re: COFF格式續(xù)篇—Lib文件的結(jié)構(gòu)zz[未登錄](méi)

2007-07-20 01:07 | Corner Zhang

好文！
期待關(guān)于dll的回復(fù) 更多評(píng)論

刷新評(píng)論列表

只有注冊(cè)用戶(hù)登錄后才能發(fā)表評(píng)論。


相關(guān)文章: HP中國(guó)區(qū)的總裁的退休感言zz COFF格式續(xù)篇—Lib文件的結(jié)構(gòu)zz COFF文件的格式zz 微軟C/C++ 編譯器選項(xiàng)zz C++各大有名庫(kù)的介紹z 圖說(shuō)歷史：400年來(lái)的計(jì)算機(jī)編年史！ How to "Build" a Computer 11-What's a Register File? Virtual Bookshelf: What's on Your Shelf? How to "Build" a Computer 10-What's a Multiplexer? How to "Build" a Computer 9-What's a Combinational Logic Device?

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問(wèn) Chat2DB 管理

<

2025年11月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

決定開(kāi)始寫(xiě)工作日記，記錄一下自己的軌跡...

常用鏈接

留言簿(4)

隨筆分類(lèi)(70)

隨筆檔案(71)

charles推薦訪(fǎng)問(wèn)

Code Project
Linux Journal
Linux man pages
Single UNIX Specification
電子書(shū)1
電子書(shū)2
電子書(shū)3

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

常用鏈接

留言簿(4)

隨筆分類(lèi)(70)

隨筆檔案(71)

charles推薦訪(fǎng)問(wèn)

搜索

積分與排名

最新評(píng)論

閱讀排行榜

評(píng)論排行榜