elf文件格式學習總結
編譯器將一個源文件生成目標文件時,會在目標文件中生成符號表和重定位表。
符號表包含在文件中定義的全局符號以及在文件中引用的外部符號(外部函數或變量)。
重定位表告訴鏈接器在哪些位置要進行重定位操作。
編譯器生成的目標文件在文件的開始處會有一個elf頭,描繪了整個文件的組織結構。它還包括很多節(section)。這些節有的是系統定義好的,有些是用戶在文件在通過.section命令自定義的,鏈接器會將多個輸入目標文件中的相同的節合并。
鏈接器對編譯生成的目標文件進行鏈接時,A. 首先進行符號解析,找出外部符號在哪定義。如果外部符號在一個靜態庫中定義,則直接將對應的定義代碼復制到最終生成的目標文件中。B. 接著鏈接器進行符號重定位。編譯器在生成目標文件時,通常使用從零開始的相對地址,而在鏈接過程中,鏈接器從一個指定的地址開始,根據輸入目標文件的順序,以段(segment)為單位將它們拼裝起來。其中每個段可以包括很多個節(section)。除了目標文件的拼裝,重定位過程中還完成了下面兩個任務:一是生成最終的符號表,二是對代碼段(.text)中的某些位置進行修改,要修改的位置由編譯器生成的重定位表指出。
鏈接過程中還會生成兩個表:got表和plt表。
got表中每一項都是本運行模塊要引用的全局變量或函數的地址,可以用got表來間接引用全局變量。函數也可以把got表的首地址作為一個基準,用相對該基準的偏移量來(直接)引用靜態函數。由于動態鏈接器(ld-linux.so)不會把運行模塊(*.so)加載到固定地址,在不同進程的地址空間中各運行模塊的絕對地址、相對地址都不同。這種不同反映到got表上,就是每個進程的每個運行模塊都有獨立的got表,所以進程間不能共享got表(內容)。
plt表中每一項都是一小段匯編代碼,對應于本運行模塊要引用的每一個全局函數。當鏈接器發現某個符號引用是位于其它共享目標文件(動態連接庫*.so)中的一個全局函數時,就在文件的plt表里創建一個項目,以便將來重定位。
鏈接生成的目標文件在文件開頭也有一個elf頭號,描繪了整個文件的組織結構,這個文件中會有多個段(segment),每個段都由相應的節(section)拼裝而成。
對由鏈接器鏈接生成的可執行目標文件進行加載運行時,內核首先讀取elf頭。根據頭部數據指示分別讀入各種數據結構,找出可加載的段并調用mmap()函數將其加載到內存。內核找到標記為PT_INTERP的段,這個段對應著動態鏈接器的名稱,然后加載動態鏈接器(linux中通常是/lib/ld-linux.so.2)。接著內核將控制權交給動態鏈接器。動態鏈接器檢查程序對外部文件(共享庫)的依賴性,并在需要時對其進行加載。之后動態鏈接器開始對程序中的外部引用(即全局變量/函數)進行重定位,即定位出程序其引用的外部變量/函數的真實內存地址。R_386_GLOB_DAT類型的重定位項目涉及到got表。R_386_JMP_SLOT類型的重定位項目涉及到plt表。動態鏈接還有一個延遲(lazy)特性,即真正引用時才進行重定位(環境變量LD_BIND_NOW為空值NULL時)。接下來動態鏈接器執行elf文件中標記為.init節的代碼,進行程序運行的初始化。最后動態鏈接器把控制權交給程序,從elf頭中定義的入口處開始執行程序。