程序人生

生活和工作都要充滿激情,否則你無(wú)法體會(huì)到淋漓盡致的快樂(lè)與痛苦

posts - 11, comments - 23, trackbacks - 0, articles - 52

聚合

<

2025年11月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

常用鏈接

留言簿(6)

隨筆分類

隨筆檔案

文章分類

文章檔案

vim user handbook

C/C++文件輸入輸出操作——FILE*、fstream、windowsAPI
幾種不同的文件操作方法!
fstream的使用方法介紹
liunx tool learn
vim handbook
my vim operator

友情link

ownwaterloo
Vczh
C++高手!
流轉(zhuǎn)-空明
圖形取理!

搜索

積分與排名

積分 - 114742
排名 - 222

閱讀排行榜

評(píng)論排行榜

Linux 匯編語(yǔ)言開(kāi)發(fā)指南

Posted on 2008-06-17 21:11 T.S Liu 閱讀(1875) 評(píng)論(0) 編輯收藏引用所屬分類: ubuntu

轉(zhuǎn)載自：IBM developerWorks 中國(guó)網(wǎng)站

肖文鵬(xiaowp@263.net)
北京理工大學(xué)計(jì)算機(jī)系碩士研究生
2003 年 7 月

匯編語(yǔ)言的優(yōu)點(diǎn)是速度快，可以直接對(duì)硬件進(jìn)行操作，這對(duì)諸如圖形處理等關(guān)鍵應(yīng)用是非常重要的。Linux 是一個(gè)用 C 語(yǔ)言開(kāi)發(fā)的操作系統(tǒng)，這使得很多程序員開(kāi)始忘記在 Linux 中還可以直接使用匯編這一底層語(yǔ)言來(lái)優(yōu)化程序的性能。本文為那些在Linux 平臺(tái)上編寫(xiě)匯編代碼的程序員提供指南，介紹 Linux 匯編語(yǔ)言的語(yǔ)法格式和開(kāi)發(fā)工具，并輔以具體的例子講述如何開(kāi)發(fā)實(shí)用的Linux 匯編程序。

一、簡(jiǎn)介

作為最基本的編程語(yǔ)言之一，匯編語(yǔ)言雖然應(yīng)用的范圍不算很廣，但重要性卻勿庸置疑，因?yàn)樗軌蛲瓿稍S多其它語(yǔ)言所無(wú)法完成的功能。就拿 Linux 內(nèi)核來(lái)講，雖然絕大部分代碼是用 C 語(yǔ)言編寫(xiě)的，但仍然不可避免地在某些關(guān)鍵地方使用了匯編代碼，其中主要是在 Linux 的啟動(dòng)部分。由于這部分代碼與硬件的關(guān)系非常密切，即使是 C 語(yǔ)言也會(huì)有些力不從心，而匯編語(yǔ)言則能夠很好揚(yáng)長(zhǎng)避短，最大限度地發(fā)揮硬件的性能。

大多數(shù)情況下 Linux 程序員不需要使用匯編語(yǔ)言，因?yàn)榧幢闶怯布?qū)動(dòng)這樣的底層程序在 Linux 操作系統(tǒng)中也可以用完全用 C 語(yǔ)言來(lái)實(shí)現(xiàn)，再加上 GCC 這一優(yōu)秀的編譯器目前已經(jīng)能夠?qū)ψ罱K生成的代碼進(jìn)行很好的優(yōu)化，的確有足夠的理由讓我們可以暫時(shí)將匯編語(yǔ)言拋在一邊了。但實(shí)現(xiàn)情況是 Linux 程序員有時(shí)還是需要使用匯編，或者不得不使用匯編，理由很簡(jiǎn)單：精簡(jiǎn)、高效和 libc 無(wú)關(guān)性。假設(shè)要移植 Linux 到某一特定的嵌入式硬件環(huán)境下，首先必然面臨如何減少系統(tǒng)大小、提高執(zhí)行效率等問(wèn)題，此時(shí)或許只有匯編語(yǔ)言能幫上忙了。

匯編語(yǔ)言直接同計(jì)算機(jī)的底層軟件甚至硬件進(jìn)行交互，它具有如下一些優(yōu)點(diǎn)：

能夠直接訪問(wèn)與硬件相關(guān)的存儲(chǔ)器或 I/O 端口；
能夠不受編譯器的限制，對(duì)生成的二進(jìn)制代碼進(jìn)行完全的控制；
能夠?qū)﹃P(guān)鍵代碼進(jìn)行更準(zhǔn)確的控制，避免因線程共同訪問(wèn)或者硬件設(shè)備共享引起的死鎖；
能夠根據(jù)特定的應(yīng)用對(duì)代碼做最佳的優(yōu)化，提高運(yùn)行速度；
能夠最大限度地發(fā)揮硬件的功能。

同時(shí)還應(yīng)該認(rèn)識(shí)到，匯編語(yǔ)言是一種層次非常低的語(yǔ)言，它僅僅高于直接手工編寫(xiě)二進(jìn)制的機(jī)器指令碼，因此不可避免地存在一些缺點(diǎn)：

編寫(xiě)的代碼非常難懂，不好維護(hù)；
很容易產(chǎn)生 bug，難于調(diào)試；
只能針對(duì)特定的體系結(jié)構(gòu)和處理器進(jìn)行優(yōu)化；
開(kāi)發(fā)效率很低，時(shí)間長(zhǎng)且單調(diào)。

Linux 下用匯編語(yǔ)言編寫(xiě)的代碼具有兩種不同的形式。第一種是完全的匯編代碼，指的是整個(gè)程序全部用匯編語(yǔ)言編寫(xiě)。盡管是完全的匯編代碼，Linux 平臺(tái)下的匯編工具也吸收了 C 語(yǔ)言的長(zhǎng)處，使得程序員可以使用 #include、#ifdef 等預(yù)處理指令，并能夠通過(guò)宏定義來(lái)簡(jiǎn)化代碼。第二種是內(nèi)嵌的匯編代碼，指的是可以嵌入到C語(yǔ)言程序中的匯編代碼片段。雖然 ANSI 的 C 語(yǔ)言標(biāo)準(zhǔn)中沒(méi)有關(guān)于內(nèi)嵌匯編代碼的相應(yīng)規(guī)定，但各種實(shí)際使用的 C 編譯器都做了這方面的擴(kuò)充，這其中當(dāng)然就包括 Linux 平臺(tái)下的 GCC。

二、Linux 匯編語(yǔ)法格式

絕大多數(shù) Linux 程序員以前只接觸過(guò)DOS/Windows 下的匯編語(yǔ)言，這些匯編代碼都是 Intel 風(fēng)格的。但在 Unix 和 Linux 系統(tǒng)中，更多采用的還是 AT&T 格式，兩者在語(yǔ)法格式上有著很大的不同：

在 AT&T 匯編格式中，寄存器名要加上 '%' 作為前綴；而在 Intel 匯編格式中，寄存器名不需要加前綴。例如：

AT&T 格式 Intel 格式

pushl %eax push eax

在 AT&T 匯編格式中，用 '$' 前綴表示一個(gè)立即操作數(shù)；而在 Intel 匯編格式中，立即數(shù)的表示不用帶任何前綴。例如：

AT&T 格式 Intel 格式

pushl $1 push 1

AT&T 和 Intel 格式中的源操作數(shù)和目標(biāo)操作數(shù)的位置正好相反。在 Intel 匯編格式中，目標(biāo)操作數(shù)在源操作數(shù)的左邊；而在 AT&T 匯編格式中，目標(biāo)操作數(shù)在源操作數(shù)的右邊。例如：

AT&T 格式 Intel 格式

addl $1, %eax add eax, 1

在 AT&T 匯編格式中，操作數(shù)的字長(zhǎng)由操作符的最后一個(gè)字母決定，后綴'b'、'w'、'l'分別表示操作數(shù)為字節(jié)（byte，8 比特）、字（word，16 比特）和長(zhǎng)字（long，32比特）；而在 Intel 匯編格式中，操作數(shù)的字長(zhǎng)是用 "byte ptr" 和 "word ptr" 等前綴來(lái)表示的。例如：

AT&T 格式 Intel 格式

movb val, %al mov al, byte ptr val

在 AT&T 匯編格式中，絕對(duì)轉(zhuǎn)移和調(diào)用指令（jump/call）的操作數(shù)前要加上'*'作為前綴，而在 Intel 格式中則不需要。

遠(yuǎn)程轉(zhuǎn)移指令和遠(yuǎn)程子調(diào)用指令的操作碼，在 AT&T 匯編格式中為 "ljump" 和 "lcall"，而在 Intel 匯編格式中則為 "jmp far" 和 "call far"，即：

AT&T 格式 Intel 格式

ljump $section, $offset jmp far section:offset

lcall $section, $offset call far section:offset

與之相應(yīng)的遠(yuǎn)程返回指令則為：

AT&T 格式 Intel 格式

lret $stack_adjust ret far stack_adjust

在 AT&T 匯編格式中，內(nèi)存操作數(shù)的尋址方式是

section:disp(base, index, scale)

而在 Intel 匯編格式中，內(nèi)存操作數(shù)的尋址方式為：

section:[base + index*scale + disp]

由于 Linux 工作在保護(hù)模式下，用的是 32 位線性地址，所以在計(jì)算地址時(shí)不用考慮段基址和偏移量，而是采用如下的地址計(jì)算方法：

disp + base + index * scale

下面是一些內(nèi)存操作數(shù)的例子：

AT&T 格式 Intel 格式

movl -4(%ebp), %eax mov eax, [ebp - 4]

movl array(, %eax, 4), %eax mov eax, [eax*4 + array]

movw array(%ebx, %eax, 4), %cx mov cx, [ebx + 4*eax + array]

movb $4, %fs:(%eax) mov fs:eax, 4

三、Hello World!

真不知道打破這個(gè)傳統(tǒng)會(huì)帶來(lái)什么樣的后果，但既然所有程序設(shè)計(jì)語(yǔ)言的第一個(gè)例子都是在屏幕上打印一個(gè)字符串 "Hello World!"，那我們也以這種方式來(lái)開(kāi)始介紹 Linux 下的匯編語(yǔ)言程序設(shè)計(jì)。

在 Linux 操作系統(tǒng)中，你有很多辦法可以實(shí)現(xiàn)在屏幕上顯示一個(gè)字符串，但最簡(jiǎn)潔的方式是使用 Linux 內(nèi)核提供的系統(tǒng)調(diào)用。使用這種方法最大的好處是可以直接和操作系統(tǒng)的內(nèi)核進(jìn)行通訊，不需要鏈接諸如 libc 這樣的函數(shù)庫(kù)，也不需要使用 ELF 解釋器，因而代碼尺寸小且執(zhí)行速度快。

Linux 是一個(gè)運(yùn)行在保護(hù)模式下的 32 位操作系統(tǒng)，采用 flat memory 模式，目前最常用到的是 ELF 格式的二進(jìn)制代碼。一個(gè) ELF 格式的可執(zhí)行程序通常劃分為如下幾個(gè)部分：.text、.data 和 .bss，其中 .text 是只讀的代碼區(qū)，.data 是可讀可寫(xiě)的數(shù)據(jù)區(qū)，而 .bss 則是可讀可寫(xiě)且沒(méi)有初始化的數(shù)據(jù)區(qū)。代碼區(qū)和數(shù)據(jù)區(qū)在 ELF 中統(tǒng)稱為 section，根據(jù)實(shí)際需要你可以使用其它標(biāo)準(zhǔn)的 section，也可以添加自定義 section，但一個(gè) ELF 可執(zhí)行程序至少應(yīng)該有一個(gè) .text 部分。下面給出我們的第一個(gè)匯編程序，用的是 AT&T 匯編語(yǔ)言格式：

例1. AT&T 格式

#hello.s
                        .data                    # 數(shù)據(jù)段聲明
                        msg : .string "Hello, world!\\n" # 要輸出的字符串
                        len = . - msg                   # 字串長(zhǎng)度
                        .text                    # 代碼段聲明
                        .global _start           # 指定入口函數(shù)
                        _start:                  # 在屏幕上顯示一個(gè)字符串
                        movl $len, %edx  # 參數(shù)三：字符串長(zhǎng)度
                        movl $msg, %ecx  # 參數(shù)二：要顯示的字符串
                        movl $1, %ebx    # 參數(shù)一：文件描述符(stdout)
                        movl $4, %eax    # 系統(tǒng)調(diào)用號(hào)(sys_write)
                        int  $0x80       # 調(diào)用內(nèi)核功能
                        # 退出程序
                        movl $0,%ebx     # 參數(shù)一：退出代碼
                        movl $1,%eax     # 系統(tǒng)調(diào)用號(hào)(sys_exit)
                        int  $0x80       # 調(diào)用內(nèi)核功能

初次接觸到 AT&T 格式的匯編代碼時(shí)，很多程序員都認(rèn)為太晦澀難懂了，沒(méi)有關(guān)系，在 Linux 平臺(tái)上你同樣可以使用 Intel 格式來(lái)編寫(xiě)匯編程序：

例2. Intel 格式

; hello.asm
                        section .data            ; 數(shù)據(jù)段聲明
                        msg db "Hello, world!", 0xA     ; 要輸出的字符串
                        len equ $ - msg                 ; 字串長(zhǎng)度
                        section .text            ; 代碼段聲明
                        global _start            ; 指定入口函數(shù)
                        _start:                  ; 在屏幕上顯示一個(gè)字符串
                        mov edx, len     ; 參數(shù)三：字符串長(zhǎng)度
                        mov ecx, msg     ; 參數(shù)二：要顯示的字符串
                        mov ebx, 1       ; 參數(shù)一：文件描述符(stdout)
                        mov eax, 4       ; 系統(tǒng)調(diào)用號(hào)(sys_write)
                        int 0x80         ; 調(diào)用內(nèi)核功能
                        ; 退出程序
                        mov ebx, 0       ; 參數(shù)一：退出代碼
                        mov eax, 1       ; 系統(tǒng)調(diào)用號(hào)(sys_exit)
                        int 0x80         ; 調(diào)用內(nèi)核功能

上面兩個(gè)匯編程序采用的語(yǔ)法雖然完全不同，但功能卻都是調(diào)用 Linux 內(nèi)核提供的 sys_write 來(lái)顯示一個(gè)字符串，然后再調(diào)用 sys_exit 退出程序。在 Linux 內(nèi)核源文件 include/asm-i386/unistd.h 中，可以找到所有系統(tǒng)調(diào)用的定義。

四、Linux 匯編工具

Linux 平臺(tái)下的匯編工具雖然種類很多，但同 DOS/Windows 一樣，最基本的仍然是匯編器、連接器和調(diào)試器。

1.匯編器

匯編器（assembler）的作用是將用匯編語(yǔ)言編寫(xiě)的源程序轉(zhuǎn)換成二進(jìn)制形式的目標(biāo)代碼。Linux 平臺(tái)的標(biāo)準(zhǔn)匯編器是 GAS，它是 GCC 所依賴的后臺(tái)匯編工具，通常包含在 binutils 軟件包中。GAS 使用標(biāo)準(zhǔn)的 AT&T 匯編語(yǔ)法，可以用來(lái)匯編用 AT&T 格式編寫(xiě)的程序：

[xiaowp@gary code]$ as -o hello.o hello.s

Linux 平臺(tái)上另一個(gè)經(jīng)常用到的匯編器是 NASM，它提供了很好的宏指令功能，并能夠支持相當(dāng)多的目標(biāo)代碼格式，包括 bin、a.out、coff、elf、rdf 等。NASM 采用的是人工編寫(xiě)的語(yǔ)法分析器，因而執(zhí)行速度要比 GAS 快很多，更重要的是它使用的是 Intel 匯編語(yǔ)法，可以用來(lái)編譯用 Intel 語(yǔ)法格式編寫(xiě)的匯編程序：

[xiaowp@gary code]$ nasm -f elf hello.asm

2.鏈接器

由匯編器產(chǎn)生的目標(biāo)代碼是不能直接在計(jì)算機(jī)上運(yùn)行的，它必須經(jīng)過(guò)鏈接器的處理才能生成可執(zhí)行代碼。鏈接器通常用來(lái)將多個(gè)目標(biāo)代碼連接成一個(gè)可執(zhí)行代碼，這樣可以先將整個(gè)程序分成幾個(gè)模塊來(lái)單獨(dú)開(kāi)發(fā)，然后才將它們組合(鏈接)成一個(gè)應(yīng)用程序。 Linux 使用 ld 作為標(biāo)準(zhǔn)的鏈接程序，它同樣也包含在 binutils 軟件包中。匯編程序在成功通過(guò) GAS 或 NASM 的編譯并生成目標(biāo)代碼后，就可以使用 ld 將其鏈接成可執(zhí)行程序了：

[xiaowp@gary code]$ ld -s -o hello hello.o

3.調(diào)試器

有人說(shuō)程序不是編出來(lái)而是調(diào)出來(lái)的，足見(jiàn)調(diào)試在軟件開(kāi)發(fā)中的重要作用，在用匯編語(yǔ)言編寫(xiě)程序時(shí)尤其如此。Linux 下調(diào)試匯編代碼既可以用 GDB、DDD 這類通用的調(diào)試器，也可以使用專門(mén)用來(lái)調(diào)試匯編代碼的 ALD(Assembly Language Debugger)。

從調(diào)試的角度來(lái)看，使用 GAS 的好處是可以在生成的目標(biāo)代碼中包含符號(hào)表(symbol table)，這樣就可以使用 GDB 和 DDD 來(lái)進(jìn)行源碼級(jí)的調(diào)試了。要在生成的可執(zhí)行程序中包含符號(hào)表，可以采用下面的方式進(jìn)行編譯和鏈接：

[xiaowp@gary code]$ as --gstabs -o hello.o hello.s
                        [xiaowp@gary code]$ ld -o hello hello.o

執(zhí)行 as 命令時(shí)帶上參數(shù) --gstabs 可以告訴匯編器在生成的目標(biāo)代碼中加上符號(hào)表，同時(shí)需要注意的是，在用 ld 命令進(jìn)行鏈接時(shí)不要加上 -s 參數(shù)，否則目標(biāo)代碼中的符號(hào)表在鏈接時(shí)將被刪去。

在 GDB 和 DDD 中調(diào)試匯編代碼和調(diào)試 C 語(yǔ)言代碼是一樣的，你可以通過(guò)設(shè)置斷點(diǎn)來(lái)中斷程序的運(yùn)行，查看變量和寄存器的當(dāng)前值，并可以對(duì)代碼進(jìn)行單步跟蹤。圖1 是在 DDD 中調(diào)試匯編代碼時(shí)的情景：

圖1 用 DDD 中調(diào)試匯編程序

匯編程序員通常面對(duì)的都是一些比較苛刻的軟硬件環(huán)境，短小精悍的ALD可能更能符合實(shí)際的需要，因此下面主要介紹一下如何用ALD來(lái)調(diào)試匯編程序。首先在命令行方式下執(zhí)行ald命令來(lái)啟動(dòng)調(diào)試器，該命令的參數(shù)是將要被調(diào)試的可執(zhí)行程序：

[xiaowp@gary doc]$ ald hello
                        Assembly Language Debugger 0.1.3
                        Copyright (C) 2000-2002 Patrick Alken
                        hello: ELF Intel 80386 (32 bit), LSB, Executable, Version 1 (current)
                        Loading debugging symbols...(15 symbols loaded)
                        ald>

當(dāng) ALD 的提示符出現(xiàn)之后，用 disassemble 命令對(duì)代碼段進(jìn)行反匯編：

ald> disassemble -s .text
                        Disassembling section .text (0x08048074 - 0x08048096)
                        08048074  BA0F000000                 mov edx, 0xf
                        08048079  B998900408                 mov ecx, 0x8049098
                        0804807E  BB01000000                 mov ebx, 0x1
                        08048083  B804000000                 mov eax, 0x4
                        08048088  CD80                       int 0x80
                        0804808A  BB00000000                 mov ebx, 0x0
                        0804808F  B801000000                 mov eax, 0x1
                        08048094  CD80                       int 0x80

上述輸出信息的第一列是指令對(duì)應(yīng)的地址碼，利用它可以設(shè)置在程序執(zhí)行時(shí)的斷點(diǎn)：

ald> break 0x08048088
                        Breakpoint 1 set for 0x08048088

斷點(diǎn)設(shè)置好后，使用 run 命令開(kāi)始執(zhí)行程序。ALD 在遇到斷點(diǎn)時(shí)將自動(dòng)暫停程序的運(yùn)行，同時(shí)會(huì)顯示所有寄存器的當(dāng)前值：

ald> run
                        Starting program: hello
                        Breakpoint 1 encountered at 0x08048088
                        eax = 0x00000004 ebx = 0x00000001 ecx = 0x08049098 edx = 0x0000000F
                        esp = 0xBFFFF6C0 ebp = 0x00000000 esi = 0x00000000 edi = 0x00000000
                        ds  = 0x0000002B es  = 0x0000002B fs  = 0x00000000 gs  = 0x00000000
                        ss  = 0x0000002B cs  = 0x00000023 eip = 0x08048088 eflags = 0x00000246
                        Flags: PF ZF IF
                        08048088  CD80                       int 0x80

如果需要對(duì)匯編代碼進(jìn)行單步調(diào)試，可以使用 next 命令：

ald> next
                        Hello, world!
                        eax = 0x0000000F ebx = 0x00000000 ecx = 0x08049098 edx = 0x0000000F
                        esp = 0xBFFFF6C0 ebp = 0x00000000 esi = 0x00000000 edi = 0x00000000
                        ds  = 0x0000002B es  = 0x0000002B fs  = 0x00000000 gs  = 0x00000000
                        ss  = 0x0000002B cs  = 0x00000023 eip = 0x0804808F eflags = 0x00000346
                        Flags: PF ZF TF IF
                        0804808F  B801000000                 mov eax, 0x1

若想獲得 ALD 支持的所有調(diào)試命令的詳細(xì)列表，可以使用 help 命令：

ald> help
                        Commands may be abbreviated.
                        If a blank command is entered, the last command is repeated.
                        Type `help <command>' for more specific information on <command>.
                        General commands
                        attach         clear          continue       detach         disassemble
                        enter          examine        file           help           load
                        next           quit           register       run            set
                        step           unload         window         write
                        Breakpoint related commands
                        break          delete         disable        enable         ignore
                        lbreak         tbreak

五、系統(tǒng)調(diào)用

即便是最簡(jiǎn)單的匯編程序，也難免要用到諸如輸入、輸出以及退出等操作，而要進(jìn)行這些操作則需要調(diào)用操作系統(tǒng)所提供的服務(wù)，也就是系統(tǒng)調(diào)用。除非你的程序只完成加減乘除等數(shù)學(xué)運(yùn)算，否則將很難避免使用系統(tǒng)調(diào)用，事實(shí)上除了系統(tǒng)調(diào)用不同之外，各種操作系統(tǒng)的匯編編程往往都是很類似的。

在 Linux 平臺(tái)下有兩種方式來(lái)使用系統(tǒng)調(diào)用：利用封裝后的 C 庫(kù)（libc）或者通過(guò)匯編直接調(diào)用。其中通過(guò)匯編語(yǔ)言來(lái)直接調(diào)用系統(tǒng)調(diào)用，是最高效地使用 Linux 內(nèi)核服務(wù)的方法，因?yàn)樽罱K生成的程序不需要與任何庫(kù)進(jìn)行鏈接，而是直接和內(nèi)核通信。

和 DOS 一樣，Linux 下的系統(tǒng)調(diào)用也是通過(guò)中斷（int 0x80）來(lái)實(shí)現(xiàn)的。在執(zhí)行 int 80 指令時(shí)，寄存器 eax 中存放的是系統(tǒng)調(diào)用的功能號(hào)，而傳給系統(tǒng)調(diào)用的參數(shù)則必須按順序放到寄存器 ebx，ecx，edx，esi，edi 中，當(dāng)系統(tǒng)調(diào)用完成之后，返回值可以在寄存器 eax 中獲得。

所有的系統(tǒng)調(diào)用功能號(hào)都可以在文件 /usr/include/bits/syscall.h 中找到，為了便于使用，它們是用 SYS_<name> 這樣的宏來(lái)定義的，如 SYS_write、SYS_exit 等。例如，經(jīng)常用到的 write 函數(shù)是如下定義的：

ssize_t write(int fd, const void *buf, size_t count);

該函數(shù)的功能最終是通過(guò) SYS_write 這一系統(tǒng)調(diào)用來(lái)實(shí)現(xiàn)的。根據(jù)上面的約定，參數(shù) fb、buf 和 count 分別存在寄存器 ebx、ecx 和 edx 中，而系統(tǒng)調(diào)用號(hào) SYS_write 則放在寄存器 eax 中，當(dāng) int 0x80 指令執(zhí)行完畢后，返回值可以從寄存器 eax 中獲得。

或許你已經(jīng)發(fā)現(xiàn)，在進(jìn)行系統(tǒng)調(diào)用時(shí)至多只有 5 個(gè)寄存器能夠用來(lái)保存參數(shù)，難道所有系統(tǒng)調(diào)用的參數(shù)個(gè)數(shù)都不超過(guò) 5 嗎？當(dāng)然不是，例如 mmap 函數(shù)就有 6 個(gè)參數(shù)，這些參數(shù)最后都需要傳遞給系統(tǒng)調(diào)用 SYS_mmap：

void  *  mmap(void *start, size_t length, int prot , int flags, int fd, off_t offset);

當(dāng)一個(gè)系統(tǒng)調(diào)用所需的參數(shù)個(gè)數(shù)大于 5 時(shí)，執(zhí)行int 0x80 指令時(shí)仍需將系統(tǒng)調(diào)用功能號(hào)保存在寄存器 eax 中，所不同的只是全部參數(shù)應(yīng)該依次放在一塊連續(xù)的內(nèi)存區(qū)域里，同時(shí)在寄存器 ebx 中保存指向該內(nèi)存區(qū)域的指針。系統(tǒng)調(diào)用完成之后，返回值仍將保存在寄存器 eax 中。

由于只是需要一塊連續(xù)的內(nèi)存區(qū)域來(lái)保存系統(tǒng)調(diào)用的參數(shù)，因此完全可以像普通的函數(shù)調(diào)用一樣使用棧(stack)來(lái)傳遞系統(tǒng)調(diào)用所需的參數(shù)。但要注意一點(diǎn)，Linux 采用的是 C 語(yǔ)言的調(diào)用模式，這就意味著所有參數(shù)必須以相反的順序進(jìn)棧，即最后一個(gè)參數(shù)先入棧，而第一個(gè)參數(shù)則最后入棧。如果采用棧來(lái)傳遞系統(tǒng)調(diào)用所需的參數(shù)，在執(zhí)行 int 0x80 指令時(shí)還應(yīng)該將棧指針的當(dāng)前值復(fù)制到寄存器 ebx中。

六、命令行參數(shù)

在 Linux 操作系統(tǒng)中，當(dāng)一個(gè)可執(zhí)行程序通過(guò)命令行啟動(dòng)時(shí)，其所需的參數(shù)將被保存到棧中：首先是 argc，然后是指向各個(gè)命令行參數(shù)的指針數(shù)組 argv，最后是指向環(huán)境變量的指針數(shù)據(jù) envp。在編寫(xiě)匯編語(yǔ)言程序時(shí)，很多時(shí)候需要對(duì)這些參數(shù)進(jìn)行處理，下面的代碼示范了如何在匯編代碼中進(jìn)行命令行參數(shù)的處理：

例3. 處理命令行參數(shù)

# args.s
                        .text
                        .globl _start
                        _start:
                        popl	%ecx		# argc
                        vnext:
                        popl	%ecx		# argv
                        test 	%ecx, %ecx      # 空指針表明結(jié)束
                        jz	exit
                        movl	%ecx, %ebx
                        xorl	%edx, %edx
                        strlen:
                        movb	(%ebx), %al
                        inc	%edx
                        inc	%ebx
                        test	%al, %al
                        jnz	strlen
                        movb	$10, -1(%ebx)
                        movl	$4, %eax        # 系統(tǒng)調(diào)用號(hào)(sys_write)
                        movl	$1, %ebx        # 文件描述符(stdout)
                        int	$0x80
                        jmp	vnext
                        exit:
                        movl	$1,%eax         # 系統(tǒng)調(diào)用號(hào)(sys_exit)
                        xorl	%ebx, %ebx      # 退出代碼
                        int 	$0x80
                        ret

七、GCC 內(nèi)聯(lián)匯編

用匯編編寫(xiě)的程序雖然運(yùn)行速度快，但開(kāi)發(fā)速度非常慢，效率也很低。如果只是想對(duì)關(guān)鍵代碼段進(jìn)行優(yōu)化，或許更好的辦法是將匯編指令嵌入到 C 語(yǔ)言程序中，從而充分利用高級(jí)語(yǔ)言和匯編語(yǔ)言各自的特點(diǎn)。但一般來(lái)講，在 C 代碼中嵌入?yún)R編語(yǔ)句要比"純粹"的匯編語(yǔ)言代碼復(fù)雜得多，因?yàn)樾枰鉀Q如何分配寄存器，以及如何與C代碼中的變量相結(jié)合等問(wèn)題。

GCC 提供了很好的內(nèi)聯(lián)匯編支持，最基本的格式是：

__asm__("asm statements");

例如：

__asm__("nop");

如果需要同時(shí)執(zhí)行多條匯編語(yǔ)句，則應(yīng)該用"\\n\\t"將各個(gè)語(yǔ)句分隔開(kāi)，例如：

__asm__( "pushl %%eax \\n\\t"
                        "movl $0, %%eax \\n\\t"
                        "popl %eax");

通常嵌入到 C 代碼中的匯編語(yǔ)句很難做到與其它部分沒(méi)有任何關(guān)系，因此更多時(shí)候需要用到完整的內(nèi)聯(lián)匯編格式：

__asm__("asm statements" : outputs : inputs : registers-modified);

插入到 C 代碼中的匯編語(yǔ)句是以":"分隔的四個(gè)部分，其中第一部分就是匯編代碼本身，通常稱為指令部，其格式和在匯編語(yǔ)言中使用的格式基本相同。指令部分是必須的，而其它部分則可以根據(jù)實(shí)際情況而省略。

在將匯編語(yǔ)句嵌入到C代碼中時(shí)，操作數(shù)如何與C代碼中的變量相結(jié)合是個(gè)很大的問(wèn)題。GCC采用如下方法來(lái)解決這個(gè)問(wèn)題：程序員提供具體的指令，而對(duì)寄存器的使用則只需給出"樣板"和約束條件就可以了，具體如何將寄存器與變量結(jié)合起來(lái)完全由GCC和GAS來(lái)負(fù)責(zé)。

在GCC內(nèi)聯(lián)匯編語(yǔ)句的指令部中，加上前綴'%'的數(shù)字(如%0，%1)表示的就是需要使用寄存器的"樣板"操作數(shù)。指令部中使用了幾個(gè)樣板操作數(shù)，就表明有幾個(gè)變量需要與寄存器相結(jié)合，這樣GCC和GAS在編譯和匯編時(shí)會(huì)根據(jù)后面給定的約束條件進(jìn)行恰當(dāng)?shù)奶幚怼Ｓ捎跇影宀僮鲾?shù)也使用' %'作為前綴，因此在涉及到具體的寄存器時(shí)，寄存器名前面應(yīng)該加上兩個(gè)'%'，以免產(chǎn)生混淆。

緊跟在指令部后面的是輸出部，是規(guī)定輸出變量如何與樣板操作數(shù)進(jìn)行結(jié)合的條件，每個(gè)條件稱為一個(gè)"約束"，必要時(shí)可以包含多個(gè)約束，相互之間用逗號(hào)分隔開(kāi)就可以了。每個(gè)輸出約束都以'='號(hào)開(kāi)始，然后緊跟一個(gè)對(duì)操作數(shù)類型進(jìn)行說(shuō)明的字后，最后是如何與變量相結(jié)合的約束。凡是與輸出部中說(shuō)明的操作數(shù)相結(jié)合的寄存器或操作數(shù)本身，在執(zhí)行完嵌入的匯編代碼后均不保留執(zhí)行之前的內(nèi)容，這是GCC在調(diào)度寄存器時(shí)所使用的依據(jù)。

輸出部后面是輸入部，輸入約束的格式和輸出約束相似，但不帶'='號(hào)。如果一個(gè)輸入約束要求使用寄存器，則GCC在預(yù)處理時(shí)就會(huì)為之分配一個(gè)寄存器，并插入必要的指令將操作數(shù)裝入該寄存器。與輸入部中說(shuō)明的操作數(shù)結(jié)合的寄存器或操作數(shù)本身，在執(zhí)行完嵌入的匯編代碼后也不保留執(zhí)行之前的內(nèi)容。

有時(shí)在進(jìn)行某些操作時(shí)，除了要用到進(jìn)行數(shù)據(jù)輸入和輸出的寄存器外，還要使用多個(gè)寄存器來(lái)保存中間計(jì)算結(jié)果，這樣就難免會(huì)破壞原有寄存器的內(nèi)容。在GCC內(nèi)聯(lián)匯編格式中的最后一個(gè)部分中，可以對(duì)將產(chǎn)生副作用的寄存器進(jìn)行說(shuō)明，以便GCC能夠采用相應(yīng)的措施。

下面是一個(gè)內(nèi)聯(lián)匯編的簡(jiǎn)單例子：

例4.內(nèi)聯(lián)匯編

/* inline.c */
                        int main()
                        {
                        int a = 10, b = 0;
                        __asm__ __volatile__("movl %1, %%eax;\\n\\r"
                        "movl %%eax, %0;"
                        :"=r"(b)      /* 輸出 */
                        :"r"(a)       /* 輸入 */
                        :"%eax");     /* 不受影響的寄存器 */
                        printf("Result: %d, %d\\n", a, b);
                        }

上面的程序完成將變量a的值賦予變量b，有幾點(diǎn)需要說(shuō)明：

變量b是輸出操作數(shù)，通過(guò)%0來(lái)引用，而變量a是輸入操作數(shù)，通過(guò)%1來(lái)引用。
輸入操作數(shù)和輸出操作數(shù)都使用r進(jìn)行約束，表示將變量a和變量b存儲(chǔ)在寄存器中。輸入約束和輸出約束的不同點(diǎn)在于輸出約束多一個(gè)約束修飾符'='。
在內(nèi)聯(lián)匯編語(yǔ)句中使用寄存器eax時(shí)，寄存器名前應(yīng)該加兩個(gè)'%'，即%%eax。內(nèi)聯(lián)匯編中使用%0、%1等來(lái)標(biāo)識(shí)變量，任何只帶一個(gè)'%'的標(biāo)識(shí)符都看成是操作數(shù)，而不是寄存器。
內(nèi)聯(lián)匯編語(yǔ)句的最后一個(gè)部分告訴GCC它將改變寄存器eax中的值，GCC在處理時(shí)不應(yīng)使用該寄存器來(lái)存儲(chǔ)任何其它的值。
由于變量b被指定成輸出操作數(shù)，當(dāng)內(nèi)聯(lián)匯編語(yǔ)句執(zhí)行完畢后，它所保存的值將被更新。

在內(nèi)聯(lián)匯編中用到的操作數(shù)從輸出部的第一個(gè)約束開(kāi)始編號(hào)，序號(hào)從0開(kāi)始，每個(gè)約束記數(shù)一次，指令部要引用這些操作數(shù)時(shí)，只需在序號(hào)前加上'%'作為前綴就可以了。需要注意的是，內(nèi)聯(lián)匯編語(yǔ)句的指令部在引用一個(gè)操作數(shù)時(shí)總是將其作為32位的長(zhǎng)字使用，但實(shí)際情況可能需要的是字或字節(jié)，因此應(yīng)該在約束中指明正確的限定符：

限定符意義

"m"、"v"、"o" 內(nèi)存單元

"r" 任何寄存器

"q" 寄存器eax、ebx、ecx、edx之一

"i"、"h" 直接操作數(shù)

"E"和"F" 浮點(diǎn)數(shù)

"g" 任意

"a"、"b"、"c"、"d" 分別表示寄存器eax、ebx、ecx和edx

"S"和"D" 寄存器esi、edi

"I" 常數(shù)（0至31）

八、小結(jié)

Linux操作系統(tǒng)是用C語(yǔ)言編寫(xiě)的，匯編只在必要的時(shí)候才被人們想到，但它卻是減少代碼尺寸和優(yōu)化代碼性能的一種非常重要的手段，特別是在與硬件直接交互的時(shí)候，匯編可以說(shuō)是最佳的選擇。Linux提供了非常優(yōu)秀的工具來(lái)支持匯編程序的開(kāi)發(fā)，使用GCC的內(nèi)聯(lián)匯編能夠充分地發(fā)揮C語(yǔ)言和匯編語(yǔ)言各自的優(yōu)點(diǎn)。

九、參考資料

在網(wǎng)站http://linuxassembly.org/上可以找到大量的Linux匯編資源。
軟件包binutils提供了as和ld等實(shí)用工具，其相關(guān)信息可以在網(wǎng)站http://sources.redhat.com/binutils/上找到。
NASM是Intel格式的匯編器，其相關(guān)信息可以在網(wǎng)站http://nasm.sourceforge.net/上找到。
ALD是一個(gè)短小精悍的匯編調(diào)試器，其相關(guān)信息可以在網(wǎng)站http://dunx1.irt.drexel.edu/~psa22/ald.html上找到。
intel2gas是一個(gè)能夠?qū)ntel匯編格式轉(zhuǎn)換成AT&T匯編格式的小工具，其相關(guān)信息可以在網(wǎng)站http://www.niksula.cs.hut.fi/~mtiihone/intel2gas/上找到。
IBM developerWorks上有一篇介紹GCC內(nèi)聯(lián)匯編的文章(http://www-900.ibm.com/developerworks/cn/linux/sdk/assemble/inline/index_eng.shtml)。
本文代碼下載：代碼。

關(guān)于作者
本文作者肖文鵬是北京理工大學(xué)計(jì)算機(jī)系的一名碩士研究生，主要從事操作系統(tǒng)和分布式計(jì)算環(huán)境的研究，喜愛(ài)Linux和Python。你可以通過(guò)xiaowp@263.net與他取得聯(lián)系。

- 作者： badcoffee 2004年10月31日, 星期日 11:20　回復(fù)（0） |　引用（0）加入博采

ELF動(dòng)態(tài)解析符號(hào)過(guò)程(修訂版)

by alert7
2002-01-27

轉(zhuǎn)載自：http://elfhack.whitecell.org

★★ 前言

本篇文章以linux為平臺(tái)為例，演示ELF動(dòng)態(tài)解析符號(hào)的過(guò)程。
不正之處，還請(qǐng)斧正。

通常，ELF解析符號(hào)方式稱為lazy MODE裝載的。這種裝載技術(shù)是ELF平臺(tái)上
默認(rèn)的方式。在不同的體系平臺(tái)在實(shí)現(xiàn)這種機(jī)制也是不同的。但是i386和SPARC
在大部分上是相同的。

動(dòng)態(tài)連接器（rtld）提供符號(hào)的動(dòng)態(tài)連接，裝載共享objects和解析標(biāo)號(hào)的引用。
通常是ld.so,它可以是一個(gè)共享object也可以是個(gè)可執(zhí)行的文件。

★★ 符號(hào)表(symbol table)

每個(gè)object要想使它對(duì)其他的ELF文件可用，就要用到符號(hào)表(symbol table)中
symbol entry.事實(shí)上，一個(gè)symbol entry 是個(gè)symbol結(jié)構(gòu)，它描述了這個(gè)
symbol的名字和該symbol的value.symbol name被編碼作為dynamic string
table的索引(index). The value of a symbol是在ELF OBJECT文件內(nèi)該
symbol的地址。該地址通常需要被重新定位（加上該object裝載到內(nèi)存的基地址
(base load address)）. 從而構(gòu)成該symbol在內(nèi)存中的絕對(duì)地址。
一個(gè)符號(hào)表入口有如下的格式：
typedef struct
{
Elf32_Word    st_name;   /* Symbol name (string tbl index) */
Elf32_Addr    st_value; /* Symbol value */
Elf32_Word    st_size;   /* Symbol size */
unsigned char st_info;   /* Symbol type and binding */
unsigned char st_other; /* No defined meaning, 0 */
Elf32_Section st_shndx; /* Section index */
} Elf32_Sym;

可執(zhí)行文件他們知道運(yùn)行時(shí)刻他們的地址，所以他們內(nèi)部的引用符號(hào)在編譯時(shí)候就已
經(jīng)被重定位了。

★★ GOT（global offset table）

GOT是一個(gè)數(shù)組，存在ELF image的數(shù)據(jù)段中，他們是一些指向objects的指針(通常
是數(shù)據(jù)objects).動(dòng)態(tài)連接器將重新修改那些編譯時(shí)還沒(méi)有確定下來(lái)地址的符號(hào)的
GOT入口。所以說(shuō)GOT在i386動(dòng)態(tài)連接中扮演著重要的角色。

★★ PLT（procedure linkage table）

PLT是一個(gè)這樣的結(jié)構(gòu)，它的entries包含了一些代碼片段用來(lái)傳輸控制到外部的過(guò)程。
在i386體系下，PLT和他的代碼片段entries有如下格式：

PLT0:
push GOT[1] ; word of identifying information
jmp GOT[2] ; pointer to rtld function nop
...
PLTn:
jmp GOT[x + n] ; GOT offset of symbol address
push n ; relocation offset of symbol
jmp PLT0 ; call the rtld
PLTn + 1
jmp GOT[x +n +1]; GOT offset of symbol address
push n +1 ; relocation offset of symbol
jmp PLT0 ; call the rtld

當(dāng)傳輸控制到一個(gè)外部的函數(shù)時(shí)，它傳輸執(zhí)行到PLT 中跟該symbol相關(guān)的那個(gè)entry
(是在編譯時(shí)候連接器安裝的)。在PLT entry中第一條指令將jump到一個(gè)存儲(chǔ)在GOT
中的一個(gè)指針地址；假如符號(hào)還沒(méi)有被解析，該GOT中存放著的是該P(yáng)LT entry中的
下一條指令地址。該指令push一個(gè)在重定位表中的偏移量到stack，然后下一條指令
傳輸控制到PLT[0]入口。該P(yáng)LT[0]包含了調(diào)用RTLD解析符號(hào)的函數(shù)代碼。該
解析符號(hào)函數(shù)地址由程序裝載器已經(jīng)插入到GOT[2]中了。

動(dòng)態(tài)連接器將展開(kāi)stack并且獲取需要解析符號(hào)在重定位表地址信息。重定位入口、
符號(hào)表和字符串表共同決定著PLT entry引用的那個(gè)符號(hào)和在進(jìn)程內(nèi)存中符號(hào)應(yīng)該
存放的地址。假如可能的話，該符號(hào)將被解析出來(lái)，它的地址將被存放在被該
PLT entry使用的GOT entry中。下一次該符號(hào)被請(qǐng)求時(shí)，與之對(duì)應(yīng)的GOT已經(jīng)包
含了該符號(hào)的地址了。所以，所有后來(lái)的調(diào)用將直接通過(guò)GOT傳輸控制。動(dòng)態(tài)連接器
只解析第一次被二進(jìn)制文件所引用的符號(hào)；這種引用方式就是我們上面所說(shuō)的
lazy MODE。

★★ 哈希表和鏈(hash table and chain)

除了符號(hào)表（symbol table），GOT（global offset table），PLT（procedure
linkage table），字符串表(string table),ELF objects還可以包含一個(gè)
hash table和chain（用來(lái)使動(dòng)態(tài)連接器解析符號(hào)更加容易）。hash table和chain
通常被用來(lái)迅速判定在符號(hào)表中哪個(gè)entry可能符合所請(qǐng)求的符號(hào)名。hash table(總
是伴隨著chain的)被作為整型數(shù)組存放。在hash表中，一半位置是留給那些buckets的，
另一半是留給在chain中的元素(element)的. hash table直接反映了symbol table
的元素?cái)?shù)目和他們的次序。

動(dòng)態(tài)連接器結(jié)構(gòu)提供了所有動(dòng)態(tài)連接的執(zhí)行是以透明方式訪問(wèn)動(dòng)態(tài)連接器.
然而，明確訪問(wèn)也是可用的。動(dòng)態(tài)連接（裝載共享objects和解析符號(hào)），
可以通過(guò)直接訪問(wèn)RTLD的那些函數(shù)來(lái)完成：dlopen() , dlsym() and
dlclose() .這些函數(shù)被包含在動(dòng)態(tài)連接器本身中。為了訪問(wèn)那些函數(shù)，
連接時(shí)需要把動(dòng)態(tài)連接函數(shù)庫(kù)(libdl)連接進(jìn)去。該庫(kù)包含了一些stub函數(shù)
允許編譯時(shí)候連接器解析那些函數(shù)的引用；然而那些stub函數(shù)只簡(jiǎn)單的返回0。
因?yàn)槭聦?shí)上函數(shù)駐留在動(dòng)態(tài)連接器中，假如從靜態(tài)連接的ELF文件中調(diào)用
那些函數(shù)，共享object的裝載將會(huì)失敗。

對(duì)于執(zhí)行動(dòng)態(tài)連接器所必須的是：hash table,hash table元素的數(shù)目，
chain,dynamic string table和dynamic symbol talbe。滿足了
這些條件，下面算法適用任何symbol的地址計(jì)算：

1. hn = elf_hash(sym_name) % nbuckets;
2. for (ndx = hash[ hn ]; ndx; ndx = chain[ ndx ]) {
3. symbol = sym_tab + ndx;
4. if (strcmp(sym_name, str_tab + symbol->st_name) == 0)
5. return (load_addr + symbol->st_value); }

hash號(hào)是elf_hash()的返回值，在ELF規(guī)范的第4部分有定義，以hash table中元素
個(gè)數(shù)取模。該號(hào)被用來(lái)做hash table的下表索引，求得hash值，找出與之匹配的符號(hào)
名的chain的索引(line 3)。使用該索引，符號(hào)從符號(hào)表中獲得（line 3).比較獲得
的符號(hào)名和請(qǐng)求的符號(hào)名是否相同(line 5).使用這個(gè)算法，就可以簡(jiǎn)單解析任何符號(hào)了。

★★ 演示

#include <stdio.h>
int main(int argc, char *argv[])
{
printf("Hello, world\n");
return 0;
}

Relocation section '.rel.plt' at offset 0x278 contains 4 entries:
Offset    Info Type            Symbol's Value Symbol's Name
0804947c 00107 R_386_JUMP_SLOT       080482d8 __register_frame_info
08049480 00207 R_386_JUMP_SLOT       080482e8 __deregister_frame_info
08049484 00307 R_386_JUMP_SLOT       080482f8 __libc_start_main
08049488 00407 R_386_JUMP_SLOT       08048308 printf
只有R_386_JUMP_SLOT的才會(huì)出現(xiàn)在GOT中

Symbol table '.dynsym' contains 7 entries:
Num:    Value Size Type    Bind   Ot Ndx Name
    0:        0     0 NOTYPE LOCAL   0 UND
    1: 80482d8   116 FUNC    WEAK    0 UND __register_frame_info@GLIBC_2.0 (2)
    2: 80482e8   162 FUNC    WEAK    0 UND __deregister_frame_info@GLIBC_2.0 (
2)
    3: 80482f8   261 FUNC    GLOBAL 0 UND __libc_start_main@GLIBC_2.0 (2)
    4: 8048308    41 FUNC    GLOBAL 0 UND printf@GLIBC_2.0 (2)
    5: 804843c     4 OBJECT GLOBAL 0   14 _IO_stdin_used
    6:        0     0 NOTYPE WEAK    0 UND __gmon_start__

[alert7@redhat]$ gcc -o test test.c
[alert7@redhat]$ ./test
Hello, world
[alert7@redhat]$ objdump -x test
...
Dynamic Section:
NEEDED      libc.so.6
INIT        0x8048298
FINI        0x804841c
HASH        0x8048128
STRTAB      0x80481c8
SYMTAB      0x8048158
STRSZ       0x70
SYMENT      0x10
DEBUG       0x0
PLTGOT      0x8049470
PLTRELSZ    0x20
PLTREL      0x11
JMPREL      0x8048278
REL         0x8048270
RELSZ       0x8
RELENT      0x8
VERNEED     0x8048250
VERNEEDNUM 0x1
VERSYM      0x8048242
...
7 .rel.got      00000008 08048270 08048270 00000270 2**2
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
8 .rel.plt      00000020 08048278 08048278 00000278 2**2
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
9 .init         0000002f 08048298 08048298 00000298 2**2
                  CONTENTS, ALLOC, LOAD, READONLY, CODE
10 .plt          00000050 080482c8 080482c8 000002c8 2**2
                  CONTENTS, ALLOC, LOAD, READONLY, CODE
11 .text         000000fc 08048320 08048320 00000320 2**4
                  CONTENTS, ALLOC, LOAD, READONLY, CODE
12 .fini         0000001a 0804841c 0804841c 0000041c 2**2
                  CONTENTS, ALLOC, LOAD, READONLY, CODE
13 .rodata       00000016 08048438 08048438 00000438 2**2
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
14 .data         0000000c 08049450 08049450 00000450 2**2
                  CONTENTS, ALLOC, LOAD, DATA
15 .eh_frame     00000004 0804945c 0804945c 0000045c 2**2
                  CONTENTS, ALLOC, LOAD, DATA
16 .ctors        00000008 08049460 08049460 00000460 2**2
                  CONTENTS, ALLOC, LOAD, DATA
17 .dtors        00000008 08049468 08049468 00000468 2**2
                  CONTENTS, ALLOC, LOAD, DATA
18 .got          00000020 08049470 08049470 00000470 2**2
                  CONTENTS, ALLOC, LOAD, DATA
19 .dynamic      000000a0 08049490 08049490 00000490 2**2
                  CONTENTS, ALLOC, LOAD, DATA
...
[alert7@redhat]$ gdb -q test
(gdb) disass main
Dump of assembler code for function main:
0x80483d0 <main>:       push   %ebp
0x80483d1 <main+1>:     mov    %esp,%ebp
0x80483d3 <main+3>:     push   $0x8048440
0x80483d8 <main+8>:     call   0x8048308 <printf>
0x80483dd <main+13>:    add    $0x4,%esp
0x80483e0 <main+16>:    xor    %eax,%eax
0x80483e2 <main+18>:    jmp    0x80483e4 <main+20>
0x80483e4 <main+20>:    leave
0x80483e5 <main+21>:    ret
...
0x80483ef <main+31>:    nop
End of assembler dump.
(gdb) b * 0x80483d8
Breakpoint 1 at 0x80483d8
(gdb) r
Starting program: /home/alert7/test

Breakpoint 1, 0x80483d8 in main ()
(gdb) disass 0x8048308    ① ⑴
Dump of assembler code for function printf:
/****************************************/ //PLT4：
0x8048308 <printf>:     jmp    *0x8049488       //jmp GOT[6]
      //此時(shí)，GOT[6]中存在的是0x804830e
0x804830e <printf+6>:   push   $0x18  //$0x18為printf重定位入口在JMPREL section中的偏移量
0x8048313 <printf+11>: jmp    0x80482c8 <_init+48> //jmp PLT0
      //PLT0處存放著調(diào)用RTLD函數(shù)的指令
      //當(dāng)函數(shù)返回時(shí)候，把GOT[6]修改為真正的
      //printf函數(shù)地址，然后直接跳到printf函數(shù)
      //執(zhí)行。
該部分為PLT的一部分
/****************************************/
End of assembler dump.
(gdb) x 0x8049488
0x8049488 <_GLOBAL_OFFSET_TABLE_+24>:   0x0804830e
080482c8 <.plt>:    ②  //PLT0：
80482c8:       ff 35 74 94 04 08       pushl 0x8049474 //pushl GOT[1]地址
        //GOT[1]是一個(gè)鑒別信息，是link_map類型的一個(gè)指針

80482ce:       ff 25 78 94 04 08       jmp    *0x8049478 //JMP GOT[2]
        //跳到動(dòng)態(tài)連接器解析函數(shù)執(zhí)行
80482d4:       00 00                   add    %al,(%eax)
80482d6:       00 00                   add    %al,(%eax)

80482d8:       ff 25 7c 94 04 08       jmp    *0x804947c //PLT1：
80482de:       68 00 00 00 00          push   $0x0
80482e3:       e9 e0 ff ff ff          jmp    80482c8 <_init+0x30>

80482e8:       ff 25 80 94 04 08       jmp    *0x8049480 //PLT2：
80482ee:       68 08 00 00 00          push   $0x8
80482f3:       e9 d0 ff ff ff          jmp    80482c8 <_init+0x30>

80482f8:       ff 25 84 94 04 08       jmp    *0x8049484 //PLT3：
80482fe:       68 10 00 00 00          push   $0x10
8048303:       e9 c0 ff ff ff          jmp    80482c8 <_init+0x30>

8048308:       ff 25 88 94 04 08       jmp    *0x8049488 //PLT4：
804830e:       68 18 00 00 00          push   $0x18
8048313:       e9 b0 ff ff ff          jmp    80482c8 <_init+0x30>

(gdb) b * 0x80482c8
Breakpoint 2 at 0x80482c8
(gdb) c
Continuing.

Breakpoint 2, 0x80482c8 in _init ()
(gdb) x/8x 0x8049470
0x8049470 <_GLOBAL_OFFSET_TABLE_>:      0x08049490      0x40013ed0      0x4000a960      0x400fa550
0x8049480 <_GLOBAL_OFFSET_TABLE_+16>:   0x080482ee      0x400328cc      0x0804830e      0x00000000
(gdb) x/50x 0x40013ed0 ( * link_map類型)
0x40013ed0:     0x00000000      0x40010c27      0x08049490      0x400143e0
0x40013ee0:     0x00000000      0x40014100      0x00000000      0x08049490
0x40013ef0:     0x080494e0      0x080494d8      0x080494a8      0x080494b0
0x40013f00:     0x080494b8      0x00000000      0x00000000      0x00000000
0x40013f10:     0x080494c0      0x080494c8      0x08049498      0x080494a0
0x40013f20:     0x00000000      0x00000000      0x00000000      0x080494f8
0x40013f30:     0x08049500      0x08049508      0x080494e8      0x080494d0
0x40013f40:     0x00000000      0x080494f0      0x00000000      0x00000000
0x40013f50:     0x00000000      0x00000000      0x00000000      0x00000000
0x40013f60:     0x00000000      0x00000000      0x00000000      0x00000000
(gdb) disass 0x4000a960    ③
Dump of assembler code for function _dl_runtime_resolve:
0x4000a960 <_dl_runtime_resolve>:       push   %eax
0x4000a961 <_dl_runtime_resolve+1>:     push   %ecx
0x4000a962 <_dl_runtime_resolve+2>:     push   %edx
0x4000a963 <_dl_runtime_resolve+3>:     mov    0x10(%esp,1),%edx
0x4000a967 <_dl_runtime_resolve+7>:     mov    0xc(%esp,1),%eax
0x4000a96b <_dl_runtime_resolve+11>:    call   0x4000a740 <fixup>
     //調(diào)用真正的解析函數(shù)fixup()，修正GOT[6]，使它指向真正的printf函數(shù)地址
0x4000a970 <_dl_runtime_resolve+16>:    pop    %edx
0x4000a971 <_dl_runtime_resolve+17>:    pop    %ecx
0x4000a972 <_dl_runtime_resolve+18>:    xchg   %eax,(%esp,1)
0x4000a975 <_dl_runtime_resolve+21>:    ret    $0x8 //跳到printf函數(shù)地址執(zhí)行
0x4000a978 <_dl_runtime_resolve+24>:    nop
0x4000a979 <_dl_runtime_resolve+25>:    lea    0x0(%esi,1),%esi
End of assembler dump.
(gdb) b * 0x4000a972
Breakpoint 4 at 0x4000a972: file dl-runtime.c, line 182.
(gdb) c
Continuing.

Breakpoint 4, 0x4000a972 in _dl_runtime_resolve () at dl-runtime.c:182
182     in dl-runtime.c
(gdb) i reg $eax $esp
eax            0x4006804c       1074167884
esp            0xbffffb64       -1073743004
(gdb) b *0x4000a975
Breakpoint 5 at 0x4000a975: file dl-runtime.c, line 182.
(gdb) c
Continuing.

Breakpoint 5, 0x4000a975 in _dl_runtime_resolve () at dl-runtime.c:182
182     in dl-runtime.c
(gdb) si
printf (format=0x1 <Address 0x1 out of bounds>) at printf.c:26
26      printf.c: No such file or directory.
(gdb) disass     ④ ⑵
Dump of assembler code for function printf:
0x4006804c <printf>:    push   %ebp
0x4006804d <printf+1>: mov    %esp,%ebp
0x4006804f <printf+3>: push   %ebx
0x40068050 <printf+4>: call   0x40068055 <printf+9>
0x40068055 <printf+9>: pop    %ebx
0x40068056 <printf+10>: add    $0xa2197,%ebx
0x4006805c <printf+16>: lea    0xc(%ebp),%eax
0x4006805f <printf+19>: push   %eax
0x40068060 <printf+20>: pushl 0x8(%ebp)
0x40068063 <printf+23>: mov    0x81c(%ebx),%eax
0x40068069 <printf+29>: pushl (%eax)
0x4006806b <printf+31>: call   0x400325b4
0x40068070 <printf+36>: mov    0xfffffffc(%ebp),%ebx
0x40068073 <printf+39>: leave
0x40068074 <printf+40>: ret
End of assembler dump.
(gdb) x/8x 0x8049470
0x8049470 <_GLOBAL_OFFSET_TABLE_>:      0x08049490      0x40013ed0      0x4000a960      0x400fa550
0x8049480 <_GLOBAL_OFFSET_TABLE_+16>:   0x080482ee      0x400328cc      0x4006804c      0x00000000

GOT[6]已經(jīng)被修正為0x4006804c了

第一次調(diào)用printf()的時(shí)候需要經(jīng)過(guò)①->②->③->④
以后調(diào)用printf()的時(shí)候就不需要這么復(fù)雜了，只要經(jīng)過(guò)⑴->⑵就可以了

我們來(lái)看看到底是如何修正GOT[6]的，也是就說(shuō)如何找到要修正的地址的
(以前我在這點(diǎn)理解上發(fā)生了一些比較大的誤解，誤導(dǎo)各位的地方還請(qǐng)包涵:) )

1：
進(jìn)入PLT4的時(shí)候 push   $0x18 ，該$0x18為printf重定位入口在JMPREL section中的偏移量
2：
printf重定位地址為JMPREL+$0x18 /* Elf32_Rel * reloc = JMPREL + reloc_offset; */
(gdb) x/8x 0x8048278+0x18
0x8048290:  0x08049488      0x00000407      0x53e58955      0x000000e8
0x80482a0 <_init+8>:    0xc3815b00      0x000011cf      0x001cbb83      0x74000000
typedef struct {
      Elf32_Addr r_offset;
      Elf32_Word r_info;
} Elf32_Rel;
也就是說(shuō)printf重定位printf_retloc.r_offset=0x08049488;
    printf_retloc.r_info=0x00000407;
再看看0x08049488是什么地方
(gdb) x 0x08049488
0x8049488 <_GLOBAL_OFFSET_TABLE_+24>:   0x4006804c
也就是GOT[6]
3:
void *const rel_addr = (void *)(l->l_addr + reloc->r_offset);
對(duì)一個(gè)可執(zhí)行文件或一個(gè)共享目標(biāo)而言,rel_addr就等于reloc->r_offset
所以rel_addr=0x08049488=GOT[6]；
4：
*reloc_addr = value;
修正了rel_addr也就是GOT[6]
至于value是如何計(jì)算的，請(qǐng)參考下面的源代碼

同時(shí)r_info又關(guān)聯(lián)著一個(gè)符號(hào)
Elf32_Sym * sym = &SYMTAB[ ELF32_R_SYM (reloc->r_info) ];
sym=0x8048158+0x00000407;
typedef struct {
      Elf32_Word st_name;
      Elf32_Addr st_value;
      Elf32_Word st_size;
      unsigned char st_info;
      unsigned char st_other;
      Elf32_Half st_shndx;
} Elf32_Sym;
(gdb) x/10x 0x8048158+0x00000407
0x804855f:      0x00003a00      0x00008000      0x00000000      0x00006900
0x804856f:      0x00008000      0x00000000      0x00008300      0x00008000
0x804857f:      0x00000000      0x0000b700

link_map結(jié)構(gòu)說(shuō)明如下：
/* Structure describing a loaded shared object. The `l_next' and `l_prev'
members form a chain of all the shared objects loaded at startup.

These data structures exist in space used by the run-time dynamic linker;
modifying them may have disastrous results.

This data structure might change in future, if necessary. User-level
programs must avoid defining objects of this type. */

★★ glibc中動(dòng)態(tài)解析符號(hào)的源代碼（glibc 2.1.3的實(shí)現(xiàn)）

.text
.globl _dl_runtime_resolve
.type _dl_runtime_resolve, @function
.align 16
_dl_runtime_resolve:
pushl %eax  # Preserve registers otherwise clobbered.
pushl %ecx
pushl %edx
movl 16(%esp), %edx # Copy args pushed by PLT in register. Note
movl 12(%esp), %eax # that `fixup' takes its parameters in regs.
call fixup  # Call resolver.
popl %edx  # Get register content back.
popl %ecx
xchgl %eax, (%esp) # Get %eax contents end store function address.
ret $8   # Jump to function address.

static ElfW(Addr) __attribute__ ((unused))
fixup (
# ifdef ELF_MACHINE_RUNTIME_FIXUP_ARGS
        ELF_MACHINE_RUNTIME_FIXUP_ARGS,
# endif
       struct link_map *l, ElfW(Word) reloc_offset)
{
const ElfW(Sym) *const symtab
    = (const void *) l->l_info[DT_SYMTAB]->d_un.d_ptr;
const char *strtab = (const void *) l->l_info[DT_STRTAB]->d_un.d_ptr;

const PLTREL *const reloc /*計(jì)算函數(shù)重定位人口*/
= (const void *) (l->l_info[DT_JMPREL]->d_un.d_ptr + reloc_offset);
/*l->l_info[DT_JMPREL]->d_un.d_ptr 為JMPREL section的地址*/

const ElfW(Sym) *sym = &symtab[ELFW(R_SYM) (reloc->r_info)];/*計(jì)算函數(shù)symtab入口*/
void *const rel_addr = (void *)(l->l_addr + reloc->r_offset);/*重定向符號(hào)的絕對(duì)地址*/

ElfW(Addr) value;

/* The use of `alloca' here looks ridiculous but it helps. The goal is
     to prevent the function from being inlined and thus optimized out.
     There is no official way to do this so we use this trick. gcc never
     inlines functions which use `alloca'. */
alloca (sizeof (int));

/* Sanity check that we're really looking at a PLT relocation. */
assert (ELFW(R_TYPE)(reloc->r_info) == ELF_MACHINE_JMP_SLOT);/*健壯性檢查*/

   /* Look up the target symbol. */
switch (l->l_info[VERSYMIDX (DT_VERSYM)] != NULL)
    {
    default:
      {
const ElfW(Half) *vernum =
   (const void *) l->l_info[VERSYMIDX (DT_VERSYM)]->d_un.d_ptr;
ElfW(Half) ndx = vernum[ELFW(R_SYM) (reloc->r_info)];
const struct r_found_version *version = &l->l_versions[ndx];

if (version->hash != 0)
   {
     value = _dl_lookup_versioned_symbol(strtab + sym->st_name,
      &sym, l->l_scope, l->l_name,
      version, ELF_MACHINE_JMP_SLOT);
     break;
   }
      }
    case 0:
      value = _dl_lookup_symbol (strtab + sym->st_name, &sym, l->l_scope,
     l->l_name, ELF_MACHINE_JMP_SLOT);
    }
   /*此時(shí)value為object裝載的基地址*/
/* Currently value contains the base load address of the object
     that defines sym. Now add in the symbol offset. */

value = (sym ? value + sym->st_value : 0);/*函數(shù)的絕對(duì)地址*/

/* And now perhaps the relocation addend. */
value = elf_machine_plt_value (l, reloc, value);/*可能還需要一下重定位*/

/* Finally, fix up the plt itself. */
elf_machine_fixup_plt (l, reloc, rel_addr, value);/*修正rel_addr，一般來(lái)說(shuō)是GOT[N]*/

return value;
}

static inline Elf32_Addr
elf_machine_plt_value (struct link_map *map, const Elf32_Rela *reloc,
Elf32_Addr value)
{
return value + reloc->r_addend;
}

/* Fixup a PLT entry to bounce directly to the function at VALUE. */
static inline void
elf_machine_fixup_plt (struct link_map *map, const Elf32_Rel *reloc,
Elf32_Addr *reloc_addr, Elf32_Addr value)
{
*reloc_addr = value;
}

參考資料：

1.glibc 2.1.3 src
2.<<ELF文件格式>>
3.<<Cheating the ELF Subversive Dynamic Linking to Libraries>> write by the grugq
4.Linux動(dòng)態(tài)鏈接技術(shù)
http://www.linuxforum.net/forum/showflat.php?Cat=&Board=Kstudy&Number=102793&page=1&view=collapsed&sb=5&o=31&part=
5.p58-0x04 by Nergal <nergal@owl.openwall.com>
<< The advanced return-into-lib(c) exploits >>

- 作者： badcoffee 2004年10月27日, 星期三 08:20　回復(fù)（0） |　引用（0）加入博采

Solaris上的開(kāi)發(fā)環(huán)境安裝及設(shè)置

作者: Badcoffee
Email: blog.oliver@gmail.com
2004年10月

原文出處: http://blog.csdn.net/yayong
版權(quán)所有: 轉(zhuǎn)載時(shí)請(qǐng)務(wù)必以超鏈接形式標(biāo)明文章原始出處、作者信息及本聲明

1. 簡(jiǎn)介

由于Solaris發(fā)行版是默認(rèn)是不安裝C編譯器及開(kāi)發(fā)環(huán)境的，因此，要在Solaris平臺(tái)做C程序開(kāi)發(fā)有如下兩種選擇：

   購(gòu)買(mǎi)Sun公司的編譯器Sun Studio
   安裝免費(fèi)的GNU開(kāi)發(fā)工具

   如果需要為Sparc平臺(tái)編譯和優(yōu)化，對(duì)生成代碼的performance要求較高，Sun Studio也許是最佳選擇。
   考慮到成本和其他因素，免費(fèi)的GNU開(kāi)發(fā)工具無(wú)疑是首選。事實(shí)上，gcc可以支持包括Sparc和X86在內(nèi)的多種平臺(tái)的交叉編譯。

Solaris發(fā)行版本的Companion CD上，包括了很多GNU的開(kāi)發(fā)工具：

   gcc            (c/c++編譯器)
   binutils       (gas/ld/ar/nm等二進(jìn)制工具，可以不安裝)
   gdb            (debug工具，調(diào)試代碼和反匯編)
   gmake          (GNU的make，可以不安裝)
   vim            (編輯器，可以支持c/c++等語(yǔ)言的語(yǔ)法高亮顯示功能)
   coreutils      (包含gnu的常用命令，利用ls --color參數(shù)可以實(shí)現(xiàn)和linux一樣的彩色終端功能)

   當(dāng)然，除安裝以上安裝包外，一般還需安裝以下程序庫(kù)的安裝包：

   glib
   gtk
   libiconv
   ncurses

   除了Solaris發(fā)行版本的Companion CD外，從www.sunfreeware.com站點(diǎn)上也可以下載到以上工具的二進(jìn)制包。
   sunfreeware的站點(diǎn)上提供了Solaris 7/8/9 各主要版本的免費(fèi)工具的下載。

以上提到的所有安裝包，均須用gzip解壓后，用pkgadd -d命令來(lái)進(jìn)行安裝。

2. 安裝及設(shè)置

   另外www.blastwave.org也提供了大量的Solaris平臺(tái)的應(yīng)用軟件，并提供了pkg-get的網(wǎng)絡(luò)安裝方式，
由于pkg-get可以自動(dòng)下載安裝指定軟件包所依賴的所有軟件包，使得軟件的安裝更簡(jiǎn)便更容易。
   首先下載并安裝pkg-get命令，就可以用如下命令來(lái)完成所有的安裝：

   # pkg-get install gcc3
   # pkg-get install gdb
   # pkg-get install vim
   # pkg-get install coreutils

   注：如果是通過(guò)proxy上網(wǎng)，需要在/opt/csw/etc/pkg-get.conf中設(shè)置代理服務(wù)器地址及端口。
       關(guān)于pkg-get的安裝和使用請(qǐng)參考官方站點(diǎn)文檔 http://www.blastwave.org

   在這里，沒(méi)有安裝binutils包，Solaris的SUNW包里已經(jīng)包含了類似功能的命令，可以在/usr/ccs/bin找到。

將root的的默認(rèn)shell修改為bash,然后在根目錄創(chuàng)建.bashrc文件：

   #vi /.profile
      TERM=dtterm
      export TERM
      PATH=$PATH:/usr/local/bin:/usr/ccs/bin;
      export PATH

alias ls='/usr/local/bin/ls --color'
alias vi='/usr/local/bin/vim'

以上設(shè)置使得vim和gnu ls代替系統(tǒng)的vi和ls，為支持類linux的彩色終端設(shè)置TERM變量。

在根目錄設(shè)置vim的配置文件，設(shè)置vim的工作模式：

   #vi /.vimrc
      set autoindent          " always set autoindenting on
      set nobackup            " do not keep a backup file, use versions instead
      set history=50          " keep 50 lines of command line history
      set showcmd             " display incomplete commands
      set tabstop=4

syntax on
set hlsearch

filetype plugin indent on

autocmd FileType text setlocal textwidth=80

只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


相關(guān)文章: learn sed 參數(shù) linux學(xué)習(xí)入門(mén)指令！使用AutoMake輕松生成Makefile（轉(zhuǎn)） vim參考手冊(cè)！ Linux平臺(tái)可以用gdb進(jìn)行反匯編和調(diào)試。 Linux 匯編語(yǔ)言開(kāi)發(fā)指南 gdb 方法說(shuō)明 (轉(zhuǎn)) gdb command! (轉(zhuǎn)) ubuntu linux base comand ubuntu一些基本操作用法!(轉(zhuǎn))

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問(wèn) Chat2DB 管理

Copyright Copyright T.S Liu

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品