一区二区三区日韩在线观看,欧美成人高清,看欧美日韩国产

前幾天和柯柯交流一個小問題，說是如何在一個函數內得到調用該函數的函數地址。有點拗口，就是說如果有一個函數A（當然我們在這個問題中并不知道它是哪個函數）調用了B函數，現在希望用個什么辦法得到A函數的地址。

我首先聯想到的是，一般調試器都能給出嵌套的函數調用關系。那么肯定是有什么辦法解決這個問題。上網查了一通之后只找到一些debug用的API和一些開發環境提供的調整宏等等，感覺不是很適用。后來想想，函數調用都涉及到“函數調用棧”（call stack），也許這里可以得到些什么信息。隱約回想起以前匯編課里老師講過的一些函數調用時要“壓棧”、“要保存現場”等，但已經記得不太清楚了，于是就又上網找了些函數調用棧的知識，發現了一些有意思的信息（上網時看到ChinaUnix上的一篇，也是轉的，原地址和作者不詳，如果你知道請告訴我）：

一個函數調用動作可分解為：零到多個PUSH指令（用于參數入棧），一個CALL指令。CALL指令內部其實還暗含了一個將返回地址（即CALL指令下一條指令的地址）壓棧的動作。
幾乎任何本地編譯器都會在每個函數體之前插入類似如下指令：PUSH EBP; MOV EBP ESP;即，在程式執行到一個函數的真正函數體時，已有以下數據順序入棧：參數，返回地址，EBP。

這里我最關心的是：函數調用時，會在棧里壓入返回地址，和EBP。

因為函數調用的返回地址，正是調用指令Call的下一個指令的地址，那么，有了返回地址，就可以得到Call指令的位置了。有Call指令的位置又能干什么呢？幸好匯編課里的知識還記得一點點：Call指令就是一個跳轉指令，它可以讓IP（instruction point[Thanks to RednaxelaFX]）指向要跳轉的指令的地址，從那里開始執行。對于函數調用來說，就是讓IP指向被調用的函數的地址。Call指令的操作數其實和被調用函數的地址有非常重要的關系。有了Call指令的操作數，就可以計算出被調用函數的地址。

但僅僅有這個還不夠，比如，A調用了B，那么在A函數中肯定有一個Call指令，但這個Call指令中的操作數是和B函數地址相關的，與A的函數地址直接關系不大（至少在沒有其它信息的情況下，不能計算出A的地址）。而我們要得到的卻是A函數的地址。所以，得向上再找一層，找到調用A函數的地方，那個地方的Call指令里的操作數才和A函數地址有關。也就是說，Z函數調用了A函數，A函數調用了B函數。現在要得到A函數的地址，我們得在Z函數里找Call指令的操作數。這時候EBP就派上用場了。本地編譯器在每個函數體之前插入的指令（PUSH EBP; MOV EBP ESP）構造了一個巧妙的結構，使得我們可以順著函數調用棧一層一層向上，找到所有調用關系。

如何向上查找呢？我們看看函數調用時棧、EBP的值的情況就知道了。

假設現在函數在正Z函數內執行，那么此時棧和EBP的值可能是像下圖這樣的：

我們先不管現在EBP指向的內存（0x000f）中的內容XXX是什么（要不然會是雞生蛋生雞的問題），總之目前在棧中的著色塊中的內容是屬于函數Z的參數，Z執行結束后應該返回的地址以及Z函數的局部變量值。

現在Z函數調用A函數，會先將傳給A的參數壓棧，然后將現在這個指令（就是"Call A"啦）的下一個指令的地址壓入棧中，以便A函數完后返回到Z中繼續執行。然后進入A函數的內存空間，首先就是調用PUSH EBP，也就是將Z的EPB的內容（地址0x000f）壓入棧中，然后再MOV EBP ESP，讓EBP有一個新的棧頂（此時棧頂中的內容不就是Z函數時EBP的內容么？），然后再將A函數的局部變量壓入棧中，開始執行A函數的代碼。這時，棧和EBP的情況就像如圖所示了：

哈，這樣就很清楚了，原來現在的EBP中的內容，正是上一級函數的EBP中的內容。而每一個函數的EBP指向的位置，向棧頂可以得到該函數的局部變量，向棧底可以得到函數的返回地址和參數。于是我們就可以根據這個結構層層向上，找到任何一層我們想找的函數EBP，從而也就能得到相應的返回地址了。　　

好，從B函數中得到Z函數對A函數調用點的返回地址的問題也就解決了。現在就是處理Call指令的問題了。

我在Visual Studio 2003的Debug版中進行反匯編調試，發現Call指令對應的機器指令都是5個byte，第一個byte（E8）是指令的器碼，猜想后面4個byte應該就是它的轉移的目標地址了。結果按這個地址去找，發現根本不對，想想匯編也忘得差不多了，于是又去找了教程看看，才記起原來Call的操作數并不是絕對地址，而是偏移地址（跳轉目標地址－Call指令地址－sizeof(Call指令)），這樣就好辦了，我有返回地址，于是就有了向上5個byte就是Call的地址，再從這個地址中取出Call指令機器碼的后四個字節，加上返回地址，就得到了目標地址。

原以為已經搞定了。不過還有一個小插曲，就是在VS的Debug版中，Call并不直接跳到一函數中去（不知道為什么），而是跳到一塊代碼區，這塊區域內排布了很多的Jmp指令用于各種跳轉（不知道為什么這么搞，也許是為調試的功能而設計的吧，誰知道？還請不吝賜教），不過沒關系，也就是多走一點路而已，Jmp指令的操作數和Call指令的意義是一樣的，最終Jmp是跳到函數代碼塊中去的。于是也就得到了想要的結果。

下面是代碼：

#include "stdafx.h"
2

#include <string>
4

unsigned int GetCallerAddress(void)
6

{
7

unsigned int _ebp;
8

__asm mov _ebp, ebp
9

for (int i=2; i != 0; --i) {
11

_ebp = *(unsigned int *)(_ebp);
12

}
13

unsigned int* ipAddress = (unsigned int*)(*(unsigned int *)(_ebp + 4));
14

ipAddress = (unsigned int*)((unsigned char *)ipAddress - 5);
16

unsigned int callInstructAddress = (unsigned int)ipAddress;
17

ipAddress = (unsigned int*)((unsigned char *)ipAddress + 1);
18

int funcAddrOffset = *ipAddress;
19

unsigned int *jumAddr = (unsigned int*)(callInstructAddress + funcAddrOffset + 5);
20

callInstructAddress = (unsigned int)jumAddr;
21

jumAddr = (unsigned int*)((unsigned char *)jumAddr + 1);
22

funcAddrOffset = *jumAddr;
23

return funcAddrOffset + callInstructAddress + 5;
25

}
26

void fun1();
28

void fun2()
30

{
31

fun1();
32

}
33

void fun3()
35

{
36

fun1();
37

}
38

void fun1()
41

{
42

unsigned int _ebp;
43

__asm mov _ebp, ebp // 取當前EBP
44

unsigned int _preEbp = *(unsigned int *)(_ebp); //得到上層函數的EBP
45

unsigned int* ipAddress = (unsigned int*)(*(unsigned int *)(_preEbp + 4)); // 取得返回地址
46

ipAddress = (unsigned int*)((unsigned char *)ipAddress - 5); // 得到Call指令地址
47

unsigned int callInstructAddress = (unsigned int)ipAddress; // 保存Call指令地址
48

ipAddress = (unsigned int*)((unsigned char *)ipAddress + 1);
49

int funcAddrOffset = *ipAddress; // 得到Call指令操作數
50

unsigned int *jumAddr = (unsigned int*)(callInstructAddress + funcAddrOffset + 5); // 找到Jmp指令
51

callInstructAddress = (unsigned int)jumAddr; // 保存jmp指令地址
52

jumAddr = (unsigned int*)((unsigned char *)jumAddr + 1);
53

funcAddrOffset = *jumAddr; // 得到jmp指令操作數
54

unsigned int addr = funcAddrOffset + callInstructAddress + 5; //得到函數地址
55

// 或者：unsigned int addr = GetCallerAddress();
57

printf("fun1 said : Caller Addres is 0x%08x\n", addr);
58

}
59

int _tmain(int argc, _TCHAR* argv[])
61

{
62

fun1();
63

fun2();
64

fun3();
65

return 0;
67

}
68

PS：后經柯柯驗證，只有VC6、2003、2008的Debug版里才有效。Release版中不行，具體原因未細查（沒時間，畢竟不是＂正務＂，呵呵）。以后再遇到時再細究吧。至少，現在對函數調用棧有了一些新的認識。很開心，呵呵呵。

后記：

　　這兩天翻看《Windows95編程大奧秘》（候捷譯）中，作者在分析PE格式的時候提到了，Call指令并不直接將程序控制轉到目標函數，而是轉入一個Jmp的代碼塊中，由Jmp來最終將控制權交給函數。為什么這么做呢？作者給出的結論是這樣做可以使得載入器的行為變得簡單。因為Jmp的操作數是存放在idata區的一個“變量”，載入器只需要將被調用的DLL的地址一次寫入這個“變量”中就可以了。如果不這么做，那么需要在每個Call指令中的位置對函數地址進行Fixup，這樣會有更多的工作量。

　　OK，你不要笑話我說還看Win95的書哦。是的，我承認我不知道上面這段話中內容在現在的XP或是Vista或是2000中是否依然有效（因為我沒有去驗證過），但我看到了解決的方向。另外，這本書真的像候捷先生所說，“仍然極具技術價值”。我很認同！

　　鑒于RednaxelaFX的提示和本書給的信息，我下一步將償試從PE文件來找這個問題的解決之道，并順帶學習一下PE格式。讀完《Win95》后，也可能會寫篇讀后感，敬請留意，嘿嘿。

posted on 2009-06-09 20:38 唐風閱讀(4455) 評論(7) 編輯收藏引用所屬分類: 調試技術與逆向工程

@OwnWaterloo
調試器沒有符號表的情況下應該也能工作，但給出來的信息是“人類不可讀”的。

一直在找一種方法，希望能實現這樣的需求：
給出兩個斷點，當程序停在第二個斷點的時候，希望得到在之期間被調用過的函數的列表（按時間順序）。
當然，希望這個方法是非侵入性的。
棧信息顯然是不夠的，某一時刻的棧信息只有被斷點函數的上層函數信息，但可以肯定的是每個函數調用都會有壓棧出棧，能不能設置一個類似“勾子”的東西，在CPU進行壓棧的時候記錄下某些信息呢？

回復更多評論

# re: 函數調用棧初探 2009-11-21 17:55 OwnWaterloo

@唐風
【
但可以肯定的是每個函數調用都會有壓棧出棧
】
問題就在于這個前提是沒有保證的。
編譯器處理尾調用時可以使用jmp而不用call。
這種情況在msvc和gcc上都存在。

編譯器不一定會生成序言部分 —— push ebp mov ebp esp。
msvc肯定有這種情況，我見過。
gcc好像會嚴格生成這部分代碼。

vs2005 team suit好像有這個功能。在性能測試中。但沒這么靈活……
好像只能在程序跑完之后才能輸出分析的結果，不能任意兩個斷點之間。
輸出結果中記得是包含了調用樹的。
可以玩玩看，也許有輸出2個斷點之間的調用樹呢？

回復更多評論

# re: 函數調用棧初探 2009-11-21 17:56 OwnWaterloo

@唐風
【
能不能設置一個類似“勾子”的東西，在CPU進行壓棧的時候記錄下某些信息呢？
】
這個就不知道了……
查查vs的那個性能測試是怎么做到的？也是非侵入的。
或者其他profile工具是怎么做的？

回復更多評論

# re: 函數調用棧初探 2009-11-22 12:54 唐風

>>問題就在于這個前提是沒有保證的。編譯器處理尾調用時可以使用jmp而不用call。這種情況在msvc和gcc上都存在。
哦哦，原來還有這種情況，呃，如果是在 debug 模式下，優化全關呢？嗯，找個時間我再也看看。

>>或者其他profile工具是怎么做的？
這倒是，以前沒想到這個可以做參考呢，嗯，謝謝提醒。

真是獨學而無友，則孤陋而寡聞。

PS:
一連兩天看到你搶占沙發長篇回復，果然是神人啊……
什么時候我夠格能和你“論戰”一番而后雙方受益，倒是可以“含笑九泉”了，:)

學習中……

回復更多評論

# re: 函數調用棧初探 2009-11-27 02:29 OwnWaterloo

你本來寫的是【quote】吧？ cnblogs確實很偏心，cppblog確實是穿小鞋的……

說正題……
這里的評論里可能有你感興趣的內容：
http://www.cnblogs.com/JeffreyZhao/archive/2009/11/17/linker-loader-library-correction-about-call-stack.html#1704232

關于push ebp,frame pointer,call-stack,debugging等。

有點長哦，一直往下看。
哈哈，評論的主角就是這篇文章中提到的RednaxelaFX。
應該是同一個人吧？
回復更多評論

# re: 函數調用棧初探 2009-11-27 19:49 唐風

謝謝你的提醒啊~！
呵呵，這兩天跑去看 WinDbg 的擴展命令去了，企圖看能不能通過寫 WinDbg 的擴展來達到目的……有點頭大的說，哈哈。

RednaxelaFX 這個“家伙”也是個神人，我在 JavaEye 上第一次發表這篇文章的時候就有他的回復，相信是同一個人，嘿嘿。（他在 JavaEye 上有關于 JavaScript 運行機制的文章，看得出是很有幾把刷子的）

跑來跑去，發現世界挺大，圈子確挺小，哈哈哈哈 :P

嗯嗯，是夠長的，明天早起好好看，嘿嘿！！

PS:
>>你本來寫的是【quote】吧？ cnblogs確實很偏心，cppblog確實是穿小鞋的……
確實是的，唉……
這段時間在通過 CSS 和 JS 腳本在配置 cnblogs 的博客，已經比較滿意了，嘿嘿。回復更多評論

刷新評論列表

只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

天秤座的唐風

公告

常用鏈接

留言簿(2)

隨筆分類(13)

隨筆檔案(13)

我的其它空間

搜索

最新評論

閱讀排行榜

評論排行榜

評論