引子:
1.在Linux系統中,進程狀態除了我們所熟知的TASK_RUNNING,TASK_INTERRUPTIBLE,TASK_STOPPED等,還有一個TASK_TRACED。這表明這個進程處于什么狀態?
2.strace可以方便的幫助我們記錄進程所執行的系統調用,它是如何跟蹤到進程執行的?
3.gdb是我們調試程序的利器,可以設置斷點,單步跟蹤程序。它的實現原理又是什么?
所有這一切的背后都隱藏著Linux所提供的一個強大的系統調用ptrace().
1.ptrace系統調用
ptrace
系統調從名字上看是用于進程跟蹤的,它提供了父進程可以觀察和控制其子進程執行的能力,并允許父進程檢查和替換子進程的內核鏡像(包括寄存器)的值。其基
本原理是:
當使用了ptrace跟蹤后,所有發送給被跟蹤的子進程的信號(除了SIGKILL),都會被轉發給父進程,而子進程則會被阻塞,這時子進程的狀態就會被
系統標注為TASK_TRACED。而父進程收到信號后,就可以對停止下來的子進程進行檢查和修改,然后讓子進程繼續運行。
其原型為:
#include <sys/ptrace.h>
long ptrace(enum __ptrace_request request, pid_t pid, void *addr, void *data);
ptrace有四個參數:
1). enum __ptrace_request request:指示了ptrace要執行的命令。
2). pid_t pid: 指示ptrace要跟蹤的進程。
3). void *addr: 指示要監控的內存地址。
4). void *data: 存放讀取出的或者要寫入的數據。
ptrace是如此的強大,以至于有很多大家所常用的工具都基于ptrace來實現,如strace和gdb。接下來,我們借由對strace和gdb的實現,來看看ptrace是如何使用的。
2. strace的實現
strace常常被用來攔截和記錄進程所執行的系統調用,以及進程所收到的信號。如有這么一段程序:
HelloWorld.c:
#include <stdio.h>
int main(){
printf("Hello World!\n");
return 0;
}
編譯后,用strace跟蹤: strace ./HelloWorld
可以看到形如:
execve("./HelloWorld", ["./HelloWorld"], [/* 67 vars */]) = 0
brk(0) = 0x804a000
mmap2(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb7f18000
access("/etc/ld.so.preload", R_OK) = -1 ENOENT (No such file or directory)
open("/home/supperman/WorkSpace/lib/tls/i686/sse2/libc.so.6", O_RDONLY) = -1 ENOENT (No such file or directory)
...
的一段輸出,這就是在執行HelloWorld中,系統所執行的系統調用,以及他們的返回值。
下面我們用ptrace來研究一下它是怎么實現的。
...
switch(pid = fork())
{
case -1:
return -1;
case 0: //子進程
ptrace(PTRACE_TRACEME,0,NULL,NULL);
execl("./HelloWorld", "HelloWorld", NULL);
default: //父進程
wait(&val); //等待并記錄execve
if(WIFEXITED(val))
return 0;
syscallID=ptrace(PTRACE_PEEKUSER, pid, ORIG_EAX*4, NULL);
printf("Process executed system call ID = %ld\n",syscallID);
ptrace(PTRACE_SYSCALL,pid,NULL,NULL);
while(1)
{
wait(&val); //等待信號
if(WIFEXITED(val)) //判斷子進程是否退出
return 0;
if(flag==0) //第一次(進入系統調用),獲取系統調用的參數
{
syscallID=ptrace(PTRACE_PEEKUSER, pid, ORIG_EAX*4, NULL);
printf("Process executed system call ID = %ld ",syscallID);
flag=1;
}
else //第二次(退出系統調用),獲取系統調用的返回值
{
returnValue=ptrace(PTRACE_PEEKUSER, pid, EAX*4, NULL);
printf("with return value= %ld\n", returnValue);
flag=0;
}
ptrace(PTRACE_SYSCALL,pid,NULL,NULL);
}
}
...
在
上面的程序中,fork出的子進程先調用了ptrace(PTRACE_TRACEME)表示子進程讓父進程跟蹤自己。然后子進程調用execl加載執行
了HelloWorld。而在父進程中則使用wait系統調用等待子進程的狀態改變。子進程因為設置了PTRACE_TRACEME而在執行系統調用被系
統停止(設置為TASK_TRACED),這時父進程被喚醒,使用ptrace(PTRACE_PEEKUSER,pid,...)分別去讀取子進程執行
的系統調用ID(放在ORIG_EAX中)以及系統調用返回時的值(放在EAX中)。然后使用ptrace(PTRACE_SYSCALL,
pid,...)指示子進程運行到下一次執行系統調用的時候(進入或者退出),直到子進程退出為止。
程序的執行結果如下:
Process executed system call ID = 11
Process executed system call ID = 45 with return value= 134520832
Process executed system call ID = 192 with return value= -1208934400
Process executed system call ID = 33 with return value= -2
Process executed system call ID = 5 with return value= -2
...
其
中,11號系統調用就是execve,45號是brk,192是mmap2,33是access,5是open...經過比對可以發現,和strace的
輸出結果一樣。當然strace進行了更詳盡和完善的處理,我們這里只是揭示其原理,感興趣的同學可以去研究一下strace的實現。
PS:
1). 在系統調用執行的時候,會執行pushl %eax # 保存系統調用號ORIG_EAX在程序用戶棧中。
2). 在系統調用返回的時候,會執行movl %eax,EAX(%esp)將系統調用的返回值放入寄存器%eax中。
3). WIFEXITED()宏用來判斷子進程是否為正常退出的,如果是,它會返回一個非零值。
4). 被跟蹤的程序在進入或者退出某次系統調用的時候都會觸發一個SIGTRAP信號,而被父進程捕獲。
5). execve()系統調用執行成功的時候并沒有返回值,因為它開始執行一段新的程序,并沒有"返回"的概念。失敗的時候會返回-1。
6). 在父進程進行進行操作的時候,用ps查看,可以看到子進程的狀態為T,表示子進程處于TASK_TRACED狀態。當然為了更具操作性,你可以在父進程中加入sleep()。
(To Be Continued)
Pthread 08/01/13
原文地址:http://blog.csdn.net/Javadino/archive/2008/09/06/2891413.aspx