0.轉(zhuǎn)載請保留原創(chuàng):http://www.shnenglu.com/jinglexy
MSN and Email: jinglexy at yahoo dot com dot cn
前不久寫的一個調(diào)試器,公司很多模塊使用linux環(huán)境,由于使用平臺的緣故,bug非常多,于是編寫了一個簡單的調(diào)試器:大致功能是捕獲程序異常,打印調(diào)用棧(也包括調(diào)用函數(shù)名),對運行的進程進行代碼或函數(shù)調(diào)試,內(nèi)核簡單調(diào)試等。代碼量并不大,有效代碼行不超過3000行,花了10工作日完成,可能是時間緊迫吧,后期調(diào)試用了3周,汗哪!
1.使用ptrace系統(tǒng)調(diào)用關(guān)聯(lián)一個進程后,需要waitpid(pid,
NULL, WUNTRACED);一下,這個調(diào)試了很長時間才發(fā)現(xiàn)的,我猜測可能是因為ptrace后,不像信號立即 進入目標進程的處理。需要調(diào)度到目標進程后,進入do_waitpid()處理函數(shù)以設(shè)置正確的調(diào)試狀態(tài)。如果不這樣做,會導致釋放管理進程失敗。比較流行的調(diào)試工具gdb就是使用ptrace實現(xiàn)的,在gcc編譯過程中也會插入專門的調(diào)試信息。原理比較簡單,實現(xiàn)起來細節(jié)需要注意的也很多。
2.在跟蹤程序異常時的調(diào)用棧中發(fā)現(xiàn)的:montavista編譯環(huán)境的一個bug?(不能捕獲動態(tài)庫中的異常,主要是因為動態(tài)庫加載時地址都不固定,使用了一種叫做got的技術(shù),可以閱讀coly大俠翻譯的《連接器與加載器》一書,非常棒)
當程序收到異常信號后,內(nèi)核進入do_signal()處理,在arch/arm/kernel/signal.c文件,
do_signal() -- > handle_signal() --> setup_rt_frame()
setup_rt_frame會拷貝上下文環(huán)境的數(shù)據(jù)結(jié)構(gòu)到用戶空間,
就是它的參數(shù) siginfo_t *info,這個數(shù)據(jù)結(jié)構(gòu)內(nèi)部包含了上下文的數(shù)據(jù)結(jié)構(gòu)struct ucontext ,
定義在:include/asm-arm/ucontext.h,內(nèi)容如下:
struct ucontext {
unsigned long uc_flags;
struct ucontext *uc_link;
stack_t uc_stack;
struct sigcontext uc_mcontext;
sigset_t uc_sigmask; /* mask last for extensibility */
};
在arm_v5t_le-gcc中,上下文結(jié)構(gòu)定義如下:
/opt/montavista/pro/devkit/arm/v5t_le/target/usr/include/sys/ucontext.h文件
typedef struct ucontext
{
unsigned long int uc_flags;
struct ucontext *uc_link;
__sigset_t uc_sigmask;
stack_t uc_stack;
mcontext_t uc_mcontext;
long int uc_filler[5];
} ucontext_t;
在上面數(shù)據(jù)結(jié)構(gòu)中, __sigset_t
uc_sigmask;被定義在上下文環(huán)境之前,
而在內(nèi)核中 fp指針在 uc_mcontext的arm_fp域中(先將uc_mcontext強制轉(zhuǎn)換成struct sigcontext結(jié)構(gòu)
在asm-arm/sigcontext.h定義),
也就是第14個 int 成員, 由于上面的stack_t 占內(nèi)存為3個 int型,所以在nipdebug調(diào)試庫中修補為
*bp = ct->uc_sigmask.__val[17];
結(jié)論:montavista編譯環(huán)境的ucontext.h文件定義上下文環(huán)境的數(shù)據(jù)結(jié)構(gòu)位置不正確,
而該數(shù)據(jù)結(jié)構(gòu)在/opt/arm/arm-linux/sys-include/sys/ucontext.h(即arm9)中定義是正確的,
/opt/ppc/include/sys/ucontext.h(ppc交叉編譯)中也是正確的。