現(xiàn)代編譯器常見(jiàn)的編譯過(guò)程
peakflys注:本文轉(zhuǎn)載自http://blog.sina.com.cn/s/blog_49ec372801008fzt.html ,其中很多對(duì)gcc的講解很實(shí)用。現(xiàn)代編譯器常見(jiàn)的編譯過(guò)程:
源文件-->預(yù)處理-->編譯/優(yōu)化-->匯編-->鏈接-->可執(zhí)行文件
對(duì)于gcc而言:
第一步 預(yù)處理
命令: gcc -o test.i -E test.c
或者 cpp -o test.i test.c (這里cpp不是指c plus plus,而是the C Preprocessor)
結(jié)果: 生成預(yù)處理后的文件test.i(可以打開(kāi)后與預(yù)處理前進(jìn)行比對(duì),當(dāng)然長(zhǎng)度會(huì)嚇你一跳)
注解: 此步讀取c源程序,對(duì)偽指令和特殊符號(hào)進(jìn)行處理。包括宏(peakflys注:通過(guò)加入-E -P 可以輕松的看到程序中宏替換后的代碼,便于編寫(xiě)復(fù)雜宏時(shí)對(duì)照),條件編譯,包含的頭文件,以及一些特殊符號(hào)。基本上是一個(gè)replace的過(guò)程。
第二步 編譯及優(yōu)化
命令: gcc -o test.s -S test.i
或者 /路徑/cc1 -o test.s test.i
結(jié)果: 生成匯編文件test.s(可打開(kāi)后查看源文件生成的匯編碼)
注解: 此步通過(guò)詞法和語(yǔ)法分析,確認(rèn)所有指令符合語(yǔ)法規(guī)則(否則報(bào)編譯錯(cuò)),之后翻譯成對(duì)應(yīng)的中間碼,在linux中被稱(chēng)為RTL(Register Transfer Language),通常是平臺(tái)無(wú)關(guān)的,這個(gè)過(guò)程也被稱(chēng)為編譯前端。編譯后端對(duì)RTL樹(shù)進(jìn)行裁減,優(yōu)化,得到在目標(biāo)機(jī)上可執(zhí)行的匯編代碼。使用不同的優(yōu)化 編譯選項(xiàng),可以看到在不同優(yōu)化級(jí)別下的代碼。了解編譯器對(duì)你寫(xiě)的代碼到底做了什么。
第三步 匯編
命令: gcc -o test.o -c test.s
或者 as -o test.o test.s
結(jié)果: 生成目標(biāo)機(jī)器指令文件test.o(可用objdump查看)
注解: 此步把匯編語(yǔ)言代碼翻譯成目標(biāo)機(jī)器指令, 用file test.o 可以看到test.o是一個(gè)relocatable的ELF文件,通常包含.text .rodata代碼段和數(shù)據(jù)段。可用readelf -r test.o查看需要relocation的部分。gcc采用as作為其匯編器,所以匯編碼是AT&T格式的,而不是Intel格式,所以在用 gcc編譯嵌入式匯編時(shí),也要采用AT&T格式。
第四步 鏈接
命令: gcc -o test test.o
或者 ld -o test test.o
結(jié)果: 生成可執(zhí)行文件test (可用objdump查看)
注解: 此步將在一個(gè)文件中引用的符號(hào)同在另外一個(gè)文件中該符號(hào)的定義鏈接起來(lái),使得所有的這些目標(biāo)文件鏈接成為一個(gè)能被操作系統(tǒng)加載到內(nèi)存的執(zhí)行體。(如果有不 到的符號(hào)定義,或者重復(fù)定義等,會(huì)報(bào)鏈接錯(cuò))。用file test 可以看到test是一個(gè)executable的ELF文件。
當(dāng)然鏈接的時(shí)候還會(huì)用到靜態(tài)鏈接庫(kù),和動(dòng)態(tài)連接庫(kù)。靜態(tài)庫(kù)和動(dòng)態(tài)庫(kù)都是.o目標(biāo)文件的集合,但是使用相差很遠(yuǎn)。
靜態(tài)庫(kù):
命令: ar -v -q test.a test.o
結(jié)果: 生成靜態(tài)鏈接庫(kù)test.a
注解: 靜態(tài)庫(kù)是在鏈接過(guò)程中將相關(guān)代碼提取出來(lái)加入可執(zhí)行文件的庫(kù)(即在鏈接的時(shí)候?qū)⒑瘮?shù)的代碼將從其所在地靜態(tài)鏈接庫(kù)中被拷貝到最終的可執(zhí)行程序中),ar只是將一些別的文件集合到一個(gè)文件中。可以打包,當(dāng)然也可以解包。(peakflys注:通常自己編寫(xiě)的常用底層都以靜態(tài)庫(kù)的形式提供,這樣一則減少上層邏輯的編譯時(shí)間,二則只需要在每個(gè)使用處包含文件名即可,不用關(guān)注庫(kù)文件的具體路徑)
動(dòng)態(tài)庫(kù):
命令: gcc -shared test.so test.o
或者/PATH/collect2 -shared test.so test.o (省略若干參數(shù))
結(jié)果: 生成動(dòng)態(tài)連接庫(kù)test.so
注解: 動(dòng)態(tài)庫(kù)在鏈接時(shí)只創(chuàng)建一些符號(hào)表,而在運(yùn)行的時(shí)候才將有關(guān)庫(kù)的代碼裝入內(nèi)存,映射到運(yùn)行時(shí)相應(yīng)進(jìn)程的虛地址空間(peakflys注:通過(guò)這種特點(diǎn),我們可以設(shè)想,如果以后服務(wù)器的功能邏輯都以這種方式提供,那么對(duì)于C++這種編譯型語(yǔ)言也可以像解釋型的腳本語(yǔ)言一樣達(dá)到不停服的功能更新)。如果出錯(cuò),如找不到對(duì)應(yīng)的.so文件,會(huì) 在執(zhí)行的時(shí)候報(bào)動(dòng)態(tài)連接錯(cuò)(可用LD_LIBRARY_PATH指定路徑)。用file test.so可以看到test.so是shared object的ELF文件。而靜態(tài)庫(kù)test.a只是一個(gè)集合包。
peakflys注:linux下,通常靜態(tài)庫(kù)以.a方式存在,動(dòng)態(tài)庫(kù)以.so方式存在;windows下靜態(tài)庫(kù)以.lib存在,動(dòng)態(tài)庫(kù)以.dll方式存在。
所以當(dāng)gcc編譯源文件時(shí)經(jīng)歷了test.c -> test.i -> RTL -> test.s -> test.o -> test的過(guò)程。當(dāng)然以上各步可以一步或若干步一起完成,如gcc -o test test.c直接得到可執(zhí)行文件。當(dāng)然也可以加上-v來(lái)查看在這個(gè)過(guò)程中,gcc總共做了多少事。
posted on 2013-04-10 09:57 peakflys 閱讀(265) 評(píng)論(0) 編輯 收藏 引用