欧美11—12娇小xxxx,欧美日韩不卡视频,欧美在线视屏

淺談體系結構與內聯優化

周知內聯是為了消除函數調用的代價，即四大指令序列：調用前序列、被調者起始序列、被調者收尾序列、返回后序列。它們通常對應到體系結構調用者保存/恢復寄存器集合與被調者保存/恢復寄存器集合之約束。這個本質也是內聯的前提。試問如果有某體系結構比如S，它任意深度的函數調用代價幾乎為零，那么顯然內聯是沒意義沒必要的。但是S可能存在嗎？我認為不太可能。因為機器的資源比如寄存器集數量與堆?？臻g是有限的，且調用需要知曉上下文，所以不能夠支持任意深度的調用，但是可以支持有限深度比如4層調用，這4層調用代價幾乎為零，假設再來一層，那么第5層調用代價就不為零了，這時如果內聯第5層就變成4層調用，代價又幾乎為零。綜上所述，內聯無論在何種體系結構，即使在一定深度內沒意義也不會破壞性能。

體系結構直接影響程序性能。主要體現在指令集、寄存器、cache三塊。它們對于編譯器實現代碼優化必須都考慮，尤其cache比如內聯優化、循環展開、基本塊布局、函數重排，如果不是因為有cache這玩意，內聯優化的復雜性會大為降低，因為不用考慮代碼膨脹引起的副作用即cache缺失，只要評估函數的指令數與動態執行消耗的關系，指令數很少但執行耗費很多時鐘周期的，則不宜內聯，尤其函數為非葉子結點；指令數很多但執行耗費較少的，則可僅內聯其中的快速路徑代碼。因現實存在cache這玩意，就必須權衡代碼膨脹帶來的副作用，是否能接受一定的膨脹，需要精確評估，構建函數調用頻率與其靜態調用位置的矩陣，計算收益比如平均執行一次的耗時是否減少，若收益為正且明顯則可內聯，否則不宜內聯。

有些編譯器為了簡單處理，不會內聯帶靜態變量的函數哪怕指令數很少，或者內聯不太正確比如LLVM（詳見下文）。其實單從技術上可以做到，不過要復雜些，復雜在于鏈接器的協作。為了保證函數級靜態變量的語義，編譯時要預留全局唯一標志與構造函數的占位符，在調用者體內插入對全局唯一標志的（位）判斷（標志字的一位對應一個靜態變量，表明是否已構造或初始化賦值）、構造函數調用/初始化賦值、置位標志，而鏈接時要確定全局唯一標志及構造函數的地址。靜態變量、全局唯一標志放于可執行文件的數據區，全局唯一構造/初始化及析構函數放于代碼區，具體布局位置可以靈活，比如. data. static_obj，. text. obj. ctor/dtor。如果這種函數性能影響較大需要內聯優化，而編譯器不支持，有個替代的辦法是用全局變量或文件/類級別的靜態變量，輔以對應標志處理一次性構造或初始化賦值（必要時將這處理封裝為一個函數以確保目標函數被內聯），可達到同樣效果不足之處是作用域擴大了。

關于LLVM對于帶靜態變量的函數之內聯的測驗結果

posted on 2023-11-16 23:32 春秋十二月閱讀(274) 評論(0) 編輯收藏引用所屬分類: Compiler

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！

相關文章: 淺談體系結構與內聯優化淺談圖論在寄存器分配中的應用忙表達式數據流分析示例基于矩陣法分析改進指令調度關于程序編譯中的圖論問題思考函數式語言編譯優化動態二進制優化與靜態編譯優化的區別 NFA、DFA、正則表達式的互轉復雜度總結關于格的基本定理簡要總結淺談重命名

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

常用鏈接

留言簿(78)

隨筆分類(161)

隨筆檔案(162)

文章分類(30)

關注的開源項目

最新隨筆

積分與排名

最新評論

閱讀排行榜

評論排行榜