国产精品第13页,欧美一激情一区二区三区,在线欧美日韩国产

為了加快尋址操作的地址對齊法

有時候為了加快大量數據的存取操作，我優化了重要路徑上的算法，用盡了精簡代碼的技巧，還采用處理指令矢量化的技能，為程序定制了一個內存管理器以增加程序的緩沖友好性（cache friendly），一般情況下是可以達到最終目的了，可在圖像處理相關的代碼中，竟然發現最大優化機會在地址訪問上，比如本人曾經見過這樣的source code：
? typedef unsigned Pixel32;
? struct Pixel24 { u8 r, g, b; };

? Pixel24* pRaw = new Pixel24[width*height];
??Pixel32* pSrcImg = loadFromFile("tangent.bmp");
? fillPort(pRaw, dstRt, pSrcImg, srcRt);???// 這個函數的內部實現對于32bit pixel -> 24bit pixel比較麻煩哦

我知道，典型的IA32系的處理器的尋址操作在機器字的n倍處最快的。
C++中:
? int a;
??Obj x;
的代碼產生的訪問對象的地址由編譯器完成了！而且絕對保證以最快地方式訪問；
?而 Obj* x;
??????Pixel24* pRaw = new Pixel24[sizeof(Pixel24)*width*height];
????? Pixel32* pSrcImg = ....
的pRaw, pSrcImg就隨運行時而定，不一定在“機器字的n倍處”,而且其一部分數據在“機器字的n倍處”。

可想而知，32bit的像素在memory上很容得以地址對齊，但是也可能其首地址沒有在機器字的n倍處，可24bit就更麻煩了。

所以我的策略是：動態分配時，多分配一個機器字的空間，然后想個辦法讓Pointer定在這個分配的線性空間內的首個“機器字的n倍處”,之后的對象訪問對齊問題靠padding完成（不過，這一步只有在真的需要時才作，因為會有大量空間浪費!）。

這里給出了me的對齊code:

? template <typename Pointer, int Align =4>
? Pointer alignAddress(void* raw)
? { // 把raw對齊為機器字的整數倍，Align為機器字的字節數.(需要在raw處多分配align個字節)
??? // Align默認為4，即32bit機的地址對齊
??? Pointer p = reinterpret_cast<Pointer>(
????? (reinterpret_cast<uintptr_t>(raw) + Align-1) & ~(Align-1) );???// 這里有點技巧
??? return p;
? }

就這么點。

可以這樣使用:
??????#define ALIGN_SET 4
??????Pixel24* pT = new unsigned char[sizeof(Pixel24)*width*height + ALIGN_SET];
????? Pixel24* pRaw = alignAddress<Pixel24*, ALIGN_SET>(pT);
????? // pRaw就是所要的地址，需要時對Pixel24開啟編譯器padding選項

????? 有了這樣的保證，前面的fillPort的優化工作就更容易了!

發表于 2007-03-01 23:17 Corner Zhang 閱讀(1458) 評論(2) 編輯收藏引用

評論

# re: 為了加快尋址操作的地址對齊法

曾經在CSDN上看過一個人問一個挺長的MACRO是什么意思，后來一個弄嵌入式的說是為了內存對齊而寫的代碼。思路就是，根據使用CPU的位數，把分配的內存地址的低位給去了。LZ的文章是另外一個思路呵呵。

Jedimaster 評論于 2007-03-01 23:28 回復更多評論

# re: 為了加快尋址操作的地址對齊法

謝謝！reinterpret_cast處的技巧從一本<<hacker delight>>里學來的

Corner Zhang 評論于 2007-03-01 23:59 回復更多評論

刷新評論列表

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！



網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

為了加快尋址操作的地址對齊法

常用鏈接

留言簿(8)

隨筆分類(80)

隨筆檔案(105)

文章分類(11)

文章檔案(16)

相冊

關聯

最新隨筆

搜索

積分與排名

最新評論

閱讀排行榜

評論排行榜