国产精品亚洲一区二区三区在线,久久九九免费,亚洲精品一区二区三区99

（轉）Win32應用程序的加載與啟動分析

轉自 chenxixia 的 Blog

Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=455591

設有一個Win32下的可執行文件MyApp.exe，這是一個Win32應用程序，符合標準的PE格式。MyApp.exe的主要執行代碼都集中在其源文件MyApp.cpp中，該文件第一個被執行的函數是WinMain。初學者會認為程序就是首先從這個WinMain函數開始執行，其實不然。

在WinMain函數被執行之前，有一系列復雜的加載動作，還要執行一大段啟動代碼。運行程序MyApp.exe時，操作系統的加載程序首先為進程分配一個4GB的虛擬地址空間，然后把程序MyApp.exe所占用的磁盤空間作為虛擬內存映射到這個4GB的虛擬地址空間中。一般情況下，會映射到虛擬地址空間中0X00400000的位置。加載一個應用程序的時間比一般人所設想的要少，因為加載一個PE文件并不是把這個文件整個一次性的從磁盤讀到內存中，而是簡單的做一個內存映射，映射一個大文件和映射一個小文件所花費的時間相差無幾。當然，真正執行文件中的代碼時，操作系統還是要把存在于磁盤上的虛擬內存中的代碼交換到物理內存(RAM)中。但是，這種交換也不是把整個文件所占用的虛擬地址空間一次性的全部從磁盤交換到物理內存中，操作系統會根據需要和內存占用情況交換一頁或多頁。當然，這種交換是雙向的，即存在于物理內存中的一部分當前沒有被使用的頁也可能被交換到磁盤中。

接著，系統在內核中創建進程對象和主線程對象以及其它內容。

然后操作系統的加載程序搜索PE文件中的引入表，加載所有應用程序所使用的動態鏈接庫。對動態鏈接庫的加載與對應用程序的加載完全類似。

再接著，操作系統執行PE文件首部所指定地址處的代碼，開始應用程序主線程的執行。首先被執行的代碼并不是MyApp中的WinMain函數，而是被稱為C Runtime startup code的WinMainCRTStartup函數，該函數是連接時由連接程序附加到文件MyApp.exe中的。該函數得到新進程的全部命令行指針和環境變量的指針，完成一些C運行時全局變量以及C運行時內存分配函數的初始化工作。如果使用C++編程，還要執行全局類對象的構造函數。最后，WinMainCRTStartup函數調用WinMain函數。

WinMainCRTStartup函數傳給WinMain函數的4個參數分別為：hInstance、hPrevInstance、lpCmdline、nCmdShow。

hInstance：該進程所對應的應用程序當前實例的句柄。WinMainCRTStartup函數通過調用GetStartupInfo函數獲得該參數的值。該參數實際上是應用程序被加載到進程虛擬地址空間的地址，通常情況下，對于大多數進程，該參數總是0X00400000。

hPrevInstance：應用程序前一實例的句柄。由于Win32應用程序的每一個實例總是運行在自己的獨立的進程地址空間中，因此，對于Win32應用程序，WinMainCRTStartup函數傳給該參數的值總是NULL。如果應用程序希望知道是否有另一個實例在運行，可以通過線程同步技術，創建一個具有唯一名稱的互斥量，通過檢測這個互斥量是否存在可以知道是否有另一個實例在運行。

lpCmdline：命令行參數的指針。該指針指向一個以0結尾的字符串，該字符串不包括應用程序名。

nCmdShow：指定如何顯示應用程序窗口。如果該程序通過在資源管理器中雙擊圖標運行，WinMainCRTStartup函數傳給該參數的值為SW_SHOWNORMAL。如果通過在另一個應用程序中調用CreatProcess函數運行，該參數由CreatProcess函數的參數lpStartupInfo(STARTUPINFO.wShowWindow)指定。

posted @ 2008-03-07 16:38 微塵閱讀(674) | 評論 (0) | 編輯收藏

（轉）深入研究 C++中的 STL Deque 容器

本文檔深入分析了std::deque，并提供了一個指導思想：當考慮到內存分配和執行性能的時候，使用std::deque要比std::vector好。

　　介紹

　　本文深入地研究了std::deque 容器。本文將討論在一些情況下使用deque> 比vector更好。讀完這篇文章后讀者應該能夠理解在容量增長的過程中deque 與vector在內存分配和性能的不同表現。由于deque> 和vector的用法很相似，讀者可以參考vector 文檔中介紹如何使用STL容器。

　　Deque總覽

　　deque和vector一樣都是標準模板庫中的內容，deque是雙端隊列，在接口上和vector非常相似，在許多操作的地方可以直接替換。假如讀者已經能夠有效地使用vector容器，下面提供deque的成員函數和操作，進行對比參考。

　　Deque成員函數

函數	描述
c.assign(beg,end) c.assign(n,elem)	將[beg; end)區間中的數據賦值給c。將n個elem的拷貝賦值給c。
c.at(idx)	傳回索引idx所指的數據，如果idx越界，拋出out_of_range。
c.back()	傳回最后一個數據，不檢查這個數據是否存在。
c.begin()	傳回迭代器重的可一個數據。
c.clear()	移除容器中所有數據。
deque<Elem> c deque<Elem> c1(c2) Deque<Elem> c(n) Deque<Elem> c(n, elem) Deque<Elem> c(beg,end) c.~deque<Elem>()	創建一個空的deque。復制一個deque。創建一個deque，含有n個數據，數據均已缺省構造產生。創建一個含有n個elem拷貝的deque。創建一個以[beg;end)區間的deque。銷毀所有數據，釋放內存。
c.empty()	判斷容器是否為空。
c.end()	指向迭代器中的最后一個數據地址。
c.erase(pos) c.erase(beg,end)	刪除pos位置的數據，傳回下一個數據的位置。刪除[beg,end)區間的數據，傳回下一個數據的位置。
c.front()	傳回地一個數據。
get_allocator	使用構造函數返回一個拷貝。
c.insert(pos,elem) c.insert(pos,n,elem) c.insert(pos,beg,end)	在pos位置插入一個elem拷貝，傳回新數據位置。在pos位置插入>n個elem數據。無返回值。在pos位置插入在[beg,end)區間的數據。無返回值。
c.max_size()	返回容器中最大數據的數量。
c.pop_back()	刪除最后一個數據。
c.pop_front()	刪除頭部數據。
c.push_back(elem)	在尾部加入一個數據。
c.push_front(elem)	在頭部插入一個數據。
c.rbegin()	傳回一個逆向隊列的第一個數據。
c.rend()	傳回一個逆向隊列的最后一個數據的下一個位置。
c.resize(num)	重新指定隊列的長度。
c.size()	返回容器中實際數據的個數。
C1.swap(c2) Swap(c1,c2)	將c1和c2元素互換。同上操作。

　　Deque操作

函數	描述
operator[]	返回容器中指定位置的一個引用。

　　上面這些特征和vector明顯相似，所以我們會提出下面的疑問。

　　問題：如果deque和vector可以提供相同功能的時候，我們使用哪一個更好呢？

　　回答：如果你要問的話，就使用vector吧。

　　或者你給個解釋？

　　非常高興你這樣問，的確，這并不是無中生有的，事實上，在C++標準里解釋了這個問題，下面有一個片斷：

　　vector在默認情況下是典型的使用序列的方法，對于deque，當使用插入刪除操作的時候是一個更好的選擇。

　　有趣的是，本文就是要非常徹底地理解這句話。

　　什么是新的？

　　細讀上面兩張表格，你會發現和vector比較這里增加了兩個函數。

　　1、c.push_front(elem) —— 在頭部插入一個數據。

　　2、c.pop_front() —— 刪除頭部數據。

　　調用方法和c.push_back(elem)和c.pop_back()相同，這些將來會告訴我們對于deque> 會非常有用，deque可以在前后加入數據。>

　　缺少了什么？

　　同時你也會發現相對于vector> 缺少了兩個函數，你將了解到deque> 不需要它們。

　　1、capacity()—— 返回vector當前的容量。

　　2、reserve() —— 給指定大小的vector> 分配空間。

　　這里是我們真正研究的開始，這里說明deque> 和vector它們在管理內部存儲的時候是完全不同的。deque是大塊大塊地分配內存，每次插入固定數量的數據。vector是就近分配內存（這可能不是一個壞的事情）。但我們應該關注是，vector每次增加的內存足夠大的時候，在當前的內存不夠的情況。下面的實驗來驗證deque不需要capacity()和reserve()> 是非常有道理的。

　　實驗一 —— 增長的容器

　　目的

　　目的是通過實驗來觀察deque和vector在容量增長的時候有什么不同。用圖形來說明它們在分配內存和執行效率上的不同。

　　描述

　　這個實驗的測試程序是從一個文件中讀取文本內容，每行作為一個數據使用push_back插入到deque> 和vector中，通過多次讀取文件來實現插入大量的數據，下面這個類就是為了測試這個內容：

#include <deque>
#include <fstream>
#include <string>
#include <vector>

static enum modes
{
　FM_INVALID = 0,
　FM_VECTOR,
　FM_DEQUE
};

class CVectorDequeTest
{
　public:
　　CVectorDequeTest();
　　void ReadTestFile(const char* szFile, int iMode)
　　{
　　　char buff[0xFFFF] = {0};
　　　std::ifstream inFile;
　　　inFile.open(szFile);
　　　while(!inFile.eof())
　　　{
　　　　inFile.getline(buff, sizeof(buff));
　　　　if(iMode == FM_VECTOR)
　　　　　m_vData.push_back(buff);
　　　　else if(iMode == FM_DEQUE)
　　　　　m_dData.push_back(buff);
　　　}
　　　inFile.close();
　　}
　　virtual ~CVectorDequeTest();
　protected:
　　std::vector<std::string> m_vData;
　　std::deque<std::string> m_dData;
};

　　結果

　　測試程序運行的平臺和一些條件：

CPU	1.8 GHz Pentium 4
內存	1.50 GB
操作系統	W2K-SP4
文件中的行數	9874
平均每行字母個數	1755.85
讀文件的次數	45
總共插入的數據個數	444330

　　使用Windows任務管理器來記錄執行效率，本程序中使用了Laurent Guinnard 的CDuration類。消耗系統資源如下圖：

　　注意在vector分配內存的最高峰，vector在分配內存的時候是怎樣達到最高值，deque就是這樣的，它在插入數據的同時，內存直線增長，首先deque的這種內存分配單元進行回收的話，存在意想不到的后果，我們希望它的分配內存看上去和vector一樣，通過上面的測試我們需要進一步的測試，現提出一個假設：假設deque分配的內存不是連續的，一定需要釋放和收回內存，我們將這些假設加入后面的測試中，但是首先讓我們從執行的性能外表分析一下這個實驗。

　　究竟分配內存需要消耗多久？

　　注意看下面這張圖片，vector在不插入數據的時候在進行尋求分配更多內存。

　　同時我們也注意到使用push_back插入一組數據消耗的時間，注意，在這里每插入一組數據代表著9874個串，平均每個串的長度是1755.85。

實驗二—— vector::reserve()的資源

　　目的

　　這個實驗的目的是vector在加入大量數據之前調用reserve()，和deque進行比較，看它們的內存分配和執行效率怎么樣？

　　描述

　　本實驗中的測試基本上和實驗一相同，除了在測試類的構造函數中加入下面這行代碼:

m_vData.reserve(1000000);

　　結果

　　測試程序運行的平臺和一些條件：

CPU	1.8 GHz Pentium 4
內存	1.50 GB
操作系統	W2K-SP4
文件中的行數	9874
平均每行字母個數	1755.85
讀文件的次數	70
總共插入的數據個數	691180

　　使用Windows任務管理器來記錄執行效率，本程序中使用了>Laurent Guinnard 的CDuration類。消耗系統資源如下圖：

　　我們注意到vector不在需要分配花費多余的時間分配內存了，這是由于我們使用了reserve()對于所測試的>691180個數據為我們每一次插入大量數據的時候保留了足夠的內存空間，對于deque存儲分配的假設，觀察這個測試中的內存分配圖形和上一個圖形，我們需要進一步量化這個測試。

　　怎樣改良內存分配的性能呢？

　　下面這個圖例說明隨著數據的增加，容量在增加：

　　當增加數據的時候對容量的增加在vector和deque執行效率基本一樣，然而，vector在插入數據的時候有一些零星的時間消耗，看下面的圖例：

　　通過統計分析vector和deque在插入平均為>1755.85長度的>9874個數據所花費的時間，下面是總結的表格：

Vector

Deque

Mean	0.603724814 sec
Maximum	0.738313000 sec
Minimum	0.559959000 sec
Std. Dev	0.037795736 sec
6-Sigma	0.226774416 sec

Mean	0.588021114 sec
Maximum	0.615617000 sec
Minimum	0.567503000 sec
Std. Dev	0.009907800 sec
6-Sigma	0.059446800 sec

　　實驗三——內存回收

　　目的

　　本實驗是對假設deque分配的內存不是臨近的，而且很難回收進行量化測試分析。

　　描述

　　在本實驗中再次用到了實驗一中的代碼，在調用函數中加入記錄增加數據執行的效率具體入下面操作：

for(xRun=0; xRun<NUMBER_OF_XRUNS; xRun++)
{
　df = new CVectorDequeTest;
　elapsed_time = 0;

　for(i=0; i<NUMBER_OF_RUNS*xRun; i++)
　{
　　cout << "Deque - Run " << i << " of " <<
　　NUMBER_OF_RUNS*xRun << "... ";
　　df->ReadTestFile("F:\\huge.csv",DF_DEQUE);
　　deque_data.push_back(datapoint());
　　deque_data.back().time_to_read = df->GetProcessTime();
　　elapsed_time += deque_data.back().time_to_read;
　　deque_data.back().elapsed_time = elapsed_time;
　　cout << deque_data.back().time_to_read << " seconds\n";
　}
　vnElements.push_back(df->GetDequeSize());
　cout << "\n\nDeleting... ";
　del_deque.Start();
　delete df;
　del_deque.Stop();
　cout << del_deque.GetDuration()/1000000.0 << " seconds.\n\n";
　vTimeToDelete.push_back(del_deque.GetDuration()/1000000.0);
}

　　結果

　　本測試和上面兩個實驗在相同的平臺上運行，除了插入的數據由>9874到>691180，需要插入>70次，下面圖例顯示了>deque在插入數據的時候分配內存的情況，在deque里插入了平均每個長度為>1755.85的字符串。>

　　盡管從幾個曲線圖中看到的實際消耗時間不同，但些曲線圖都精確到了>R2=95.15%。所給的數據點都實際背離了下表中統計的曲線圖數據:

deque Results
Mean	0.007089269 sec
Maximum	11.02838496 sec
Minimum	-15.25901667 sec
Std. Dev	3.3803636 sec
6-Sigma	20.2821816 sec

　　在相同的情況下比較vector的結果是非常有意義的。下面圖就是將vector和deque在相同的情況下分配內存消耗的時間比較圖：

　　這些數據在這個測試中是>R2=82.12%。這或許可以經過每個點反復運行得到更加優化，在這個問題中這些數據適當地標注了這些點，所給的數據點都實際背離了下表中統計的曲線圖數據:

vector Results
Mean	-0.007122715sec
Maximum	0.283452127 sec
Minimum	-0.26724459sec
Std. Dev	0.144572356sec
6-Sigma	0.867434136sec

實驗四—— vector::insert() 和 deque::insert() 執行特點比較

　　目的

　　deque主張使用參數為常量的insert()。但怎么樣能和vector::insert()比較一下呢？本實驗的目的就是比較一下vector::insert()> 和 deque::insert()的工作特點。

　　描述

　　在容器的容器多次插入數據，在這里可能不符合你的需求，既然這樣你可以使用insert()，試驗代碼也和實驗一基本一樣，使用insert()代替push_back()，使用insert(>)來測試。

　　結果

　　當插入常量給deque的時候，從下圖可以看出和vector的對比來。

　　注意兩張圖片中時間軸的不同，這是將>61810個數據插入到容器中。

　　實驗五——讀取容器的性能

　　目的

　　這個實驗將測試vector::at(),vector::operator[],deque::at()和deque::operator[]的性能。首先應該是operator[]比at（）效率要高，因為它不進行邊界檢查，同時也比較vector和deque。

　　描述

　　這個實驗將測試中的容器有1000000個類型為std::string，每個字符串長度為1024的數據，分別使用at()和operator[]這兩個操作來訪問容器容器的數據，測試它們運行的時間，這個測試執行50次，統計每次執行的結果。

　　結果

　　我們看到使用vector和deque訪問容器中的數據，他們執行的性能差別很小，使用operator[]和at()訪問數據的性能差別幾乎可以忽略不計，下面是統計的結果：

vector::at()
Mean	1.177088125sec
Maximum	1.189580000sec
Minimum	1.168340000sec
Std. Dev	0.006495193sec
6-Sigma	0.038971158sec

deque::at()
Mean	1.182364375sec
Maximum	1.226860000sec
Minimum	1.161270000sec
Std. Dev	0.016362148sec
6-Sigma	0.098172888sec

vector::operator[]
Mean	1.164221042sec
Maximum	1.192550000sec
Minimum	1.155690000sec
Std. Dev	0.007698520sec
6-Sigma	0.046191120sec

deque::operator[]
Mean	1.181507292sec
Maximum	1.218540000 sec
Minimum	1.162710000sec
Std. Dev	0.010275712sec
6-Sigma	0.061654272sec

　　結論

　　在這篇文章中我們覆蓋了多種不同的情況來選擇我們到底是該使用vector還是deque。讓我們總結一下測試的結果看下面幾個結論。

　　當執行大數據量的調用push_back()的時候，記住要調用vector::reserve()。

　　在實驗一中我們研究了vector和deque在插入數據的情況。通過這些假設，我們可以看出deque分配的空間是預先分配好的，deque維持一個固定增長率，在vector實驗中我們考慮到應該調用vecor::reserve()>.然后在下面這個例子驗證了我們的假設，在使用vector的時候調用reserve()能夠膀子我們預先分配空間，這將是vector一個默認選擇的操作。

　　當你分配很多內存單元的時候，記住使用deque回收內存要比vector消耗時間多。

　　在實驗三中我們探討了vector和deque在回收非鄰接內存塊上的不同，分別證明了vector在分配內存的時候是線性增長，而deque是指數增長，同樣，vector要回收的內存比deque多的多，如果你循環調用了push_back()，那么deque將獲取大量的內存，而且是臨近的。我們通過測試發現在分配內存單元消耗的時間和vector的時間接近。

　　如果你計劃使用insert()，或者需要pop_front()，那就使用deque。

　　由于vector沒有提供pop_front()函數，但在實驗四的結果中可以看出沒有insert()是非常好的，同時也告訴我們為什么deque在STL類中要作為單獨的一個類劃分出來。

　　對于訪問數據，vector::at()效率最高。

　　在實驗五中統計的數據表示，所有訪問數據方法的效率是非常接近的，但是vector::at()效率最高。這是因為最優的平衡圖訪問時間為最低的六個西格瑪值。

　　最后

　　我希望本文能夠帶你認識deque，而且對它感興趣或者一個啟發，歡迎繼續討論關于vector和deque任何問題和內容。

posted @ 2008-02-29 22:04 微塵閱讀(686) | 評論 (0) | 編輯收藏

也談 extern "C" 的用法

       相信大家在編碼中，有時會見到某某函數前面加了 extern "C" 的關鍵字修飾，尤其在模塊(Dll)提供的頭文件中。但是否很清楚的了解它的作用，我當時第一次碰到時，其實是懂非懂的^_^。查了些資料，才明白其用法，詳細如下。

      1. 首先說下編譯器編譯函數時，對函數名的處理。
         在C語言中，對函數如: IRoleView* RoleViewCreate(int nType); 編譯后生成的函數名是RoleViewCreate
         但是在C++中，由于存在函數重載的特性，所以編譯時C++編譯器會根據參數、返回值等信息對函數名改編，如上面函數在C++編譯器中生成的函數名是 ?RoleViewCreate@@YAPAVIRoleView@@H@z

     2. extern "C"的含義。
         extern "C" 有兩重含義：
        其一，被修飾的變量或函數是extern的存儲類型，它告訴編譯器，其聲明的變量或函數可以被本模塊和外部某塊使用。
        其二，被其修飾的函數或變量是按照C語言的方式來編譯和鏈接的。
        注意，extern "C"寫法只在C++中被支持，C語言不支持該寫法。

    3. extern "C"的兩種慣用用法：
        a) 在C++中使用C語言的函數或變量，在包含C語言提供的頭文件是，需要用 extern "C" { } 來包含頭文件。如下：
           extern "C"
          {
               #include "lua.h"    //lua.h是C編寫，并提供的頭文件
          }
        這里引用下第1點的函數來說明上述寫法的用途：假設lua.h中包含函數 IRoleView* RoleViewCreate(int nType), 那么C語言的編譯時生成的函數名是RoleViewCreate，而當C++客戶程序去使用它時，默認是按C++的鏈接方式（即不加以上的 extern "C"時），所以C++客戶程序會去外部模塊中查找函數名為
?RoleViewCreate@@YAPAVIRoleView@@H@z的函數，這樣C++編譯器會找不到該函數，報出"無法解析的外部標識符"的錯誤；而當加上
extern "C" { } 時，它就告訴編譯器頭文件中包含的函數或變量要按照C語言的編譯鏈接方式進行，所以C++編譯器會去外部模塊查找函數名為
RoleViewCreate的函數，從而得到正確結果。

      b) 在C中調用一個C++語言中的函數或變量時，C++的頭文件需要添加 extern "C"，這是為了讓編譯器對函數或變量按C語言的方式進行編譯，已供C語言調用；但在C語言中，不能直接包含聲明了extern "C"的頭文件，而應該在C文件中把在C++頭文件中定義的函數，聲明為 extern類型，因為在C語言中，并不支持extern "C"的寫法；

參考資料：《C++中extern "C" 含義深層探索》作者：宋寶華
                    《C++ Primer》

posted @ 2008-02-25 20:46 微塵閱讀(563) | 評論 (0) | 編輯收藏

微塵--KeepMoving

（轉）Win32應用程序的加載與啟動分析

（轉）深入研究 C++中的 STL Deque 容器

也談 extern "C" 的用法

日歷

常用鏈接

留言簿(1)

隨筆分類

隨筆檔案

文章檔案

收藏夾

友情Blog

搜索

最新評論

閱讀排行榜

評論排行榜