• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            任我行

            一天一個腳印......
            每日一句:
            posts - 54, comments - 218, trackbacks - 1, articles - 0
              C++博客 :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

            堆棧,堆棧,堆和棧的區(qū)別

            Posted on 2006-01-21 16:23 任我行 閱讀(156649) 評論(32)  編輯 收藏 引用 所屬分類: C++

            堆和棧的區(qū)別?(轉(zhuǎn)貼)

            非本人作也!因非常經(jīng)典,所以收歸旗下,與眾人閱之!原作者不祥!

            堆和棧的區(qū)別
            一、預(yù)備知識—程序的內(nèi)存分配
            一個由c/C++編譯的程序占用的內(nèi)存分為以下幾個部分
            1、棧區(qū)(stack)—?由編譯器自動分配釋放?,存放函數(shù)的參數(shù)值,局部變量的值等。其操作方式類似于數(shù)據(jù)結(jié)構(gòu)中的棧。
            2、堆區(qū)(heap)?—?一般由程序員分配釋放,?若程序員不釋放,程序結(jié)束時可能由OS回收?。注意它與數(shù)據(jù)結(jié)構(gòu)中的堆是兩回事,分配方式倒是類似于鏈表,呵呵。
            3、全局區(qū)(靜態(tài)區(qū))(static)—,全局變量和靜態(tài)變量的存儲是放在一塊的,初始化的全局變量和靜態(tài)變量在一塊區(qū)域,?未初始化的全局變量和未初始化的靜態(tài)變量在相鄰的另一塊區(qū)域。?-?程序結(jié)束后有系統(tǒng)釋放?
            4、文字常量區(qū)—常量字符串就是放在這里的。?程序結(jié)束后由系統(tǒng)釋放
            5、程序代碼區(qū)—存放函數(shù)體的二進制代碼。
            二、例子程序?
            這是一個前輩寫的,非常詳細(xì)?
            //main.cpp?
            int?a?=?0;?全局初始化區(qū)?
            char?*p1;?全局未初始化區(qū)?
            main()?
            {?
            int?b;?棧?
            char?s[]?=?"abc";?棧?
            char?*p2;?棧?
            char?*p3?=?"123456";?123456\0在常量區(qū),p3在棧上。?
            static?int?c?=0;?全局(靜態(tài))初始化區(qū)?
            p1?=?(char?*)malloc(10);?
            p2?=?(char?*)malloc(20);?
            分配得來得10和20字節(jié)的區(qū)域就在堆區(qū)。?
            strcpy(p1,?"123456");?123456\0放在常量區(qū),編譯器可能會將它與p3所指向的"123456"優(yōu)化成一個地方。?
            }?


            二、堆和棧的理論知識?
            2.1申請方式?
            stack:?
            由系統(tǒng)自動分配。?例如,聲明在函數(shù)中一個局部變量?int?b;?系統(tǒng)自動在棧中為b開辟空間?
            heap:?
            需要程序員自己申請,并指明大小,在c中malloc函數(shù)?
            如p1?=?(char?*)malloc(10);?
            在C++中用new運算符?
            如p2?=?(char?*)malloc(10);?
            但是注意p1、p2本身是在棧中的。?


            2.2?
            申請后系統(tǒng)的響應(yīng)?
            棧:只要棧的剩余空間大于所申請空間,系統(tǒng)將為程序提供內(nèi)存,否則將報異常提示棧溢出。?
            堆:首先應(yīng)該知道操作系統(tǒng)有一個記錄空閑內(nèi)存地址的鏈表,當(dāng)系統(tǒng)收到程序的申請時,?
            會遍歷該鏈表,尋找第一個空間大于所申請空間的堆結(jié)點,然后將該結(jié)點從空閑結(jié)點鏈表中刪除,并將該結(jié)點的空間分配給程序,另外,對于大多數(shù)系統(tǒng),會在這塊內(nèi)存空間中的首地址處記錄本次分配的大小,這樣,代碼中的delete語句才能正確的釋放本內(nèi)存空間。另外,由于找到的堆結(jié)點的大小不一定正好等于申請的大小,系統(tǒng)會自動的將多余的那部分重新放入空閑鏈表中。?

            2.3申請大小的限制?
            棧:在Windows下,棧是向低地址擴展的數(shù)據(jù)結(jié)構(gòu),是一塊連續(xù)的內(nèi)存的區(qū)域。這句話的意思是棧頂?shù)牡刂泛蜅5淖畲笕萘渴窍到y(tǒng)預(yù)先規(guī)定好的,在WINDOWS下,棧的大小是2M(也有的說是1M,總之是一個編譯時就確定的常數(shù)),如果申請的空間超過棧的剩余空間時,將提示overflow。因此,能從棧獲得的空間較小。?
            堆:堆是向高地址擴展的數(shù)據(jù)結(jié)構(gòu),是不連續(xù)的內(nèi)存區(qū)域。這是由于系統(tǒng)是用鏈表來存儲的空閑內(nèi)存地址的,自然是不連續(xù)的,而鏈表的遍歷方向是由低地址向高地址。堆的大小受限于計算機系統(tǒng)中有效的虛擬內(nèi)存。由此可見,堆獲得的空間比較靈活,也比較大。?


            2.4申請效率的比較:?
            棧由系統(tǒng)自動分配,速度較快。但程序員是無法控制的。?
            堆是由new分配的內(nèi)存,一般速度比較慢,而且容易產(chǎn)生內(nèi)存碎片,不過用起來最方便.?
            另外,在WINDOWS下,最好的方式是用VirtualAlloc分配內(nèi)存,他不是在堆,也不是在棧是直接在進程的地址空間中保留一快內(nèi)存,雖然用起來最不方便。但是速度快,也最靈活。?

            2.5堆和棧中的存儲內(nèi)容?
            棧:?在函數(shù)調(diào)用時,第一個進棧的是主函數(shù)中后的下一條指令(函數(shù)調(diào)用語句的下一條可執(zhí)行語句)的地址,然后是函數(shù)的各個參數(shù),在大多數(shù)的C編譯器中,參數(shù)是由右往左入棧的,然后是函數(shù)中的局部變量。注意靜態(tài)變量是不入棧的。?
            當(dāng)本次函數(shù)調(diào)用結(jié)束后,局部變量先出棧,然后是參數(shù),最后棧頂指針指向最開始存的地址,也就是主函數(shù)中的下一條指令,程序由該點繼續(xù)運行。?
            堆:一般是在堆的頭部用一個字節(jié)存放堆的大小。堆中的具體內(nèi)容有程序員安排。?

            2.6存取效率的比較?

            char?s1[]?=?"aaaaaaaaaaaaaaa";?
            char?*s2?=?"bbbbbbbbbbbbbbbbb";?
            aaaaaaaaaaa是在運行時刻賦值的;?
            而bbbbbbbbbbb是在編譯時就確定的;?
            但是,在以后的存取中,在棧上的數(shù)組比指針?biāo)赶虻淖址?例如堆)快。?
            比如:?
            #include?
            void?main()?
            {?
            char?a?=?1;?
            char?c[]?=?"1234567890";?
            char?*p?="1234567890";?
            a?=?c[1];?
            a?=?p[1];?
            return;?
            }?
            對應(yīng)的匯編代碼?
            10:?a?=?c[1];?
            00401067?8A?4D?F1?mov?cl,byte?ptr?[ebp-0Fh]?
            0040106A?88?4D?FC?mov?byte?ptr?[ebp-4],cl?
            11:?a?=?p[1];?
            0040106D?8B?55?EC?mov?edx,dword?ptr?[ebp-14h]?
            00401070?8A?42?01?mov?al,byte?ptr?[edx+1]?
            00401073?88?45?FC?mov?byte?ptr?[ebp-4],al?
            第一種在讀取時直接就把字符串中的元素讀到寄存器cl中,而第二種則要先把指針值讀到edx中,在根據(jù)edx讀取字符,顯然慢了。?


            2.7小結(jié):?
            堆和棧的區(qū)別可以用如下的比喻來看出:?
            使用棧就象我們?nèi)ワ堭^里吃飯,只管點菜(發(fā)出申請)、付錢、和吃(使用),吃飽了就走,不必理會切菜、洗菜等準(zhǔn)備工作和洗碗、刷鍋等掃尾工作,他的好處是快捷,但是自由度小。?
            使用堆就象是自己動手做喜歡吃的菜肴,比較麻煩,但是比較符合自己的口味,而且自由度大。?



            windows進程中的內(nèi)存結(jié)構(gòu)


            在閱讀本文之前,如果你連堆棧是什么多不知道的話,請先閱讀文章后面的基礎(chǔ)知識。?

            接觸過編程的人都知道,高級語言都能通過變量名來訪問內(nèi)存中的數(shù)據(jù)。那么這些變量在內(nèi)存中是如何存放的呢?程序又是如何使用這些變量的呢?下面就會對此進行深入的討論。下文中的C語言代碼如沒有特別聲明,默認(rèn)都使用VC編譯的release版。?

            首先,來了解一下?C?語言的變量是如何在內(nèi)存分部的。C?語言有全局變量(Global)、本地變量(Local),靜態(tài)變量(Static)、寄存器變量(Regeister)。每種變量都有不同的分配方式。先來看下面這段代碼:?

            #include?<stdio.h>?

            int?g1=0,?g2=0,?g3=0;?

            int?main()?
            {?
            static?int?s1=0,?s2=0,?s3=0;?
            int?v1=0,?v2=0,?v3=0;?

            //打印出各個變量的內(nèi)存地址?

            printf("0x%08x\n",&v1);?//打印各本地變量的內(nèi)存地址?
            printf("0x%08x\n",&v2);?
            printf("0x%08x\n\n",&v3);?
            printf("0x%08x\n",&g1);?//打印各全局變量的內(nèi)存地址?
            printf("0x%08x\n",&g2);?
            printf("0x%08x\n\n",&g3);?
            printf("0x%08x\n",&s1);?//打印各靜態(tài)變量的內(nèi)存地址?
            printf("0x%08x\n",&s2);?
            printf("0x%08x\n\n",&s3);?
            return?0;?
            }?

            編譯后的執(zhí)行結(jié)果是:?

            0x0012ff78?
            0x0012ff7c?
            0x0012ff80?

            0x004068d0?
            0x004068d4?
            0x004068d8?

            0x004068dc?
            0x004068e0?
            0x004068e4?

            輸出的結(jié)果就是變量的內(nèi)存地址。其中v1,v2,v3是本地變量,g1,g2,g3是全局變量,s1,s2,s3是靜態(tài)變量。你可以看到這些變量在內(nèi)存是連續(xù)分布的,但是本地變量和全局變量分配的內(nèi)存地址差了十萬八千里,而全局變量和靜態(tài)變量分配的內(nèi)存是連續(xù)的。這是因為本地變量和全局/靜態(tài)變量是分配在不同類型的內(nèi)存區(qū)域中的結(jié)果。對于一個進程的內(nèi)存空間而言,可以在邏輯上分成3個部份:代碼區(qū),靜態(tài)數(shù)據(jù)區(qū)和動態(tài)數(shù)據(jù)區(qū)。動態(tài)數(shù)據(jù)區(qū)一般就是“堆棧”。“棧(stack)”和“堆(heap)”是兩種不同的動態(tài)數(shù)據(jù)區(qū),棧是一種線性結(jié)構(gòu),堆是一種鏈?zhǔn)浇Y(jié)構(gòu)。進程的每個線程都有私有的“棧”,所以每個線程雖然代碼一樣,但本地變量的數(shù)據(jù)都是互不干擾。一個堆棧可以通過“基地址”和“棧頂”地址來描述。全局變量和靜態(tài)變量分配在靜態(tài)數(shù)據(jù)區(qū),本地變量分配在動態(tài)數(shù)據(jù)區(qū),即堆棧中。程序通過堆棧的基地址和偏移量來訪問本地變量。?


            ├———————┤低端內(nèi)存區(qū)域?
            │?……?│?
            ├———————┤?
            │?動態(tài)數(shù)據(jù)區(qū)?│?
            ├———————┤?
            │?……?│?
            ├———————┤?
            │?代碼區(qū)?│?
            ├———————┤?
            │?靜態(tài)數(shù)據(jù)區(qū)?│?
            ├———————┤?
            │?……?│?
            ├———————┤高端內(nèi)存區(qū)域?


            堆棧是一個先進后出的數(shù)據(jù)結(jié)構(gòu),棧頂?shù)刂房偸切∮诘扔跅5幕刂贰N覀兛梢韵攘私庖幌潞瘮?shù)調(diào)用的過程,以便對堆棧在程序中的作用有更深入的了解。不同的語言有不同的函數(shù)調(diào)用規(guī)定,這些因素有參數(shù)的壓入規(guī)則和堆棧的平衡。windows?API的調(diào)用規(guī)則和ANSI?C的函數(shù)調(diào)用規(guī)則是不一樣的,前者由被調(diào)函數(shù)調(diào)整堆棧,后者由調(diào)用者調(diào)整堆棧。兩者通過“__stdcall”和“__cdecl”前綴區(qū)分。先看下面這段代碼:?

            #include?<stdio.h>?

            void?__stdcall?func(int?param1,int?param2,int?param3)?
            {?
            int?var1=param1;?
            int?var2=param2;?
            int?var3=param3;?
            printf("0x%08x\n",?m1);?//打印出各個變量的內(nèi)存地址?
            printf("0x%08x\n",?m2);?
            printf("0x%08x\n\n",?m3);?
            printf("0x%08x\n",&var1);?
            printf("0x%08x\n",&var2);?
            printf("0x%08x\n\n",&var3);?
            return;?
            }?

            int?main()?
            {?
            func(1,2,3);?
            return?0;?
            }?

            編譯后的執(zhí)行結(jié)果是:?

            0x0012ff78?
            0x0012ff7c?
            0x0012ff80?

            0x0012ff68?
            0x0012ff6c?
            0x0012ff70?


            ├———————┤<—函數(shù)執(zhí)行時的棧頂(ESP)、低端內(nèi)存區(qū)域?
            │?……?│?
            ├———————┤?
            │?var?1?│?
            ├———————┤?
            │?var?2?│?
            ├———————┤?
            │?var?3?│?
            ├———————┤?
            │?RET?│?
            ├———————┤<—“__cdecl”函數(shù)返回后的棧頂(ESP)?
            │?parameter?1?│?
            ├———————┤?
            │?parameter?2?│?
            ├———————┤?
            │?parameter?3?│?
            ├———————┤<—“__stdcall”函數(shù)返回后的棧頂(ESP)?
            │?……?│?
            ├———————┤<—棧底(基地址?EBP)、高端內(nèi)存區(qū)域?


            上圖就是函數(shù)調(diào)用過程中堆棧的樣子了。首先,三個參數(shù)以從又到左的次序壓入堆棧,先壓“param3”,再壓“param2”,最后壓入“param1”;然后壓入函數(shù)的返回地址(RET),接著跳轉(zhuǎn)到函數(shù)地址接著執(zhí)行(這里要補充一點,介紹UNIX下的緩沖溢出原理的文章中都提到在壓入RET后,繼續(xù)壓入當(dāng)前EBP,然后用當(dāng)前ESP代替EBP。然而,有一篇介紹windows下函數(shù)調(diào)用的文章中說,在windows下的函數(shù)調(diào)用也有這一步驟,但根據(jù)我的實際調(diào)試,并未發(fā)現(xiàn)這一步,這還可以從param3和var1之間只有4字節(jié)的間隙這點看出來);第三步,將棧頂(ESP)減去一個數(shù),為本地變量分配內(nèi)存空間,上例中是減去12字節(jié)(ESP=ESP-3*4,每個int變量占用4個字節(jié));接著就初始化本地變量的內(nèi)存空間。由于“__stdcall”調(diào)用由被調(diào)函數(shù)調(diào)整堆棧,所以在函數(shù)返回前要恢復(fù)堆棧,先回收本地變量占用的內(nèi)存(ESP=ESP+3*4),然后取出返回地址,填入EIP寄存器,回收先前壓入?yún)?shù)占用的內(nèi)存(ESP=ESP+3*4),繼續(xù)執(zhí)行調(diào)用者的代碼。參見下列匯編代碼:?

            ;--------------func?函數(shù)的匯編代碼-------------------?

            :00401000?83EC0C?sub?esp,?0000000C?//創(chuàng)建本地變量的內(nèi)存空間?
            :00401003?8B442410?mov?eax,?dword?ptr?[esp+10]?
            :00401007?8B4C2414?mov?ecx,?dword?ptr?[esp+14]?
            :0040100B?8B542418?mov?edx,?dword?ptr?[esp+18]?
            :0040100F?89442400?mov?dword?ptr?[esp],?eax?
            :00401013?8D442410?lea?eax,?dword?ptr?[esp+10]?
            :00401017?894C2404?mov?dword?ptr?[esp+04],?ecx?

            ……………………(省略若干代碼)?

            :00401075?83C43C?add?esp,?0000003C?;恢復(fù)堆棧,回收本地變量的內(nèi)存空間?
            :00401078?C3?ret?000C?;函數(shù)返回,恢復(fù)參數(shù)占用的內(nèi)存空間?
            ;如果是“__cdecl”的話,這里是“ret”,堆棧將由調(diào)用者恢復(fù)?

            ;-------------------函數(shù)結(jié)束-------------------------?


            ;--------------主程序調(diào)用func函數(shù)的代碼--------------?

            :00401080?6A03?push?00000003?//壓入?yún)?shù)param3?
            :00401082?6A02?push?00000002?//壓入?yún)?shù)param2?
            :00401084?6A01?push?00000001?//壓入?yún)?shù)param1?
            :00401086?E875FFFFFF?call?00401000?//調(diào)用func函數(shù)?
            ;如果是“__cdecl”的話,將在這里恢復(fù)堆棧,“add?esp,?0000000C”?

            聰明的讀者看到這里,差不多就明白緩沖溢出的原理了。先來看下面的代碼:?

            #include?<stdio.h>?
            #include?<string.h>?

            void?__stdcall?func()?
            {?
            char?lpBuff[8]="\0";?
            strcat(lpBuff,"AAAAAAAAAAA");?
            return;?
            }?

            int?main()?
            {?
            func();?
            return?0;?
            }?

            編譯后執(zhí)行一下回怎么樣?哈,“"0x00414141"指令引用的"0x00000000"內(nèi)存。該內(nèi)存不能為"read"。”,“非法操作”嘍!"41"就是"A"的16進制的ASCII碼了,那明顯就是strcat這句出的問題了。"lpBuff"的大小只有8字節(jié),算進結(jié)尾的\0,那strcat最多只能寫入7個"A",但程序?qū)嶋H寫入了11個"A"外加1個\0。再來看看上面那幅圖,多出來的4個字節(jié)正好覆蓋了RET的所在的內(nèi)存空間,導(dǎo)致函數(shù)返回到一個錯誤的內(nèi)存地址,執(zhí)行了錯誤的指令。如果能精心構(gòu)造這個字符串,使它分成三部分,前一部份僅僅是填充的無意義數(shù)據(jù)以達(dá)到溢出的目的,接著是一個覆蓋RET的數(shù)據(jù),緊接著是一段shellcode,那只要著個RET地址能指向這段shellcode的第一個指令,那函數(shù)返回時就能執(zhí)行shellcode了。但是軟件的不同版本和不同的運行環(huán)境都可能影響這段shellcode在內(nèi)存中的位置,那么要構(gòu)造這個RET是十分困難的。一般都在RET和shellcode之間填充大量的NOP指令,使得exploit有更強的通用性。?


            ├———————┤<—低端內(nèi)存區(qū)域?
            │?……?│?
            ├———————┤<—由exploit填入數(shù)據(jù)的開始?
            │?│?
            │?buffer?│<—填入無用的數(shù)據(jù)?
            │?│?
            ├———————┤?
            │?RET?│<—指向shellcode,或NOP指令的范圍?
            ├———————┤?
            │?NOP?│?
            │?……?│<—填入的NOP指令,是RET可指向的范圍?
            │?NOP?│?
            ├———————┤?
            │?│?
            │?shellcode?│?
            │?│?
            ├———————┤<—由exploit填入數(shù)據(jù)的結(jié)束?
            │?……?│?
            ├———————┤<—高端內(nèi)存區(qū)域?


            windows下的動態(tài)數(shù)據(jù)除了可存放在棧中,還可以存放在堆中。了解C++的朋友都知道,C++可以使用new關(guān)鍵字來動態(tài)分配內(nèi)存。來看下面的C++代碼:?

            #include?<stdio.h>?
            #include?<iostream.h>?
            #include?<windows.h>?

            void?func()?
            {?
            char?*buffer=new?char[128];?
            char?bufflocal[128];?
            static?char?buffstatic[128];?
            printf("0x%08x\n",buffer);?//打印堆中變量的內(nèi)存地址?
            printf("0x%08x\n",bufflocal);?//打印本地變量的內(nèi)存地址?
            printf("0x%08x\n",buffstatic);?//打印靜態(tài)變量的內(nèi)存地址?
            }?

            void?main()?
            {?
            func();?
            return;?
            }?

            程序執(zhí)行結(jié)果為:?

            0x004107d0?
            0x0012ff04?
            0x004068c0?

            可以發(fā)現(xiàn)用new關(guān)鍵字分配的內(nèi)存即不在棧中,也不在靜態(tài)數(shù)據(jù)區(qū)。VC編譯器是通過windows下的“堆(heap)”來實現(xiàn)new關(guān)鍵字的內(nèi)存動態(tài)分配。在講“堆”之前,先來了解一下和“堆”有關(guān)的幾個API函數(shù):?

            HeapAlloc?在堆中申請內(nèi)存空間?
            HeapCreate?創(chuàng)建一個新的堆對象?
            HeapDestroy?銷毀一個堆對象?
            HeapFree?釋放申請的內(nèi)存?
            HeapWalk?枚舉堆對象的所有內(nèi)存塊?
            GetProcessHeap?取得進程的默認(rèn)堆對象?
            GetProcessHeaps?取得進程所有的堆對象?
            LocalAlloc?
            GlobalAlloc?

            當(dāng)進程初始化時,系統(tǒng)會自動為進程創(chuàng)建一個默認(rèn)堆,這個堆默認(rèn)所占內(nèi)存的大小為1M。堆對象由系統(tǒng)進行管理,它在內(nèi)存中以鏈?zhǔn)浇Y(jié)構(gòu)存在。通過下面的代碼可以通過堆動態(tài)申請內(nèi)存空間:?

            HANDLE?hHeap=GetProcessHeap();?
            char?*buff=HeapAlloc(hHeap,0,8);?

            其中hHeap是堆對象的句柄,buff是指向申請的內(nèi)存空間的地址。那這個hHeap究竟是什么呢?它的值有什么意義嗎?看看下面這段代碼吧:?

            #pragma?comment(linker,"/entry:main")?//定義程序的入口?
            #include?<windows.h>?

            _CRTIMP?int?(__cdecl?*printf)(const?char?*,?...);?//定義STL函數(shù)printf?
            /*---------------------------------------------------------------------------?
            寫到這里,我們順便來復(fù)習(xí)一下前面所講的知識:?
            (*注)printf函數(shù)是C語言的標(biāo)準(zhǔn)函數(shù)庫中函數(shù),VC的標(biāo)準(zhǔn)函數(shù)庫由msvcrt.dll模塊實現(xiàn)。?
            由函數(shù)定義可見,printf的參數(shù)個數(shù)是可變的,函數(shù)內(nèi)部無法預(yù)先知道調(diào)用者壓入的參數(shù)個數(shù),函數(shù)只能通過分析第一個參數(shù)字符串的格式來獲得壓入?yún)?shù)的信息,由于這里參數(shù)的個數(shù)是動態(tài)的,所以必須由調(diào)用者來平衡堆棧,這里便使用了__cdecl調(diào)用規(guī)則。BTW,Windows系統(tǒng)的API函數(shù)基本上是__stdcall調(diào)用形式,只有一個API例外,那就是wsprintf,它使用__cdecl調(diào)用規(guī)則,同printf函數(shù)一樣,這是由于它的參數(shù)個數(shù)是可變的緣故。?
            ---------------------------------------------------------------------------*/?
            void?main()?
            {?
            HANDLE?hHeap=GetProcessHeap();?
            char?*buff=HeapAlloc(hHeap,0,0x10);?
            char?*buff2=HeapAlloc(hHeap,0,0x10);?
            HMODULE?hMsvcrt=LoadLibrary("msvcrt.dll");?
            printf=(void?*)GetProcAddress(hMsvcrt,"printf");?
            printf("0x%08x\n",hHeap);?
            printf("0x%08x\n",buff);?
            printf("0x%08x\n\n",buff2);?
            }?

            執(zhí)行結(jié)果為:?

            0x00130000?
            0x00133100?
            0x00133118?

            hHeap的值怎么和那個buff的值那么接近呢?其實hHeap這個句柄就是指向HEAP首部的地址。在進程的用戶區(qū)存著一個叫PEB(進程環(huán)境塊)的結(jié)構(gòu),這個結(jié)構(gòu)中存放著一些有關(guān)進程的重要信息,其中在PEB首地址偏移0x18處存放的ProcessHeap就是進程默認(rèn)堆的地址,而偏移0x90處存放了指向進程所有堆的地址列表的指針。windows有很多API都使用進程的默認(rèn)堆來存放動態(tài)數(shù)據(jù),如windows?2000下的所有ANSI版本的函數(shù)都是在默認(rèn)堆中申請內(nèi)存來轉(zhuǎn)換ANSI字符串到Unicode字符串的。對一個堆的訪問是順序進行的,同一時刻只能有一個線程訪問堆中的數(shù)據(jù),當(dāng)多個線程同時有訪問要求時,只能排隊等待,這樣便造成程序執(zhí)行效率下降。?

            最后來說說內(nèi)存中的數(shù)據(jù)對齊。所位數(shù)據(jù)對齊,是指數(shù)據(jù)所在的內(nèi)存地址必須是該數(shù)據(jù)長度的整數(shù)倍,DWORD數(shù)據(jù)的內(nèi)存起始地址能被4除盡,WORD數(shù)據(jù)的內(nèi)存起始地址能被2除盡,x86?CPU能直接訪問對齊的數(shù)據(jù),當(dāng)他試圖訪問一個未對齊的數(shù)據(jù)時,會在內(nèi)部進行一系列的調(diào)整,這些調(diào)整對于程序來說是透明的,但是會降低運行速度,所以編譯器在編譯程序時會盡量保證數(shù)據(jù)對齊。同樣一段代碼,我們來看看用VC、Dev-C++和lcc三個不同編譯器編譯出來的程序的執(zhí)行結(jié)果:?

            #include?<stdio.h>?

            int?main()?
            {?
            int?a;?
            char?b;?
            int?c;?
            printf("0x%08x\n",&a);?
            printf("0x%08x\n",&b);?
            printf("0x%08x\n",&c);?
            return?0;?
            }?

            這是用VC編譯后的執(zhí)行結(jié)果:?
            0x0012ff7c?
            0x0012ff7b?
            0x0012ff80?
            變量在內(nèi)存中的順序:b(1字節(jié))-a(4字節(jié))-c(4字節(jié))。?

            這是用Dev-C++編譯后的執(zhí)行結(jié)果:?
            0x0022ff7c?
            0x0022ff7b?
            0x0022ff74?
            變量在內(nèi)存中的順序:c(4字節(jié))-中間相隔3字節(jié)-b(占1字節(jié))-a(4字節(jié))。?

            這是用lcc編譯后的執(zhí)行結(jié)果:?
            0x0012ff6c?
            0x0012ff6b?
            0x0012ff64?
            變量在內(nèi)存中的順序:同上。?

            三個編譯器都做到了數(shù)據(jù)對齊,但是后兩個編譯器顯然沒VC“聰明”,讓一個char占了4字節(jié),浪費內(nèi)存哦。?


            基礎(chǔ)知識:?
            堆棧是一種簡單的數(shù)據(jù)結(jié)構(gòu),是一種只允許在其一端進行插入或刪除的線性表。允許插入或刪除操作的一端稱為棧頂,另一端稱為棧底,對堆棧的插入和刪除操作被稱為入棧和出棧。有一組CPU指令可以實現(xiàn)對進程的內(nèi)存實現(xiàn)堆棧訪問。其中,POP指令實現(xiàn)出棧操作,PUSH指令實現(xiàn)入棧操作。CPU的ESP寄存器存放當(dāng)前線程的棧頂指針,EBP寄存器中保存當(dāng)前線程的棧底指針。CPU的EIP寄存器存放下一個CPU指令存放的內(nèi)存地址,當(dāng)CPU執(zhí)行完當(dāng)前的指令后,從EIP寄存器中讀取下一條指令的內(nèi)存地址,然后繼續(xù)執(zhí)行。?


            參考:《Windows下的HEAP溢出及其利用》by:?isno?
            《windows核心編程》by:?Jeffrey?Richter?



            摘要:?討論常見的堆性能問題以及如何防范它們。(共?9?頁)

            前言
            您是否是動態(tài)分配的?C/C++?對象忠實且幸運的用戶?您是否在模塊間的往返通信中頻繁地使用了“自動化”?您的程序是否因堆分配而運行起來很慢?不僅僅您遇到這樣的問題。幾乎所有項目遲早都會遇到堆問題。大家都想說,“我的代碼真正好,只是堆太慢”。那只是部分正確。更深入理解堆及其用法、以及會發(fā)生什么問題,是很有用的。

            什么是堆?
            (如果您已經(jīng)知道什么是堆,可以跳到“什么是常見的堆性能問題?”部分)

            在程序中,使用堆來動態(tài)分配和釋放對象。在下列情況下,調(diào)用堆操作:?

            事先不知道程序所需對象的數(shù)量和大小。


            對象太大而不適合堆棧分配程序。
            堆使用了在運行時分配給代碼和堆棧的內(nèi)存之外的部分內(nèi)存。下圖給出了堆分配程序的不同層。

            GlobalAlloc/GlobalFree:Microsoft?Win32?堆調(diào)用,這些調(diào)用直接與每個進程的默認(rèn)堆進行對話。

            LocalAlloc/LocalFree:Win32?堆調(diào)用(為了與?Microsoft?Windows?NT?兼容),這些調(diào)用直接與每個進程的默認(rèn)堆進行對話。

            COM?的?IMalloc?分配程序(或?CoTaskMemAlloc?/?CoTaskMemFree):函數(shù)使用每個進程的默認(rèn)堆。自動化程序使用“組件對象模型?(COM)”的分配程序,而申請的程序使用每個進程堆。

            C/C++?運行時?(CRT)?分配程序:提供了?malloc()?和?free()?以及?new?和?delete?操作符。如?Microsoft?Visual?Basic?和?Java?等語言也提供了新的操作符并使用垃圾收集來代替堆。CRT?創(chuàng)建自己的私有堆,駐留在?Win32?堆的頂部。

            Windows?NT?中,Win32?堆是?Windows?NT?運行時分配程序周圍的薄層。所有?API?轉(zhuǎn)發(fā)它們的請求給?NTDLL。

            Windows?NT?運行時分配程序提供?Windows?NT?內(nèi)的核心堆分配程序。它由具有?128?個大小從?8?到?1,024?字節(jié)的空閑列表的前端分配程序組成。后端分配程序使用虛擬內(nèi)存來保留和提交頁。

            在圖表的底部是“虛擬內(nèi)存分配程序”,操作系統(tǒng)使用它來保留和提交頁。所有分配程序使用虛擬內(nèi)存進行數(shù)據(jù)的存取。

            分配和釋放塊不就那么簡單嗎?為何花費這么長時間?

            堆實現(xiàn)的注意事項
            傳統(tǒng)上,操作系統(tǒng)和運行時庫是與堆的實現(xiàn)共存的。在一個進程的開始,操作系統(tǒng)創(chuàng)建一個默認(rèn)堆,叫做“進程堆”。如果沒有其他堆可使用,則塊的分配使用“進程堆”。語言運行時也能在進程內(nèi)創(chuàng)建單獨的堆。(例如,C?運行時創(chuàng)建它自己的堆。)除這些專用的堆外,應(yīng)用程序或許多已載入的動態(tài)鏈接庫?(DLL)?之一可以創(chuàng)建和使用單獨的堆。Win32?提供一整套?API?來創(chuàng)建和使用私有堆。有關(guān)堆函數(shù)(英文)的詳盡指導(dǎo),請參見?MSDN。

            當(dāng)應(yīng)用程序或?DLL?創(chuàng)建私有堆時,這些堆存在于進程空間,并且在進程內(nèi)是可訪問的。從給定堆分配的數(shù)據(jù)將在同一個堆上釋放。(不能從一個堆分配而在另一個堆釋放。)

            在所有虛擬內(nèi)存系統(tǒng)中,堆駐留在操作系統(tǒng)的“虛擬內(nèi)存管理器”的頂部。語言運行時堆也駐留在虛擬內(nèi)存頂部。某些情況下,這些堆是操作系統(tǒng)堆中的層,而語言運行時堆則通過大塊的分配來執(zhí)行自己的內(nèi)存管理。不使用操作系統(tǒng)堆,而使用虛擬內(nèi)存函數(shù)更利于堆的分配和塊的使用。

            典型的堆實現(xiàn)由前、后端分配程序組成。前端分配程序維持固定大小塊的空閑列表。對于一次分配調(diào)用,堆嘗試從前端列表找到一個自由塊。如果失敗,堆被迫從后端(保留和提交虛擬內(nèi)存)分配一個大塊來滿足請求。通用的實現(xiàn)有每塊分配的開銷,這將耗費執(zhí)行周期,也減少了可使用的存儲空間。

            Knowledge?Base?文章?Q10758,“用?calloc()?和?malloc()?管理內(nèi)存”?(搜索文章編號),?包含了有關(guān)這些主題的更多背景知識。另外,有關(guān)堆實現(xiàn)和設(shè)計的詳細(xì)討論也可在下列著作中找到:“Dynamic?Storage?Allocation:?A?Survey?and?Critical?Review”,作者?Paul?R.?Wilson、Mark?S.?Johnstone、Michael?Neely?和?David?Boles;“International?Workshop?on?Memory?Management”,?作者?Kinross,?Scotland,?UK,?1995?年?9?月(http://www.cs.utexas.edu/users/oops/papers.html)(英文)。

            Windows?NT?的實現(xiàn)(Windows?NT?版本?4.0?和更新版本)?使用了?127?個大小從?8?到?1,024?字節(jié)的?8?字節(jié)對齊塊空閑列表和一個“大塊”列表。“大塊”列表(空閑列表[0])?保存大于?1,024?字節(jié)的塊。空閑列表容納了用雙向鏈表鏈接在一起的對象。默認(rèn)情況下,“進程堆”執(zhí)行收集操作。(收集是將相鄰空閑塊合并成一個大塊的操作。)收集耗費了額外的周期,但減少了堆塊的內(nèi)部碎片。

            單一全局鎖保護堆,防止多線程式的使用。(請參見“Server?Performance?and?Scalability?Killers”中的第一個注意事項,?George?Reilly?所著,在?“MSDN?Online?Web?Workshop”上(站點:http://msdn.microsoft.com/workshop/server/iis/tencom.asp(英文)。)單一全局鎖本質(zhì)上是用來保護堆數(shù)據(jù)結(jié)構(gòu),防止跨多線程的隨機存取。若堆操作太頻繁,單一全局鎖會對性能有不利的影響。

            什么是常見的堆性能問題?
            以下是您使用堆時會遇到的最常見問題:?

            分配操作造成的速度減慢。光分配就耗費很長時間。最可能導(dǎo)致運行速度減慢原因是空閑列表沒有塊,所以運行時分配程序代碼會耗費周期尋找較大的空閑塊,或從后端分配程序分配新塊。


            釋放操作造成的速度減慢。釋放操作耗費較多周期,主要是啟用了收集操作。收集期間,每個釋放操作“查找”它的相鄰塊,取出它們并構(gòu)造成較大塊,然后再把此較大塊插入空閑列表。在查找期間,內(nèi)存可能會隨機碰到,從而導(dǎo)致高速緩存不能命中,性能降低。


            堆競爭造成的速度減慢。當(dāng)兩個或多個線程同時訪問數(shù)據(jù),而且一個線程繼續(xù)進行之前必須等待另一個線程完成時就發(fā)生競爭。競爭總是導(dǎo)致麻煩;這也是目前多處理器系統(tǒng)遇到的最大問題。當(dāng)大量使用內(nèi)存塊的應(yīng)用程序或?DLL?以多線程方式運行(或運行于多處理器系統(tǒng)上)時將導(dǎo)致速度減慢。單一鎖定的使用—常用的解決方案—意味著使用堆的所有操作是序列化的。當(dāng)?shù)却i定時序列化會引起線程切換上下文。可以想象交叉路口閃爍的紅燈處走走停停導(dǎo)致的速度減慢。?
            競爭通常會導(dǎo)致線程和進程的上下文切換。上下文切換的開銷是很大的,但開銷更大的是數(shù)據(jù)從處理器高速緩存中丟失,以及后來線程復(fù)活時的數(shù)據(jù)重建。

            堆破壞造成的速度減慢。造成堆破壞的原因是應(yīng)用程序?qū)Χ褖K的不正確使用。通常情形包括釋放已釋放的堆塊或使用已釋放的堆塊,以及塊的越界重寫等明顯問題。(破壞不在本文討論范圍之內(nèi)。有關(guān)內(nèi)存重寫和泄漏等其他細(xì)節(jié),請參見?Microsoft?Visual?C++(R)?調(diào)試文檔?。)


            頻繁的分配和重分配造成的速度減慢。這是使用腳本語言時非常普遍的現(xiàn)象。如字符串被反復(fù)分配,隨重分配增長和釋放。不要這樣做,如果可能,盡量分配大字符串和使用緩沖區(qū)。另一種方法就是盡量少用連接操作。
            競爭是在分配和釋放操作中導(dǎo)致速度減慢的問題。理想情況下,希望使用沒有競爭和快速分配/釋放的堆。可惜,現(xiàn)在還沒有這樣的通用堆,也許將來會有。

            在所有的服務(wù)器系統(tǒng)中(如?IIS、MSProxy、DatabaseStacks、網(wǎng)絡(luò)服務(wù)器、?Exchange?和其他),?堆鎖定實在是個大瓶頸。處理器數(shù)越多,競爭就越會惡化。

            盡量減少堆的使用
            現(xiàn)在您明白使用堆時存在的問題了,難道您不想擁有能解決這些問題的超級魔棒嗎?我可希望有。但沒有魔法能使堆運行加快—因此不要期望在產(chǎn)品出貨之前的最后一星期能夠大為改觀。如果提前規(guī)劃堆策略,情況將會大大好轉(zhuǎn)。調(diào)整使用堆的方法,減少對堆的操作是提高性能的良方。

            如何減少使用堆操作?通過利用數(shù)據(jù)結(jié)構(gòu)內(nèi)的位置可減少堆操作的次數(shù)。請考慮下列實例:

            struct?ObjectA?{
            ???//?objectA?的數(shù)據(jù)?
            }

            struct?ObjectB?{
            ???//?objectB?的數(shù)據(jù)?
            }

            //?同時使用?objectA?和?objectB

            //
            //?使用指針?
            //
            struct?ObjectB?{
            ???struct?ObjectA?*?pObjA;
            ???//?objectB?的數(shù)據(jù)?
            }

            //
            //?使用嵌入
            //
            struct?ObjectB?{
            ???struct?ObjectA?pObjA;
            ???//?objectB?的數(shù)據(jù)?
            }

            //
            //?集合?–?在另一對象內(nèi)使用?objectA?和?objectB
            //

            struct?ObjectX?{
            ???struct?ObjectA??objA;
            ???struct?ObjectB??objB;
            }

            避免使用指針關(guān)聯(lián)兩個數(shù)據(jù)結(jié)構(gòu)。如果使用指針關(guān)聯(lián)兩個數(shù)據(jù)結(jié)構(gòu),前面實例中的對象?A?和?B?將被分別分配和釋放。這會增加額外開銷—我們要避免這種做法。


            把帶指針的子對象嵌入父對象。當(dāng)對象中有指針時,則意味著對象中有動態(tài)元素(百分之八十)和沒有引用的新位置。嵌入增加了位置從而減少了進一步分配/釋放的需求。這將提高應(yīng)用程序的性能。


            合并小對象形成大對象(聚合)。聚合減少分配和釋放的塊的數(shù)量。如果有幾個開發(fā)者,各自開發(fā)設(shè)計的不同部分,則最終會有許多小對象需要合并。集成的挑戰(zhàn)就是要找到正確的聚合邊界。


            內(nèi)聯(lián)緩沖區(qū)能夠滿足百分之八十的需要(aka?80-20?規(guī)則)。個別情況下,需要內(nèi)存緩沖區(qū)來保存字符串/二進制數(shù)據(jù),但事先不知道總字節(jié)數(shù)。估計并內(nèi)聯(lián)一個大小能滿足百分之八十需要的緩沖區(qū)。對剩余的百分之二十,可以分配一個新的緩沖區(qū)和指向這個緩沖區(qū)的指針。這樣,就減少分配和釋放調(diào)用并增加數(shù)據(jù)的位置空間,從根本上提高代碼的性能。


            在塊中分配對象(塊化)。塊化是以組的方式一次分配多個對象的方法。如果對列表的項連續(xù)跟蹤,例如對一個?{名稱,值}?對的列表,有兩種選擇:選擇一是為每一個“名稱-值”對分配一個節(jié)點;選擇二是分配一個能容納(如五個)“名稱-值”對的結(jié)構(gòu)。例如,一般情況下,如果存儲四對,就可減少節(jié)點的數(shù)量,如果需要額外的空間數(shù)量,則使用附加的鏈表指針。?
            塊化是友好的處理器高速緩存,特別是對于?L1-高速緩存,因為它提供了增加的位置?—不用說對于塊分配,很多數(shù)據(jù)塊會在同一個虛擬頁中。

            正確使用?_amblksiz。C?運行時?(CRT)?有它的自定義前端分配程序,該分配程序從后端(Win32?堆)分配大小為?_amblksiz?的塊。將?_amblksiz?設(shè)置為較高的值能潛在地減少對后端的調(diào)用次數(shù)。這只對廣泛使用?CRT?的程序適用。
            使用上述技術(shù)將獲得的好處會因?qū)ο箢愋汀⒋笮〖肮ぷ髁慷兴煌5偰茉谛阅芎涂缮s性方面有所收獲。另一方面,代碼會有點特殊,但如果經(jīng)過深思熟慮,代碼還是很容易管理的。

            其他提高性能的技術(shù)
            下面是一些提高速度的技術(shù):?

            使用?Windows?NT5?堆?
            由于幾個同事的努力和辛勤工作,1998?年初?Microsoft?Windows(R)?2000?中有了幾個重大改進:

            改進了堆代碼內(nèi)的鎖定。堆代碼對每堆一個鎖。全局鎖保護堆數(shù)據(jù)結(jié)構(gòu),防止多線程式的使用。但不幸的是,在高通信量的情況下,堆仍受困于全局鎖,導(dǎo)致高競爭和低性能。Windows?2000?中,鎖內(nèi)代碼的臨界區(qū)將競爭的可能性減到最小,從而提高了可伸縮性。


            使用?“Lookaside”列表。堆數(shù)據(jù)結(jié)構(gòu)對塊的所有空閑項使用了大小在?8?到?1,024?字節(jié)(以?8-字節(jié)遞增)的快速高速緩存。快速高速緩存最初保護在全局鎖內(nèi)。現(xiàn)在,使用?lookaside?列表來訪問這些快速高速緩存空閑列表。這些列表不要求鎖定,而是使用?64?位的互鎖操作,因此提高了性能。


            內(nèi)部數(shù)據(jù)結(jié)構(gòu)算法也得到改進。
            這些改進避免了對分配高速緩存的需求,但不排除其他的優(yōu)化。使用?Windows?NT5?堆評估您的代碼;它對小于?1,024?字節(jié)?(1?KB)?的塊(來自前端分配程序的塊)是最佳的。GlobalAlloc()?和?LocalAlloc()?建立在同一堆上,是存取每個進程堆的通用機制。如果希望獲得高的局部性能,則使用?Heap(R)?API?來存取每個進程堆,或為分配操作創(chuàng)建自己的堆。如果需要對大塊操作,也可以直接使用?VirtualAlloc()?/?VirtualFree()?操作。

            上述改進已在?Windows?2000?beta?2?和?Windows?NT?4.0?SP4?中使用。改進后,堆鎖的競爭率顯著降低。這使所有?Win32?堆的直接用戶受益。CRT?堆建立于?Win32?堆的頂部,但它使用自己的小塊堆,因而不能從?Windows?NT?改進中受益。(Visual?C++?版本?6.0?也有改進的堆分配程序。)

            使用分配高速緩存?
            分配高速緩存允許高速緩存分配的塊,以便將來重用。這能夠減少對進程堆(或全局堆)的分配/釋放調(diào)用的次數(shù),也允許最大限度的重用曾經(jīng)分配的塊。另外,分配高速緩存允許收集統(tǒng)計信息,以便較好地理解對象在較高層次上的使用。

            典型地,自定義堆分配程序在進程堆的頂部實現(xiàn)。自定義堆分配程序與系統(tǒng)堆的行為很相似。主要的差別是它在進程堆的頂部為分配的對象提供高速緩存。高速緩存設(shè)計成一套固定大小(如?32?字節(jié)、64?字節(jié)、128?字節(jié)等)。這一個很好的策略,但這種自定義堆分配程序丟失與分配和釋放的對象相關(guān)的“語義信息”。?

            與自定義堆分配程序相反,“分配高速緩存”作為每類分配高速緩存來實現(xiàn)。除能夠提供自定義堆分配程序的所有好處之外,它們還能夠保留大量語義信息。每個分配高速緩存處理程序與一個目標(biāo)二進制對象關(guān)聯(lián)。它能夠使用一套參數(shù)進行初始化,這些參數(shù)表示并發(fā)級別、對象大小和保持在空閑列表中的元素的數(shù)量等。分配高速緩存處理程序?qū)ο缶S持自己的私有空閑實體池(不超過指定的閥值)并使用私有保護鎖。合在一起,分配高速緩存和私有鎖減少了與主系統(tǒng)堆的通信量,因而提供了增加的并發(fā)、最大限度的重用和較高的可伸縮性。

            需要使用清理程序來定期檢查所有分配高速緩存處理程序的活動情況并回收未用的資源。如果發(fā)現(xiàn)沒有活動,將釋放分配對象的池,從而提高性能。

            可以審核每個分配/釋放活動。第一級信息包括對象、分配和釋放調(diào)用的總數(shù)。通過查看它們的統(tǒng)計信息可以得出各個對象之間的語義關(guān)系。利用以上介紹的許多技術(shù)之一,這種關(guān)系可以用來減少內(nèi)存分配。

            分配高速緩存也起到了調(diào)試助手的作用,幫助您跟蹤沒有完全清除的對象數(shù)量。通過查看動態(tài)堆棧返回蹤跡和除沒有清除的對象之外的簽名,甚至能夠找到確切的失敗的調(diào)用者。

            MP?堆?
            MP?堆是對多處理器友好的分布式分配的程序包,在?Win32?SDK(Windows?NT?4.0?和更新版本)中可以得到。最初由?JVert?實現(xiàn),此處堆抽象建立在?Win32?堆程序包的頂部。MP?堆創(chuàng)建多個?Win32?堆,并試圖將分配調(diào)用分布到不同堆,以減少在所有單一鎖上的競爭。

            本程序包是好的步驟?—一種改進的?MP-友好的自定義堆分配程序。但是,它不提供語義信息和缺乏統(tǒng)計功能。通常將?MP?堆作為?SDK?庫來使用。如果使用這個?SDK?創(chuàng)建可重用組件,您將大大受益。但是,如果在每個?DLL?中建立這個?SDK?庫,將增加工作設(shè)置。

            重新思考算法和數(shù)據(jù)結(jié)構(gòu)?
            要在多處理器機器上伸縮,則算法、實現(xiàn)、數(shù)據(jù)結(jié)構(gòu)和硬件必須動態(tài)伸縮。請看最經(jīng)常分配和釋放的數(shù)據(jù)結(jié)構(gòu)。試問,“我能用不同的數(shù)據(jù)結(jié)構(gòu)完成此工作嗎?”例如,如果在應(yīng)用程序初始化時加載了只讀項的列表,這個列表不必是線性鏈接的列表。如果是動態(tài)分配的數(shù)組就非常好。動態(tài)分配的數(shù)組將減少內(nèi)存中的堆塊和碎片,從而增強性能。

            減少需要的小對象的數(shù)量減少堆分配程序的負(fù)載。例如,我們在服務(wù)器的關(guān)鍵處理路徑上使用五個不同的對象,每個對象單獨分配和釋放。一起高速緩存這些對象,把堆調(diào)用從五個減少到一個,顯著減少了堆的負(fù)載,特別當(dāng)每秒鐘處理?1,000?個以上的請求時。

            如果大量使用“Automation”結(jié)構(gòu),請考慮從主線代碼中刪除“Automation?BSTR”,或至少避免重復(fù)的?BSTR?操作。(BSTR?連接導(dǎo)致過多的重分配和分配/釋放操作。)

            摘要
            對所有平臺往往都存在堆實現(xiàn),因此有巨大的開銷。每個單獨代碼都有特定的要求,但設(shè)計能采用本文討論的基本理論來減少堆之間的相互作用。?

            評價您的代碼中堆的使用。


            改進您的代碼,以使用較少的堆調(diào)用:分析關(guān)鍵路徑和固定數(shù)據(jù)結(jié)構(gòu)。


            在實現(xiàn)自定義的包裝程序之前使用量化堆調(diào)用成本的方法。


            如果對性能不滿意,請要求?OS?組改進堆。更多這類請求意味著對改進堆的更多關(guān)注。


            要求?C?運行時組針對?OS?所提供的堆制作小巧的分配包裝程序。隨著?OS?堆的改進,C?運行時堆調(diào)用的成本將減小。


            操作系統(tǒng)(Windows?NT?家族)正在不斷改進堆。請隨時關(guān)注和利用這些改進。
            Murali?Krishnan?是?Internet?Information?Server?(IIS)?組的首席軟件設(shè)計工程師。從?1.0?版本開始他就設(shè)計?IIS,并成功發(fā)行了?1.0?版本到?4.0?版本。Murali?組織并領(lǐng)導(dǎo)?IIS?性能組三年?(1995-1998),?從一開始就影響?IIS?性能。他擁有威斯康星州?Madison?大學(xué)的?M.S.和印度?Anna?大學(xué)的?B.S.。工作之外,他喜歡閱讀、打排球和家庭烹飪。



            http://community.csdn.net/Expert/FAQ/FAQ_Index.asp?id=172835
            我在學(xué)習(xí)對象的生存方式的時候見到一種是在堆棧(stack)之中,如下??
            CObject??object;??
            還有一種是在堆(heap)中??如下??
            CObject*??pobject=new??CObject();??
            ?
            請問??
            (1)這兩種方式有什么區(qū)別???
            (2)堆棧與堆有什么區(qū)別????
            ?
            ?
            ---------------------------------------------------------------??
            ?
            1)??about??stack,??system??will??allocate??memory??to??the??instance??of??object??automatically,??and??to??the
            ?heap,??you??must??allocate??memory??to??the??instance??of??object??with??new??or??malloc??manually.??
            2)??when??function??ends,??system??will??automatically??free??the??memory??area??of??stack,??but??to??the?
            heap,??you??must??free??the??memory??area??manually??with??free??or??delete,??else??it??will??result??in??memory
            leak.??
            3)棧內(nèi)存分配運算內(nèi)置于處理器的指令集中,效率很高,但是分配的內(nèi)存容量有限。??
            4)堆上分配的內(nèi)存可以有我們自己決定,使用非常靈活。??
            ---------------------------------------------------------------??

            Feedback

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2006-07-25 18:04 by Teresa
            求教:
            問個問題, 堆棧大小的限制是受寄存器地址為數(shù)的限制么?
            如果不是, 你知道是受什么的限制么?

            謝謝啦先!

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2006-07-28 13:22 by 任我行
            棧:是一塊連續(xù)的內(nèi)存的區(qū)域。這句話的意思是棧頂?shù)牡刂泛蜅5淖畲笕萘渴窍到y(tǒng)預(yù)先規(guī)定好的,在WINDOWS下,棧的大小是2M(也有的說是1M,總之是一個編譯時就確定的常數(shù)),如果申請的空間超過棧的剩余空間時,將提示overflow。因此,能從棧獲得的空間較小。
            堆:堆是向高地址擴展的數(shù)據(jù)結(jié)構(gòu),是不連續(xù)的內(nèi)存區(qū)域。這是由于系統(tǒng)是用鏈表來存儲的空閑內(nèi)存地址的,自然是不連續(xù)的,而鏈表的遍歷方向是由低地址向高地址。堆的大小受限于計算機系統(tǒng)中有效的虛擬內(nèi)存。由此可見,堆獲得的空間比較靈活,也比較大。
            應(yīng)用文章中的話,在編譯時,可以用/STACK命令來設(shè)置棧的大小,VC中默認(rèn)時2M,不過也有一個限制,堆的最大空間和機器位數(shù)有關(guān),32機上是4G吧。

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2006-08-10 16:00 by relearn_C
            非常好的文章,感謝您的分享。贊一個!

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2006-08-14 15:29 by jitongwang
            版主很強
            多謝幾篇啊
            頂一下

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2006-10-11 06:02 by vic
            樓主加我MSN
            mars_lavigne@hotmail.com
            我非常想找人輔導(dǎo)
            因為換了專業(yè),老師正在講這個
            我聽不懂,而且還是外語,所以希望能聽到中文講解
            謝謝

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2006-10-12 17:01 by myself
            非常遺憾,網(wǎng)絡(luò)環(huán)境不能用任何聊天工具,只能Email。
            在私人留言里留言吧!

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2006-12-01 10:58 by butler
            感覺這個文章非常精典,我把它也復(fù)制到我的BLOG上面去了。
            謝謝樓主對此文的收集整理!

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2006-12-05 17:02 by Aaron
            沒得說,太棒了!!

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2006-12-23 10:17 by 陌生人
            確實是非常非常好的文章!謝了

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2007-04-03 13:55 by nighteblis
            good...雖然還有很多看不懂呢。

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2008-01-22 13:17 by 分段方法地方
            很好,很強大

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2008-05-28 14:05 by 蘿卜
            看不懂

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2008-07-03 11:55 by 瘋子
            對于整理這些知識的人 我想說 太強 對于樓主 我想說 強

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2008-10-24 18:38 by vrs_Saber
            LZ,請問下文章前面說的是函數(shù)地址最先入棧,可是為什么后面的那個圖確實參數(shù)先入棧,函數(shù)地址在入棧,最后是變量??

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2009-04-17 20:17 by 創(chuàng)意產(chǎn)品網(wǎng)
            學(xué)習(xí)了

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2009-04-29 17:14 by 創(chuàng)意家居
            不錯不錯

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2009-06-01 18:32 by bneliao
            非常不錯,寫得很好

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2009-09-09 22:40 by 雷勇
            棧區(qū)(stack)— 由編譯器自動分配釋放
            我覺得這句話就是錯的

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2010-04-15 19:51 by ff
            高手

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2010-05-10 14:30 by 葉葉
            受益匪淺

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2011-03-11 20:30 by Bourbon
            寫的太好了,解了很多困惑。

            # re: 堆棧,堆棧,堆和棧的區(qū)別[未登錄]  回復(fù)  更多評論   

            2011-05-18 18:40 by 王強
            程序的內(nèi)存分配可以畫個圖展示一下嗎?謝謝!

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2011-08-01 22:31 by 牛b
            難得一見的好文章!

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2011-08-24 23:03 by 凌雨
            @Teresa
            寫得太好了

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2011-12-28 00:57 by 吳同學(xué)
            我一定會仔細(xì)研究!!

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2012-03-06 21:28 by VB小青年
            辛苦了啊,我看都費勁……樓主NB

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2012-04-16 15:39 by Lorainee
            非常棒,寫的很到位。

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2012-05-03 17:45 by material2010
            相見恨晚

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2012-07-13 11:06 by zhangleifly
            轉(zhuǎn)走先咯~謝

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2012-10-23 17:05 by 李冬
            呵呵,當(dāng)初應(yīng)聘的時候被問到了堆和棧的區(qū)別,當(dāng)時回答的一般啊。如果當(dāng)時就看了這篇文章,估計應(yīng)聘的時候能把那考官嚇?biāo)腊伞?/div>

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2013-05-02 16:30 by lucas
            感謝樓主,不過有個小問題
            2.5堆和棧中的存儲內(nèi)容
            棧: 在函數(shù)調(diào)用時,第一個進棧的是主函數(shù)中后的下一條指令(函數(shù)調(diào)用語句的下一條可執(zhí)行語句)的地址,然后是函數(shù)的各個參數(shù),在大多數(shù)的C編譯器中,參數(shù)是由右往左入棧的,然后是函數(shù)中的局部變量。注意靜態(tài)變量是不入棧的。

            這個是不是應(yīng)該是 先壓參數(shù),然后再壓返回地址的說?

            # re: 堆棧,堆棧,堆和棧的區(qū)別  回復(fù)  更多評論   

            2015-06-10 11:23 by Grubby
            “原作者不祥!”
            這句話,真實包含深深的怨念
            久久久精品人妻一区二区三区蜜桃| 国产成人久久激情91| 伊人久久大香线蕉av不卡| 欧美熟妇另类久久久久久不卡 | 久久无码人妻精品一区二区三区 | 日韩欧美亚洲综合久久| 好属妞这里只有精品久久| 日批日出水久久亚洲精品tv| 精品久久久久久久久午夜福利| 日日狠狠久久偷偷色综合0| 国产精品一区二区久久| 久久久久亚洲国产| 国内精品久久久久影院网站 | 日本福利片国产午夜久久| 日本五月天婷久久网站| 久久人人爽人人澡人人高潮AV| 国产V综合V亚洲欧美久久| 久久久久久久波多野结衣高潮| 国产伊人久久| 欧美久久精品一级c片片| 久久久国产乱子伦精品作者| 久久无码专区国产精品发布| 久久久久久av无码免费看大片| 久久久精品午夜免费不卡| 精品久久久久久亚洲精品 | 国产精品久久久久jk制服| 狠狠精品久久久无码中文字幕| 亚洲欧美日韩精品久久亚洲区 | 国产毛片欧美毛片久久久| 久久久久久国产精品无码下载 | 精品综合久久久久久97| 一本一道久久a久久精品综合| 久久精品国产精品亜洲毛片| 国产—久久香蕉国产线看观看| 国产V综合V亚洲欧美久久| 狠狠色婷婷久久一区二区三区| 韩国免费A级毛片久久| 久久亚洲综合色一区二区三区| 2022年国产精品久久久久| 久久久久亚洲AV无码永不| 精品久久久久久综合日本|