的項目中,就可以對是否需要垃圾回收功能做出準確的判斷。
它是否影響性能,能影響多少,回收的代價等等問題就會顯得更加明確。
對C++下垃圾回收的討論很多,有興趣可以看看這里和這里。至于實現,惠普的垃圾回收器是一個產品化的開源項目,而且已經被很多項目使用。但是他的具體實現總是讓人感覺不是很可靠。云風是一個簡單的回收器,有人對其源碼進行研究,有興趣可以看這里,它沒有內存緊縮功能。
首先,說說垃圾回收的目標,也就是需求。
1. 不能有內存泄漏(最基本的要求)。
2. 能自動回收無用內存(當然需要解決循環引用問題)。
3. 能整理內存(內存緊縮),程序運行時間長了,總會有小塊內存無法被重復使用。
先說說前兩條需求,程序中的所有已分配內存都應該有其對應的指針指向它,如果一塊內存沒有任何指針指向它,那么我們說這塊內存被泄漏了(這里內存泄漏的定義和Java不太一樣)。

簡單的表述就是無用對象且不可達。
什么叫可達?可達表示從哪里為起點可達?這里要引出一個叫根集的概念:在程序運行的任意狀態,寄存器(考慮多核CPU在多線程下),程序棧,和靜態數據段中所有的指針的集合叫根集。
所以可達指的是這塊內存從根集出發,可以找到一個指向它的指針,不可達就是找不到。
要實現垃圾回收器,首先要能在程序的任意狀態,找到根集。其次是要能管理所有堆上的內存。當從根集掃描發現一塊不可達內存時,這塊內存就應該被收集。
注意上圖:黃色的指針表示它是根集,紅色的指針則不是根集。
要回收內存,首先要知道內存的地址,所以上圖中4塊內存的地址是必須知道的。
看看要回收內存,需要知道那些信息吧:
根集和內存塊集。收集前,先從根集順著黑色的箭頭開始掃描,對所以掃描到的內存塊做個標記,然后從內存塊集中檢查所有內存塊,如果被做了標記,就保留,如果沒有做標記,就收集。
怎么得到根集呢?對于像Java,C#之類的語言,它的指針是受到虛擬機或者Framework控制的,但是在C++中,原生的指針(raw pointer)是不受控制的,而且Scott Meyers([More] Effective C++)的作者,
Andrew Koenig夫婦(C++ 沉思錄)的作者,這些大牛們多次勸告,不要使用原生指針。
所以以前有auto_ptr, 現在有shared_ptr問世。為了得到根集,我也將原生指針進行包裝,只不過不用于所有權管理,也不用于引用計數,而是用于得到根集。
首先看看指針的定義:




















































注意pointer的構造函數,它將自己注冊到根集中去。
再看看根集:

gc_register 函數也就是做了一個push_back。
有人會問,那要是出現這種情況:





















那不是pB->pA在堆上嗎?不應該屬于根集呀。
這個問題就要和內存塊管理扯上關系啦,下篇再說
整個垃圾回收器已經寫完并簡單的測試代碼在這里,有興趣可以看看并測試。