太久沒有更新blog了,慚愧下先,下邊進(jìn)入正題。
最近在實(shí)現(xiàn)一個(gè)閹割版的函數(shù)式語言(編譯器已完成,虛擬機(jī)在憋的過程中,之后會發(fā)帖),希望內(nèi)存管理的部分由虛擬機(jī)來完成,而不是由客戶自己折騰,這樣顯然可以降低客戶使用這門語言的難度,比如不需要擔(dān)心內(nèi)存泄漏,減少內(nèi)存運(yùn)用不當(dāng)?shù)腷ug,這里客戶只管放心地一直申請內(nèi)存就行,不再需要手工釋放內(nèi)存(如果讓客戶選擇是否自己釋放都行,會提高難度,起碼得做個(gè)平衡樹放著這些申請的內(nèi)存地址便于查找,這里先偷懶)。
首先講一下虛擬機(jī)的內(nèi)存管理機(jī)制。眾所周知,頻繁地申請和釋放內(nèi)存會大大降低效率,所以我們可以在虛擬機(jī)運(yùn)行一開始的時(shí)候就統(tǒng)一申請內(nèi)存,虛擬機(jī)運(yùn)行結(jié)束在統(tǒng)一釋放內(nèi)存。如果中間有某些內(nèi)存已經(jīng)不需要再次使用,繼續(xù)占著茅坑不拉屎是非常不道德的,于是需要對此做點(diǎn)事情,造成內(nèi)存已釋放的“假象”。這里強(qiáng)調(diào)一下,虛擬機(jī)知道哪塊內(nèi)存正在使用、哪塊內(nèi)存不需再用就行了,實(shí)際上程序吃的內(nèi)存還是沒有減少。聲明一下,下文提到的申請和釋放內(nèi)存講的都是“假象”。
如何實(shí)現(xiàn)這個(gè)機(jī)制呢?本能地想到引用計(jì)數(shù),記錄下到底有多少個(gè)對象引用這塊內(nèi)存,如果引用計(jì)數(shù)為0就釋放內(nèi)存。后來才意識到引用計(jì)數(shù)是行不通的,萬一有環(huán)形數(shù)據(jù)結(jié)構(gòu)(如一個(gè)對象自己引用自己),顯然會造成內(nèi)存泄漏。然后就動了對象池的念頭,如果用這種方法,需要很多個(gè)對象池,包括虛擬機(jī)運(yùn)行中的表、堆棧里的各種數(shù)據(jù)類型的對象,這么多個(gè)對象池看著很礙眼,于是還是決定實(shí)現(xiàn)垃圾收集器。
下面介紹垃圾收集器的工作機(jī)制。內(nèi)存單元并不會在變成垃圾的同時(shí)就立刻被回收,而是保持不可到達(dá)的狀態(tài),直到內(nèi)存被耗盡或者內(nèi)存分配達(dá)到某個(gè)閾值,用戶程序會被掛起,此時(shí)才進(jìn)行垃圾收集,也就是先標(biāo)記正在使用的內(nèi)存,再清除垃圾,即內(nèi)存回收。垃圾收集器回收足夠的內(nèi)存后,用戶程序就可以繼續(xù)工作。如國無法恢復(fù)足夠多的內(nèi)存,則拋出異常。
1. 標(biāo)記
標(biāo)記是為了識別垃圾,依靠對所有存活對象進(jìn)行一次全局遍歷來確定哪些內(nèi)存可以回收。這個(gè)遍歷從根出發(fā)(運(yùn)行時(shí)的棧和表),利用相互引用關(guān)系,標(biāo)記所有存活對象,除此之外,其他內(nèi)存就是垃圾。這里強(qiáng)調(diào)下,標(biāo)記并不會沿著已經(jīng)被標(biāo)記的單元追蹤下去,這確保了標(biāo)記能夠終止。
2. 縮并
用戶程序在堆上分配多種大小不同的對象,經(jīng)過標(biāo)記,我們發(fā)現(xiàn),堆空間變得破碎,如果不擴(kuò)展堆,也許就無法分配一個(gè)大型對象,因?yàn)檎也坏揭粋€(gè)足夠大的“空洞”容納新的對象 ,即使空閑內(nèi)存的總量是足夠的。還有另外一個(gè)問題,經(jīng)過若干個(gè)垃圾收集周期后,分配一個(gè)小型對象要采用什么算法?首次匹配代價(jià)低點(diǎn),但是會產(chǎn)生更多碎片;最佳匹配產(chǎn)生的碎片少了,但是耗費(fèi)的代價(jià)高。這顯然提高了內(nèi)存分配的難度。基于以上的討論,對內(nèi)存進(jìn)行縮并就是自然的事了。即把空閑的內(nèi)存掃到一起,也把正在使用的內(nèi)存掃到一起,這樣就把堆空間分成了兩部分。這樣空閑的內(nèi)存連續(xù)了,也就解決了內(nèi)存碎片的問題。當(dāng)為新對象分配內(nèi)存時(shí),再也不用尋找合適的“空洞”,只需把記錄空閑內(nèi)存的基點(diǎn)后移,大大提高了內(nèi)存分配的效率。
3. 分代收集
我們先有這樣的假設(shè):大多數(shù)對象都在年輕的時(shí)候死亡,而越老的對象則越不可能死亡。在垃圾收集的過程中,用戶程序是被掛起的,如果對整個(gè)堆都進(jìn)行垃圾收集,顯然用戶程序等待的時(shí)間是很長的。如果我們能把工作集中在回收最有可能是垃圾的對象上,就能讓內(nèi)存回收的效率更高,對用戶程序的影響更小。
基于以上假設(shè),我們需要區(qū)分年輕對象和年老對象。把對象按年齡分到堆中的不同區(qū)域里,其中最年輕的分代會被頻繁地收集,而較老的分代則收集頻率會低得多。對象首先在最年輕的分代里分配,如果它們的壽命足夠長,能夠在足夠多次收集中存活下來(這里就是一次),則會被提升到較老的分代里。這里注意一下,較老的對象可能引用了較年輕的對象,我們?nèi)孕鑼Υ诉M(jìn)行掃描,但是我們現(xiàn)在不必把年老的對象從一個(gè)半?yún)^(qū)復(fù)制到另一個(gè)半?yún)^(qū)了,將垃圾收集器的努力集中在回收最年輕的分代所占據(jù)的內(nèi)存上,節(jié)省了用戶等待的時(shí)間。
posted on 2010-05-14 12:59
Lyt 閱讀(2211)
評論(3) 編輯 收藏 引用 所屬分類:
垃圾收集器