太久沒有更新blog了,慚愧下先,下邊進入正題。
最近在實現(xiàn)一個閹割版的函數(shù)式語言(編譯器已完成,虛擬機在憋的過程中,之后會發(fā)帖),希望內(nèi)存管理的部分由虛擬機來完成,而不是由客戶自己折騰,這樣顯然可以降低客戶使用這門語言的難度,比如不需要擔(dān)心內(nèi)存泄漏,減少內(nèi)存運用不當(dāng)?shù)腷ug,這里客戶只管放心地一直申請內(nèi)存就行,不再需要手工釋放內(nèi)存(如果讓客戶選擇是否自己釋放都行,會提高難度,起碼得做個平衡樹放著這些申請的內(nèi)存地址便于查找,這里先偷懶)。
首先講一下虛擬機的內(nèi)存管理機制。眾所周知,頻繁地申請和釋放內(nèi)存會大大降低效率,所以我們可以在虛擬機運行一開始的時候就統(tǒng)一申請內(nèi)存,虛擬機運行結(jié)束在統(tǒng)一釋放內(nèi)存。如果中間有某些內(nèi)存已經(jīng)不需要再次使用,繼續(xù)占著茅坑不拉屎是非常不道德的,于是需要對此做點事情,造成內(nèi)存已釋放的“假象”。這里強調(diào)一下,虛擬機知道哪塊內(nèi)存正在使用、哪塊內(nèi)存不需再用就行了,實際上程序吃的內(nèi)存還是沒有減少。聲明一下,下文提到的申請和釋放內(nèi)存講的都是“假象”。
如何實現(xiàn)這個機制呢?本能地想到引用計數(shù),記錄下到底有多少個對象引用這塊內(nèi)存,如果引用計數(shù)為0就釋放內(nèi)存。后來才意識到引用計數(shù)是行不通的,萬一有環(huán)形數(shù)據(jù)結(jié)構(gòu)(如一個對象自己引用自己),顯然會造成內(nèi)存泄漏。然后就動了對象池的念頭,如果用這種方法,需要很多個對象池,包括虛擬機運行中的表、堆棧里的各種數(shù)據(jù)類型的對象,這么多個對象池看著很礙眼,于是還是決定實現(xiàn)垃圾收集器。
下面介紹垃圾收集器的工作機制。內(nèi)存單元并不會在變成垃圾的同時就立刻被回收,而是保持不可到達的狀態(tài),直到內(nèi)存被耗盡或者內(nèi)存分配達到某個閾值,用戶程序會被掛起,此時才進行垃圾收集,也就是先標(biāo)記正在使用的內(nèi)存,再清除垃圾,即內(nèi)存回收。垃圾收集器回收足夠的內(nèi)存后,用戶程序就可以繼續(xù)工作。如國無法恢復(fù)足夠多的內(nèi)存,則拋出異常。
1. 標(biāo)記
標(biāo)記是為了識別垃圾,依靠對所有存活對象進行一次全局遍歷來確定哪些內(nèi)存可以回收。這個遍歷從根出發(fā)(運行時的棧和表),利用相互引用關(guān)系,標(biāo)記所有存活對象,除此之外,其他內(nèi)存就是垃圾。這里強調(diào)下,標(biāo)記并不會沿著已經(jīng)被標(biāo)記的單元追蹤下去,這確保了標(biāo)記能夠終止。
2. 縮并
用戶程序在堆上分配多種大小不同的對象,經(jīng)過標(biāo)記,我們發(fā)現(xiàn),堆空間變得破碎,如果不擴展堆,也許就無法分配一個大型對象,因為找不到一個足夠大的“空洞”容納新的對象 ,即使空閑內(nèi)存的總量是足夠的。還有另外一個問題,經(jīng)過若干個垃圾收集周期后,分配一個小型對象要采用什么算法?首次匹配代價低點,但是會產(chǎn)生更多碎片;最佳匹配產(chǎn)生的碎片少了,但是耗費的代價高。這顯然提高了內(nèi)存分配的難度。基于以上的討論,對內(nèi)存進行縮并就是自然的事了。即把空閑的內(nèi)存掃到一起,也把正在使用的內(nèi)存掃到一起,這樣就把堆空間分成了兩部分。這樣空閑的內(nèi)存連續(xù)了,也就解決了內(nèi)存碎片的問題。當(dāng)為新對象分配內(nèi)存時,再也不用尋找合適的“空洞”,只需把記錄空閑內(nèi)存的基點后移,大大提高了內(nèi)存分配的效率。
3. 分代收集
我們先有這樣的假設(shè):大多數(shù)對象都在年輕的時候死亡,而越老的對象則越不可能死亡。在垃圾收集的過程中,用戶程序是被掛起的,如果對整個堆都進行垃圾收集,顯然用戶程序等待的時間是很長的。如果我們能把工作集中在回收最有可能是垃圾的對象上,就能讓內(nèi)存回收的效率更高,對用戶程序的影響更小。
基于以上假設(shè),我們需要區(qū)分年輕對象和年老對象。把對象按年齡分到堆中的不同區(qū)域里,其中最年輕的分代會被頻繁地收集,而較老的分代則收集頻率會低得多。對象首先在最年輕的分代里分配,如果它們的壽命足夠長,能夠在足夠多次收集中存活下來(這里就是一次),則會被提升到較老的分代里。這里注意一下,較老的對象可能引用了較年輕的對象,我們?nèi)孕鑼Υ诉M行掃描,但是我們現(xiàn)在不必把年老的對象從一個半?yún)^(qū)復(fù)制到另一個半?yún)^(qū)了,將垃圾收集器的努力集中在回收最年輕的分代所占據(jù)的內(nèi)存上,節(jié)省了用戶等待的時間。