• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆 - 17  文章 - 48  trackbacks - 0
            <2013年4月>
            31123456
            78910111213
            14151617181920
            21222324252627
            2829301234
            567891011

            常用鏈接

            留言簿(3)

            隨筆檔案

            搜索

            •  

            最新評(píng)論

            閱讀排行榜

            評(píng)論排行榜

            GC的分類

            通常情況下GC分為兩種,分別是:掃描GC(Tracing GC)和引用計(jì)數(shù)GC(Reference counting GC)。其中掃描GC是比較常用的GC實(shí)現(xiàn)方法,其原理是:把正在使用的對(duì)象找出來,然后把未被使用的對(duì)象釋放。而引用計(jì)數(shù)GC則是對(duì)每個(gè)對(duì)象都添加一個(gè)計(jì)數(shù)器,引用增加一個(gè)計(jì)數(shù)器就加一,引用減少一個(gè)計(jì)數(shù)器就減一,當(dāng)計(jì)數(shù)器減至零時(shí),把對(duì)象回收釋放。引用計(jì)數(shù)GC跟C++中的shared_ptr類似,自然也會(huì)存在循環(huán)引用問題。

            掃描GC(Tracing GC)是廣泛使用的GC方法,最簡(jiǎn)單的實(shí)現(xiàn)方式是mark-sweep,即掃描所有存活的對(duì)象并mark,然后遍歷整個(gè)GC對(duì)象列表,把所有標(biāo)記過的對(duì)象清除標(biāo)記,把未標(biāo)記過的對(duì)象釋放。如果GC使用的是mark-sweep方法,程序運(yùn)行一段時(shí)間后觸發(fā)了GC,每次GC的時(shí)候會(huì)把當(dāng)前程序中的所有對(duì)象都掃描一次,然后釋放未使用的對(duì)象。這對(duì)于分配GC對(duì)象少的程序來說沒有什么問題,當(dāng)程序中存在大量分配GC對(duì)象時(shí),每次啟動(dòng)GC掃描所有對(duì)象的代價(jià)是很高的,又因?yàn)镚C的過程通常是stop-the-world,所以高代價(jià)的GC會(huì)導(dǎo)致整個(gè)程序卡頓一段時(shí)間。對(duì)于這個(gè)問題,解決方法有增量GC(Incremental GC)和分代GC(Generational GC)。

            增量GC(Incremental GC)會(huì)把整個(gè)GC過程分成很多步(phase),每步的執(zhí)行可以存在一定間隔運(yùn)行程序本身,這就盡量把stop-the-world的時(shí)間變短,使得程序不會(huì)因?yàn)镚C而導(dǎo)致延遲太大。Lua默認(rèn)采用的是這種實(shí)現(xiàn)方法,Lua 5.2中也引入了分代GC作為備選GC方法。

            分代GC(Generational GC)把對(duì)象分成幾代(Generation),通常把GC分為兩種:Minor GC和Major GC。剛剛分配出來的對(duì)象屬于最年輕的一代,在一次GC過后把年輕代中存活的對(duì)象上升到年老的一代中。把只掃描年輕一代的對(duì)象以減少掃描對(duì)象數(shù)量的GC過程稱為Minor GC,只有在特定情況下才會(huì)啟動(dòng)完整的Major GC。分代GC是基于在大多數(shù)程序中新創(chuàng)建的對(duì)象同時(shí)也是最快變成無效的對(duì)象的經(jīng)驗(yàn)設(shè)計(jì)的,對(duì)年輕代對(duì)象GC時(shí),可以釋放大多數(shù)無效對(duì)象,存活下來的對(duì)象一般存活時(shí)間也會(huì)更長,因此把它們上升到下一代中以減少最這些對(duì)象的掃描。

            對(duì)于GC內(nèi)存的管理,有移動(dòng)和非移動(dòng)之分。移動(dòng)的就是把一次GC過后存活的對(duì)象compact到一起,使GC管理的內(nèi)存保持連續(xù),這里增加了一個(gè)移動(dòng)對(duì)象的開銷,不過它也同樣帶來不少好處:分配釋放對(duì)象快和更快的序列遍歷(在CPU cache中及在同一個(gè)Virtual memory page中)。正因?yàn)樗鼤?huì)把對(duì)象compact到一起,對(duì)象的地址就會(huì)發(fā)生變化,這也就導(dǎo)致一個(gè)明顯的缺點(diǎn),不能使用指針引用GC對(duì)象。

            其它高級(jí)GC方法,比如.NET的background GC,幾乎不需要stop-the-world就可以在GC線程中完成GC,這種高科技的GC對(duì)于我這種初級(jí)人士基本屬于不可想象。

            初級(jí)分代GC設(shè)計(jì)

            了解了基本的GC方法之后,我為luna第二版實(shí)現(xiàn)了一個(gè)初級(jí)的分代GC,把對(duì)象分成三代:GCGen0,GCGen1,GCGen2:

               GCGen0是最年輕的一代,默認(rèn)所有對(duì)象都是分配在這代中。
               GCGen1是年老的一代,在一次GC過后GCGen0代存活的對(duì)象會(huì)移動(dòng)到這一代中。
               GCGen2是最老的一代,一般情況下用于存放編譯時(shí)分配的會(huì)長期存在的對(duì)象,比如函數(shù)及字符串常量。

            由于我在很多地方直接引用了GC對(duì)象的指針,為了簡(jiǎn)單起見,我沒有在GC之后移動(dòng)對(duì)象,而是對(duì)每個(gè)對(duì)象單獨(dú)分配釋放內(nèi)存。每個(gè)對(duì)象都有Generation標(biāo)記和GC標(biāo)記以及一個(gè)用于指向跟自己屬于同代的GC對(duì)象的指針。

            Minor GC對(duì)GCGen0代對(duì)象mark-sweep,并把存活的對(duì)象移動(dòng)到GCGen1代中。既然需要mark,自然需要對(duì)所有GCGen0代存活的對(duì)象標(biāo)記,這通過對(duì)root對(duì)象的遍歷完成,root是指所有對(duì)象的引用入口,比如程序的棧和全局表。對(duì)于Minor GC的root對(duì)象遍歷最簡(jiǎn)單的方法是跟Major GC的root遍歷完全一致,不過這樣的遍歷對(duì)于本來就是為了減少遍歷對(duì)象的Minor GC來說似乎不合,所以通常只對(duì)某一小塊root遍歷,比如只對(duì)棧上的對(duì)象遍歷,然后再把存活的對(duì)象保留不存活的對(duì)象釋放。

            Minor GC的root遍歷存在一個(gè)問題:假設(shè)只把棧上的對(duì)象作為root遍歷,會(huì)存在一些從GCGen0代分配出來的對(duì)象沒有被棧上的對(duì)象引用,而被全局表中的某個(gè)對(duì)象引用,或者其它某個(gè)非GCGen0對(duì)象引用了,這樣對(duì)GCGen0代sweep的時(shí)候可能會(huì)把這個(gè)存活的對(duì)象當(dāng)做無效對(duì)象而釋放掉,這種操作自然也就會(huì)導(dǎo)致整個(gè)程序crash。于是為了控制root遍歷的范圍,又要解決這個(gè)問題,對(duì)非GCGen0對(duì)象引用GCGen0對(duì)象的時(shí)候,需要把這個(gè)非GCGen0的對(duì)象也加入到root遍歷列表中去。這時(shí)引入了barrier,對(duì)于非GCGen0對(duì)象引用GCGen0對(duì)象時(shí),把這個(gè)非GCGen0的對(duì)象放到barrier列表中。

            Major GC是一個(gè)完整的GC,它遍歷所有的root并mark,并把所有的無效的對(duì)象都sweep釋放。

            GC啟動(dòng)的時(shí)機(jī)

            GC什么時(shí)候啟動(dòng)是一個(gè)需要仔細(xì)考慮的問題,由于我實(shí)現(xiàn)的GC并沒有自己管理內(nèi)存(Lua也沒有自己管理內(nèi)存,所有內(nèi)存分配都通過realloc),所以我把GCGen0代和GCGen1代的對(duì)象數(shù)量作為啟動(dòng)時(shí)機(jī)的衡量指標(biāo),當(dāng)GCGen0和GCGen1的對(duì)象數(shù)量大于它們的閾值時(shí),分別啟動(dòng)Minor GC和Major GC。我覺得對(duì)象的數(shù)量比起內(nèi)存占用大小(各種復(fù)雜的GC對(duì)象導(dǎo)致內(nèi)存占用很難精確的統(tǒng)計(jì),Lua的內(nèi)存統(tǒng)計(jì)也不夠精確)更能反映GC時(shí)間的長短,如果兩者結(jié)合也許會(huì)更好。

            通過判斷GC對(duì)象個(gè)數(shù)超過閾值時(shí)啟動(dòng)GC,同時(shí)需要在GC之后自動(dòng)調(diào)整閾值大小。比如某些程序很快的達(dá)到GCGen0的閾值并在Minor GC之后有超過一半的對(duì)象還是存活的,這時(shí)需要把閾值調(diào)大,以減少GC啟動(dòng)的次數(shù),這個(gè)閾值也不能無限擴(kuò)大,這不僅會(huì)導(dǎo)致一段時(shí)間內(nèi)內(nèi)存占用一直上升,也會(huì)導(dǎo)致一旦觸發(fā)GC所需掃描的對(duì)象數(shù)量太多,GC耗時(shí)太長,程序運(yùn)行的延時(shí)增加。

            結(jié)語

            為了減少stop-the-world的時(shí)間,引入的各種方法都會(huì)讓GC實(shí)現(xiàn)難度加大。GC是一個(gè)復(fù)雜的東西,網(wǎng)上所能找到的資料文章似乎不太多,而有關(guān)GC的書,目前只發(fā)現(xiàn)《The Garbage Collection Handbook》(我還沒有看過),而這本書既沒有pdf也沒有kindle版,只能在美國Amazon上買紙質(zhì)書。另外一個(gè)參考資料就是各個(gè)語言的實(shí)現(xiàn)源碼了。
            posted on 2013-11-17 22:20 airtrack 閱讀(2647) 評(píng)論(1)  編輯 收藏 引用

            FeedBack:
            # re: 初級(jí)分代GC 2013-11-19 23:20 fyxtc
            寫得很好~  回復(fù)  更多評(píng)論
              

            只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


            久久久久亚洲AV无码专区网站 | 免费观看成人久久网免费观看| 亚洲精品无码久久久久sm| 色综合久久久久综合体桃花网| 精品国产VA久久久久久久冰| 国产精品伊人久久伊人电影| 久久精品国产亚洲αv忘忧草| 久久精品国产免费| 无码精品久久久久久人妻中字| 老色鬼久久亚洲AV综合| 少妇人妻综合久久中文字幕| 国产亚州精品女人久久久久久 | 国产精品成人99久久久久91gav| 香蕉久久AⅤ一区二区三区| 国内精品久久人妻互换| 久久久久久久综合综合狠狠| 久久精品国产福利国产秒| 合区精品久久久中文字幕一区| 国产精品一区二区久久国产| 国产精品99久久久精品无码| 国内精品欧美久久精品| 狠狠久久亚洲欧美专区| 日韩精品久久久肉伦网站| 欧美亚洲日本久久精品| 2020最新久久久视精品爱| 91精品国产高清久久久久久91| 国产精品99久久久久久宅男小说| 国内精品久久久久久久久| 久久99国产综合精品| 日韩精品久久无码人妻中文字幕 | 久久国产视屏| 精品国产一区二区三区久久蜜臀| 久久精品国产免费| 国产成人久久激情91| 国产精品免费看久久久香蕉| 国产精品一区二区久久不卡| 久久精品中文闷骚内射| 国产日韩久久久精品影院首页| 久久精品人人做人人爽电影| 91麻精品国产91久久久久| 草草久久久无码国产专区|