到昨天為止,yfgc中的核心代碼,我覺得是看完了。
從gc_malloc中,了解到分配出來的內存如何進行管理;
從gc_link中,了解到如何在兩塊內存之間建立引用依賴關系;
從gc_enter和gc_leave中,了解到通過gc_malloc分配出來的自由內存是如何在調用堆棧上記錄的;
從gc_collect中,整合了以上所有的內容,了解到整個依賴樹是如何建立固定部分和自動部分,以及如何標記出垃圾和非垃圾內存的區別并進行回收的。
不過,在gc_collect的實現中,還是有些WEAK_CONTAINER的內容無法理解,因此今晚就來看看weak table吧。
weak table我譯為弱表,什么是弱表呢?弱表可以看作一個容器,容器內的元素為其他內存的指針,也就是容器和其他內存之間建立了引用依賴關系。只是這種引用是弱引用,其依賴關系通常會在gc_collect的時候被系統自動解除,以便于將容器中所指向的內存進行回收(如果這些內存沒有在其他地方被強引用的話)。因此弱表引用的內存通常不能直接持有,因為其生命期是沒有保證的,只能通過弱表進行查找訪問。我的解釋可能不太準確,有興趣的同學自己google一下吧。
解釋了概念,接下來看看代碼
1
struct gc_weak_table
{
2
int node_id;
3
};
4
5
struct gc_weak_table*
6
gc_weak_table(void *parent)
7

{
8
struct gc_weak_table *ret=my_malloc(sizeof(*ret));
9
ret->node_id=map_id(ret);
10
E.pool[ret->node_id].u.c.weak=WEAK_CONTAINER;
11
if (parent)
{
12
gc_link(parent,0,ret);
13
}
14
else
{
15
stack_push(ret->node_id);
16
}
17
return ret;
18
}
首先,gc_weak_table的成員變量node_id,用來保存他在 E.pool中的索引。保存這個的作用是,用來定位弱表中所引用的內存的存放位置,看gc_weak_next的時候就知道了。


2

3

4

5

6

7



8

9

10

11



12

13

14



15

16

17

18

至于gc_weak_table函數的實現非常熟悉,其實就是gc_malloc,再加上一些特殊代碼罷了。第9行,對自身內存的id賦值。第10行,用WEAK_CONTAINER將自己的節點標記為弱表節點,這樣在gc_collect的時候就會得到特殊照顧了,這點后面再說。
1
void*
2
gc_weak_next(struct gc_weak_table *cont,int *iter)
3

{
4
int i,j;
5
struct link *children = E.pool[cont->node_id].u.n.children;
6
if (children==0)
{
7
return 0;
8
}
9
10
for (i = (iter==0 ? 0 : *iter) ;i < children->number; i++)
{
11
int id=children->children[i];
12
if (id)
{
13
if (E.pool[id].u.c.mem == FREED_POINTER)
{
14
children->children[i] = 0;
15
}
16
else
{
17
if (iter)
{
18
*iter=i+1;
19
}
20
stack_push(id);
21
return E.pool[id].u.n.mem;
22
}
23
}
24
}
25
26
for (i=0;i<children->number;i++)
{
27
if (children->children[i]==0)
{
28
break;
29
}
30
}
31
32
for (j=i,++i;i<children->number;i++)
{
33
if (children->children[i]!=0)
{
34
children->children[j++]=children->children[i];
35
}
36
}
37
38
children->number=j;
39
40
return 0;
41
}
gc_weak_next用來遍歷弱表中所有引用的內存,參數cont即弱表本身,參數iter為弱表所引用的內存的位置索引,通常初始值為1,被gc_weak_next遞增改變。
2

3



4

5

6



7

8

9

10



11

12



13



14

15

16



17



18

19

20

21

22

23

24

25

26



27



28

29

30

31

32



33



34

35

36

37

38

39

40

41

從第5行可知,其實弱表所引用的內存就在children中。第10行的for循環體,遍歷children查找一塊還有效的引用內存。第20行將他stack_push,因為這是要return的,最少會被外部所持有,因此壓入自由內存堆棧,稍微延長生命期。
剩下的代碼,是用來刪除已經被回收的child內存(對應的chidren[i]=0),稍微看看就能理解了。
弱表的代碼就這么多,通過gc_weak_next的實現,可以得知,仍舊是通過gc_link來將內存添加到弱表中的,只要弱表是parent即可。
好了,現在可以回頭看看在gc_collect中和弱表有關的代碼了,如果沒有弱表,整個gc庫的if、else什么的會少得多。
1
static void
2
gc_mark(int root)
3

{
4
if (E.pool[root].u.c.weak==WEAK_CONTAINER)
{
5
for (i=children->number-1;i>=0;i--)
{
6
gc_mark_weak(children->children[i]);
7
}
8
}
9
}
10
11
static __inline void
12
gc_mark_weak(int weak)
13

{
14
if (E.pool[weak].mark < E.mark)
{
15
E.pool[weak].mark=E.mark;
16
}
17
}
在gc_mark對依賴關系做標記的時候,有一個關于WEAK_CONTAINER的分支判斷,對弱表所引用的內存節點執行的是gc_mark_weak,而gc_mark_weak的實現則是將節點的mark賦值為E.mark。這也就解釋了為什么在gc_collect的時候,會存在E.pool[i].mark == E.mark的情形,這是弱表所引用的內存被標記的結果,因此弱表所引用的內存,在gc_collect的時候就被回收,不過并沒有用node_free釋放對應的內存節點,而是做了一個標記
2

3



4



5



6

7

8

9

10

11

12

13



14



15

16

17


為啥非要主動遍歷弱表才能這樣呢。。。。