5、線程關(guān)聯(lián)內(nèi)存池再提速
上一節(jié)已經(jīng)提到問題,解決辦法是這樣的
struct tm_bufunit
{
tm_pool *pool; //pool指針
union
{
tm_bufunit *next; //下一個塊指針
char data[4]; //數(shù)據(jù)區(qū)域
};
};
static void *tm_malloc(size_t size, size_t *osize=NULL)
{
tm_bufunit *p = (tm_bufunit *)malloc(sizeof(tm_bufunit)-offsetof(tm_bufunit, data)+size);
if(p)
{
p->pool = NULL;
if(osize) *osize = size;
return p->data;
}
return NULL;
}
看上面的代碼應(yīng)該很容易明白,就是將由該池malloc的內(nèi)存塊也打上統(tǒng)一的標(biāo)記,這樣由該池分配的任何內(nèi)存塊都可用最簡單的判斷釋放,省去了查找線程查找目標(biāo)池的兩次查詢,不光提速了而且解決了上一節(jié)提到的那個bug。
最終實現(xiàn)的線程關(guān)聯(lián)內(nèi)存池通用分配函數(shù)tm_new大概相當(dāng)于malloc 15倍左右的速度,定位到pool之后的newobj相當(dāng)于malloc 45倍左右的速度。通用函數(shù)大致相當(dāng)于nedmalloc速度的2.6-3倍,直接定位到pool的分配速度大概相當(dāng)于dlmalloc 的2倍。
關(guān)于線程關(guān)聯(lián)的內(nèi)存池還有一些細(xì)節(jié)問題我沒有展開討論,如free表是每個線程保留一份還是全局保留一份,如果是全局保留一份則涉及到復(fù)用的時候如何分配,還有就是tls系列函數(shù)我看nedmalloc也在用,我第一版也在用,但后來實測發(fā)現(xiàn)這些函數(shù)貌似效率不高,后面的版本沒有采用tls系列函數(shù)。
關(guān)于線程關(guān)聯(lián)的內(nèi)存池我寫了5個版本,當(dāng)然最重要的還是第一個版本,后面的版本除了這一節(jié)提到的重要改進(jìn)之外變化不是很大,最后的第五版增了一些和我的私有lib相關(guān)的功能。
以前寫文章太少,總是看別人的文章,在網(wǎng)絡(luò)時代覺得自己挺自私,這次一鼓作氣,一口氣寫了出來,可能寫得很粗略,不知道有多少人能看明白,如能給讀者一點啟示我將感到很欣慰。