在平時的應用設計中,由于出現多線程(進程)的并發應用,以及分布式應用,比較容易出現死鎖現象。
下面來看一個簡單的實例:
有兩個獨立的鏈表,假定使用兩個獨立的鎖來保護他們,以便能夠獨立的訪問。再假定某個操作要求遍歷一個列表所檢索到的元素必須從兩個列表中斷開連接,
而且必須以一次
原子操作來完成。
線程1 | 線程2
lock(&lock_a); | lock(&lock_b);
find element to unlink on list a | find element to unlink on list b
lock(&lock_b); | lock(&lock_a);
unlink element from both lists | unlink element from both lists
unlock(&lock_b); | unlock(&lock_a);
unlock(&lock_a); | unlock(&lock_b);
可能出現死鎖的情況。
這要求在消除一個元素是必須同時擁有兩個列表的鎖。對第一個線程要先或得鎖lock_a, 然后要或得鎖lock_b.
第2個線程正好相反,它先或得鎖lock_b,然后再獲取鎖lock_a.
如果某一時刻,第一個線程執行到了 find element to unlink on list a, 而第二個線程此時執行到了find element to unlink on list b, 則這兩個線程將發生死鎖。
這種死鎖稱為AB-BA死鎖。 (注,死鎖的發生是跟兩個線程的執行時序相關的,例如,第一個線程執行完了所有的這部分代碼,線程2才開始執行此段代碼,則不會發生死鎖。)
如果某個鎖不是遞歸鎖,例如lock_a, 而線程1在應用中對它進行多個調用,而沒有調用解鎖操作,也會發生死鎖。
代碼示例如下:
lock(&lock_a);
other logic code
lock(&lock_a);
other logic code
unlock(&lock_a);
unlock(&lock_a);
防止死鎖的辦法: 為了防止發生這類死鎖,所有線程必須以相同的次序獲得嵌套鎖,即以相同的次序獲得且同時占有鎖。
可以把上面的代碼改成如下代碼來避免死鎖:
lock(&lock_a);
lock(&lock_b);
find element to unlink on list a or b
unlink element from both lists
unlock(&lock_b);
unlock(&lock_a);
當涉及到3個或者更多鎖的時候也是如此:只要各線程在獲得和釋放鎖的時候保持相同的次序,那么就不會出現死鎖。