• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            loop_in_codes

            低調(diào)做技術(shù)__歡迎移步我的獨立博客 codemaro.com 微博 kevinlynx

            圖解分布式一致性協(xié)議Paxos

            Paxos協(xié)議/算法是分布式系統(tǒng)中比較重要的協(xié)議,它有多重要呢?

            <分布式系統(tǒng)的事務(wù)處理>

            Google Chubby的作者M(jìn)ike Burrows說過這個世界上只有一種一致性算法,那就是Paxos,其它的算法都是殘次品。

            <大規(guī)模分布式存儲系統(tǒng)>

            理解了這兩個分布式協(xié)議之后(Paxos/2PC),學(xué)習(xí)其他分布式協(xié)議會變得相當(dāng)容易。

            學(xué)習(xí)Paxos算法有兩部分:a) 算法的原理/證明;b) 算法的理解/運作。

            理解這個算法的運作過程其實基本就可以用于工程實踐。而且理解這個過程相對來說也容易得多。

            網(wǎng)上我覺得講Paxos講的好的屬于這篇:paxos圖解Paxos算法詳解,我這里就結(jié)合wiki上的實例進(jìn)一步闡述。一些paxos基礎(chǔ)通過這里提到的兩篇文章,以及wiki上的內(nèi)容基本可以理解。

            算法內(nèi)容

            Paxos在原作者的《Paxos Made Simple》中內(nèi)容是比較精簡的:

            Phase 1

            (a) A proposer selects a proposal number n and sends a prepare request with number n to a majority of acceptors.

            (b) If an acceptor receives a prepare request with number n greater than that of any prepare request to which it has already responded, then it responds to the request with a promise not to accept any more proposals numbered less than n and with the highest-numbered pro-posal (if any) that it has accepted.

            Phase 2

            (a) If the proposer receives a response to its prepare requests (numbered n) from a majority of acceptors, then it sends an accept request to each of those acceptors for a proposal numbered n with a value v , where v is the value of the highest-numbered proposal among the responses, or is any value if the responses reported no proposals.

            (b) If an acceptor receives an accept request for a proposal numbered n, it accepts the proposal unless it has already responded to a prepare request having a number greater than n.

            借用paxos圖解文中的流程圖可概括為:

            實例及詳解

            Paxos中有三類角色ProposerAcceptorLearner,主要交互過程在ProposerAcceptor之間。

            ProposerAcceptor之間的交互主要有4類消息通信,如下圖:

            這4類消息對應(yīng)于paxos算法的兩個階段4個過程:

            • phase 1
              • a) proposer向網(wǎng)絡(luò)內(nèi)超過半數(shù)的acceptor發(fā)送prepare消息
              • b) acceptor正常情況下回復(fù)promise消息
            • phase 2
              • a) 在有足夠多acceptor回復(fù)promise消息時,proposer發(fā)送accept消息
              • b) 正常情況下acceptor回復(fù)accepted消息

            因為在整個過程中可能有其他proposer針對同一件事情發(fā)出以上請求,所以在每個過程中都會有些特殊情況處理,這也是為了達(dá)成一致性所做的事情。如果在整個過程中沒有其他proposer來競爭,那么這個操作的結(jié)果就是確定無異議的。但是如果有其他proposer的話,情況就不一樣了。

            paxos中文wiki上的例子為例。簡單來說該例子以若干個議員提議稅收,確定最終通過的法案稅收比例。

            以下圖中基本只畫出proposer與一個acceptor的交互。時間標(biāo)志T2總是在T1后面。propose number簡稱N。

            情況之一如下圖:

            A3在T1發(fā)出accepted給A1,然后在T2收到A5的prepare,在T3的時候A1才通知A5最終結(jié)果(稅率10%)。這里會有兩種情況:

            • A5發(fā)來的N5小于A1發(fā)出去的N1,那么A3直接拒絕(reject)A5
            • A5發(fā)來的N5大于A1發(fā)出去的N1,那么A3回復(fù)promise,但帶上A1的(N1, 10%)

            這里可以與paxos流程圖對應(yīng)起來,更好理解。acceptor會記錄(MaxN, AcceptN, AcceptV)

            A5在收到promise后,后續(xù)的流程可以順利進(jìn)行。但是發(fā)出accept時,因為收到了(AcceptN, AcceptV),所以會取最大的AcceptN對應(yīng)的AcceptV,例子中也就是A1的10%作為AcceptV。如果在收到promise時沒有發(fā)現(xiàn)有其他已記錄的AcceptV,則其值可以由自己決定。

            針對以上A1和A5沖突的情況,最終A1和A5都會廣播接受的值為10%。

            其實4個過程中對于acceptor而言,在回復(fù)promise和accepted時由于都可能因為其他proposer的介入而導(dǎo)致特殊處理。所以基本上看在這兩個時間點收到其他proposer的請求時就可以了解整個算法了。例如在回復(fù)promise時則可能因為proposer發(fā)來的N不夠大而reject:

            如果在發(fā)accepted消息時,對其他更大N的proposer發(fā)出過promise,那么也會reject該proposer發(fā)出的accept,如圖:

            這個對應(yīng)于Phase 2 b):

            it accepts the proposal unless it has already responded to a prepare request having a number greater than n.

            總結(jié)

            Leslie Lamport沒有用數(shù)學(xué)描述Paxos,但是他用英文闡述得很清晰。將Paxos的兩個Phase的內(nèi)容理解清楚,整個算法過程還是不復(fù)雜的。

            至于Paxos中一直提到的一個全局唯一且遞增的proposer number,其如何實現(xiàn),引用如下:

            如何產(chǎn)生唯一的編號呢?在《Paxos made simple》中提到的是讓所有的Proposer都從不相交的數(shù)據(jù)集合中進(jìn)行選擇,例如系統(tǒng)有5個Proposer,則可為每一個Proposer分配一個標(biāo)識j(0~4),則每一個proposer每次提出決議的編號可以為5*i + j(i可以用來表示提出議案的次數(shù))

            參考文檔

            posted on 2014-10-15 22:45 Kevin Lynx 閱讀(10370) 評論(6)  編輯 收藏 引用 所屬分類: network

            評論

            # re: 圖解分布式一致性協(xié)議Paxos 2014-10-16 09:44 zuhd

            簡直看不懂~~~  回復(fù)  更多評論   

            # re: 圖解分布式一致性協(xié)議Paxos[未登錄] 2014-10-17 22:33 楊粼波

            @zuhd 看下ZooKeeper就明白了,ZooKeeper是Paxos算法的實現(xiàn)。  回復(fù)  更多評論   

            # re: 圖解分布式一致性協(xié)議Paxos 2014-12-12 11:32 IT技術(shù)

            博主,http://it.taocms.org/10/5777.htm是包含“知識來源”的說明的  回復(fù)  更多評論   

            # re: 圖解分布式一致性協(xié)議Paxos 2015-01-10 09:45 jogos do friv

            簡直看不懂  回復(fù)  更多評論   

            # re: 圖解分布式一致性協(xié)議Paxos 2016-02-22 12:11 tievoli

            very nice...  回復(fù)  更多評論   

            # re: 圖解分布式一致性協(xié)議Paxos 2016-06-20 12:04 MaxLiu

            acceptor 階段2 if(K > MaxN) 的約束少了個, 除了令 AcceptN = K, AcceptV = V 外, 還要令 MaxN = K.  回復(fù)  更多評論   

            久久婷婷五月综合97色一本一本 | 久久精品国产欧美日韩99热| 亚洲午夜久久久久久久久久| 思思久久99热只有频精品66| 久久国产亚洲精品| 亚洲一区精品伊人久久伊人| 亚洲精品成人久久久| 久久人人爽人人爽人人爽| 久久久一本精品99久久精品88| 久久久久国产一级毛片高清板 | 精品无码久久久久国产动漫3d| 久久精品人人做人人爽电影| 亚洲国产精品无码久久久不卡| 国内精品久久人妻互换| AAA级久久久精品无码区| 久久午夜福利电影| 久久久久久国产a免费观看黄色大片 | 久久精品蜜芽亚洲国产AV| 99久久超碰中文字幕伊人| 国产精品综合久久第一页| 日韩久久无码免费毛片软件| 国产A三级久久精品| 久久久久久久综合日本亚洲 | 精品乱码久久久久久夜夜嗨 | 久久国产精品-久久精品| 99国内精品久久久久久久| 香蕉aa三级久久毛片| A狠狠久久蜜臀婷色中文网| 国产精品热久久无码av| 午夜天堂av天堂久久久| 久久精品无码一区二区三区免费| 久久亚洲精品无码aⅴ大香| 91精品国产高清久久久久久io| 亚洲а∨天堂久久精品| 久久成人国产精品二三区| 久久久久se色偷偷亚洲精品av| 久久99精品国产麻豆婷婷| 国产成人精品白浆久久69| 伊人久久五月天| 色综合久久精品中文字幕首页| 无码国内精品久久人妻|