• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            C小加

            厚德 博學(xué) 求真 至善 The bright moon and breeze
            posts - 145, comments - 195, trackbacks - 0, articles - 0
              C++博客 :: 首頁(yè) :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

            Nosql入門(mén)知識(shí)(轉(zhuǎn))

            Posted on 2012-12-01 16:57 C小加 閱讀(2149) 評(píng)論(0)  編輯 收藏 引用 所屬分類(lèi): NoSQL

            1. NoSQL其實(shí)是關(guān)系型數(shù)據(jù)庫(kù)相對(duì)應(yīng)的,是no relational 即非關(guān)系型數(shù)據(jù)庫(kù);web2.0特別是一些用戶訪問(wèn)量比較大的網(wǎng)站如:www.taobao.com weibo.com baidu.com 

            每秒的訪問(wèn)量可能是上萬(wàn)次(10K);傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù) mysql oracle 每秒進(jìn)行10K次數(shù)據(jù)查詢還可以勉強(qiáng)應(yīng)付,但是如果是每秒10K次讀寫(xiě)數(shù)據(jù)庫(kù),因?yàn)閿?shù)據(jù)庫(kù)的數(shù)據(jù)都是卸載磁盤(pán)中,所以磁盤(pán)IO也是支撐不住每秒10K的讀寫(xiě)。

            在web的架構(gòu)中,數(shù)據(jù)庫(kù)是最難進(jìn)行橫向擴(kuò)展的(通過(guò)簡(jiǎn)單的添加機(jī)器和硬件,也就是添加一些服務(wù)節(jié)點(diǎn)來(lái)提高負(fù)載均衡能力);對(duì)于7*24小時(shí)在線的網(wǎng)站來(lái)說(shuō),對(duì)關(guān)系型數(shù)據(jù)庫(kù)進(jìn)行升級(jí)和擴(kuò)展(分布式擴(kuò)展--分庫(kù)分表)是非常痛苦的事情,往往要進(jìn)行停機(jī)維護(hù);但這種對(duì)www.taobao.com 來(lái)說(shuō)是非常丑陋的事情。[--可不可以添加幾臺(tái)服務(wù)器然后把復(fù)制,然后進(jìn)行負(fù)載均衡--]。

            NoSQL 是采用key/value的結(jié)構(gòu)來(lái)存儲(chǔ)數(shù)據(jù),而且大多數(shù)的NoSQL采用內(nèi)存來(lái)存儲(chǔ)數(shù)據(jù),一段時(shí)間后把數(shù)據(jù)同步到磁盤(pán)中;由于使用內(nèi)存保存數(shù)據(jù)很好地解決了高并發(fā)讀寫(xiě)的問(wèn)題;其次NoSQL提供了根據(jù)key值進(jìn)行橫向分表(比如:用戶id,每2000w數(shù)據(jù)放到一臺(tái)數(shù)據(jù)庫(kù)服務(wù)器中的一張用戶表中);同時(shí)實(shí)現(xiàn)了主從數(shù)據(jù)庫(kù)互備,這樣可以讓數(shù)據(jù)庫(kù)的動(dòng)態(tài)遷移變得簡(jiǎn)單,讓數(shù)據(jù)庫(kù)服務(wù)器的橫向擴(kuò)展變得容易了。


            2. 分布式數(shù)據(jù)庫(kù)的CAP理論

             CAP理論是說(shuō)Consistency(一致性), Availability(可用性), partition tolerance(分布)三部分系統(tǒng);而且任何系統(tǒng)只會(huì)滿足兩個(gè),不會(huì)有任何的系統(tǒng)會(huì)同時(shí)滿足這三個(gè)條件;在傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)中是強(qiáng)調(diào)C 一致性,但是在滿足高可用性(高并發(fā)時(shí)效率不高),高擴(kuò)展性(分布式數(shù)據(jù)庫(kù)進(jìn)行橫向擴(kuò)展)存在一定的缺陷。但是NoSQL在進(jìn)行設(shè)計(jì)的時(shí)候就是針對(duì)并發(fā)海量數(shù)據(jù)存儲(chǔ)的情況下進(jìn)行設(shè)計(jì)的,在這種高并發(fā)海量數(shù)據(jù)下數(shù)據(jù)一致性并不像銀行那樣保持?jǐn)?shù)據(jù)的強(qiáng)一致性,所以NoSQL·放棄強(qiáng)一致性的追求,從而達(dá)到更高的可用性和擴(kuò)展性,通過(guò)“鴿巢原理”達(dá)到最終的一致性。

            現(xiàn)在的數(shù)據(jù)庫(kù)系統(tǒng)肯定是同一個(gè)時(shí)刻有多個(gè)進(jìn)程對(duì)數(shù)據(jù)庫(kù)進(jìn)行讀寫(xiě)操作,假設(shè)現(xiàn)在有3個(gè)進(jìn)程(A、B、C)對(duì)數(shù)據(jù)庫(kù)的某表進(jìn)行操作,

            • 強(qiáng)一致性:A寫(xiě)入的數(shù)據(jù)x,B、C可以讀到數(shù)據(jù)x
            • 弱一致性:A寫(xiě)入的數(shù)據(jù)x,B、C一段時(shí)間內(nèi)讀不到,最后會(huì)讀到
            • 最終一致性:是一種特殊的一致性,保證在一段時(shí)間內(nèi)沒(méi)有數(shù)據(jù)的更新,但所有的返回都是把最新的數(shù)據(jù)返回;---緩存的概念,一段時(shí)間后把數(shù)據(jù)更新到數(shù)據(jù)庫(kù),達(dá)到最終一致性。
            3. 哈希算法
            (1). 哈希算法的基本原理:
                 哈希算法的提出和應(yīng)用背景,對(duì)于一個(gè)龐大的字符串?dāng)?shù)組array,給你一個(gè)字符串讓你判斷它是否在這個(gè)字符串?dāng)?shù)組中并找到它,最好的辦法就是把這個(gè)龐大的字符串?dāng)?shù)組構(gòu)建成一個(gè)哈希表,然后在進(jìn)行查詢是否有這個(gè)字符串。
             (2).構(gòu)建hash table的過(guò)程:一般是采用一個(gè)32的整數(shù)來(lái)代表一個(gè)字符串,首先這個(gè)array的字符串已經(jīng)存在內(nèi)存或者磁盤(pán)中,我們要做的只是按照一定的算法把每個(gè)字符串映射到一個(gè)32位的整數(shù),每個(gè)int占4個(gè)字節(jié),在字符串中每個(gè)字符都占一個(gè)字節(jié);這樣就建立了字符串與32位整數(shù)的映射,然后根據(jù)程序大小設(shè)定一個(gè)hash table的Size(這個(gè)Size確保所有的int % Size的值是唯一的--取最大值即可),這個(gè)把剛才得到的所有字符串對(duì)應(yīng)的32位整數(shù)對(duì)這個(gè)Size進(jìn)行取模,這個(gè)模值就是此整數(shù)在hash table的位置;這個(gè)位置與每一個(gè)字符串又建立了一個(gè)映射關(guān)系;這樣讓你查詢這個(gè)str是否在array中?
            • 首先,是把這個(gè)str,用相同的哈希算法進(jìn)行編碼---->映射到一個(gè)32位的int型數(shù)據(jù) num
            • 然后,把這個(gè)num % Size 獲取此字符串在hash table里面的位置;
            • 然后,判斷hash table 此位置是否已經(jīng)有數(shù)據(jù)占用,如果已經(jīng)占用說(shuō)明在array里面有一個(gè)字符串對(duì)應(yīng)的32位整數(shù)與str的32位整數(shù)相同,在一個(gè)字符串對(duì)應(yīng)唯一一個(gè)32位整數(shù)的前提條件下,就說(shuō)明array里面存在字符串str。
            1. int GetHashTablePos(char *lpszString, SOMESTRUCTURE *lpTable, int nTableSize)  
            2. { //lpszSring--要查詢的字符串;lpTable 哈希表;nTableSize是哈希表的Size  
            3. int nHash = HashString(lpszString), nHashPos = nHash % nTableSize;  
            4.   
            5. if (lpTable[nHashPos].bExists && !strcmp(lpTable[nHashPos].pString, lpszString))  //時(shí)間復(fù)雜度是O(1)  
            6.   return nHashPos;  
            7. else  
            8.   return -1; //Error value  
            9. }  
            (3).  上面的處理方法是假設(shè)一個(gè)字符串通過(guò)一個(gè)哈希算法只得到唯一一個(gè)hashcode(32為int整數(shù));但是如果存在兩個(gè)整數(shù)在同一個(gè)哈希算法得到同一個(gè)hashcode,那這個(gè)查詢就不正確的,雖然這個(gè)可能性比較小,但確實(shí)存在這個(gè)風(fēng)險(xiǎn)。
            采用的解決辦法是用多個(gè)不同的哈希算法來(lái)校驗(yàn),兩個(gè)str 在三個(gè)不同的哈希算法得到的hashcode都相同的概率是:1/18889465931478580854784;可以認(rèn)為是OK的。
            1. int GetHashTablePos(char *lpszString, MPQHASHTABLE *lpTable, int nTableSize)  
            2. {  
            3. const int HASH_OFFSET = 0HASH_A = 1HASH_B = 2;  
            4. int nHash = HashString(lpszString, HASH_OFFSET);  
            5. int nHashA = HashString(lpszString, HASH_A);  
            6. int nHashB = HashString(lpszString, HASH_B);  
            7. int nHashStart = nHash % nTableSize, nHashPos = nHashStart;  
            8. while (lpTable[nHashPos].bExists)  
            9. {  
            10.   if (lpTable[nHashPos].nHashA == nHashA && lpTable[nHashPos].nHashB == nHashB)  
            11.    return nHashPos;  
            12.   else  
            13.    nHashPos = (nHashPos + 1) % nTableSize;  
            14.   if (nHashPos == nHashStart)  
            15.    break;  
            16. }  
            17. return -1; //Error value  
            18. }  

            這樣就可以保證萬(wàn)無(wú)一失了!
            (4). 常見(jiàn)的哈希算法:MD5 SHA  SHA-1等都是常用的哈希算法,而且他們都屬于混合哈希算法,除了混合哈希算法還有加法、乘法、除法的哈希算法;
            所以,在比較一個(gè)文件是否發(fā)生變化的方法出了可以用最后修改時(shí)間來(lái)判斷,也可以用其哈希code來(lái)比較,比如用MD5來(lái)比較,如果其MD5都變化了則文件一定被修改了。

            4. Tair 緩存也是一種 基于key/value的NoSQL結(jié)構(gòu)開(kāi)發(fā)的一種緩存機(jī)制,其實(shí)質(zhì)也是NoSQL數(shù)據(jù)庫(kù),不過(guò)是key/value結(jié)構(gòu)而且是用內(nèi)存來(lái)存儲(chǔ)數(shù)據(jù),所以用把Tair叫做緩存。

            5. 關(guān)系型數(shù)據(jù)庫(kù)的事務(wù)(ACID)
            (1). 事務(wù)(Transaction):Transaction是訪問(wèn)并可能更新數(shù)據(jù)庫(kù)中各種數(shù)據(jù)項(xiàng)的一個(gè)程序執(zhí)行單元(unit),事務(wù)一般由高級(jí)數(shù)據(jù)語(yǔ)言(C++ Java SQL)等寫(xiě)的用戶程序引起的,并用begin transaction----end transaction 來(lái)界定一個(gè)完整的事務(wù)
            1. <begin transaction>  
            2. ****  
            3. ****  
            4. ****  
            5. </end transaction>  
            一個(gè)完整的事務(wù)由begin transaction----end transaction  里面的所有操作組成;在關(guān)系型數(shù)據(jù)庫(kù)中一個(gè)事務(wù)可以是一條SQL語(yǔ)句或一組SQL語(yǔ)句或者是一個(gè)程序;事務(wù)是并發(fā)和回滾的基本單位。
            (2). 事務(wù)的ACID屬性:
            • Atomicity(原子性):一個(gè)事務(wù)是一個(gè)不可分割的完整單元,一個(gè)transaction里面的所有操作要么都做完,要么都不做;當(dāng)中間一個(gè)操作失敗把所有已經(jīng)做的操作都回滾!
            • Consistency(一致性):數(shù)據(jù)庫(kù)在一個(gè)事務(wù)開(kāi)始前是一致性的,在這個(gè)事務(wù)執(zhí)行完畢后仍然是一致性的;只是從一個(gè)一致性狀態(tài)到另一個(gè)一致性狀態(tài);但都是一致性的
            • Isolation(隔離性):一個(gè)事務(wù)的執(zhí)行不能被其他事務(wù)所打擾,即一個(gè)事務(wù)內(nèi)部操作及使用的數(shù)據(jù)對(duì)并發(fā)的事務(wù)是隔離的,并發(fā)執(zhí)行的事務(wù)之間互相不干擾(不理解)!!
            • Durablity(持久性):也就永久性(Permanence),即一個(gè)事務(wù)一旦執(zhí)行完畢,則它對(duì)數(shù)據(jù)庫(kù)的更新是持久性的,即不受其他操作的影響;也就是事務(wù)修改了數(shù)據(jù)庫(kù)了
            這個(gè)ACID的屬性是關(guān)系型數(shù)據(jù)庫(kù)(DBMS)非常重要的屬性,在執(zhí)行數(shù)據(jù)庫(kù)操作時(shí)必須滿足ACID屬性,其中AI是我們編程中要注意的地方。
            无码国内精品久久人妻蜜桃| 精品久久久久久久久午夜福利| 久久人搡人人玩人妻精品首页| 久久婷婷色香五月综合激情 | 久久久久久精品免费免费自慰| 午夜久久久久久禁播电影| 久久久久一区二区三区| 日本欧美国产精品第一页久久| 久久综合香蕉国产蜜臀AV| 精品久久久久久久中文字幕| 亚洲午夜久久久影院伊人| 久久精品二区| 精品九九久久国内精品| 无码任你躁久久久久久老妇App| 国产精品久久波多野结衣| 国产成人精品久久| 久久成人国产精品一区二区| 99久久国产综合精品麻豆| 国色天香久久久久久久小说 | 精品熟女少妇aⅴ免费久久| 中文精品久久久久人妻不卡| 久久综合色区| 狠狠色伊人久久精品综合网| 99久久99这里只有免费的精品| 久久www免费人成看片| 色偷偷88欧美精品久久久 | 久久综合久久综合亚洲| 激情综合色综合久久综合| 青青青伊人色综合久久| 久久精品国产亚洲AV无码娇色| 久久久久久国产精品无码下载 | 久久久久国产一区二区| 色综合久久最新中文字幕| 精品国产福利久久久| 国产精品久久久久影视不卡| 99久久人妻无码精品系列蜜桃| 久久综合国产乱子伦精品免费| 综合网日日天干夜夜久久| 精品久久久无码21p发布| 超级碰碰碰碰97久久久久| 97视频久久久|