青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 15, comments - 10, trackbacks - 0, articles - 0

跨機(jī)房的hadoop集群

Posted on 2013-10-27 23:28 whspecial 閱讀(5301) 評論(0)  編輯 收藏 引用 所屬分類: hadoop

這是來自于阿里技術(shù)嘉年華的一個分享,因為在百度也考慮過類似的事情,所以聽得比較有感悟,這里把相關(guān)內(nèi)容整理一下。

首先尊重版權(quán),還是把原鏈接和作者貼上:

http://adc.alibabatech.org/carnival/history/schedule/2013/detail/main/286?video=0

來自于阿里吳威工程師的分享

 

首先需要說明一點,跨機(jī)房hadoop可能應(yīng)用場景并不是很多,國內(nèi)像BAT這種巨頭也許需要,但是大部分的中小公司也許并不需要這個,也許這是個屠龍之技,呵呵。

把這個問題分三段來講,第一段是問題出現(xiàn)的背景,第二段是解決該問題的難點,第三段是最終的解決方案。

(一) 背景:

先要看下為什么需要做一個跨機(jī)房的大集群?

大集群的優(yōu)點在于數(shù)據(jù)管理和授權(quán)容易(這個問題在一個多部門的大公司還是很重要的);跨部門的使用數(shù)據(jù)容易,無需重復(fù)拉取數(shù)據(jù)。

在集群達(dá)到一定規(guī)模時,單機(jī)房(機(jī)房內(nèi)的容量是有限的)已經(jīng)無法滿足集群的需求了,要想一勞永逸的解決問題,需要建設(shè)一個跨機(jī)房的hadoop集群。

(二)技術(shù)挑戰(zhàn):

2.1 NameNode的性能問題:

         在管理一個巨大的hadoop集群時,由于原始的Namenode是單節(jié)點,因此會成為一個性能瓶頸,遇到的性能問題主要包括兩方面:存儲容量問題(存儲元數(shù)據(jù))和計算壓力(處理rpc請求,修改內(nèi)存樹時候需要全局鎖)問題。

         其中存儲容量問題可以依賴內(nèi)存的垂直擴(kuò)展來解決,但是計算壓力卻很難通過提升硬件來解決(因為目前廠商的主要發(fā)展方向是多核,而非提高主頻)

2.2機(jī)房之間的網(wǎng)絡(luò)限制:

         機(jī)房之間的網(wǎng)絡(luò)永遠(yuǎn)是個硬件條件的限制,跨機(jī)房的網(wǎng)絡(luò)傳輸帶來了數(shù)據(jù)延時和帶寬限制:

1, 延時一般是在10ms之內(nèi),而hadoop上大部分運行的是離線作業(yè),基本可接受

2, 帶寬限制的問題比較大,因為單機(jī)房內(nèi)的點對點帶寬一般是在1Gbps,而機(jī)房之間的帶寬確在20Mbps左右,非常有限。

2.3資源組之間的管理

         每個部門可以看做一個資源組,它們可能會互相使用對方的數(shù)據(jù),因此如何規(guī)劃計算和存儲的位置就很重要,否則會在多個機(jī)房之間出現(xiàn)大量的數(shù)據(jù)拷貝。

(三)解決方案:

先看下整個跨集群hadoop的架構(gòu)圖:


 

重點介紹里面三點,也就是和上面三個問題相對應(yīng)的:

1, 可以看到這里畫出了兩個NNnamenode),它們實際上還是屬于一個hadoop集群,這是業(yè)界里的一個解決方案:HDFS Fedaration,它為了解決元數(shù)據(jù)節(jié)點性能問題;

2, 可以看到這里有一個cross node節(jié)點,它是用來在兩個機(jī)房之間同步數(shù)據(jù)的,它的設(shè)計考慮到了機(jī)房間的網(wǎng)絡(luò)限制;

3, 最后是groupA、groupB,這是為了解決數(shù)據(jù)產(chǎn)出方和使用方關(guān)系來用的。

3.1 Federation

Federation相關(guān)資料見:

http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/Federation.html#HDFS_Federation


為了水平擴(kuò)展Namenode,federation使用了多個互相獨立的namenode。它們之間互相不需要通信,每個datenode需要向全部namenode注冊并發(fā)送信息。

BlockPool是屬于一個namenodeblock集合,每個blockpool之間也是互相獨立的。

         federation里,有一個需要關(guān)注的問題,就是多個namenode的地址如何對用戶進(jìn)行透明?它采用的解決方案是目錄樹掛載的方案(社區(qū)有個viewFS,應(yīng)該就是為了解決這個問題):熟悉linux或者nfs的朋友應(yīng)該都知道mount這個概念,目錄樹掛載就是這個意思。

不過使用目錄樹掛載也存在著一個問題,就是各個子目錄下的存儲資源需要人為的介入管理,不能出現(xiàn)嚴(yán)重的不均。

3.2 crossNode

         機(jī)房間的網(wǎng)絡(luò)限制要求不能出現(xiàn)大規(guī)模、長時間的數(shù)據(jù)拷貝,需要一個專門管理機(jī)房間數(shù)據(jù)拷貝的進(jìn)程,叫做crossNode。它是獨立部署的一個節(jié)點,和元數(shù)據(jù)節(jié)點是分離的。

         它能提供的功能概括來說主要包括以下三點:

a) 根據(jù)預(yù)置的跨機(jī)房文件,進(jìn)行數(shù)據(jù)拷貝

b) 處理實時的數(shù)據(jù)拷貝請求

c) 進(jìn)行跨機(jī)房的數(shù)據(jù)流量控制

如何得知跨機(jī)房文件列表?

         由于離線任務(wù)基本都是定時觸發(fā)的,可以根據(jù)對歷史作業(yè)的分析來形成一個跨機(jī)房文件列表

3.3   資源組之間的管理

各個資源組之間存在數(shù)據(jù)的依賴,我們希望通過資源組管理,能實現(xiàn)大部分任務(wù)在本機(jī)房內(nèi)產(chǎn)出數(shù)據(jù),只有少量跨機(jī)房產(chǎn)出數(shù)據(jù);大部分任務(wù)讀取本機(jī)房的數(shù)據(jù)副本,只有少量跨機(jī)房讀取數(shù)據(jù)。

為了標(biāo)識資源組之間的數(shù)據(jù)依賴性,定義一個資源組之間的距離概念:一個資源組訪問另一個資源組的數(shù)據(jù)量越多,則兩者的距離越近,應(yīng)該將距離接近的資源組放在同一個機(jī)房內(nèi)。

為了讓計算和產(chǎn)出盡可能地靠近,使用一個MRProxy,對于不同類型的任務(wù)做不同處理:

a)            離線計算:跨機(jī)房列表中的數(shù)據(jù)正在傳輸中(DC1->DC2),DC2上的 Job 被暫停調(diào)度,等待傳輸完畢

b)            Ad-hoc查詢:DC2上的 Job 需要讀DC1上的數(shù)據(jù),Job暫停調(diào)度,通知 CrossNode,數(shù)據(jù)傳輸完畢后繼續(xù)調(diào)度

c)             特殊情況:跨機(jī)房數(shù)據(jù) Join,DC1大表,DC2小表,Job 調(diào)度到DC1上,跨機(jī)房直接讀取DC2數(shù)據(jù),無需等待

 

由于是根據(jù)視頻和ppt整理,并沒有代碼或者文檔,所以可能有些地方的理解有偏差,歡迎來提意見~

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲视频在线视频| 亚洲精品一区二区三区av| 欧美一区二区三区视频免费播放| 99精品99| 国产久一道中文一区| 久久久久9999亚洲精品| 欧美一区日韩一区| 极品尤物av久久免费看| 欧美大片在线看| 欧美精品999| 亚洲欧美国产制服动漫| 小处雏高清一区二区三区 | 欧美一区二区三区另类| 国内精品视频久久| 亚洲电影观看| 欧美精品福利在线| 性欧美xxxx视频在线观看| 久久精品国产综合| 亚洲精品在线看| 亚洲制服av| 亚洲福利在线视频| 一区二区三区精品在线| 国产亚洲成av人片在线观看桃| 免费日韩av电影| 欧美日韩一级黄| 开元免费观看欧美电视剧网站| 欧美高清成人| 性亚洲最疯狂xxxx高清| 美女主播一区| 欧美一二区视频| 欧美精品v国产精品v日韩精品| 欧美一区二区三区免费大片| 另类天堂视频在线观看| 午夜国产精品视频免费体验区| 久久久久国产精品一区| 亚洲一区免费| 欧美电影在线观看| 久久久久久91香蕉国产| 欧美日韩亚洲三区| 欧美不卡视频| 国产一区二区高清不卡| 一本色道久久综合亚洲精品婷婷| 精品99一区二区三区| 亚洲——在线| 一区二区三区久久精品| 美女主播视频一区| 久久婷婷麻豆| 国产日韩欧美高清免费| 一区二区三区免费看| 亚洲精品九九| 巨乳诱惑日韩免费av| 久久精精品视频| 国产精品少妇自拍| 99riav久久精品riav| 亚洲精品日韩激情在线电影| 久久久国产精品一区二区三区| 欧美一级成年大片在线观看| 欧美日韩成人激情| 亚洲国内高清视频| 91久久线看在观草草青青| 久久精品视频免费| 久久色在线播放| 国产日韩欧美综合精品| 亚洲欧美视频| 久久成人羞羞网站| 国产欧美精品一区aⅴ影院| 亚洲一区中文| 欧美一区午夜精品| 国产日韩精品一区二区| 香蕉久久国产| 久久躁狠狠躁夜夜爽| 国语自产偷拍精品视频偷 | 在线一区二区日韩| 亚洲素人一区二区| 国产精品久久久久永久免费观看 | 欧美~级网站不卡| 亚洲国产一区二区在线| 欧美成人精品在线播放| 亚洲激情视频在线| 亚洲天堂久久| 国产欧美二区| 久久视频国产精品免费视频在线| 欧美成黄导航| 一区二区三区视频观看| 国产精品日韩| 久久精品卡一| 91久久精品日日躁夜夜躁国产| 99re视频这里只有精品| 国产精品久久久久久av福利软件 | 亚洲精品一区二区三区蜜桃久| 亚洲手机在线| 国产性天天综合网| 蜜桃精品久久久久久久免费影院| 亚洲人成在线播放网站岛国| 亚洲欧美国产视频| 在线不卡中文字幕| 欧美日韩在线高清| 午夜在线精品偷拍| 亚洲激情专区| 久久aⅴ乱码一区二区三区| 亚洲国产高清aⅴ视频| 欧美日韩免费在线| 欧美在线观看一区二区三区| 亚洲国产欧美日韩精品| 午夜在线不卡| 亚洲精选成人| 国精产品99永久一区一区| 欧美黄色大片网站| 欧美一区在线看| 99pao成人国产永久免费视频| 久久精品国产一区二区三区| 亚洲日本在线观看| 国产亚洲综合在线| 欧美日韩精品一区二区三区四区| 欧美在线地址| 一本久久综合亚洲鲁鲁| 欧美高清视频| 久久精品最新地址| 亚洲视频第一页| 亚洲黄色视屏| 国产综合18久久久久久| 欧美午夜不卡在线观看免费 | 国模吧视频一区| 国产精品久久影院| 欧美精品一区二区三区一线天视频 | 99视频精品免费观看| 欧美成人午夜激情在线| 久久久噜久噜久久综合| 欧美亚洲网站| 亚洲欧美日韩一区在线观看| 亚洲美女黄网| 亚洲精品乱码久久久久久蜜桃91| 国产综合在线看| 国产亚洲一区二区三区在线播放| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ入口 | 香蕉久久一区二区不卡无毒影院| 一片黄亚洲嫩模| 日韩视频在线一区| 亚洲三级影院| 亚洲精品一品区二品区三品区| 在线观看日韩欧美| 一区二区在线视频| 一区二区自拍| 在线国产精品一区| 亚洲电影免费观看高清完整版| 激情久久五月| 在线观看视频欧美| 亚洲国产高潮在线观看| 亚洲日本激情| 亚洲伦理在线观看| 一区二区三区四区五区视频| 99综合视频| 亚洲欧美国内爽妇网| 午夜视频一区| 久久超碰97中文字幕| 久久久蜜桃精品| 欧美aa国产视频| 91久久精品一区二区三区| 日韩午夜av电影| 亚洲无线观看| 久久精品国产99精品国产亚洲性色 | 亚洲美女av黄| 亚洲一二三四区| 久久国产精品网站| 免费国产一区二区| 欧美日韩精品久久久| 国产精品久久久久av免费| 国产日韩欧美高清免费| 亚洲国产91| 亚洲夜晚福利在线观看| 欧美中文字幕视频在线观看| 美女图片一区二区| 日韩一区二区电影网| 性久久久久久久久| 欧美黑人一区二区三区| 国产精品系列在线播放| 激情亚洲网站| 亚洲图片欧洲图片av| 久久久久免费| 亚洲精品国精品久久99热| 亚洲欧美国产毛片在线| 欧美成人精品h版在线观看| 国产精品va在线播放| 在线观看久久av| 亚洲一级影院| 欧美国产精品一区| 亚洲欧美日韩国产一区二区三区| 毛片基地黄久久久久久天堂| 国产精品久久久久av| 亚洲精品裸体| 久久久亚洲一区| 在线亚洲一区| 欧美国产精品人人做人人爱| 国产一区二区三区高清在线观看| 日韩视频精品在线| 免费在线成人av| 羞羞色国产精品| 欧美色图天堂网| 亚洲日本成人| 另类图片国产|