青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 15, comments - 10, trackbacks - 0, articles - 0

跨機房的hadoop集群

Posted on 2013-10-27 23:28 whspecial 閱讀(5301) 評論(0)  編輯 收藏 引用 所屬分類: hadoop

這是來自于阿里技術嘉年華的一個分享,因為在百度也考慮過類似的事情,所以聽得比較有感悟,這里把相關內容整理一下。

首先尊重版權,還是把原鏈接和作者貼上:

http://adc.alibabatech.org/carnival/history/schedule/2013/detail/main/286?video=0

來自于阿里吳威工程師的分享

 

首先需要說明一點,跨機房hadoop可能應用場景并不是很多,國內像BAT這種巨頭也許需要,但是大部分的中小公司也許并不需要這個,也許這是個屠龍之技,呵呵。

把這個問題分三段來講,第一段是問題出現(xiàn)的背景,第二段是解決該問題的難點,第三段是最終的解決方案。

(一) 背景:

先要看下為什么需要做一個跨機房的大集群?

大集群的優(yōu)點在于數(shù)據(jù)管理和授權容易(這個問題在一個多部門的大公司還是很重要的);跨部門的使用數(shù)據(jù)容易,無需重復拉取數(shù)據(jù)。

在集群達到一定規(guī)模時,單機房(機房內的容量是有限的)已經無法滿足集群的需求了,要想一勞永逸的解決問題,需要建設一個跨機房的hadoop集群。

(二)技術挑戰(zhàn):

2.1 NameNode的性能問題:

         在管理一個巨大的hadoop集群時,由于原始的Namenode是單節(jié)點,因此會成為一個性能瓶頸,遇到的性能問題主要包括兩方面:存儲容量問題(存儲元數(shù)據(jù))和計算壓力(處理rpc請求,修改內存樹時候需要全局鎖)問題。

         其中存儲容量問題可以依賴內存的垂直擴展來解決,但是計算壓力卻很難通過提升硬件來解決(因為目前廠商的主要發(fā)展方向是多核,而非提高主頻)

2.2機房之間的網絡限制:

         機房之間的網絡永遠是個硬件條件的限制,跨機房的網絡傳輸帶來了數(shù)據(jù)延時和帶寬限制:

1, 延時一般是在10ms之內,而hadoop上大部分運行的是離線作業(yè),基本可接受

2, 帶寬限制的問題比較大,因為單機房內的點對點帶寬一般是在1Gbps,而機房之間的帶寬確在20Mbps左右,非常有限。

2.3資源組之間的管理

         每個部門可以看做一個資源組,它們可能會互相使用對方的數(shù)據(jù),因此如何規(guī)劃計算和存儲的位置就很重要,否則會在多個機房之間出現(xiàn)大量的數(shù)據(jù)拷貝。

(三)解決方案:

先看下整個跨集群hadoop的架構圖:


 

重點介紹里面三點,也就是和上面三個問題相對應的:

1, 可以看到這里畫出了兩個NNnamenode),它們實際上還是屬于一個hadoop集群,這是業(yè)界里的一個解決方案:HDFS Fedaration,它為了解決元數(shù)據(jù)節(jié)點性能問題;

2, 可以看到這里有一個cross node節(jié)點,它是用來在兩個機房之間同步數(shù)據(jù)的,它的設計考慮到了機房間的網絡限制;

3, 最后是groupA、groupB,這是為了解決數(shù)據(jù)產出方和使用方關系來用的。

3.1 Federation

Federation相關資料見:

http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/Federation.html#HDFS_Federation


為了水平擴展Namenodefederation使用了多個互相獨立的namenode。它們之間互相不需要通信,每個datenode需要向全部namenode注冊并發(fā)送信息。

BlockPool是屬于一個namenodeblock集合,每個blockpool之間也是互相獨立的。

         federation里,有一個需要關注的問題,就是多個namenode的地址如何對用戶進行透明?它采用的解決方案是目錄樹掛載的方案(社區(qū)有個viewFS,應該就是為了解決這個問題):熟悉linux或者nfs的朋友應該都知道mount這個概念,目錄樹掛載就是這個意思。

不過使用目錄樹掛載也存在著一個問題,就是各個子目錄下的存儲資源需要人為的介入管理,不能出現(xiàn)嚴重的不均。

3.2 crossNode

         機房間的網絡限制要求不能出現(xiàn)大規(guī)模、長時間的數(shù)據(jù)拷貝,需要一個專門管理機房間數(shù)據(jù)拷貝的進程,叫做crossNode。它是獨立部署的一個節(jié)點,和元數(shù)據(jù)節(jié)點是分離的。

         它能提供的功能概括來說主要包括以下三點:

a) 根據(jù)預置的跨機房文件,進行數(shù)據(jù)拷貝

b) 處理實時的數(shù)據(jù)拷貝請求

c) 進行跨機房的數(shù)據(jù)流量控制

如何得知跨機房文件列表?

         由于離線任務基本都是定時觸發(fā)的,可以根據(jù)對歷史作業(yè)的分析來形成一個跨機房文件列表

3.3   資源組之間的管理

各個資源組之間存在數(shù)據(jù)的依賴,我們希望通過資源組管理,能實現(xiàn)大部分任務在本機房內產出數(shù)據(jù),只有少量跨機房產出數(shù)據(jù);大部分任務讀取本機房的數(shù)據(jù)副本,只有少量跨機房讀取數(shù)據(jù)。

為了標識資源組之間的數(shù)據(jù)依賴性,定義一個資源組之間的距離概念:一個資源組訪問另一個資源組的數(shù)據(jù)量越多,則兩者的距離越近,應該將距離接近的資源組放在同一個機房內。

為了讓計算和產出盡可能地靠近,使用一個MRProxy,對于不同類型的任務做不同處理:

a)            離線計算:跨機房列表中的數(shù)據(jù)正在傳輸中(DC1->DC2),DC2上的 Job 被暫停調度,等待傳輸完畢

b)            Ad-hoc查詢:DC2上的 Job 需要讀DC1上的數(shù)據(jù),Job暫停調度,通知 CrossNode,數(shù)據(jù)傳輸完畢后繼續(xù)調度

c)             特殊情況:跨機房數(shù)據(jù) Join,DC1大表,DC2小表,Job 調度到DC1上,跨機房直接讀取DC2數(shù)據(jù),無需等待

 

由于是根據(jù)視頻和ppt整理,并沒有代碼或者文檔,所以可能有些地方的理解有偏差,歡迎來提意見~

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美亚洲一区二区在线| 欧美高清在线播放| 亚洲一级在线| 国产精品欧美激情| 欧美在线一级视频| 久久精品国产99国产精品澳门| 国产精品亚洲аv天堂网| 欧美在线电影| 亚洲欧美日韩天堂一区二区| 国产午夜精品理论片a级大结局| 久久久久久网址| 欧美成在线观看| 一区二区日韩| 欧美亚洲日本国产| 亚洲国产另类久久久精品极度| 欧美激情精品久久久久久蜜臀| 久久这里有精品15一区二区三区| 最新国产の精品合集bt伙计| 日韩亚洲精品电影| 国产一本一道久久香蕉| 欧美激情精品久久久久久蜜臀| 欧美日韩播放| 久久亚洲私人国产精品va| 欧美激情第六页| 欧美在线播放一区二区| 欧美成人激情视频免费观看| 亚洲欧美影音先锋| 蜜桃av一区二区三区| 夜夜嗨av一区二区三区四区| 亚洲专区一区| 一本色道久久99精品综合| 性欧美办公室18xxxxhd| 亚洲开发第一视频在线播放| 亚洲已满18点击进入久久| 亚洲黄色免费电影| 午夜亚洲福利在线老司机| 日韩一区二区精品葵司在线| 久久高清福利视频| 亚洲欧美激情四射在线日| 久热综合在线亚洲精品| 久久高清国产| 欧美成人午夜激情在线| 久久久噜噜噜久久狠狠50岁| 欧美三级视频在线观看| 欧美成人免费全部| 国产性天天综合网| 一区二区三区久久精品| 亚洲精品国产日韩| 久久久久综合一区二区三区| 欧美一区二区精美| 欧美午夜精品理论片a级大开眼界| 免费视频久久| 国一区二区在线观看| 亚洲一区二区三区视频| 亚洲私人影院在线观看| 欧美激情91| 欧美激情国产日韩| 亚洲国产裸拍裸体视频在线观看乱了中文| 亚洲欧美大片| 性欧美xxxx大乳国产app| 欧美特黄视频| 正在播放亚洲| 亚洲午夜伦理| 欧美日韩精品免费观看视频完整| 欧美激情一区二区三区在线视频 | 欧美 日韩 国产精品免费观看| 国产精品美女999| 在线视频你懂得一区| 亚洲色图综合久久| 欧美午夜精品久久久久免费视| 亚洲国产日韩精品| 亚洲黄一区二区| 欧美丰满少妇xxxbbb| 亚洲人成绝费网站色www| 99国产精品国产精品久久 | 欧美片第一页| 亚洲黄色片网站| 日韩网站在线观看| 欧美日韩午夜剧场| 一区二区三区日韩在线观看| 亚洲欧美日韩国产一区二区三区| 国产精品久99| 欧美一区二区网站| 欧美成人tv| av不卡在线看| 国产精品中文字幕欧美| 欧美一区二区三区免费视| 久久亚洲国产精品一区二区| 亚洲国产高清aⅴ视频| 欧美国产日韩精品| 中日韩高清电影网| 久久精品99国产精品| 亚洲丰满在线| 国产精品国产三级国产 | 日韩写真视频在线观看| 亚洲欧美另类中文字幕| 国产一区二区久久| 蜜臀av性久久久久蜜臀aⅴ四虎| 亚洲国产精品福利| 亚洲欧美日韩国产一区二区三区| 国产亚洲视频在线| 欧美福利网址| 午夜精品区一区二区三| 欧美岛国激情| 欧美一区二区三区免费视| 亚洲国产精品成人精品| 国产精品久久夜| 麻豆freexxxx性91精品| 亚洲视频视频在线| 你懂的成人av| 亚洲欧美日韩在线高清直播| 在线不卡视频| 国产精品久线观看视频| 蜜桃av噜噜一区二区三区| 亚洲一级二级| 亚洲精品资源| 欧美v日韩v国产v| 欧美一区日韩一区| 在线一区二区三区四区| 极品av少妇一区二区| 欧美三级视频| 欧美成人亚洲成人日韩成人| 欧美在线看片| 一区二区日韩免费看| 欧美国产欧美亚洲国产日韩mv天天看完整 | 亚洲精选久久| 好看的亚洲午夜视频在线| 欧美日韩福利视频| 美国成人直播| 久久久av毛片精品| 亚洲欧美国产精品专区久久| 亚洲精品综合久久中文字幕| 麻豆久久久9性大片| 欧美在线免费观看| 亚洲欧美日韩一区二区三区在线观看 | 你懂的亚洲视频| 久久久精品日韩欧美| 性欧美精品高清| 亚洲欧美不卡| 亚洲欧美日韩国产| 亚洲一区二区三区四区五区午夜| 亚洲国产精品电影在线观看| 欧美成人69| 欧美激情a∨在线视频播放| 狂野欧美一区| 毛片一区二区三区| 久久综合九色欧美综合狠狠| 久久久久久久综合狠狠综合| 久久福利电影| 老鸭窝亚洲一区二区三区| 久久久免费精品视频| 久久久蜜桃一区二区人| 久久躁日日躁aaaaxxxx| 老牛国产精品一区的观看方式| 久久视频在线看| 欧美a级一区| 亚洲国产日韩在线| 亚洲另类一区二区| 一区二区三区欧美在线| 亚洲午夜未删减在线观看| 亚洲自拍高清| 久久国产精品99精品国产| 久久久综合网站| 欧美成人免费视频| 国产精品高潮呻吟久久av黑人| 国产精品美女久久久浪潮软件| 国产精品一级| 影视先锋久久| 亚洲美女精品一区| 午夜激情久久久| 久久蜜桃av一区精品变态类天堂| 久久夜色精品国产亚洲aⅴ | 一本色道久久综合亚洲精品按摩 | 欧美电影在线| 亚洲精品黄网在线观看| 亚洲性线免费观看视频成熟| 久久精品国产综合| 欧美激情视频一区二区三区免费| 欧美日韩一区二区三区视频| 国产夜色精品一区二区av| 最新日韩欧美| 欧美在线一级视频| 亚洲欧洲精品一区二区| 亚洲欧美国产视频| 欧美成人日韩| 国产一区二区三区四区三区四| 91久久在线播放| 欧美一区二区精品在线| 亚洲二区在线视频| 欧美一二区视频| 欧美日韩亚洲天堂| 亚洲国产片色| 久久精品国产欧美激情| 日韩一区二区精品| 美女日韩欧美| 国产字幕视频一区二区| 亚洲一区二区三区欧美 | 久久国产精品久久国产精品| 亚洲国产高清高潮精品美女| 欧美一区不卡|