• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            Javen-Studio 咖啡小屋

            http://javenstudio.org - C++ Java 分布式 搜索引擎
            Naven's Research Laboratory - Thinking of Life, Imagination of Future

              C++博客 :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::
              24 隨筆 :: 57 文章 :: 170 評論 :: 4 Trackbacks
             

            1          Hadoop是什么

            Hadoop原來是Apache Lucene下的一個子項目,它最初是從Nutch項目中分離出來的專門負責分布式存儲以及分布式運算的項目。簡單地說來,Hadoop是一個可以更容易開發(fā)和運行處理大規(guī)模數(shù)據(jù)的軟件平臺。下面列舉hadoop主要的一些特點:

             

            1         擴容能力(Scalable:能可靠地(reliably)存儲和處理千兆字節(jié)(PB)數(shù)據(jù)。

            2         成本低(Economical:可以通過普通機器組成的服務器群來分發(fā)以及處理數(shù)據(jù)。這些服務器群總計可達數(shù)千個節(jié)點。

            3         高效率(Efficient:通過分發(fā)數(shù)據(jù),hadoop可以在數(shù)據(jù)所在的節(jié)點上并行地(parallel)處理它們,這使得處理非常的快速。

            4         可靠性(Reliablehadoop能自動地維護數(shù)據(jù)的多份復制,并且在任務失敗后能自動地重新部署(redeploy)計算任務。

             

            Hadoop實現(xiàn)了一個分布式文件系統(tǒng)(Hadoop Distributed File System),簡稱HDFSHDFS有著高容錯性(fault-tolerent)的特點,并且設計用來部署在低廉的(low-cost)硬件上。而且它提供高傳輸率(high throughput)來訪問應用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(large data set)的應用程序。HDFS放寬了(relaxPOSIX的要求(requirements)這樣可以流的形式訪問(streaming access)文件系統(tǒng)中的數(shù)據(jù)。

             

            Hadoop還實現(xiàn)了MapReduce分布式計算模型。MapReduce將應用程序的工作分解成很多小的工作小塊(small blocks of work)HDFS為了做到可靠性(reliability)創(chuàng)建了多份數(shù)據(jù)塊(data blocks)的復制(replicas),并將它們放置在服務器群的計算節(jié)點中(compute nodes),MapReduce就可以在它們所在的節(jié)點上處理這些數(shù)據(jù)了。

            如下圖所示:

             

            Hadoop API被分成(divide into)如下幾種主要的包(package

             

                      org.apache.hadoop.conf     定義了系統(tǒng)參數(shù)的配置文件處理API

                      org.apache.hadoop.fs          定義了抽象的文件系統(tǒng)API

                      org.apache.hadoop.dfs       Hadoop分布式文件系統(tǒng)(HDFS)模塊的實現(xiàn)。

                      org.apache.hadoop.io         定義了通用的I/O API,用于針對網(wǎng)絡,數(shù)據(jù)庫,文件等數(shù)據(jù)對象做讀寫操作。

                      org.apache.hadoop.ipc       用于網(wǎng)絡服務端和客戶端的工具,封裝了網(wǎng)絡異步I/O的基礎模塊。

                      org.apache.hadoop.mapred         Hadoop分布式計算系統(tǒng)(MapReduce)模塊的實現(xiàn),包括任務的分發(fā)調(diào)度等。

                      org.apache.hadoop.metrics        定義了用于性能統(tǒng)計信息的API,主要用于mapreddfs模塊。

                      org.apache.hadoop.record 定義了針對記錄的I/O API類以及一個記錄描述語言翻譯器,用于簡化將記錄序列化成語言中性的格式(language-neutral manner)。

                      org.apache.hadoop.tools    定義了一些通用的工具。

                      org.apache.hadoop.util       定義了一些公用的API

             

            下面逐個從源代碼中剖析這幾個主要模塊的框架以及運作原理



            作者:naven 2008-02-21
            posted on 2008-02-22 00:53 Javen-Studio 閱讀(7461) 評論(7)  編輯 收藏 引用

            評論

            # re: Annotated Hadoop: 第一節(jié) Hadoop是什么 2008-09-20 14:06 路人A
            PB 是千GB,不是千兆  回復  更多評論
              

            # re: Annotated Hadoop: 第一節(jié) Hadoop是什么 2008-09-21 20:40 Javen-Studio
            謝謝提醒,不過應該是PB=1024TB=1024*1024GB  回復  更多評論
              

            # re: Annotated Hadoop: 第一節(jié) Hadoop是什么 2009-03-12 13:54 hadoop中文
            歡迎大家到http://cn.hadoop.org/
            討論,國內(nèi)研究這個的人太少  回復  更多評論
              

            # re: Annotated Hadoop: 第一節(jié) Hadoop是什么 2009-11-25 11:02 terrs
            為什么是java實現(xiàn),有c 實現(xiàn)的嗎?
              回復  更多評論
              

            # re: Annotated Hadoop: 第一節(jié) Hadoop是什么[未登錄] 2010-06-14 04:53 yang
            @hadoop中文
            哎 都在研究別人的東西
            自己沒有開發(fā)能力嗎  回復  更多評論
              

            # re: Annotated Hadoop: 第一節(jié) Hadoop是什么 2010-06-17 17:15 Javen-Studio
            研究別人成功的產(chǎn)品, 然后開發(fā)自己想法的東西, 本人一直以研發(fā)為主:)  回復  更多評論
              

            # re: Annotated Hadoop: 第一節(jié) Hadoop是什么 2011-05-10 05:23 achilis
            是1024TB@路人A
              回復  更多評論
              

            91精品国产高清91久久久久久| 久久久噜噜噜久久中文字幕色伊伊| 久久精品国产亚洲麻豆| 久久人人爽人人爽人人片AV东京热| 久久婷婷色综合一区二区| www亚洲欲色成人久久精品| 久久午夜电影网| 国产精品青草久久久久福利99 | 久久精品中文字幕大胸| 日本亚洲色大成网站WWW久久| 国产免费久久精品丫丫| 久久久无码精品亚洲日韩软件| 久久精品亚洲欧美日韩久久| 久久国产香蕉一区精品| 国产精品久久久久久五月尺| 久久久久亚洲av综合波多野结衣| 亚洲国产精品无码久久| 97久久久久人妻精品专区| 一级做a爰片久久毛片16| 久久久久久极精品久久久| 精品久久久久久久久免费影院| 亚洲av伊人久久综合密臀性色| 久久大香香蕉国产| 精品久久久久久无码中文野结衣| 久久人人爽人人爽AV片| 久久亚洲国产最新网站| 久久精品国产网红主播| 久久午夜综合久久| 亚洲国产精品久久久天堂| 国内精品久久久久久久影视麻豆 | 久久99热这里只有精品国产| 国内精品久久久人妻中文字幕| 99久久无码一区人妻| yy6080久久| 99久久伊人精品综合观看| 久久精品综合网| 久久精品夜色噜噜亚洲A∨| 久久九九精品99国产精品| 亚洲精品无码久久久| 久久er热视频在这里精品| 久久综合久久美利坚合众国|