• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            Javen-Studio 咖啡小屋

            http://javenstudio.org - C++ Java 分布式 搜索引擎
            Naven's Research Laboratory - Thinking of Life, Imagination of Future

              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
              24 隨筆 :: 57 文章 :: 170 評論 :: 4 Trackbacks
             

            3          MapReduce工作原理

            Map-Reduce框架的運作完全基于<key,value>對,即數據的輸入是一批<key,value>對,生成的結果也是一批<key,value>對,只是有時候它們的類型不一樣而已。Keyvalue的類由于需要支持被序列化(serialize)操作,所以它們必須要實現Writable接口,而且key的類還必須實現WritableComparable接口,使得可以讓框架對數據集的執行排序操作。

             

            一個Map-Reduce任務的執行過程以及數據輸入輸出的類型如下所示:

            (input)<k1,v1> -> map -> <k2,v2> -> combine -> <k2,v2> -> reduce -> <k3,v3>(output)

             

            下面通過一個的例子并結合源代碼來詳細說明這個過程

            3.1       WordCount示例

            這也是Hadoop自帶的一個例子,目標是統計文本文件中單詞的個數。

            假設有如下的兩個文本文件來運行WorkCount程序:

            Hello World Bye World

             

             

            Hello Hadoop GoodBye Hadoop

             

             

             


            3.2       map數據輸入

            Hadoop針對文本文件缺省使用LineRecordReader類來實現讀取,一行一個key/value對,key取偏移量,value為行內容。

            如下是map1的輸入數據:

            Key1

            Value1

            0

            Hello World Bye World

            如下是map2的輸入數據:

            Key1

            Value1

            0

            Hello Hadoop GoodBye Hadoop

            3.3       map輸出/combine輸入

            如下是map1的輸出結果

            Key2

            Value2

            Hello

            1

            World

            1

            Bye

            1

            World

            1

            如下是map2的輸出結果

            Key2

            Value2

            Hello

            1

            Hadoop

            1

            GoodBye

            1

            Hadoop

            1

            3.4       combine輸出

            Combiner類實現將相同key的值合并起來,它也是一個Reducer的實現。

            如下是combine1的輸出

            Key2

            Value2

            Hello

            1

            World

            2

            Bye

            1

            如下是combine2的輸出

            Key2

            Value2

            Hello

            1

            Hadoop

            2

            GoodBye

            1

            3.5       reduce輸出

            Reducer類實現將相同key的值合并起來。

            如下是reduce的輸出

            Key2

            Value2

            Hello

            2

            World

            2

            Bye

            1

            Hadoop

            2

            GoodBye

            1

            即實現了WordCount的處理。

             

            未完待續

             

             

             

             

            Annotated Hadoop 作者:naven 日期:2007-12-29

            posted on 2008-02-22 01:10 Javen-Studio 閱讀(7208) 評論(2)  編輯 收藏 引用

            評論

            # re: Annotated Hadoop: 第三節 MapReduce工作原理 2008-07-02 17:05 yyyyyyyyy
            Reducer類實現將相同key的值合并起來。

            如下是reduce的輸出

            Key2
            Value2

            Hello
            2

            World
            2

            Bye
            1

            Hadoop
            2

            GoodBye
            1

              回復  更多評論
              

            # re: Annotated Hadoop: 第三節 MapReduce工作原理 2009-03-12 13:56 hadoop中文
            歡迎大家到http://cn.hadoop.org/
            討論,國內研究這個的人太少了  回復  更多評論
              

            日韩人妻无码一区二区三区久久| 婷婷久久精品国产| 久久被窝电影亚洲爽爽爽| 99久久99久久精品国产片果冻| 国产精品久久久久久久久久免费| 日韩va亚洲va欧美va久久| 亚洲AV乱码久久精品蜜桃| 久久久久久免费一区二区三区 | 久久九九精品99国产精品| 日本免费一区二区久久人人澡| 久久久久久久亚洲精品| 久久亚洲精品人成综合网| 久久天天躁狠狠躁夜夜av浪潮 | 无码人妻少妇久久中文字幕蜜桃| 色综合合久久天天综合绕视看| 久久青青草视频| 国产免费福利体检区久久| 好久久免费视频高清| 国内精品九九久久精品| 香蕉久久AⅤ一区二区三区| 久久亚洲精品中文字幕三区| 99久久夜色精品国产网站| 色天使久久综合网天天| 国产精品久久久99| 精品人妻伦九区久久AAA片69| 国产精品9999久久久久| 亚洲精品无码成人片久久| 超级碰碰碰碰97久久久久| 深夜久久AAAAA级毛片免费看| 国产精品免费久久久久影院| 88久久精品无码一区二区毛片 | 久久精品国产99国产精品| 99久久精品这里只有精品| 国产精品欧美久久久天天影视| 国产精品视频久久久| 久久本道伊人久久| 夜夜亚洲天天久久| 久久久久香蕉视频| 久久精品国产2020| 丁香狠狠色婷婷久久综合| 精品久久一区二区三区|