• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            使用Python通過Hive的Streaming來寫UDF的一些記錄

                  最近使用Hive來統計數據,用了pyhs2來實現查詢,但是有些復雜的處理比如,自定義對域名的處理等,不能通過hql來實現,發現能夠使用udf。

                  Java來實現Hive的寫法 

            package jsl.hive.udf;

            import org.apache.hadoop.hive.ql.exec.UDF;
            import org.apache.hadoop.io.Text;

            public final class DomainRoot extends UDF {
                public Text evaluate(Text s) {
                    if (s == null) {return null;}
                    String tmp = s.toString();
                    tmp = this.getDomainRoot(tmp);
                    return new Text(tmp);
                }   

                private String getDomainRoot(String domain) {
                    throw NoneImplementException("xxxx");
                }   
            }

            如果Java的UDF需要當成常用的,不用每次add可以注冊到Hive中,
            ql/src/java/org/apache/hadoop/hive/ql/exec/FunctionRegistry.java中加入
            registerUDF("domain_root", UDFParseUrl.class, false);并重新編譯hive即可


               下面來說說重點,通過Streaming用Python來寫處理。
               關于Streaming的基礎內容:

               約束:首先必須add file到hive中(當python中引用了其他如自己寫的模塊時,也需要一并add進去)
                        其次非常不幸,在單獨的一個查詢中,不能夠使用UDAF的函數如sum()
                        再次不得為中間結果數據使用cluster by或distribute by

            注意:對于優化查詢,使用cluster by或distribute by 和sort by一起非常重要

            posted on 2014-09-12 11:41 Hallelujah 閱讀(2107) 評論(0)  編輯 收藏 引用

            <2014年9月>
            31123456
            78910111213
            14151617181920
            21222324252627
            2829301234
            567891011

            導航

            統計

            常用鏈接

            留言簿(1)

            隨筆分類(15)

            隨筆檔案(14)

            最新隨筆

            搜索

            最新隨筆

            最新評論

            閱讀排行榜

            評論排行榜

            亚洲精品国产第一综合99久久| 久久久久中文字幕| 无夜精品久久久久久| 人人妻久久人人澡人人爽人人精品 | 狠狠狠色丁香婷婷综合久久俺| 91精品国产9l久久久久| 久久人人爽人爽人人爽av| 区久久AAA片69亚洲| 精品综合久久久久久97超人| 无码国内精品久久人妻麻豆按摩| 精品久久久无码21p发布 | 国产A级毛片久久久精品毛片| 无码人妻少妇久久中文字幕| 久久不见久久见免费视频7| 久久免费大片| 青青青国产成人久久111网站| 久久久精品国产免大香伊 | 狠狠色丁香婷婷久久综合 | 久久久久久伊人高潮影院| 久久成人国产精品二三区| 久久精品国产乱子伦| 性做久久久久久久久老女人| 99久久国产综合精品麻豆| 久久久国产精华液| 久久伊人中文无码| 精品久久久久久99人妻| 久久精品成人免费网站| 天堂久久天堂AV色综合| 久久亚洲AV无码精品色午夜麻豆| 久久精品免费网站网| 99久久精品免费国产大片| 国产精品久久久久久久| 国内精品久久久久影院一蜜桃| 人妻精品久久无码区| 色综合久久久久久久久五月| 国产成人精品综合久久久| 18岁日韩内射颜射午夜久久成人| 亚洲婷婷国产精品电影人久久| 一本久道久久综合狠狠躁AV| 欧美久久久久久精选9999| 亚洲?V乱码久久精品蜜桃|