海量數據
大數據量,海量數據 處理方法總結
布隆過濾器應用
悉數那些“巨型”數據倉庫
Hadoop在業界的使用情況
淘寶Hadoop集群的概況
分布式
Paxos在大型系統中常見的應用場景
hadoop的實現
序
HDFS的基本概念
HDFS 讀寫流程
HDFS namenode源碼分析
HDFS datanode源碼分析
HDFS dfsclient讀文件過程 源碼分析
HDFS dfsclient寫文件過程 源碼分析
MapReduce源碼分析總結
mapreduce作業流程概論
How MapReduce Works
基于hadoop的crc校驗談hadoop的離線設計思想
Hadoop在MapReduce中使用壓縮詳解
HDFS數據的Checksum
Hadoop開發常用的InputFormat和OutputFormat
Hadoop之failed task和killed task
Hadoop的調度器總結
管理
hadoop集群部署
hadoop部署注意項
hadoop配置文件說明
hadoop集群默認配置和常用配置
hadoop集群測量
Hadoop管理員的十個最佳實踐
Hadoop 權限管理
Hadoop FS Shell
Hadoop Shell 講解
hadoop fs -count的結果含義
Hadoop添加節點datanode
Hadoop刪除節點
hadoop SecondaryNameNode和NameNode
hadoop 根據SecondaryNameNode恢復Namenode
hadoop機架感知
HDFS 安全模式
hadoop的dfs.replication
Hadoop回收站trash
hadoop升級
Hadoop計算能力調度器算法解析
Hadoop計算能力調度器應用和配置
hadoop和kerberos的整合總結
hadoop的dfs.umask
NFS服務對Hadoop(hdfs)集群影響測試
Facebook團隊關于Hadoop/HBase在SSD上的實驗和討論
調優
架構設計
Hadoop使用場景
hive
Hive體系架構
應用
Hadoop和Hive的數據處理流程
hive部署手冊
hive元數據中utf8的修改
hive并發調用的運行方式-個人經驗篇
hive Cli常用操作(翻譯自Hive wiki)
hive數據類型(翻譯自Hive Wiki)
hive 創建/刪除/截斷 表(翻譯自Hive wiki)
hive數據操作(翻譯自Hive wiki+實例講解)
hive原生和復合類型的數據加載和使用
hive修改 表/分區語句
hive select操作(翻譯自Hive wiki)
hive GroupBy操作(翻譯自Hive wiki)
hive 中 Order by, Sort by ,Dristribute by,Cluster By 的作用和用法
Hive Join(翻譯自Hive wiki)
hive lateral view語句(翻譯自Hive wiki)
Hive Union(翻譯自Hive wiki)
Hive子查詢(翻譯自Hive wiki)
hive實例講解實現in和not in子句
Hive Explain(翻譯自Hive wiki)
Hive虛擬列(翻譯自Hive wiki)
hive 鎖定(翻譯自Hive wiki)
hive函數(Hive wiki)
hive udf開發流程(Hive wiki)
hive udaf開發入門和運行過程詳解
hive中UDTF編寫和使用
hive屬性(Hive wiki)
hive中分組取前N個值的實現
hive sql遇到的問題
優化
hive大數據傾斜總結
hive join詳解
hive文件存儲格式
hive怎樣決定reducer個數
hive的hive.exec.parallel參數說明
hive local hadoop特性
hbase
Hbase配置手冊
pig
介紹入門
Apache Pig入門 –介紹/基本架構/與Hive對比
pig部署手冊
教程
Apache Pig中文教程集合
本文轉自:http://www.cnblogs.com/ggjucheng/archive/2012/04/22/2465625.html