云計算hadoop
發布日期:2015-04-24瀏覽:5834
- 
                                                                課程背景現今企業數據倉庫和關系型數據庫擅長處理結構化數據,并且可以存儲大量的數據。但成本上有些昂貴。這種對數據的要求限制了可處理的數據種類,同時這種慣性所帶的缺點還影響到數據倉庫在面對海量異構數據時對于敏捷的探索。這通常意味著有價值的數據源在組織內從未被挖掘。這就是Hadoop與傳統數據處理方式最大的不同。Hadoop帶來了廉價的處理大數據(大數據的數據容量通常是10-100GB或更多,同時數據種類多種多樣,包括結構化、非結構化等)的能力。
 本課程就重點探討云計算與Hadoop系統的組成部分,并解釋各個組成部分的功能。課程對象從IT行業和通信行業的構架師、數據分析師、程序員、工程師、產品經理課程時長12 H課程大綱
 第一講:Hadoop概述
 1.什么是Hadoop
 2.為什么要選擇Hadoop
 3.Hadoop關鍵詞和術語
 
 
 第二講:Hadoop的單機部署
 1.部署條件
 支持平臺
 所需軟件
 安裝軟件
 2.下載源
 3.運行Hadoop集群的準備工作
 4.Hadoop單機操作方法
 5.偽分布式模式的操作
 配置文件
 免密碼Shh設置
 執行程序
 
 
 第三講:Hadoop集群搭建
 1.Hadoop軟件安裝
 2.Master配置
 3.Slave配置
 4.初始化和啟動Hadoop集群
 初始文件系統
 啟動Hadoop
 停止Hadoop
 5.測試用例
 6.管理界面與命令
 
 
 第四講:Hadoop架構分析
 1.HDFS特點與角色
 2.MapReduce介紹
 3.綜合架構分析
 4.Hadoop應用
 
 
 第五講:Hadoop系統維護
 1.Hadoop的系統監控
 2.Hadoop中的命令總結
 3.NameNode與JobTracker單點故障說明
 4.經驗總結
 5.其它日常問題說明
 
 
                
 
             
                         
                 
                 
    


 
	                
	                    
	            




 請輸入正確的用戶名
請輸入正確的用戶名
					 
				 
				