1、Apache Hadoop 不足之處
? 版本管理混亂
? 部署過(guò)程繁瑣介粘、升級(jí)過(guò)程復(fù)雜
? 兼容性差
? 安全性低
2旬痹、Hadoop 發(fā)行版
? Apache Hadoop
? Cloudera’s Distribution Including Apache Hadoop(CDH)
? Hortonworks Data Platform (HDP)
? MapR
? EMR
? …
3晨缴、CDH能解決哪些問(wèn)題
? 1000臺(tái)服務(wù)器的集群,最少要花費(fèi)多長(zhǎng)時(shí)間來(lái)搭建好Hadoop集群远搪,包括Hive劣纲、Hbase、Flume谁鳍、Kafka癞季、Spark等等
? 只給你一天時(shí)間,完成以上工作倘潜?
? 對(duì)于以上集群進(jìn)行hadoop版本升級(jí)绷柒,你會(huì)選擇什么升級(jí)方案,最少要花費(fèi)多長(zhǎng)時(shí)間涮因?
? 新版本的Hadoop废睦,與Hive、Hbase养泡、Flume嗜湃、Kafka、Spark等等兼容澜掩?
4净蚤、CDH簡(jiǎn)介
? Cloudera's Distribution, including Apache Hadoop
? 是Hadoop眾多分支中的一種,由Cloudera維護(hù)输硝,基于穩(wěn)定版本的Apache Hadoop構(gòu)建
? 提供了Hadoop的核心
– 可擴(kuò)展存儲(chǔ)
– 分布式計(jì)算
? 基于Web的用戶(hù)界面
5今瀑、CDH的優(yōu)點(diǎn)
? 版本劃分清晰
? 版本更新速度快
? 支持Kerberos安全認(rèn)證
? 文檔清晰
? 支持多種安裝方式(Cloudera Manager方式)
6、CDH安裝方式
? Cloudera Manager
? Yum
? Rpm
? Tarball
7、CDH下載地址
? CDH5.4
?http://archive.cloudera.com/cdh5/
?Cloudera Manager5.4.3:
?http://www.cloudera.com/downloads/manager/5-4-3.html