![240](https://cdn2.jianshu.io/assets/default_avatar/12-aeeea4bedf10f2a12c0d50d626951489.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
Spark core 一、 spark是一個分布式同通用計算框架恭理,可用于離線大數(shù)據(jù)處理栋豫、實(shí)時流計算酪耕、交互式計算涧至、圖計算等搀别,集成了SparkSQL...
Kafka 一急侥、Kafka是一個分布式消息隊列系統(tǒng)提澎,以集群方式存在姚垃。 優(yōu)點(diǎn):高吞吐率(每秒百萬級);基于多分區(qū)多副本實(shí)現(xiàn)高容錯盼忌,并發(fā)能力強(qiáng)积糯;易擴(kuò)...
一、基本原理 Hive是基于Hadoop的一個數(shù)據(jù)倉庫工具谦纱,可以將結(jié)構(gòu)化數(shù)據(jù)文件映射成一張表絮宁,并提供類似SQL的查詢功能。Hive適用于大數(shù)據(jù)離...
一服协、YARN:Hadoop集群中的同一資源調(diào)度系統(tǒng)绍昂。Hadoop2.0后引入,主要功能有:負(fù)責(zé)集群中資源的統(tǒng)一調(diào)度偿荷,響應(yīng)客戶端的請求窘游。 優(yōu)缺點(diǎn) ...
一、HDFS:hadoop分布式文件存儲系統(tǒng)跳纳。 優(yōu)點(diǎn): 1. 基于多副本存儲忍饰,實(shí)現(xiàn)高容錯 2. 適合大數(shù)據(jù)離線批處理,移動計算寺庄,不移動數(shù)據(jù)艾蓝,將數(shù)...
ZK,分布式應(yīng)用間的協(xié)調(diào)調(diào)度機(jī)制斗塘,監(jiān)聽和管理分布式服務(wù)器間的連接赢织。 一、 zk的數(shù)據(jù)結(jié)構(gòu)——znode 每個Znode由3部分組成 :stat:...