背景 2017年時序數(shù)據(jù)庫忽然火了起來薪韩。開年2月Facebook開源了beringei時序數(shù)據(jù)庫质欲;到了4月基于PostgreSQL打造的時序數(shù)據(jù)庫TimeScaleDB也開源...
![240](https://cdn2.jianshu.io/assets/default_avatar/12-aeeea4bedf10f2a12c0d50d626951489.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
背景 2017年時序數(shù)據(jù)庫忽然火了起來薪韩。開年2月Facebook開源了beringei時序數(shù)據(jù)庫质欲;到了4月基于PostgreSQL打造的時序數(shù)據(jù)庫TimeScaleDB也開源...
Spark core 一、 spark是一個分布式同通用計算框架,可用于離線大數(shù)據(jù)處理辙纬、實時流計算、交互式計算叭喜、圖計算等贺拣,集成了SparkSQL、SparkStream捂蕴、ML...
Kafka 一譬涡、Kafka是一個分布式消息隊列系統(tǒng),以集群方式存在啥辨。 優(yōu)點:高吞吐率(每秒百萬級)涡匀;基于多分區(qū)多副本實現(xiàn)高容錯,并發(fā)能力強溉知;易擴展(增加blocker)等渊跋。 ...
一、基本原理 Hive是基于Hadoop的一個數(shù)據(jù)倉庫工具着倾,可以將結(jié)構(gòu)化數(shù)據(jù)文件映射成一張表拾酝,并提供類似SQL的查詢功能。Hive適用于大數(shù)據(jù)離線批處理卡者,不適合實時處理蒿囤,分為...
一、YARN:Hadoop集群中的同一資源調(diào)度系統(tǒng)崇决。Hadoop2.0后引入材诽,主要功能有:負責集群中資源的統(tǒng)一調(diào)度,響應客戶端的請求恒傻。 優(yōu)缺點 二脸侥、YARN核心組件及架構(gòu) 1...
一、HDFS:hadoop分布式文件存儲系統(tǒng)盈厘。 優(yōu)點: 1. 基于多副本存儲睁枕,實現(xiàn)高容錯 2. 適合大數(shù)據(jù)離線批處理,移動計算,不移動數(shù)據(jù)外遇,將數(shù)據(jù)位置暴露給計算框架注簿,把計算任...
ZK,分布式應用間的協(xié)調(diào)調(diào)度機制山上,監(jiān)聽和管理分布式服務器間的連接恩袱。 一、 zk的數(shù)據(jù)結(jié)構(gòu)——znode 每個Znode由3部分組成 :stat:此為狀態(tài)信息, 描述該Znod...