第2章 安裝kafka 本章介紹Apache Kafka broker的入門知識(shí)搏存,包括如何搭建Apache ZooKeeper集群, Kafka...
理想情況下,在Kubernetes上部署應(yīng)用程序的開發(fā)人員不需要知道集群提供了什么存儲(chǔ)技術(shù)姨拥,就像他們不需要知道用于運(yùn)行pod的物理服務(wù)器的特征一...
譯者有話說 這是一本非常適合數(shù)據(jù)架構(gòu)師或準(zhǔn)數(shù)據(jù)架構(gòu)師閱讀的書!當(dāng)前IT行業(yè)渠鸽,越來越多的數(shù)據(jù)倉(cāng)庫基于云環(huán)境創(chuàng)建叫乌,越來越多的數(shù)據(jù)倉(cāng)庫要求實(shí)時(shí)性,越來...
管道概念與設(shè)計(jì) 什么是管道? 管道描述了從源頭系統(tǒng)到目標(biāo)系統(tǒng)的數(shù)據(jù)流徽缚,并定義了在此過程中如何轉(zhuǎn)換數(shù)據(jù)憨奸。 可以使用單個(gè)origin(初始)階段表示...
Spark The Definitive Guide(Spark權(quán)威指南) 中文版。本書詳細(xì)介紹了Spark2.x版本的各個(gè)模塊凿试,目前市面上最好...
Spark The Definitive Guide(Spark權(quán)威指南) 中文版排宰。本書詳細(xì)介紹了Spark2.x版本的各個(gè)模塊,目前市面上最好...
15.3 使用UDAFs構(gòu)建自定義聚合 在前面的小節(jié)中红省,您快速回顧了聚合數(shù)據(jù)额各,在簡(jiǎn)單數(shù)據(jù)集上執(zhí)行了聚合操作,并最終處理了真實(shí)的數(shù)據(jù)吧恃。在這些操作中...
Streamsets簡(jiǎn)介及概述 StreamSets Data Collector是一個(gè)功能強(qiáng)大的企業(yè)級(jí)流處理平臺(tái)虾啦,可以使用該平臺(tái)來接入數(shù)據(jù),處...
關(guān)注公眾號(hào):登峰大數(shù)據(jù),閱讀Spark實(shí)戰(zhàn)第二版(完整中文版)傲醉,系統(tǒng)學(xué)習(xí)Spark3.0大數(shù)據(jù)框架蝇闭! 如果您覺得作者翻譯的內(nèi)容有幫助,請(qǐng)分享給更...