第2章 安裝kafka 本章介紹Apache Kafka broker的入門知識,包括如何搭建Apache ZooKeeper集群, Kafka...
理想情況下,在Kubernetes上部署應用程序的開發(fā)人員不需要知道集群提供了什么存儲技術,就像他們不需要知道用于運行pod的物理服務器的特征一...
譯者有話說 這是一本非常適合數據架構師或準數據架構師閱讀的書!當前IT行業(yè)桨武,越來越多的數據倉庫基于云環(huán)境創(chuàng)建,越來越多的數據倉庫要求實時性,越來...
管道概念與設計 什么是管道? 管道描述了從源頭系統(tǒng)到目標系統(tǒng)的數據流戏自,并定義了在此過程中如何轉換數據。 可以使用單個origin(初始)階段表示...
Spark The Definitive Guide(Spark權威指南) 中文版绎秒。本書詳細介紹了Spark2.x版本的各個模塊浦妄,目前市面上最好...
Spark The Definitive Guide(Spark權威指南) 中文版。本書詳細介紹了Spark2.x版本的各個模塊见芹,目前市面上最好...
15.3 使用UDAFs構建自定義聚合 在前面的小節(jié)中剂娄,您快速回顧了聚合數據,在簡單數據集上執(zhí)行了聚合操作玄呛,并最終處理了真實的數據阅懦。在這些操作中...
Streamsets簡介及概述 StreamSets Data Collector是一個功能強大的企業(yè)級流處理平臺,可以使用該平臺來接入數據徘铝,處...
關注公眾號:登峰大數據耳胎,閱讀Spark實戰(zhàn)第二版(完整中文版),系統(tǒng)學習Spark3.0大數據框架惕它! 如果您覺得作者翻譯的內容有幫助怕午,請分享給更...