用戶行為日志 信令數(shù)據(jù) cell mapWithState DStream 整合RDD == transform 數(shù)據(jù)一:日志信息 DStre...
Spark Streaming 基于Spark之上的流處理 流:source ==> compute ==> store 離線是特殊的流 let...
Function functions.scala hobbies.txt alice jogging,Coding,cooking 3 li...
External Data Source API 外部數(shù)據(jù)源 MapReduce Hive Spark 加載數(shù)據(jù) 格式:json省艳、parquet...
DataFrame python pandas R RDD MapReduce DataFrame vs Dataset(1.6) DS: Ja...
1.核心概念 broker: 進程 producer: 生產(chǎn)者 consumer: 消費者 topic: 主題 partitions: 分區(qū) (...
Spark SQL IOE SQL:schema + file select ... from xxx where..... SQL on Ha...
下載地址: Zookeeper: http://mirror.bit.edu.cn/apache/zookeeper/current/ Scal...
Kafka: 消息中間件 -->分布式流式平臺 MQ Redis Kafka Flume 生產(chǎn)者 source Broker channe...