一個(gè)懶散的人 - 簡(jiǎn)書(shū)

IP屬地：陜西

GeoSpark-[階段性總結(jié)]
一管跺、 Geospark安裝：我采用的是gradle安裝，安裝環(huán)境是Spark3.0.3+Scala.2.12.3 二、 Geospark 能夠...

0.1 1080 0 1
2021-08-12：Scala 的另類用法
將代碼塊當(dāng)成參數(shù)傳入輸出結(jié)果

188 0 0

SparkSQL字段血緣關(guān)系的實(shí)現(xiàn)方式
說(shuō)明： spark sql的字段血緣關(guān)系具體實(shí)現(xiàn)代碼和使用方法見(jiàn)GitHub：RHobart/spark-lineage-parent: 跟蹤S...

0.2 2859 0 2
DeltaLake批處理：數(shù)據(jù)表的讀取與寫(xiě)入
DeltaLake支持大部分由Spark DataFrame提供的Opition選項(xiàng) SparkSession的配置創(chuàng)建表 DeltaLake...

0.1 676 0 1
presto 的安裝與使用
相關(guān)說(shuō)明： Presto官網(wǎng): Presto | Distributed SQL Query Engine for Big Data (pres...

0.1 2469 0 1
Flink 讀取Kafka數(shù)據(jù)
一直以來(lái)都是使用spark structstreaming 讀取kafka數(shù)據(jù)避除，最近一直在嘗試用flink讀取kafka數(shù)據(jù)。開(kāi)發(fā)環(huán)境配置: ...

0.2 2621 0 2
Debezium 初次使用
世間的一切都可以用時(shí)間來(lái)解決前言：因項(xiàng)目需要，需要調(diào)研debezium，也就是捕獲數(shù)據(jù)更改(CDC)陨晶。翻閱了網(wǎng)上的一些資料和官網(wǎng)信息，將之總...

2398 0 0

SPARK提交任務(wù)到Y(jié)arn集群的過(guò)程
上面的命令執(zhí)行順序大致為：文件描述： spark-submit.sh 提交任務(wù)帝璧，程序進(jìn)入到SparkSubmit 文件代碼中執(zhí)行main()...

960 0 0
spark 行專列先誉，列轉(zhuǎn)行
目的：數(shù)據(jù)行專列湿刽，列轉(zhuǎn)行數(shù)據(jù)準(zhǔn)備：列轉(zhuǎn)行：行專列：完整代碼：

1051 0 0