IP屬地:貴州
Spark序列化概述 在Spark的架構(gòu)中颖对,在網(wǎng)絡(luò)中傳遞的或者緩存在內(nèi)存抓督、硬盤中的對象需要進行序列化操作肴敛,序列化的作用主要是利用時間換空間: 分...
廣播數(shù)據(jù)變量 ? 在App中經(jīng)常會用到List太惠、MaP等變量镰矿。如果不適用廣播變量阱穗,默認每個task都會拉取一份副本到本地哭懈。廣播變量的好處灾馒,不...
場景需求: 將SparkSQL計算的結(jié)果數(shù)據(jù)保存到MySQL,但是計算數(shù)據(jù)里面缺少into_time字段。通過withColumn和UDF實現(xiàn)新...