有時(shí)候有沒(méi)有這么一種情況黎泣,我拿到了一個(gè)sql,csv,parquet文件,一起來(lái)就想寫(xiě)sql,不想寫(xiě)那些亂七八糟的的東西勘究,只是想快速實(shí)現(xiàn)我要的聚合查詢(xún)數(shù)據(jù)。那么我們可以利用spark-sql直接操作文件的特性處理這類(lèi)的需求妻率,姐姐再也不用擔(dān)心我不會(huì)spark了,因?yàn)槲揖椭粫?huì)sql板祝。
使用方法
csv
spark.sql("select * from csv.`/tmp/demo.csv`").show(false)
json
spark.sql("select * from json.`/tmp/demo.json`").show(false)
parquet
spark.sql("select * from parquet.`/tmp/demo.parquet`").show(false)