dataframe 添加一列看似簡單段多,實際上卻非常復(fù)雜
一 是添加自己定義的數(shù)據(jù)作為一列
val result_instance = result.limit(1).select($"result"as "one").crossJoin(result)
result.limit(1) //讀取第一行沮焕,獲取指定行自行設(shè)計
result.limit(1).select($"result"as "one)
//選取制定行的指定列眯搭,最后得到的是只有一個元素的dataframe
val result_instance = result.limit(1).select($"result"as "one").crossJoin(result)
//crossJoin 進(jìn)行dataframe的合并怖喻,將原先只有一個元素的dataframe擴(kuò)展為一列dataframe 并和原表合并在一起
二 是添加已經(jīng)存在于數(shù)據(jù)表中的數(shù)據(jù)新建作為一列
val outcomes = result_instance
.withColumn("test_vec",lit(Vectors.dense(Array[Double](1.0,1.0,1.0)))
//此方法不做過多解釋失乾,暫時還沒有深入研究