spark常見行動算子

reduce(f:(T,T)=>T)

1. 作用:通過func函數(shù)聚集RDD中的所有元素康愤,先聚合分區(qū)內(nèi)數(shù)據(jù),再聚合分區(qū)間數(shù)據(jù)

2.創(chuàng)建一個(gè)RDD針對里面的元素進(jìn)行累加計(jì)算獲取結(jié)果

val rdd=sc.makeRDD(1 to 10)

rdd.reduce(_ + _)


count()

1.作用:在驅(qū)動程序中贮匕,以數(shù)組的形式返回?cái)?shù)據(jù)集的所有元素

2. 需求:創(chuàng)建一個(gè)RDD,并將RDD內(nèi)容收集到Driver端打印

val rdd=sc.makeRDD(1 to 10)?

rdd.count()

結(jié)果:

10



first()

1. 作用:返回RDD中的第一個(gè)元素

2.創(chuàng)建一個(gè)RDD,獲取里面的第一個(gè)元素調(diào)用first函數(shù)返回第一個(gè)元祖,底層調(diào)用的就是take()函數(shù)

val rdd2=sc.makeRDD(Arrray(("qiuxiang",1),("tangbohu",3),("huangrong",3)))

rdd2.first()

結(jié)果:

("qiuxiang",1)


take(num: Int)

1. 作用:返回一個(gè)由RDD的前n個(gè)元素組成的數(shù)組,

2.創(chuàng)建一個(gè)RDD,獲取里面的第一個(gè)元素調(diào)用first函數(shù)返回第一個(gè)元祖

val rdd2=sc.makeRDD(Arrray(("qiuxiang",1),("tangbohu",3),("huangrong",3)))

rdd2.take(3)

結(jié)果:

("qiuxiang",1),("tangbohu",3),("huangrong",3


takeOrdered(num:Int)&& top(num:Int)

1. 作用:返回該RDD排序后的前n個(gè)元素組成的數(shù)組,內(nèi)部涉及排序默認(rèn)是升序,top是降序

2.創(chuàng)建一個(gè)RDD,獲取里面的第一個(gè)元素調(diào)用takeOrdered算子

val rdd=sc.makeRDD(Array(1,90,23,10,11,88,23,-1))

rdd.takeOrdered(3)

rdd.top(3)

結(jié)果:

Aarray(-1, 1, 10)

Array(90, 88, 23)

aggregat[U: ClassTag]((zeroValue: U)(seqOp: (U, T) => U, combOp: (U, U) => U))

0.參數(shù)(zeroValue: U)(seqOp: (U, T) => U, combOp: (U, U) => U)

1.作用:aggregate函數(shù)將每個(gè)分區(qū)里面的元素通過seqOp和初始值進(jìn)行聚合(即第一個(gè)參數(shù)的作用),然后用combine函數(shù)將每個(gè)分區(qū)的結(jié)果和初始值(zeroValue)進(jìn)行combine操作守呜。這個(gè)函數(shù)最終返回的類型不需要和RDD中元素類型一致 為了更好的理解這個(gè)這個(gè)算子的作用我們下面進(jìn)行一個(gè)簡單的操作

2.需求:創(chuàng)建一個(gè)RDD指定RDD由Array(num:Int),2個(gè)分區(qū)組成計(jì)算這個(gè)RDD元素的值

val rdd=sc.makeRDD(Array(10,29,90,11,24,10),2)

rdd.aggregate(0)((x:Int,y:Int)=>(x+y),(x:Int,y:Int)=>(x+y))

結(jié)果 :174

上面結(jié)果其實(shí)沒有問題但是如果將初始值改成10的話

rdd.aggregate(10)((x:Int,y:Int)=>(x+y),(x:Int,y:Int)=>(x+y))

結(jié)果:204

204的計(jì)算結(jié)果是是怎么算出來的呢?

我們這里計(jì)算的有兩個(gè)分區(qū)aggregat()算子,是先分區(qū)內(nèi)計(jì)算,再分區(qū)之間計(jì)算,然后再分區(qū)數(shù)計(jì)算

p0? ? (10,20,90)? ?p0分區(qū)內(nèi)的數(shù)據(jù)計(jì)算結(jié)果是10+10+20+90=139

p1? ? ?(11,24,10? )? ?p1分區(qū)內(nèi)的數(shù)據(jù)計(jì)算結(jié)果是: 10+11+24+10=55

p0? ? p1? 兩個(gè)分區(qū) 計(jì)算結(jié)果為:10

最終結(jié)果是:139+55+10=204


fold(zeroValue:T)(op: (T, T) =>T)

1. 作用:折疊操作山憨,aggregate的簡化操作查乒,seqop和combop一樣

2.val rdd=sc.makeRDD(Array(10,29,90,11,24,10),2)

rdd.fold(0)(_+_)

結(jié)果:174

saveAsTextFile(path:String)

1.作用:將數(shù)據(jù)集的元素以textfile的形式保存到HDFS文件系統(tǒng)或者其他支持的文件系統(tǒng),對于每個(gè)元素郁竟,Spark將會調(diào)用toString方法玛迄,將它裝換為文件中的文本

saveAsSequenceFile(path:String)

作用:將數(shù)據(jù)集中的元素以Hadoop sequencefile的格式保存到指定的目錄下,可以使HDFS或者其他Hadoop支持的文件系統(tǒng)

saveAsObjectFile(path:String)

作用:用于將RDD中的元素序列化成對象枪孩,存儲到文件中

countByKey()

1. 作用:針對(K,V)類型的RDD憔晒,返回一個(gè)(K,Int)的map,表示每一個(gè)key對應(yīng)的元素個(gè)數(shù)蔑舞。

2.創(chuàng)建一個(gè)PairRDD拒担,統(tǒng)計(jì)每種key的個(gè)數(shù)

val rdd= sc.makRDD(List((1,3),(1,2),(1,4),(2,3),(3,6),(3,8)),3)

?rdd.countByKey

結(jié)果:Map(3 -> 2, 1 -> 3, 2 -> 1)

foreach[U](f:A =>U)

1. 作用:在數(shù)據(jù)集的每一個(gè)元素上,運(yùn)行函數(shù)func進(jìn)行更新

需求:創(chuàng)建一個(gè)RDD攻询,對每個(gè)元素進(jìn)行打印

val rdd= sc.makRDD(List((1,3),(1,2),(1,4),(2,3),(3,6),(3,8)),3)

rdd.foreach(t=>{print(t._1+"--"+t._2)})

結(jié)果:1--3 1--2 1--4 2--3 3--6 3--8

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末从撼,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子钧栖,更是在濱河造成了極大的恐慌低零,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,640評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件拯杠,死亡現(xiàn)場離奇詭異掏婶,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)潭陪,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,254評論 3 395
  • 文/潘曉璐 我一進(jìn)店門雄妥,熙熙樓的掌柜王于貴愁眉苦臉地迎上來最蕾,“玉大人,你說我怎么就攤上這事老厌∥猎颍” “怎么了?”我有些...
    開封第一講書人閱讀 165,011評論 0 355
  • 文/不壞的土叔 我叫張陵枝秤,是天一觀的道長醋拧。 經(jīng)常有香客問我,道長淀弹,這世上最難降的妖魔是什么丹壕? 我笑而不...
    開封第一講書人閱讀 58,755評論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮薇溃,結(jié)果婚禮上雀费,老公的妹妹穿的比我還像新娘。我一直安慰自己痊焊,他們只是感情好盏袄,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,774評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著薄啥,像睡著了一般辕羽。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上垄惧,一...
    開封第一講書人閱讀 51,610評論 1 305
  • 那天刁愿,我揣著相機(jī)與錄音,去河邊找鬼到逊。 笑死铣口,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的觉壶。 我是一名探鬼主播脑题,決...
    沈念sama閱讀 40,352評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼铜靶!你這毒婦竟也來了叔遂?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,257評論 0 276
  • 序言:老撾萬榮一對情侶失蹤争剿,失蹤者是張志新(化名)和其女友劉穎已艰,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蚕苇,經(jīng)...
    沈念sama閱讀 45,717評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡哩掺,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,894評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了涩笤。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片嚼吞。...
    茶點(diǎn)故事閱讀 40,021評論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡幔嫂,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出誊薄,到底是詐尸還是另有隱情,我是刑警寧澤锰茉,帶...
    沈念sama閱讀 35,735評論 5 346
  • 正文 年R本政府宣布呢蔫,位于F島的核電站,受9級特大地震影響飒筑,放射性物質(zhì)發(fā)生泄漏片吊。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,354評論 3 330
  • 文/蒙蒙 一协屡、第九天 我趴在偏房一處隱蔽的房頂上張望俏脊。 院中可真熱鬧,春花似錦肤晓、人聲如沸爷贫。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,936評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽漫萄。三九已至,卻和暖如春盈匾,著一層夾襖步出監(jiān)牢的瞬間腾务,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,054評論 1 270
  • 我被黑心中介騙來泰國打工削饵, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留岩瘦,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,224評論 3 371
  • 正文 我出身青樓窿撬,卻偏偏與公主長得像启昧,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子劈伴,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,974評論 2 355

推薦閱讀更多精彩內(nèi)容