Spark Transformations and Actions

轉(zhuǎn)換畏梆、操作算子

groupByKey

groupByKey([numTasks])是數(shù)據(jù)分組操作他宛，在一個(gè)由（K,V）對組成的數(shù)據(jù)集上調(diào)用椅文，返回一個(gè)（K,Seq[V])對的數(shù)據(jù)集饱狂。

val rdd0 = sc.parallelize(Array((1,1), (1,2) , (1,3) , (2,1) , (2,2) , (2,3)), 3)

val rdd1 = rdd0.groupByKey()

rdd1.collect

res0: Array[(Int, Iterable[Int])] = Array((1,ArrayBuffer(1, 2, 3)), (2,ArrayBuffer(1, 2, 3)))

union

union(otherDataset)是數(shù)據(jù)合并廷没，返回一個(gè)新的數(shù)據(jù)集钥弯，由原數(shù)據(jù)集和otherDataset聯(lián)合而成壹罚。

val rdd1 = sc.parallelize(1 to 9, 3)

val rdd2 = rdd1.map(x => x * 2)

rdd2.collect

val rdd3 = rdd2.filter(x => x > 10)

rdd3.collect

val rdd4 = rdd1.union(rdd3)

rdd4.collect

res: Array[Int] = Array(1,2,3,4,5,6,7,8,9,12,14,16,18)

join

join(otherDataset, [numTasks])是連接操作，將輸入數(shù)據(jù)集(K,V)和另外一個(gè)數(shù)據(jù)集(K,W)進(jìn)行Join寿羞，得到(K, (V,W))猖凛；該操作是對于相同K的V和W集合進(jìn)行笛卡爾積操作，也即V和W的所有組合绪穆；

val rdd0 = sc.parallelize((1,1),(1,2),(1,3),(2,1),(2,2),(2,3), 3)

val rdd5 = rdd0.join(rdd0)

rdd5.collect

res:?Array[(Int, (Int, Int))] = Array((1,(1,1)), (1,(1,2)), (1,(1,3)), (1,(2,1)), (1,(2,2)), (1,(2,3)), (1,(3,1)), (1,(3,2)), (1,(3,3)), (2,(1,1)), (2,(1,2)), (2,(1,3)), (2,(2,1)), (2,(2,2)), (2,(2,3)), (2,(3,1)), (2,(3,2)), (2,(3,3)))

cogroup

cogroup(otherDataset, [numTasks])是將輸入數(shù)據(jù)集(K, V)和另外一個(gè)數(shù)據(jù)集(K, W)進(jìn)行cogroup辨泳，得到一個(gè)格式為(K, Seq[V], Seq[W])的數(shù)據(jù)集虱岂。

val rdd6 = rdd0.cogroup(rdd0)

rdd6.collect

res: Array[(Int, (Iterable[Int], Iterable[Int]))] = Array((1,(ArrayBuffer(1, 2, 3),ArrayBuffer(1, 2, 3))), (2,(ArrayBuffer(1, 2, 3),ArrayBuffer(1, 2, 3))))

最后編輯于：2017.12.08 18:29:13

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市菠红，隨后出現(xiàn)的幾起案子第岖，更是在濱河造成了極大的恐慌，老刑警劉巖试溯，帶你破解...
沈念sama閱讀 218,122評論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件蔑滓，死亡現(xiàn)場離奇詭異，居然都是意外死亡遇绞，警方通過查閱死者的電腦和手機(jī)键袱，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,070評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來摹闽，“玉大人蹄咖，你說我怎么就攤上這事「堵梗” “怎么了澜汤？”我有些...
開封第一講書人閱讀 164,491評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長舵匾。經(jīng)常有香客問我俊抵，道長，這世上最難降的妖魔是什么坐梯？我笑而不...
開封第一講書人閱讀 58,636評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任徽诲，我火速辦了婚禮，結(jié)果婚禮上烛缔，老公的妹妹穿的比我還像新娘馏段。我一直安慰自己轩拨，他們只是感情好践瓷，可當(dāng)我...
茶點(diǎn)故事閱讀 67,676評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著亡蓉，像睡著了一般晕翠。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上砍濒，一...
開封第一講書人閱讀 51,541評論 1贊 305
城市分裂傳說
那天淋肾，我揣著相機(jī)與錄音，去河邊找鬼爸邢。笑死樊卓，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的杠河。我是一名探鬼主播碌尔，決...
沈念sama閱讀 40,292評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼浇辜，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了唾戚？” 一聲冷哼從身側(cè)響起柳洋，我...
開封第一講書人閱讀 39,211評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎叹坦，沒想到半個(gè)月后熊镣，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,655評論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡募书，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,846評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年绪囱，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片锐膜。...
茶點(diǎn)故事閱讀 39,965評論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡毕箍，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出道盏，到底是詐尸還是另有隱情而柑，我是刑警寧澤，帶...
沈念sama閱讀 35,684評論 5贊 347
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布荷逞，位于F島的核電站媒咳，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏种远。R本人自食惡果不足惜涩澡，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,295評論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望坠敷。院中可真熱鬧妙同，春花似錦、人聲如沸膝迎。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,894評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽限次。三九已至芒涡，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間卖漫，已是汗流浹背费尽。一陣腳步聲響...
開封第一講書人閱讀 33,012評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留羊始，地道東北人旱幼。一個(gè)月前我還...
沈念sama閱讀 48,126評論 3贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像突委，于是被迫代替她去往敵國和親柏卤。傳聞我的和親對象是個(gè)殘疾皇子叹誉，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,914評論 2贊 355

Spark Transformations and Actions

推薦閱讀更多精彩內(nèi)容