RDD持久化

  1. 官網(wǎng)介紹

One of the most important capabilities in Spark is persisting (or caching) a dataset in memory across operations

spark的最重要的一個功能就是跨操作的在內(nèi)存中持久化(緩存)一個數(shù)據(jù)集

When you persist an RDD, each node stores any partitions of it that it computes in memory and reuses them in other actions on that dataset (or datasets derived from it). This allows future actions to be much faster (often by more than 10x)

當(dāng)你持久化一個RDD, 每一個node存儲RDD的所有的分區(qū)信息,
這樣就可以在以內(nèi)存的方式進行計算并且在以后的作用在該dataset
(或者來源自該dataset的數(shù)據(jù)集)的action中進行重用象泵。
這樣以后再使用該action寞秃,該action執(zhí)行的更快(通常超過原來的10倍)

Caching is a key tool for iterative algorithms and fast interactive use

Caching對于迭代算法和快速交互使用的關(guān)鍵工具

You can mark an RDD to be persisted using the persist() or cache() methods on it

可以使用persist()方法或者cache()方法來標(biāo)識某個RDD是持久化的
  1. cache()

2.1 源碼


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市偶惠,隨后出現(xiàn)的幾起案子春寿,更是在濱河造成了極大的恐慌,老刑警劉巖忽孽,帶你破解...
    沈念sama閱讀 216,651評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件绑改,死亡現(xiàn)場離奇詭異谢床,居然都是意外死亡,警方通過查閱死者的電腦和手機厘线,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,468評論 3 392
  • 文/潘曉璐 我一進店門识腿,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人造壮,你說我怎么就攤上這事渡讼。” “怎么了耳璧?”我有些...
    開封第一講書人閱讀 162,931評論 0 353
  • 文/不壞的土叔 我叫張陵成箫,是天一觀的道長。 經(jīng)常有香客問我旨枯,道長蹬昌,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,218評論 1 292
  • 正文 為了忘掉前任攀隔,我火速辦了婚禮皂贩,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘昆汹。我一直安慰自己明刷,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,234評論 6 388
  • 文/花漫 我一把揭開白布筹煮。 她就那樣靜靜地躺著遮精,像睡著了一般。 火紅的嫁衣襯著肌膚如雪败潦。 梳的紋絲不亂的頭發(fā)上本冲,一...
    開封第一講書人閱讀 51,198評論 1 299
  • 那天,我揣著相機與錄音劫扒,去河邊找鬼檬洞。 笑死,一個胖子當(dāng)著我的面吹牛沟饥,可吹牛的內(nèi)容都是我干的添怔。 我是一名探鬼主播,決...
    沈念sama閱讀 40,084評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼贤旷,長吁一口氣:“原來是場噩夢啊……” “哼广料!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起幼驶,我...
    開封第一講書人閱讀 38,926評論 0 274
  • 序言:老撾萬榮一對情侶失蹤艾杏,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后盅藻,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體购桑,經(jīng)...
    沈念sama閱讀 45,341評論 1 311
  • 正文 獨居荒郊野嶺守林人離奇死亡畅铭,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,563評論 2 333
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了勃蜘。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片硕噩。...
    茶點故事閱讀 39,731評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖缭贡,靈堂內(nèi)的尸體忽然破棺而出炉擅,到底是詐尸還是另有隱情,我是刑警寧澤阳惹,帶...
    沈念sama閱讀 35,430評論 5 343
  • 正文 年R本政府宣布坑资,位于F島的核電站,受9級特大地震影響穆端,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜仿便,卻給世界環(huán)境...
    茶點故事閱讀 41,036評論 3 326
  • 文/蒙蒙 一体啰、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧嗽仪,春花似錦荒勇、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,676評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至窿凤,卻和暖如春仅偎,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背雳殊。 一陣腳步聲響...
    開封第一講書人閱讀 32,829評論 1 269
  • 我被黑心中介騙來泰國打工橘沥, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人夯秃。 一個月前我還...
    沈念sama閱讀 47,743評論 2 368
  • 正文 我出身青樓座咆,卻偏偏與公主長得像,于是被迫代替她去往敵國和親仓洼。 傳聞我的和親對象是個殘疾皇子介陶,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,629評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 1. Background 當(dāng)我們需要多次使用同一個 RDD 時,如果簡單的調(diào)用 Action 操作色建,Spark ...
    xiaoc024閱讀 925評論 0 0
  • 為什么需要持久化 所謂的持久化哺呜,就是將數(shù)據(jù)進行保存,避免數(shù)據(jù)丟失镀岛。RDD持久化并非將數(shù)據(jù)落盤保存弦牡,而是用作緩存友驮。了...
    萬事萬物閱讀 1,339評論 0 2
  • rdd的全稱為Resilient Distributed Datasets(彈性分布式數(shù)據(jù)集)rdd的操作有兩種t...
    Albert陳凱閱讀 978評論 0 0
  • (1) persist算子 使用方法: StorageLevel說明: StorageLevel的構(gòu)造函數(shù): St...
    printf200閱讀 295評論 0 1
  • (1) persist算子 使用方法: StorageLevel說明: StorageLevel的構(gòu)造函數(shù): St...
    piziyang12138閱讀 243評論 0 0