scala語(yǔ)法在spark withScope上的應(yīng)用

withSpout在spark中是用來做DAG可視化的雕崩,它在代碼里的用法如下(以map為例仰坦,spark 1.5.0版本)

def map[U: ClassTag](f: T => U): RDD[U] = withScope {
  val cleanF = sc.clean(f)
  new MapPartitionsRDD[U, T](this, (context, pid, iter) => iter.map(cleanF))
}

因?yàn)閷?duì)scala語(yǔ)法比較生疏扣孟,初次見面官帘,一臉懵逼瞬雹,這里的withScope是個(gè)什么用法?乍看一下有種java的implements Comparable的感覺刽虹。

其實(shí)挖炬,withScope是一個(gè)函數(shù)。

map()的函數(shù)體其實(shí)就是調(diào)用了一下withScope状婶,將泛型什么的先去掉,代碼簡(jiǎn)單來看就是下面這個(gè)樣子馅巷。

def map(f): RDD = withScope(body)

因?yàn)楹瘮?shù)體只有簡(jiǎn)單的一句膛虫,所以省略了大括號(hào) "{ }"。
map函數(shù)補(bǔ)上大括號(hào)可以是這個(gè)樣子钓猬。

def map[U: ClassTag](f: T => U): RDD[U] = {
  withScope {
    val cleanF = sc.clean(f)
    new MapPartitionsRDD[U, T](this, (context, pid, iter) => iter.map(cleanF))
  }
}

函數(shù)只有單一參數(shù)稍刀,調(diào)用時(shí),有時(shí)小括號(hào)和花括號(hào)是可以互換的

比如

rdd.map(x => x._1) //小括號(hào)
rdd.map{x => x._1} //花括號(hào)

這里敞曹,map()的參數(shù)是一個(gè)匿名函數(shù)账月,一句簡(jiǎn)短代碼即可搞定。但是澳迫,當(dāng)函數(shù)用一句搞不定時(shí)局齿,就需要使用"{}"來界定代碼塊了。其實(shí)橄登,于小括號(hào)和花括號(hào)之間來回切換的例子抓歼,在寫spark程序時(shí)讥此,經(jīng)常遇到。
比如:

rdd.map(x => x._1).filter {
  ... //一些用一句代碼不易搞定的復(fù)雜過濾邏輯
}

回到withScope谣妻,它就是一個(gè)只有單一參數(shù)的函數(shù)萄喳。

private[spark] def withScope[U](body: => U): U = RDDOperationScope.withScope[U](sc)(body)

withScope的參數(shù)body是一個(gè)傳名參數(shù)。

傳名參數(shù)

傳名參數(shù) 僅在被使用時(shí)觸發(fā)實(shí)際參數(shù)的求值運(yùn)算蹋半。 它們與 傳值參數(shù) 正好相反他巨。
傳名參數(shù)的優(yōu)點(diǎn)是,如果它們?cè)诤瘮?shù)體中未被使用减江,則不會(huì)對(duì)它們進(jìn)行求值染突。 另一方面,傳值參數(shù)的優(yōu)點(diǎn)是它們僅被計(jì)算一次您市。
傳名參數(shù)給人的感覺就像是字符串替換觉痛,最終把body替換成用戶寫的代碼。
跟蹤withScop的代碼可以看到body的使用茵休。


body的調(diào)用

最開始理解有誤薪棒,以為body的類型是個(gè)無參函數(shù)。無參函數(shù)作為參數(shù)的話榕莺,可以參考下面的代碼中的print2()俐芯。

object TestMain {

  def main(args: Array[String]): Unit = {
    print1(getInt)
    println("-----------")
    print2(getInt)
  }

  def print1(f: => Int): Unit = { //傳名參數(shù)
    println(f)
    println(f.getClass)
  }

  def print2(f: () => Int): Unit = { //函數(shù)參數(shù)
    println(f)
    println(f.getClass)
  }

  def getInt(): Int = {
    1
  }
}

該代碼運(yùn)行結(jié)果如下

1
int
-----------
<function0>
class com.iflytek.gnome.data.tmpsupport.main.TestMain$$anonfun$main$2

柯里化函數(shù)

我們看到上文中的withScope()又調(diào)用了RDDOperationScope中定義的withScope,而且調(diào)用方式有些奇怪钉鸯。有兩個(gè)參數(shù)sc和body吧史,而且用了兩個(gè)括號(hào)。
再去看RDDOperationScope中withScope的定義唠雕,參數(shù)中也用了兩個(gè)括號(hào)贸营。第一個(gè)括號(hào)定義了sc和allowNesting參數(shù),第二個(gè)括號(hào)定義了body參數(shù)岩睁。
這種形式在scala中叫做柯里化(currying)钞脂。

private[spark] def withScope[T](
      sc: SparkContext,
allowNesting: Boolean = false)(body: => T): T = {
  ...
}

柯里化是將原先一次性接受的參數(shù),改成了鏈?zhǔn)浇邮艿男问讲度濉_@里引用《快學(xué)scala》中的例子說明冰啃。

def mul(x: Int)(y: Int) = x * y //定義柯里化函數(shù)
mul(6)(7) //調(diào)用柯里化函數(shù)

嚴(yán)格來講,首先調(diào)用mul(6)刘莹,返回的結(jié)果是函數(shù)(y: Int) => 6 * y (x被替換成了6)阎毅。而這個(gè)函數(shù)又被應(yīng)用到了7,最終得到42点弯。
柯里化的本質(zhì)是什么呢扇调?

其實(shí),上面的mul()是如下形式的簡(jiǎn)寫抢肛。mul()本質(zhì)上是定義了一個(gè)只有參數(shù)x的函數(shù)肃拜,其返回結(jié)果是另一個(gè)函數(shù)痴腌。

def mul(x: Int) = (y: Int) => x * y

如《快學(xué)scala》所說

如你所見,多參數(shù)不過是個(gè)虛飾燃领,并不是編程語(yǔ)言的什么根本性的特質(zhì)士聪。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市猛蔽,隨后出現(xiàn)的幾起案子剥悟,更是在濱河造成了極大的恐慌,老刑警劉巖曼库,帶你破解...
    沈念sama閱讀 211,561評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件区岗,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡毁枯,警方通過查閱死者的電腦和手機(jī)慈缔,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,218評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來种玛,“玉大人藐鹤,你說我怎么就攤上這事÷冈希” “怎么了娱节?”我有些...
    開封第一講書人閱讀 157,162評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)祭示。 經(jīng)常有香客問我肄满,道長(zhǎng),這世上最難降的妖魔是什么质涛? 我笑而不...
    開封第一講書人閱讀 56,470評(píng)論 1 283
  • 正文 為了忘掉前任稠歉,我火速辦了婚禮,結(jié)果婚禮上汇陆,老公的妹妹穿的比我還像新娘轧抗。我一直安慰自己,他們只是感情好瞬测,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,550評(píng)論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著纠炮,像睡著了一般月趟。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上恢口,一...
    開封第一講書人閱讀 49,806評(píng)論 1 290
  • 那天孝宗,我揣著相機(jī)與錄音,去河邊找鬼耕肩。 笑死因妇,一個(gè)胖子當(dāng)著我的面吹牛问潭,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播婚被,決...
    沈念sama閱讀 38,951評(píng)論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼狡忙,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了址芯?” 一聲冷哼從身側(cè)響起灾茁,我...
    開封第一講書人閱讀 37,712評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎谷炸,沒想到半個(gè)月后北专,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,166評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡旬陡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,510評(píng)論 2 327
  • 正文 我和宋清朗相戀三年拓颓,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片描孟。...
    茶點(diǎn)故事閱讀 38,643評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡驶睦,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出画拾,到底是詐尸還是另有隱情啥繁,我是刑警寧澤,帶...
    沈念sama閱讀 34,306評(píng)論 4 330
  • 正文 年R本政府宣布青抛,位于F島的核電站旗闽,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏蜜另。R本人自食惡果不足惜适室,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,930評(píng)論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望举瑰。 院中可真熱鬧捣辆,春花似錦、人聲如沸此迅。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,745評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)耸序。三九已至忍些,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間坎怪,已是汗流浹背罢坝。 一陣腳步聲響...
    開封第一講書人閱讀 31,983評(píng)論 1 266
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留搅窿,地道東北人嘁酿。 一個(gè)月前我還...
    沈念sama閱讀 46,351評(píng)論 2 360
  • 正文 我出身青樓隙券,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親闹司。 傳聞我的和親對(duì)象是個(gè)殘疾皇子娱仔,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,509評(píng)論 2 348