迭代計算

一、Apache Hama

簡介:Apache Hama是一個純BSP(Bulk Synchronous Parallel)計算框架,模仿了Google的Pregel瑰煎。用來處理大規(guī)模的科學(xué)計算嗤军,特別是矩陣和圖計算。

?建立在Hadoop上的分布式并行計算模型苫亦。

?基于 Map/Reduce 和 Bulk Synchronous 的實現(xiàn)框架。

?運(yùn)行環(huán)境需要關(guān)聯(lián) Zookeeper怨咪、HBase屋剑、HDFS 組件。

Hama中有2個主要的模型:

– 矩陣計算(Matrix package)

– 面向圖計算(Graph package)

Apache Hama官方網(wǎng)站>>>

二诗眨、Apache Giraph

代碼托管地址:GitHub

簡介:Apache Giraph是一個可伸縮的分布式迭代圖處理系統(tǒng)唉匾,靈感來自BSP(bulk synchronous parallel)和Google的Pregel,與它們 區(qū)別于則是是開源匠楚、基于 Hadoop 的架構(gòu)等巍膘。

Giraph處理平臺適用于運(yùn)行大規(guī)模的邏輯計算,比如頁面排行芋簿、共享鏈接峡懈、基于個性化排行等。Giraph專注于社交圖計算益咬,被Facebook作為其Open Graph工具的核心逮诲,幾分鐘內(nèi)處理數(shù)萬億次用戶及其行為之間的連接帜平。

三、HaLoop

簡介:迭代的MapReduce梅鹦,HaLoop——適用于迭代計算的Hadoop 裆甩。

Hadoop與HaLoop的不同

與Hadoop比較的四點(diǎn)改變:

1.提供了一套新的編程接口,更加適用于迭代計算齐唆;

2.HaLoop的master進(jìn)行job內(nèi)的循環(huán)控制嗤栓,直到迭代計算結(jié)束;

3.Task Scheduler也進(jìn)行了修改箍邮,使得任務(wù)能夠盡量滿足data locality

4.slave nodes對數(shù)據(jù)進(jìn)行cache并index索引茉帅,索引也以文件的形式保存在本地磁盤。

HaLoop官網(wǎng)>>>

四锭弊、Twister

簡介:Twister堪澎, 迭代式MapReduce框架,Twister是由一個印度人開發(fā)的味滞,其架構(gòu)如下:

在Twister中樱蛤,大文件不會自動被切割成一個一個block,因而用戶需提前把文件分成一個一個小文件剑鞍,以供每個task處理昨凡。在map階段,經(jīng)過map()處理完的結(jié)果被放在分布式內(nèi)存中蚁署,然后通過一個broker network(NaradaBroking系統(tǒng))將數(shù)據(jù)push給各個reduce task(Twister假設(shè)內(nèi)存足夠大便脊,中間數(shù)據(jù)可以全部放在內(nèi)存中);在reduce階段光戈,所有reduce task產(chǎn)生的結(jié)果通過一個combine操作進(jìn)行歸并哪痰,此時,用戶可以進(jìn)行條件判定田度, 確定迭代是否結(jié)束妒御。combine后的數(shù)據(jù)直接被送給map task解愤,開始新一輪的迭代镇饺。為了提高容錯性,Twister每隔一段時間會將map task和reduce task產(chǎn)生的結(jié)果寫到磁盤上送讲,這樣奸笤,一旦某個task失敗,它可以從最近的備份中獲取輸入哼鬓,重新計算监右。

為了避免每次迭代重新創(chuàng)建task,Twister維護(hù)了一個task pool异希,每次需要task時直接從pool中取健盒。在Twister中,所有消息和數(shù)據(jù)都是通過broker network傳遞的,該broker network是一個獨(dú)立的模塊扣癣,目前支持NaradaBroking和ActiveMQ惰帽。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市父虑,隨后出現(xiàn)的幾起案子该酗,更是在濱河造成了極大的恐慌,老刑警劉巖士嚎,帶你破解...
    沈念sama閱讀 206,723評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件呜魄,死亡現(xiàn)場離奇詭異,居然都是意外死亡莱衩,警方通過查閱死者的電腦和手機(jī)爵嗅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,485評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來笨蚁,“玉大人操骡,你說我怎么就攤上這事∽裕” “怎么了册招?”我有些...
    開封第一講書人閱讀 152,998評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長勒极。 經(jīng)常有香客問我是掰,道長,這世上最難降的妖魔是什么辱匿? 我笑而不...
    開封第一講書人閱讀 55,323評論 1 279
  • 正文 為了忘掉前任键痛,我火速辦了婚禮,結(jié)果婚禮上匾七,老公的妹妹穿的比我還像新娘絮短。我一直安慰自己,他們只是感情好昨忆,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,355評論 5 374
  • 文/花漫 我一把揭開白布丁频。 她就那樣靜靜地躺著,像睡著了一般邑贴。 火紅的嫁衣襯著肌膚如雪席里。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,079評論 1 285
  • 那天拢驾,我揣著相機(jī)與錄音奖磁,去河邊找鬼。 笑死繁疤,一個胖子當(dāng)著我的面吹牛咖为,可吹牛的內(nèi)容都是我干的秕狰。 我是一名探鬼主播,決...
    沈念sama閱讀 38,389評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼躁染,長吁一口氣:“原來是場噩夢啊……” “哼封恰!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起褐啡,我...
    開封第一講書人閱讀 37,019評論 0 259
  • 序言:老撾萬榮一對情侶失蹤诺舔,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后备畦,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體低飒,經(jīng)...
    沈念sama閱讀 43,519評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,971評論 2 325
  • 正文 我和宋清朗相戀三年懂盐,在試婚紗的時候發(fā)現(xiàn)自己被綠了褥赊。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,100評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡莉恼,死狀恐怖拌喉,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情俐银,我是刑警寧澤尿背,帶...
    沈念sama閱讀 33,738評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站捶惜,受9級特大地震影響田藐,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜吱七,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,293評論 3 307
  • 文/蒙蒙 一汽久、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧踊餐,春花似錦景醇、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,289評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至苍碟,卻和暖如春酒觅,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背微峰。 一陣腳步聲響...
    開封第一講書人閱讀 31,517評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留抒钱,地道東北人蜓肆。 一個月前我還...
    沈念sama閱讀 45,547評論 2 354
  • 正文 我出身青樓颜凯,卻偏偏與公主長得像,于是被迫代替她去往敵國和親仗扬。 傳聞我的和親對象是個殘疾皇子症概,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,834評論 2 345

推薦閱讀更多精彩內(nèi)容