高性能計算奕枝、大數(shù)據(jù)與機(jī)器學(xué)習(xí)的融合

2019年9月哥谷,美國國家科學(xué)技術(shù)理事會(NSTC)發(fā)布《高性能計算、大數(shù)據(jù)與機(jī)器學(xué)習(xí)的融合》報告麻献,對美國網(wǎng)絡(luò)與信息技術(shù)研發(fā)計劃(NITRD)大數(shù)據(jù)與高端計算研發(fā)機(jī)構(gòu)間工作組于去年10月舉行的同名會議進(jìn)行了總結(jié)们妥。關(guān)鍵結(jié)論(1)隨著數(shù)據(jù)量的急速增加,在科學(xué)需求的推動下勉吻,高性能計算(HPC)监婶、大數(shù)據(jù)(BD)和機(jī)器學(xué)習(xí)(ML)不斷融合。數(shù)據(jù)的產(chǎn)生不再是瓶頸齿桃,取而代之的是數(shù)據(jù)的管理惑惶、分析和推理。(2)隨著半導(dǎo)體縮放對性能提升的貢獻(xiàn)逐漸減少短纵,未來系統(tǒng)的異構(gòu)性將不斷增加带污。系統(tǒng)將需要全面提高靈活性并具備低延遲,以更有效地支持新的應(yīng)用香到。此外鱼冀,因為當(dāng)前可信數(shù)據(jù)很少,需要新的工具與基準(zhǔn)來處理HPC模擬悠就、大數(shù)據(jù)和機(jī)器學(xué)習(xí)應(yīng)用中遇到的通用問題千绪。(3)未來的計算生態(tài)系統(tǒng)將不同于當(dāng)前的計算生態(tài)系統(tǒng),更可能是將邊緣計算梗脾、云計算和高性能計算結(jié)合起來荸型。為實現(xiàn)這種無縫的生態(tài)系統(tǒng),將需要新的編程算法炸茧、語言編譯器瑞妇、操作系統(tǒng)和運(yùn)行時系統(tǒng)來提供新的抽象與服務(wù)。預(yù)計“邊緣智能計算”的重要性將日益提升梭冠,其涉及網(wǎng)絡(luò)邊緣(近數(shù)據(jù)源)的智能數(shù)據(jù)采集或數(shù)據(jù)分類辕狰。(4)HPC、BD和ML社區(qū)間需要開展更多的合作妈嘹,以實現(xiàn)更高校快速的生態(tài)系統(tǒng)開發(fā)绍妨,更有效地服務(wù)于這三類社區(qū)润脸。數(shù)據(jù)分析與HPC模擬的融合已經(jīng)取得了一些進(jìn)展,而由于技術(shù)和組織上的差異他去,支持HPC和BD社區(qū)的軟件生態(tài)系統(tǒng)卻呈現(xiàn)出完全不同的情況毙驯。

已經(jīng)為大家精心準(zhǔn)備了大數(shù)據(jù)的系統(tǒng)學(xué)習(xí)資料,從Linux-Hadoop-spark-......灾测,需要的小伙伴可以點(diǎn)擊進(jìn)入

案例HPC-BD-ML融合的一個案例是美國能源部與國立衛(wèi)生研究院合作在國家癌癥研究所開展的“癌癥分布式學(xué)習(xí)環(huán)境”(CANDLE)項目爆价,其致力于匯集分子、藥物反應(yīng)、治療策略三個重大挑戰(zhàn)領(lǐng)域的數(shù)據(jù)铭段,來改進(jìn)癌癥患者的療效骤宣。每一領(lǐng)域都有不同的專家團(tuán)隊在不同規(guī)模、模型和模擬中使用不同形式的數(shù)據(jù)序愚,以求創(chuàng)建一個“單一可擴(kuò)展的深度神經(jīng)網(wǎng)絡(luò)代碼憔披,用于解決所有三大挑戰(zhàn)”:理解關(guān)鍵蛋白質(zhì)交互的分子生物學(xué)原理;開發(fā)可用于藥物反應(yīng)的預(yù)測模型爸吮;從數(shù)以百萬計的癌癥患者記錄中自動分析與提取信息芬膝,并確定最佳的癌癥治療策略。

另一個案例是能源部和產(chǎn)業(yè)界形娇、學(xué)術(shù)界共同開展的“面向氣候分析的百億億次深度學(xué)習(xí)”項目锰霜,來自多家機(jī)構(gòu)的研究人員借助能源部的“頂點(diǎn)”(Summit)超算系統(tǒng),利用經(jīng)訓(xùn)練的深度學(xué)習(xí)模型識別極端天氣模式桐早。研究團(tuán)隊開發(fā)了一種創(chuàng)新的卷積分割架構(gòu)癣缅,可自動提取熱帶氣旋、大氣河流等極端天氣模式的像素級掩模勘畔,有助于氣候科學(xué)界表征未來同類事件的頻率和強(qiáng)度所灸。該項目獲得了2018年的戈登貝爾獎。

機(jī)遇與挑戰(zhàn)(1)硬件模擬和數(shù)據(jù)分析均依賴于計算系統(tǒng)的能力炫七,當(dāng)硬件異構(gòu)性隨著不斷變化的用戶需求日益提升時爬立,系統(tǒng)性能也會隨之提升。融合面臨的主要硬件挑戰(zhàn)包括:所有層的互連效率万哪,創(chuàng)新性工具與通用端到端基準(zhǔn)套件侠驯,功耗,集成內(nèi)存奕巍,可擴(kuò)展文件系統(tǒng)吟策,可靠網(wǎng)絡(luò),平衡的硬件開發(fā)等的止。(2)運(yùn)作模式大型試驗過去主要依賴于本地計算資源進(jìn)行數(shù)據(jù)分析檩坚,現(xiàn)在越來越轉(zhuǎn)向于通過HPC獲得實時結(jié)果。同樣的诅福,部分機(jī)器學(xué)習(xí)和深度學(xué)習(xí)應(yīng)用也需要借助HPC資源進(jìn)行訓(xùn)練匾委。模擬的規(guī)模和復(fù)雜性也需要一個應(yīng)用能處理復(fù)雜工作流并通過ML實現(xiàn)工作負(fù)載的自動化。就分布式基礎(chǔ)設(shè)施中HPC氓润、模擬赂乐、數(shù)據(jù)分析與機(jī)器學(xué)習(xí)在工作流中的融合而言,邊緣智能計算提供了一個很好的例子咖气。主要的運(yùn)作模式挑戰(zhàn)包括:面向ML與大規(guī)模數(shù)據(jù)分析的可擴(kuò)展工具與能力挨措,新用戶培訓(xùn)與支持挖滤,新的數(shù)據(jù)工具與服務(wù),管理良好的端到端解決方案等浅役。(3)軟件最近的HPC系統(tǒng)能很好地將模擬的預(yù)測功能與機(jī)器學(xué)習(xí)的分析和優(yōu)化功能相結(jié)合斩松。隨著深度神經(jīng)網(wǎng)絡(luò)在機(jī)器學(xué)習(xí)中的應(yīng)用,數(shù)據(jù)分析目前也具有了傳統(tǒng)HPC工作負(fù)載的計算特性担租。HPC和數(shù)據(jù)分析系統(tǒng)都采用了GPU等加速器來改善單個計算節(jié)點(diǎn)的性能砸民,而且為突破計算性能擴(kuò)展的限制,這種趨勢還將繼續(xù)奋救。主要的軟件挑戰(zhàn)包括:系統(tǒng)設(shè)計岭参,邊緣計算或邊緣智能計算,系統(tǒng)管理尝艘,通用軟件庫等演侯。

碼字不容易,幫忙點(diǎn)個贊,點(diǎn)贊關(guān)注是我寫作的動力,謝謝背亥!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末秒际,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子狡汉,更是在濱河造成了極大的恐慌娄徊,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,816評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件盾戴,死亡現(xiàn)場離奇詭異寄锐,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)尖啡,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,729評論 3 385
  • 文/潘曉璐 我一進(jìn)店門橄仆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人衅斩,你說我怎么就攤上這事盆顾。” “怎么了畏梆?”我有些...
    開封第一講書人閱讀 158,300評論 0 348
  • 文/不壞的土叔 我叫張陵您宪,是天一觀的道長。 經(jīng)常有香客問我奠涌,道長宪巨,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,780評論 1 285
  • 正文 為了忘掉前任铣猩,我火速辦了婚禮揖铜,結(jié)果婚禮上茴丰,老公的妹妹穿的比我還像新娘达皿。我一直安慰自己天吓,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,890評論 6 385
  • 文/花漫 我一把揭開白布峦椰。 她就那樣靜靜地躺著龄寞,像睡著了一般。 火紅的嫁衣襯著肌膚如雪汤功。 梳的紋絲不亂的頭發(fā)上物邑,一...
    開封第一講書人閱讀 50,084評論 1 291
  • 那天,我揣著相機(jī)與錄音滔金,去河邊找鬼色解。 笑死,一個胖子當(dāng)著我的面吹牛餐茵,可吹牛的內(nèi)容都是我干的科阎。 我是一名探鬼主播,決...
    沈念sama閱讀 39,151評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼忿族,長吁一口氣:“原來是場噩夢啊……” “哼锣笨!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起道批,我...
    開封第一講書人閱讀 37,912評論 0 268
  • 序言:老撾萬榮一對情侶失蹤错英,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后隆豹,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體椭岩,經(jīng)...
    沈念sama閱讀 44,355評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,666評論 2 327
  • 正文 我和宋清朗相戀三年噪伊,在試婚紗的時候發(fā)現(xiàn)自己被綠了簿煌。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,809評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡鉴吹,死狀恐怖姨伟,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情豆励,我是刑警寧澤夺荒,帶...
    沈念sama閱讀 34,504評論 4 334
  • 正文 年R本政府宣布,位于F島的核電站良蒸,受9級特大地震影響技扼,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜嫩痰,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,150評論 3 317
  • 文/蒙蒙 一剿吻、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧串纺,春花似錦丽旅、人聲如沸椰棘。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽邪狞。三九已至,卻和暖如春茅撞,著一層夾襖步出監(jiān)牢的瞬間帆卓,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,121評論 1 267
  • 我被黑心中介騙來泰國打工米丘, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留剑令,地道東北人。 一個月前我還...
    沈念sama閱讀 46,628評論 2 362
  • 正文 我出身青樓拄查,卻偏偏與公主長得像尚洽,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子靶累,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,724評論 2 351

推薦閱讀更多精彩內(nèi)容