2019年9月哥谷,美國國家科學(xué)技術(shù)理事會(NSTC)發(fā)布《高性能計算、大數(shù)據(jù)與機(jī)器學(xué)習(xí)的融合》報告麻献,對美國網(wǎng)絡(luò)與信息技術(shù)研發(fā)計劃(NITRD)大數(shù)據(jù)與高端計算研發(fā)機(jī)構(gòu)間工作組于去年10月舉行的同名會議進(jìn)行了總結(jié)们妥。關(guān)鍵結(jié)論(1)隨著數(shù)據(jù)量的急速增加,在科學(xué)需求的推動下勉吻,高性能計算(HPC)监婶、大數(shù)據(jù)(BD)和機(jī)器學(xué)習(xí)(ML)不斷融合。數(shù)據(jù)的產(chǎn)生不再是瓶頸齿桃,取而代之的是數(shù)據(jù)的管理惑惶、分析和推理。(2)隨著半導(dǎo)體縮放對性能提升的貢獻(xiàn)逐漸減少短纵,未來系統(tǒng)的異構(gòu)性將不斷增加带污。系統(tǒng)將需要全面提高靈活性并具備低延遲,以更有效地支持新的應(yīng)用香到。此外鱼冀,因為當(dāng)前可信數(shù)據(jù)很少,需要新的工具與基準(zhǔn)來處理HPC模擬悠就、大數(shù)據(jù)和機(jī)器學(xué)習(xí)應(yīng)用中遇到的通用問題千绪。(3)未來的計算生態(tài)系統(tǒng)將不同于當(dāng)前的計算生態(tài)系統(tǒng),更可能是將邊緣計算梗脾、云計算和高性能計算結(jié)合起來荸型。為實現(xiàn)這種無縫的生態(tài)系統(tǒng),將需要新的編程算法炸茧、語言編譯器瑞妇、操作系統(tǒng)和運(yùn)行時系統(tǒng)來提供新的抽象與服務(wù)。預(yù)計“邊緣智能計算”的重要性將日益提升梭冠,其涉及網(wǎng)絡(luò)邊緣(近數(shù)據(jù)源)的智能數(shù)據(jù)采集或數(shù)據(jù)分類辕狰。(4)HPC、BD和ML社區(qū)間需要開展更多的合作妈嘹,以實現(xiàn)更高校快速的生態(tài)系統(tǒng)開發(fā)绍妨,更有效地服務(wù)于這三類社區(qū)润脸。數(shù)據(jù)分析與HPC模擬的融合已經(jīng)取得了一些進(jìn)展,而由于技術(shù)和組織上的差異他去,支持HPC和BD社區(qū)的軟件生態(tài)系統(tǒng)卻呈現(xiàn)出完全不同的情況毙驯。
案例HPC-BD-ML融合的一個案例是美國能源部與國立衛(wèi)生研究院合作在國家癌癥研究所開展的“癌癥分布式學(xué)習(xí)環(huán)境”(CANDLE)項目爆价,其致力于匯集分子、藥物反應(yīng)、治療策略三個重大挑戰(zhàn)領(lǐng)域的數(shù)據(jù)铭段,來改進(jìn)癌癥患者的療效骤宣。每一領(lǐng)域都有不同的專家團(tuán)隊在不同規(guī)模、模型和模擬中使用不同形式的數(shù)據(jù)序愚,以求創(chuàng)建一個“單一可擴(kuò)展的深度神經(jīng)網(wǎng)絡(luò)代碼憔披,用于解決所有三大挑戰(zhàn)”:理解關(guān)鍵蛋白質(zhì)交互的分子生物學(xué)原理;開發(fā)可用于藥物反應(yīng)的預(yù)測模型爸吮;從數(shù)以百萬計的癌癥患者記錄中自動分析與提取信息芬膝,并確定最佳的癌癥治療策略。
另一個案例是能源部和產(chǎn)業(yè)界形娇、學(xué)術(shù)界共同開展的“面向氣候分析的百億億次深度學(xué)習(xí)”項目锰霜,來自多家機(jī)構(gòu)的研究人員借助能源部的“頂點(diǎn)”(Summit)超算系統(tǒng),利用經(jīng)訓(xùn)練的深度學(xué)習(xí)模型識別極端天氣模式桐早。研究團(tuán)隊開發(fā)了一種創(chuàng)新的卷積分割架構(gòu)癣缅,可自動提取熱帶氣旋、大氣河流等極端天氣模式的像素級掩模勘畔,有助于氣候科學(xué)界表征未來同類事件的頻率和強(qiáng)度所灸。該項目獲得了2018年的戈登貝爾獎。
機(jī)遇與挑戰(zhàn)(1)硬件模擬和數(shù)據(jù)分析均依賴于計算系統(tǒng)的能力炫七,當(dāng)硬件異構(gòu)性隨著不斷變化的用戶需求日益提升時爬立,系統(tǒng)性能也會隨之提升。融合面臨的主要硬件挑戰(zhàn)包括:所有層的互連效率万哪,創(chuàng)新性工具與通用端到端基準(zhǔn)套件侠驯,功耗,集成內(nèi)存奕巍,可擴(kuò)展文件系統(tǒng)吟策,可靠網(wǎng)絡(luò),平衡的硬件開發(fā)等的止。(2)運(yùn)作模式大型試驗過去主要依賴于本地計算資源進(jìn)行數(shù)據(jù)分析檩坚,現(xiàn)在越來越轉(zhuǎn)向于通過HPC獲得實時結(jié)果。同樣的诅福,部分機(jī)器學(xué)習(xí)和深度學(xué)習(xí)應(yīng)用也需要借助HPC資源進(jìn)行訓(xùn)練匾委。模擬的規(guī)模和復(fù)雜性也需要一個應(yīng)用能處理復(fù)雜工作流并通過ML實現(xiàn)工作負(fù)載的自動化。就分布式基礎(chǔ)設(shè)施中HPC氓润、模擬赂乐、數(shù)據(jù)分析與機(jī)器學(xué)習(xí)在工作流中的融合而言,邊緣智能計算提供了一個很好的例子咖气。主要的運(yùn)作模式挑戰(zhàn)包括:面向ML與大規(guī)模數(shù)據(jù)分析的可擴(kuò)展工具與能力挨措,新用戶培訓(xùn)與支持挖滤,新的數(shù)據(jù)工具與服務(wù),管理良好的端到端解決方案等浅役。(3)軟件最近的HPC系統(tǒng)能很好地將模擬的預(yù)測功能與機(jī)器學(xué)習(xí)的分析和優(yōu)化功能相結(jié)合斩松。隨著深度神經(jīng)網(wǎng)絡(luò)在機(jī)器學(xué)習(xí)中的應(yīng)用,數(shù)據(jù)分析目前也具有了傳統(tǒng)HPC工作負(fù)載的計算特性担租。HPC和數(shù)據(jù)分析系統(tǒng)都采用了GPU等加速器來改善單個計算節(jié)點(diǎn)的性能砸民,而且為突破計算性能擴(kuò)展的限制,這種趨勢還將繼續(xù)奋救。主要的軟件挑戰(zhàn)包括:系統(tǒng)設(shè)計岭参,邊緣計算或邊緣智能計算,系統(tǒng)管理尝艘,通用軟件庫等演侯。
碼字不容易,幫忙點(diǎn)個贊,點(diǎn)贊關(guān)注是我寫作的動力,謝謝背亥!