摘要:據(jù)了解颠毙,借助阿里云蛀蜜,上汽乘用車實(shí)現(xiàn)了工程開(kāi)發(fā)仿真能力升級(jí),仿真計(jì)算效率提升了25%磅摹,使工程開(kāi)發(fā)人員更加專注于產(chǎn)品設(shè)計(jì)和性能優(yōu)化户誓,打造出世界級(jí)產(chǎn)品的高品質(zhì)幕侠。今年北京車展上全球首秀的概念車MG X-Motion橙依,其量產(chǎn)車的卓越整車性能正是經(jīng)過(guò)上汽仿真計(jì)算云平臺(tái)反復(fù)驗(yàn)證和優(yōu)化的窗骑。
? ? ? ?隨著上汽集團(tuán)與阿里云的合作開(kāi)展,阿里云各項(xiàng)技術(shù)逐步深入到上汽汽車研發(fā)領(lǐng)域的核心業(yè)務(wù)實(shí)現(xiàn)落地抵知。其中上海汽車集團(tuán)股份有限公司乘用車分公司(以下簡(jiǎn)稱上汽乘用車)與阿里云共建的仿真計(jì)算混合云就是新制造產(chǎn)業(yè)升級(jí)的典型代表項(xiàng)目刷喜。
???????上汽乘用車作為上汽集團(tuán)全資子公司掖疮,承擔(dān)著上汽自主品牌汽車的研發(fā)颗祝、制造與銷售螺戳,擁有榮威倔幼、MG兩大品牌,上海翩腐、南京和英國(guó)三地技術(shù)研發(fā)中心茂卦,上海臨港疙筹、南京浦口和英國(guó)長(zhǎng)橋三個(gè)制造基地而咆。伴隨上汽乘用車的市場(chǎng)表現(xiàn)強(qiáng)勁幕袱,車型研發(fā)工作也在持續(xù)加速升級(jí)们豌,而為工程仿真服務(wù)的的計(jì)算資源供應(yīng)開(kāi)始遠(yuǎn)遠(yuǎn)落后于現(xiàn)實(shí)需求望迎,具體表現(xiàn)為:
【研發(fā)需求強(qiáng)烈】
當(dāng)前CAE仿真計(jì)算已經(jīng)承擔(dān)非常重要的任務(wù)辩尊,普遍出現(xiàn)計(jì)算任務(wù)工況多、規(guī)模大轿亮、時(shí)間緊的情況我注,迫切需要快速獲取高性能計(jì)算資源但骨;
【資源迭代滯后】
當(dāng)前上汽乘用車建設(shè)的本地HPC集群雖然經(jīng)歷多次擴(kuò)建嗽冒,但是硬件資源嚴(yán)重老化补履,硬件資源故障率居高不下箫锤,計(jì)算性能難以滿足業(yè)務(wù)需求,且資源更新迭代速度緩慢阳准,嚴(yán)重影響仿真研發(fā)業(yè)務(wù)進(jìn)度氛堕;
【?用戶體驗(yàn)欠佳】
仿真研發(fā)人員一直保留著傳統(tǒng)的HPC計(jì)算中心操作方式,線下前后處理與到線上求解計(jì)算野蝇,流程割裂讼稚,數(shù)據(jù)挪動(dòng)頻繁,亟需建設(shè)高沉浸绕沈、全業(yè)務(wù)锐想、CAE仿真分析在線服務(wù)平臺(tái)。
針對(duì)以上問(wèn)題乍狐,2017年底上汽乘用車攜手阿里云、泛云科技建設(shè)業(yè)內(nèi)首個(gè)IaaS混合型工業(yè)仿真計(jì)算服務(wù)平臺(tái)——上汽仿真計(jì)算云SSCC(SAIC Simulation Computing Cloud)浅蚪,并于2018年初成功上線藕帜,再度驗(yàn)證了云計(jì)算模式在工業(yè)研發(fā)領(lǐng)域的彈性、快速與高效惜傲!??
???????上汽仿真計(jì)算云主要由阿里云公共云集群和上汽乘用車自建集群兩大部分組成洽故,同時(shí)通過(guò)高速專線實(shí)現(xiàn)了數(shù)據(jù)互通和計(jì)算資源的聯(lián)合調(diào)度,其中阿里云公共云集群主要提供了以下計(jì)算資源:
【HPC計(jì)算集群】HPC集群計(jì)算節(jié)點(diǎn)由超級(jí)計(jì)算集群scch5實(shí)例組成盗誊。SCC與彈性裸金屬(神龍)服務(wù)器一脈相承收津,既提供了云計(jì)算的成熟管控、彈性資源優(yōu)勢(shì)浊伙,又達(dá)到了物理機(jī)的性能撞秋,并在此之上加入高速RDMA互聯(lián)支持,大幅提升網(wǎng)絡(luò)性能嚣鄙,顯著提高大規(guī)模集群加速比吻贿。
【NAS共享文件存儲(chǔ)】NAS作為云上數(shù)據(jù)流的共享交通樞紐,無(wú)論是用戶提交的作業(yè)輸入哑子,作業(yè)求解結(jié)果舅列,后處理輸入數(shù)據(jù),都經(jīng)由NAS中轉(zhuǎn)使得VPC內(nèi)所有計(jì)算資源可以同時(shí)訪問(wèn)數(shù)據(jù)卧蜓,NASplus還打通了Windows/Linux跨平臺(tái)共享數(shù)據(jù)訪問(wèn)帐要,滿足常見(jiàn)企業(yè)業(yè)務(wù)場(chǎng)景。NAS結(jié)合阿里云飛天盤古2.0最新技術(shù)弥奸,提供了高聚合帶寬榨惠,完全滿足CAE軟件的I/O性能需求,并通過(guò)多備份等手段提供了10個(gè)9的數(shù)據(jù)可用性。隨著業(yè)務(wù)規(guī)模增長(zhǎng)赠橙,還可以根據(jù)需求升級(jí)為CPFS分布式文件系統(tǒng)提供極致I/O性能耽装。
【圖形處理集群】采用Pascal架構(gòu)的Nvidia Tesla系列企業(yè)級(jí)GPU,在提供高可用性的同時(shí)期揪,確保在多用戶登錄使用圖形服務(wù)器時(shí)仍能生成流暢的演示動(dòng)畫掉奄,快速完成模型渲染等工作,保障前/后處理工作流的完整性凤薛、可靠性姓建。
數(shù)據(jù)顯示,平均每天500多個(gè)碰撞分析缤苫、結(jié)構(gòu)剛度分析引瀑、流體分析、NVH分析等多學(xué)科仿真計(jì)算作業(yè)在上汽仿真計(jì)算云平臺(tái)上完成榨馁,模擬了整車、發(fā)動(dòng)機(jī)數(shù)百種工況帜矾。由于阿里云超級(jí)計(jì)算集群帶來(lái)的性能提升翼虫,相對(duì)本地集群節(jié)約了計(jì)算求解時(shí)間,用戶作業(yè)排隊(duì)時(shí)間也明顯縮短屡萤,工程師可以在工作時(shí)間段做更多的模型調(diào)整珍剑,提升工作效率。另外作業(yè)數(shù)據(jù)絕大部分在阿里云公共云集群閉環(huán)流動(dòng)死陆,大大減輕了本地存儲(chǔ)的壓力招拙,更多歷史工程數(shù)據(jù)得以保留,為工程師做多方案對(duì)比分析提供了極大幫助措译。據(jù)了解别凤,借助阿里云,上汽乘用車實(shí)現(xiàn)了工程開(kāi)發(fā)仿真能力升級(jí)领虹,仿真計(jì)算效率提升了25%规哪,使工程開(kāi)發(fā)人員更加專注于產(chǎn)品設(shè)計(jì)和性能優(yōu)化,打造出世界級(jí)產(chǎn)品的高品質(zhì)塌衰。今年北京車展上全球首秀的概念車MG X-Motion诉稍,其量產(chǎn)車的卓越整車性能正是經(jīng)過(guò)上汽仿真計(jì)算云平臺(tái)反復(fù)驗(yàn)證和優(yōu)化的。
上汽乘用車數(shù)據(jù)及信息系統(tǒng)部工程應(yīng)用支持高級(jí)經(jīng)理尤靜表示最疆,阿里云與上汽自建HPC集群杯巨,性能表現(xiàn)卓越、資源彈性伸縮努酸,大大緩解了研發(fā)需求的壓力服爷,很好地保障了工程開(kāi)發(fā)進(jìn)度。數(shù)據(jù)及信息系統(tǒng)部基礎(chǔ)設(shè)施總監(jiān)強(qiáng)斌也表示,阿里云公共云管控模式成熟层扶,安全性符合上汽相關(guān)規(guī)范箫章,資源開(kāi)通靈活,節(jié)約了自建集群的資源投入和人力成本镜会。據(jù)了解檬寂,混合云技術(shù)的應(yīng)用,有效推動(dòng)了上汽乘用車技術(shù)中心的全球化數(shù)字研發(fā)發(fā)展進(jìn)程戳表,符合上汽乘用車產(chǎn)品國(guó)際化的研發(fā)思維桶至;同時(shí)這種高效合作的模式,可以快速擴(kuò)展到產(chǎn)品研發(fā)的完整業(yè)務(wù)鏈匾旭,助力上汽乘用車向終端市場(chǎng)快速推出符合上汽“新四化”——電動(dòng)化镣屹、智能網(wǎng)聯(lián)化、共享化价涝、國(guó)際化發(fā)展方向的汽車產(chǎn)品和出行服務(wù)女蜈。
阿里云EHPC技術(shù)特點(diǎn)
綜合IaaS/PaaS/SaaS各方面的創(chuàng)新,上汽仿真計(jì)算云表現(xiàn)出以下幾方面的技術(shù)優(yōu)勢(shì):
第一色瘩,性能優(yōu)越
? ?*HPC計(jì)算節(jié)點(diǎn)性能強(qiáng)勁伪窖,采用Intel Xeon Gold 6149 CPU,最新第五代Skylake架構(gòu)帶來(lái)更卓越的計(jì)算性能居兆;
? ?*先進(jìn)高性能網(wǎng)覆山;絡(luò)架構(gòu),RoCE 2 × 25 Gbps 互聯(lián)泥栖,低延遲高帶寬簇宽,大幅提升加速比;
? ?*NASplus/CPFS共享存儲(chǔ)提供聚合帶寬吧享,滿足絕大多數(shù)CAE場(chǎng)景需求魏割,還可升級(jí)至CPFS文件系統(tǒng);
集群整體性能處于國(guó)際領(lǐng)先地位
?第二钢颂,SLA保證
???????公共云完善穩(wěn)定的管控系統(tǒng)及宕機(jī)遷移等響應(yīng)手段见妒,保障了單個(gè)計(jì)算節(jié)點(diǎn)99.95%的可用性,確保CAE仿真計(jì)算業(yè)務(wù)的連續(xù)性甸陌。?
第三须揣,混合云架構(gòu)
? ?*云上VPC與本地集群通過(guò)高速通道(專線)打通成為獨(dú)立子網(wǎng),確保數(shù)據(jù)安全互通钱豁。
? ?*云上計(jì)算資源無(wú)縫接入本地license耻卡、調(diào)度器及SaaS等。
? ?*出現(xiàn)超出規(guī)劃的計(jì)算資源需求(如緊急項(xiàng)目)牲尺,臨時(shí)增加公共云資源是最佳應(yīng)對(duì)手段
第四卵酪,自動(dòng)伸縮(*E-HPC支持)
???????在合理設(shè)置集群負(fù)載閾值的前提下幌蚊,自動(dòng)伸縮功能既可最大限度地節(jié)省公共云資源花銷,又能在高峰期消化負(fù)荷溃卡,保障CAE仿真計(jì)算求解業(yè)務(wù)順利運(yùn)作溢豆。
第五,快速POC
???????直接在阿里云控制臺(tái)操作公共云資源開(kāi)通瘸羡,分鐘級(jí)交付整個(gè)集群漩仙,即可開(kāi)展測(cè)試。無(wú)需等待采購(gòu)或數(shù)據(jù)中心機(jī)房規(guī)劃/安裝部署等瑣碎問(wèn)題犹赖。
?????? POC進(jìn)行時(shí)队他,可以選擇臨時(shí)開(kāi)通超過(guò)正式環(huán)境規(guī)劃的資源量,加快CAE應(yīng)用驗(yàn)證流程
第六峻村,Linux/Windows數(shù)據(jù)共享互通
?????? NASplus提供了業(yè)界領(lǐng)先的NAS同時(shí)以NFS協(xié)議掛載到Linux/Windows上的重要功能麸折,使得用戶可以在使用熟悉的Windows操作界面進(jìn)行交互式后處理操作的時(shí)候,能夠直接讀取共享存儲(chǔ)中的求解計(jì)算結(jié)果粘昨。
第七垢啼,彈性容量的數(shù)據(jù)閉環(huán)
???????用戶上傳作業(yè)輸入數(shù)據(jù)后,求解計(jì)算后的結(jié)果數(shù)據(jù)寫入NAS后即可進(jìn)入使用云上圖形服務(wù)器的后處理张肾,形成數(shù)據(jù)閉環(huán)芭析,安全可靠。如無(wú)特殊情況無(wú)需下載回本地捌浩。
???????另一方面,即使數(shù)據(jù)用量已超過(guò)規(guī)劃量(比如超出購(gòu)買的容量包)工秩,公共云NAS的10PB存儲(chǔ)上限可完全確保數(shù)據(jù)正常寫入尸饺,求解計(jì)算幾乎不受存儲(chǔ)空間限制,充分保障了業(yè)務(wù)連續(xù)性
第八助币,完善的帳號(hào)管理使能協(xié)同開(kāi)發(fā)
???????客戶可以通過(guò)RAM授權(quán)子帳號(hào)只讀權(quán)限的方式浪听,讓合作伙伴登錄云上機(jī)器進(jìn)行軟件維護(hù),錯(cuò)誤排查/分析等眉菱,無(wú)需長(zhǎng)途奔波到現(xiàn)場(chǎng)迹栓。共享后臺(tái)VNC鏈接也大大方便了多方討論合作。?
第九俭缓,完備的SaaS服務(wù)能力
平臺(tái)內(nèi)置集群計(jì)算克伊、虛擬應(yīng)用兩類IaaS資源入口,并根據(jù)工程軟件的應(yīng)用特點(diǎn)進(jìn)行統(tǒng)一的部署华坦、集成愿吹、調(diào)度及監(jiān)控,可以提供CAD惜姐、CAE等工程軟件在線服務(wù):
交互類應(yīng)用:HyperWorks, EnSight, Converge Studio, Star-CCM+, Fluent, MSC.Admas犁跪,Abaqus椿息,NCode
計(jì)算類應(yīng)用:LS-Dyna, Converge, Star-CCM+, Fluent, MSC.Nastran, NX.Nastran, MSC.Admas, NCode, OptiStruct, Abaqus, Star-CD, iSight
第十,精細(xì)化業(yè)務(wù)調(diào)度能力
????基于上汽乘用車本地HPC集群坷衍、阿里云的資源差異性寝优,結(jié)合用戶數(shù)據(jù)存儲(chǔ)一致性需求,平臺(tái)設(shè)計(jì)并實(shí)現(xiàn)了精細(xì)化的仿真計(jì)算業(yè)務(wù)調(diào)度能力枫耳,包括并不僅限于:
1.資源配額調(diào)劑乏矾。平臺(tái)基于部門、項(xiàng)目組屬性進(jìn)行固定資源嘉涌、公共資源配額約束妻熊,既可保障部門、項(xiàng)目組的剛性計(jì)算需求仑最,亦可滿足企業(yè)層面的彈性資源調(diào)度要求扔役;
2.IaaS資源統(tǒng)一調(diào)度。平臺(tái)通過(guò)設(shè)備分組策略警医,將本地HPC設(shè)備亿胸、阿里云集群實(shí)例進(jìn)行統(tǒng)一調(diào)度,既可保證單一算例的高效并行效率预皇,也可為海量任務(wù)提供資源快速調(diào)度侈玄;
3.用戶數(shù)據(jù)統(tǒng)一視圖。平臺(tái)可同時(shí)管理本地存儲(chǔ)與阿里云存儲(chǔ)吟温,為了保障用戶數(shù)據(jù)管理體驗(yàn)序仙,特別設(shè)計(jì)并實(shí)現(xiàn)了用戶數(shù)據(jù)統(tǒng)一視圖,CAE數(shù)據(jù)可與臨近資源節(jié)點(diǎn)智能匹配并發(fā)起計(jì)算或交互鲁豪;
4.閑時(shí)搶占調(diào)度策略潘悼。平臺(tái)針對(duì)用戶計(jì)算業(yè)務(wù)場(chǎng)景,特別設(shè)計(jì)并實(shí)現(xiàn)了閑時(shí)搶占調(diào)度策略爬橡,在規(guī)定時(shí)段可突破預(yù)定資源配額約束治唤,最大化利用計(jì)算資源;
5.許可證高級(jí)調(diào)度機(jī)制糙申。平臺(tái)針對(duì)工業(yè)軟件許可證特點(diǎn)宾添,設(shè)計(jì)并實(shí)現(xiàn)了一系列高級(jí)調(diào)度機(jī)制,可以為設(shè)備節(jié)點(diǎn)組柜裸、用戶組進(jìn)行許可證資源預(yù)留控制缕陕。
上汽仿真計(jì)算云SSCC (是國(guó)內(nèi)首個(gè)投入實(shí)際生產(chǎn)的CAE仿真計(jì)算混合云,可為數(shù)百人的仿真分析團(tuán)隊(duì)提供在線服務(wù)疙挺,月均完成仿真計(jì)算任務(wù)達(dá)到上萬(wàn)例榄檬。
回顧項(xiàng)目歷程,同時(shí)展望中國(guó)工業(yè)自主研發(fā)的未來(lái)征程衔统,上汽仿真計(jì)算云SSCC將會(huì)成為云計(jì)算實(shí)踐的一個(gè)重要里程碑事件鹿榜,為中國(guó)企業(yè)揭示智慧工業(yè)研發(fā)云的真實(shí)能力與巨大價(jià)值:
上汽集團(tuán)已建成計(jì)算資源彈性供應(yīng)體系與靈活管控機(jī)制海雪,實(shí)現(xiàn)了精細(xì)化的研發(fā)資源管理、安全可靠的核心研發(fā)數(shù)據(jù)閉環(huán)生產(chǎn)舱殿,必將完全釋放智慧研發(fā)創(chuàng)造力奥裸,進(jìn)一步提升核心研發(fā)生產(chǎn)效率;?阿里云正在為中國(guó)智造提供全面沪袭、高效的計(jì)算引擎服務(wù)湾宙,在工業(yè)仿真計(jì)算領(lǐng)域?qū)崿F(xiàn)了不可估量的價(jià)值。