2020-04-25 19:07:05 出處:快科技 作者:上方文Q 編輯:上方文Q
長久以來占业,服務器绒怨、數(shù)據(jù)中心領域一直是x86 CPU架構的天下,但是隨著市場需求谦疾、應用負載的多元化南蹂,隨著云計算、邊緣計算念恍、高性能計算的不斷演進碎紊,RISC-V、ARM等架構也都迎來了新的爆發(fā)機遇樊诺,尤其是ARM仗考,眾多巨頭紛紛參與,生態(tài)建設也是如火如荼词爬。
比如最近秃嗜,亞馬遜就發(fā)布了ARM架構的64核心Graviton2,安晟培(Ampere)則推出了80核心的Altra。現(xiàn)在锅锨,Mavell(美滿電子)奉上了第三代ARM芯片“ThunderX3”叽赊。
Marvell的大名很多人可能不太熟悉,但這家歷史悠久的半導體企業(yè)其實隨時都在你身邊必搞,比如機械硬盤主控必指,絕大部分都出自Marvell的手筆,SSD主控也有豐富的產(chǎn)品恕洲。
Marvell成立于1995年,總部位于美國加州圣克拉拉霜第,在美國葛家、以色列、印度泌类、德國癞谒、中國都設有研發(fā)中心,全球員工超過5000人刃榨,全球?qū)@^1萬件弹砚,2020財年收入27億美元,核心業(yè)務覆蓋存儲枢希、網(wǎng)絡桌吃、計算三大領域,特別是擁有超過15年的高性能多核心CPU研發(fā)經(jīng)驗晴玖。
Mavell旗下?lián)碛型暾腃PU處理器產(chǎn)品線为流,包括Armada呕屎、Octeon TX、Octeon Fusion敬察、ThunderX四大系列秀睛,尤其是已經(jīng)悄然成為全球最大的ARM服務器處理器供應商,應用范圍莲祸、生態(tài)支持都獨步全球蹂安,累計出貨量已突破1億顆。
2017年锐帜,Marvell還以約60億美元的價格收購了美國無工廠半導體企業(yè)Cavium(凱為半導體)田盈,進一步增強了ARM平臺的設計能力。
既然有了成熟的x86允瞧,為何要大力推廣ARM?它有什么吸引整個行業(yè)的呢?
Marvell認為述暂,在架構痹升、工藝、性能畦韭、能效疼蛾、生態(tài)等多個方面,ARM都展現(xiàn)出了更優(yōu)秀的品質(zhì)艺配,雖然不會也不能全方位取代x86察郁,但是在部分特定領域,尤其是云計算妒挎、高性能計算等绳锅,已經(jīng)明顯超越x86。
架構方面酝掩,x86一直是一個架構打天下鳞芙,從服務器數(shù)據(jù)中心到桌面筆記本消費級,都基于同一個架構衍生不同的產(chǎn)品期虾,缺乏靈活性原朝,尤其是在并行處理方面,而且規(guī)模越做越大镶苞,也導致成本喳坠、功耗越來越無法滿足需求。
工藝方面茂蚓,Intel已經(jīng)失去了領導地位壕鹉,至強系列至今還是14nm,AMD雖然走到了7nm聋涨,但又在架構上“取巧”使用chiplet多芯片設計晾浴,導致內(nèi)存帶寬、內(nèi)存延遲明顯不足牍白,ARM方面則跟著臺積電一路走到了7nm脊凰,并即將進入5nm。
性能和能效方面茂腥,Marvell認為ARM架構的單線程性能已經(jīng)是一流水準狸涌,多線程和平臺性能更是遙遙領先,內(nèi)存帶寬最岗、延遲同樣優(yōu)秀帕胆,而且功耗低、能效高般渡。
生態(tài)方面,x86雖然歷史悠久歼捐,但負擔也很重何陆,比如考慮各種歷史甚至是消費級兼容性,ARM則沒有過多拖累豹储,架構直接為服務器優(yōu)化而生贷盲。
同時,軟硬件行業(yè)對ARM的支持也越來越豐富剥扣,比如Marvell ThunderX2已經(jīng)被20多家終端客戶部署在大規(guī)模云計算巩剖、高性能計算市場,包括微軟Azure钠怯、HPE佳魔、Cray、Atos晦炊、洛斯阿拉莫斯國家實驗室鞠鲜、桑迪亞國家實驗室、勞倫斯利弗莫爾國家實驗室断国、橡樹嶺國家實驗室贤姆、布里斯托大學、萊徹斯特大學等等稳衬。
甚至霞捡,Intel的一些軟硬件技術同樣支持ARM平臺,NVIDIA薄疚、AMD GPU同樣也支持碧信。
接下來說說具體產(chǎn)品街夭。Marvell ThunderX系列嚴格遵循每兩年升級一代的路線圖砰碴,ThunerX2系列誕生于2018年,而在今天的主角ThunerX3之后莱坎,2022年還將看到ThunerX4衣式,工藝也是一路升級寸士,28nm檐什、16nm、7nm……
ThunerX3采用臺積電7nm DUV工藝制造乃正,基于Marvell自主研發(fā)架構,指令集兼容ARM v8.3 婶博,最多96個核心瓮具,而且繼續(xù)支持4線程,也就是最多384個線程,是上一代的整整三倍名党,而且支持雙路并行叹阔,此時單系統(tǒng)可提供192個核心、768個線程传睹。
同時耳幢,頻率方面基準最高2.4GHz,最高加速3.1GHz欧啤,比上代還提高了100MHz睛藻。
新的內(nèi)核集成四個128-bit Neon SIMD單元,就寬度而言等效于一個x86 AVX-512邢隧,從而大大提高了浮點性能店印。Intel至強最高端型號兩個,AMD霄龍則是每核心兩個256-bit SIMD單元倒慧,基本等效按摘。
內(nèi)存支持八通道DDR4,頻率達3200MHz纫谅,并支持64條PCIe 4.0(16個控制器)院峡,比上代PCIe 3.0更進一步而且增加了8條通道,未來還會隨著PCIe 5.0/6.0標準的演進而升級系宜。
當然了照激,企業(yè)級的RAS、虛擬化這些都是必不可少的元素盹牧。
接下來說說性能,當然都是來自Marvell官方的數(shù)據(jù)汰寓,而且具體性能表現(xiàn)取決于特定的工作負載口柳。
綜合性能方面,ThunderX3對比上代IPC(每時鐘周期指令數(shù))性能提升超過25%有滑,基本可視為架構本身的進步幅度跃闹,而結合更高的運行頻率,單核心性能提升超過60%毛好,再加上大大增加的核心數(shù)望艺,整體性能提升可以超過3倍!
對比x86雙雄找默,ThunderX3的優(yōu)勢不在于絕對性能,而是更好的能效吼驶,相比于AMD Rome二代霄龍可高出30%惩激,對比Intel二代可擴展至強更是領先多達1.2倍店煞。
ThunderX3并不貪大求全,主攻市場只有兩個骡技,一是云計算衩椒,包括大數(shù)據(jù)、數(shù)據(jù)庫哮兰、流媒體毛萌、Web、搜索喝滞、存儲阁将、移動應用開發(fā)、手游等等右遭,其高度并行做盅、豐富I/O、超低延遲窘哈、ARM原生都是獨特優(yōu)勢吹榴。
性能方面,單核心四線程可以帶來可觀的性能提升滚婉,常見應用中最多可以提升達80%图筹,特定負載下甚至能見到3-4倍的提升。
對比AMD二代霄龍让腹、Intel二代可擴展至強远剩,ThunderX3在云端也毫不示弱,所服務的領域內(nèi)已經(jīng)全面勝出骇窍,而且延遲更低瓜晤,而且支持更多數(shù)量的虛擬機。
第二個主攻方向就是高性能計算痢掠,包括政府部門、天氣預報嘲恍、油氣勘探足画、計算機輔助工程、生物基因蛔钙、電子設計自動化等锌云,高內(nèi)存帶寬荠医、高能效吁脱、高并行性的特點可以說非常適合桑涎。
對比兩家x86方案, ThunderX3在浮點兼贡、內(nèi)存帶寬指標以及量子化學攻冷、計算流體動力學、計算化學遍希、矢量物理等應用方面等曼,都有著不俗的表現(xiàn)。
對于ThunderX3的市場前景凿蒜,Marvell也是非常積極樂觀禁谦,透露現(xiàn)在部署ThunderX2的超過20家客戶,都在準備升級ThunderX3废封,而后續(xù)的ThunderX4還會繼續(xù)帶來大幅度的提升州泊。
中間的是上代ThunderX2