CPU性能過剩提升乏力影響未來行業(yè)發(fā)展嗎徘层?

學號:16020188037? ? ? 姓名:崔岸婧

轉(zhuǎn)載自:https://blog.csdn.net/llawliet0001/article/details/85013354

【嵌牛導讀】:CPU性能過剩的影響

【嵌牛鼻子】:CPU性能過剩峻呕、GPU、FPGA

【嵌牛提問】:CPU性能過剩對不同產(chǎn)業(yè)有什么影響趣效?各行業(yè)如何應對這個問題瘦癌?

【嵌牛正文】:

雖然CPU仍然在不斷發(fā)展,但是它的性能已經(jīng)不再僅僅受限于單個處理器類型或制造工藝上了跷敬。和過去相比讯私,CPU性能提升的步伐明顯放緩了,接下來怎么辦西傀,成為橫亙在整個行業(yè)面前的大問題斤寇。

自2010年開始,單個CPU內(nèi)核的處理能力就逐漸停止了增長的腳步拥褂,發(fā)熱和噪聲等和功耗相關(guān)的問題迫使處理器公司另辟蹊徑娘锁,不再汲汲于推高時鐘頻率,轉(zhuǎn)而在CPU中集成更多內(nèi)核饺鹃。多核設(shè)計的引入莫秆,下一代制造工藝對功耗和性能的改進间雀,推動著處理器性能繼續(xù)跟隨著工藝升級的步伐大幅提升。但是現(xiàn)在镊屎,制造工藝升級對性能的提升幅度也大不如前惹挟,再加上許多公司已經(jīng)完全停止了在更先進工藝節(jié)點上的努力,CPU性能的提升再次遇到了瓶頸缝驳。

CPU性能提升乏力的嚴峻現(xiàn)實影響到了多個行業(yè)的發(fā)展匪煌。軟件開發(fā)人員已經(jīng)習慣了并理所當然地預計計算和內(nèi)存資源將會不斷增長,但是現(xiàn)在党巾,CPU性能提升的速度大不如前了萎庭。正是在摩爾定律的加持下,軟件可編程能力和豐富的功能集合才得以出現(xiàn)并發(fā)揮重要作用齿拂,也給硬件工程師和軟件工程師提供了一種緩沖驳规。

“由于摩爾定律,計算能力的增長和加速在部分程度上應該歸功于英特爾等公司不斷前進到下一代工藝節(jié)點上署海,從而使得計算引擎本身的優(yōu)化不再那么重要了吗购,”Microchip旗下美高森美戰(zhàn)略營銷高級總監(jiān)Nilam Ruparelia說≡夷“再加上軟件技術(shù)本身的進步捻勉,使得軟件生產(chǎn)力提高的速度大大超過了摩爾定律。如果能夠讓編程變得輕松容易刀森,就會有更多的人從事編程踱启。通過軟件完成各種事務的能力也已經(jīng)大大增強⊙械祝”

工藝的升級越來越難了埠偿。Flex Logix首席執(zhí)行官Geoff Tate表示,“處理器已經(jīng)不再是執(zhí)行計算任務的唯一解決方案了榜晦」诮看看數(shù)據(jù)中心吧,之前乾胶,這里面唯一的處理器件只有x86抖剿,但是現(xiàn)在,各種配置的FPGA和GPU處理器的身影幾乎無處不在识窿≌独桑”

這種異構(gòu)方案在人工智能/機器學習的設(shè)計中尤為普遍⊥蠓觯“根據(jù)運算的性質(zhì)孽拷,很有必要將矩陣運算或密集型的線性代數(shù)運算放到GPU上執(zhí)行,”Arteris IP營銷副總裁Kurt Shuler說半抱。 “你可以設(shè)計自己專屬的ASIC進一步優(yōu)化計算性能脓恕,也可以把一些任務負荷分配到FPGA上膜宋。當然,你可能依然需要CPU來管理高級別的數(shù)據(jù)控制流炼幔∏锩#總之,處理器件的數(shù)量越來愈多乃秀,而且變得越來越復雜肛著。如果你分析一下數(shù)據(jù)中心就會發(fā)現(xiàn),它們變得越來越異構(gòu)化了跺讯∈嗷撸”

之所以出現(xiàn)這種轉(zhuǎn)變,是因為物理規(guī)律的限制刀脏【旨裕“我們在RISC和CISC架構(gòu)上已經(jīng)做到頭了,”西門子旗下Mentor的Questa產(chǎn)品經(jīng)理Gordon Allan警告說愈污∫“可編程性和傳統(tǒng)邏輯都在演變。現(xiàn)在暂雹,各種定制邏輯器件實現(xiàn)通用功能首装,然后通過智能互聯(lián)技術(shù)把所有這些功能融合在一起。而之前則是通過軟件將一些微操作組合在一起形成算法杭跪∠陕撸”

這當然不意味著CPU會消亡或者停止演進,只不過CPU架構(gòu)師的工作變得更加困難了揍魂〗按祝“通用CPU架構(gòu)和微架構(gòu)依然會繼續(xù)發(fā)展棚瘟,而且足以高效地勝任大多數(shù)任務现斋,并將設(shè)計、生態(tài)建設(shè)和復雜性維持在可持續(xù)的水平上偎蘸∽#”Arm嵌入式和汽車業(yè)務線戰(zhàn)略副總裁Tim Whitfield表示。

影響架構(gòu)改變的最大障礙之一是可編程能力迷雪∠奘椋“可編程能力的大小,甚至沒有可編程能力也不會對整體效率帶來多大影響章咧,”Mentor的HLS平臺項目主管Russell Klein說倦西。 “傳統(tǒng)的CPU、DSP赁严、多核CPU和FPGA都是可編程的曼追,但具有截然不同的效率和不同的編程難度榜轿『糁恚可編程能力在一定程度上降低了效率,但是影響效率的主要因素卻在于并行計算能力蝙泼。DSP具有執(zhí)行特定任務的能力,其效率高過CPU劝枣。GPU也有一些特定于專業(yè)領(lǐng)域的計算單元汤踏,而且引入了并行計算。FPGA和ASIC的并行計算能力更為出色舔腾∠海”

硬件器件的異化比較容易,擺脫舊有的軟件范式卻非常艱難稳诚≡乩螅“業(yè)界將應用程序進行更改,以適應更廣泛的芯片類型采桃±廖酰”Allan說∑瞻欤“這導致了新的軟件生態(tài)系統(tǒng)和新API的出現(xiàn)工扎,但是它們都只不過是在原有軟件上構(gòu)建了更多的層而已。這樣做衔蹲,都是為了試圖讓一個觸及性能極限和低功耗極限的處理器繼續(xù)工作而已≈铮現(xiàn)在我們需要一些新的方法∮呤唬”

“在這種情況下橱健,人們應該把注意力從在軟件開發(fā)上進行修補轉(zhuǎn)移到新型硬件上,只有適當?shù)挠布拍軐崿F(xiàn)真正的節(jié)能沙廉【械矗”Menta業(yè)務開發(fā)總經(jīng)理兼副總裁Yoan Dupret說∏肆辏“這將最終催生具有高度靈活性的異構(gòu)芯片珊皿。Tsugio Makimoto博士之前就曾經(jīng)預測過,今天我們正在進入“高度靈活的超級整合”時代巨税◇ǎ”

CPU的改進

對于那些認為CPU已經(jīng)走入死胡同的說法,我想引用馬克吐溫先生的話回懟一下:“說我已經(jīng)死了的報道太夸張了草添∈欢担”

CPU還有若干進一步改進的路徑。其中之一就是針對特定功能添加定制指令,不過這也有一定的風險抄淑∠耍“如果器件可編程,增加了指令就意味著增加了硬件的復雜性蝇狼,”GreenWaves Technologies業(yè)務開發(fā)副總裁Martin Croome警告說阅畴。“新的指令單元里的每一個晶體管都有靜態(tài)泄露迅耘,如果器件有低功耗指標贱枣,情況就糟糕了,新指令單元不僅增加成本颤专,也提高了功耗纽哥。你必須小心,看看增加新指令是否利大于弊栖秕〈核”

在CPU的發(fā)展歷史中,新的指令單元不斷被增加進來簇捍≈豢牵“隨著制造工藝的發(fā)展,處理器設(shè)計人員可以使用的晶體管越來越多暑塑,于是他們增加了越來越多的功能吼句,以加速運行在其上的單線程程序∈赂瘢”Mentor的Klein說道惕艳。“他們添加了各種指令單元驹愚,比如預測執(zhí)行远搪、分支預測、寄存器別名等等逢捺,但是谁鳍,添加新指令單元的得失對比使得這條路子越走越窄了≌籼穑”

在大多數(shù)情況下棠耕,能力整合可以帶來一定的好處∧拢“在處理器件的發(fā)展歷史中,我們多次看到通用CPU集成各種加速器的情形辉巡『拊鳎”Arm的Whitfield解釋道,“通常瓤荔,我們會對架構(gòu)和微體系架構(gòu)進行調(diào)整输硝,將加速度集成到通用CPU中,這方面的例子包括浮點和加密加速器程梦〉惆眩”

還有一條路徑:做減法∮旄剑“我們認為RISC-V這種新的方案更好郎逃,它可以幫助我們在一定程度上克服摩爾定律的放緩,”美高森美的Ruparelia說挺份“玻“一種全新的、優(yōu)化的架構(gòu)給我們提供了更多的方法匀泊,以克服摩爾定律放緩帶來的挑戰(zhàn)优训。如果硅片工藝的進化停止了,就像發(fā)條被擰到了最緊一樣各聘,你必須優(yōu)化所有的層面-CPU型宙、特定域的架構(gòu)、工具鏈伦吠,甚至編譯器也要針對特定應用進行優(yōu)化妆兑。”

必須根據(jù)最終產(chǎn)品的目標設(shè)計合適的處理器搁嗓∠溲ィ“通過比較不同處理器的能效腺逛,算法可以在消耗最少能量的情況下在相對簡單的處理器上執(zhí)行,”Klein補充說衡怀」髅“更大的處理器可以更快地完成工作,但是它們的能效低得多抛杨。此外够委,在幾個小型處理器中并行運行某個算法,其能效比在一個大型處理器上運行這個算法高得多。隨著更多簡單內(nèi)核的引入潘拨,電壓和時鐘頻率可以進一步降低吊输,從而進一步提高能效√罚”

優(yōu)化計算引擎

針對特定任務打造內(nèi)核是一項成功的策略季蚂。“可編程DSP是分擔CPU密集計算應用的理想選擇琅束,”Cadence的Tensilica IP產(chǎn)品管理扭屁、營銷和業(yè)務開發(fā)高級主管Lazaar Louis說≌粒“DSP靈活疯搅、可編程,而且支持Open VX和Open CL等開放式埋泵、跨平臺的加速標準幔欧,可輕松將應用程序移植到DSP。對于某些常見應用丽声,DSP還可以與專用硬件加速器配合使用礁蔗,不僅可以發(fā)揮加速器的更高功效,還可以結(jié)合DSP的可編程能力雁社,從而滿足應用在產(chǎn)品生命周期中不斷變化的需求浴井。”

許多架構(gòu)都因為沒有提供強大的軟件開發(fā)環(huán)境而失敗了霉撵』钦悖“GPU是一個通過打造成本可持續(xù)的獨立開發(fā)環(huán)境和軟件生態(tài)系統(tǒng)而大獲成功的典型例子⊥狡拢”Whitfield說撕氧。“有的機器學習算法看起來需要一些專業(yè)的加速器喇完,它們將作為一種粗粒度的加速引擎和通用CPU一起使用伦泥。”

GPU的成功之路非常有意思锦溪〔桓“GPU是一種針對特定域的架構(gòu),剛開始主要面向游戲刻诊,現(xiàn)在又被用到區(qū)塊鏈和神經(jīng)網(wǎng)絡(luò)上防楷,”Ruparelia指出』捣辏“GPU有一些傳統(tǒng)CPU上很難實現(xiàn)的功能域帐,針對特定域優(yōu)化的體系結(jié)構(gòu)能夠?qū)崿F(xiàn)更高的單元計算性能和軟件生產(chǎn)力赘被。神經(jīng)網(wǎng)絡(luò)是一個典型的例子是整,和一個專門針對它設(shè)計的可編程平臺相比肖揣,如果你在CPU上運行它,將花費10倍之多的運行時間和功耗浮入×牛”

但是GPU并沒有針對神經(jīng)網(wǎng)絡(luò)進行專門優(yōu)化∈滦悖“在卷積神經(jīng)網(wǎng)絡(luò)中彤断,80%的時間都消耗在卷積運算上,”GreenWaves的Croome說易迹。 “卷積有各種形式宰衙,運算量也各有大小。涉及到的概念有填充睹欲、膨脹供炼、步幅以及濾波器的大小等。卷積有許多參數(shù)窘疮,如果你試圖構(gòu)建一個可以在硬件中完成所有卷積運算的系統(tǒng)袋哼,這個系統(tǒng)將使用大量當前已知的硬件。你必須使用最常見的卷積參數(shù)闸衫,并構(gòu)建一些能夠保持足夠靈活性的東西涛贯。”

那么蔚出,是不是有人可以為定制加速器提供完整的軟件開發(fā)環(huán)境呢弟翘?

“我們正在編寫優(yōu)化的內(nèi)核,并給一些矢量化的運算進行了手工編碼骄酗,”Croome繼續(xù)說道稀余。“我們使用了標準的向量操作酥筝,但是即便如此滚躯,你寫代碼時,當涉及到寄存器加載操作時嘿歌,也需要考慮如何優(yōu)化編碼掸掏,以便編譯器能夠以一種特定的方式定位到它≈娴郏”

這就是加速器的編碼開始變得困難的地方丧凤。Synopsys解決方案事業(yè)部產(chǎn)品營銷經(jīng)理Gordon Cooper說:“使用一組GPU或CPU訓練神經(jīng)網(wǎng)絡(luò),然后在GPU上運行該神經(jīng)網(wǎng)絡(luò)非常容易步脓。人們可以通過Caffe或TensorFlow做到這一點愿待。但是浩螺,當我們使用專用硬件滿足嵌入式系統(tǒng)的要求,比如低功耗仍侥、小尺寸時要出,GPU只能保證性能,卻無法保證能效农渊。使用異構(gòu)方案的缺點是患蹂,無論是加速器還是專用處理器,都有各自不同的工具鏈或者多個工具鏈砸紊,你需要學習并管理好它們传于,這可不像給GPU編程那么簡單∽硗纾”

這是一種微妙的平衡沼溜。“使用GPU的優(yōu)勢是很靈活游添,但是無法保證功耗和尺寸系草,另一方面,沒有編程環(huán)境否淤,或者很難使用悄但,一樣會讓你舉步維艱,”Cooper補充道石抡¢芟“在加速器上變成永遠不會像為CPU編寫代碼那樣簡單。你可以參照DSP世界的編程進行優(yōu)化啰扛,先用C語言編程嚎京,然后優(yōu)化內(nèi)部的循環(huán)體。這是一種平衡隐解“暗郏”

改換硬件

長期以來,F(xiàn)PGA都自我標榜為可編程的硬件煞茫∨劣浚“硬件RTL工程師可以將FPGA用作可編程平臺,這沒有任何問題续徽,”Rupatelia說蚓曼。“但是钦扭,當軟件工程師把FPGA作為一種可編程平臺時纫版,麻煩就來了。這個挑戰(zhàn)已經(jīng)存在很長時間了客情∑浔祝”

今天癞己,F(xiàn)PGA也被嵌入到了ASIC中∷蠓ィ“eFPGA IP是異構(gòu)方案的一種元素痹雅,怎么個用法取決于架構(gòu)定義和代碼的劃分,”Menta的Dupret說籽御。 “HLS工具可以為此提供幫助练慕,但最終的目標是為異構(gòu)體系結(jié)構(gòu)自動化地進行代碼劃分惰匙。我們現(xiàn)在還沒有實現(xiàn)這個目標技掏,但我們確信這是行業(yè)發(fā)展的方向∠罟恚”

這也很可能成為物聯(lián)網(wǎng)硬件開發(fā)的重要一環(huán)哑梳。“我們?nèi)绾未_保物聯(lián)網(wǎng)設(shè)備的靈活性绘盟,并且可以現(xiàn)場升級鸠真?”Allan問道×湔保“可以需要結(jié)合使用軟件和智能FPGA技術(shù)吠卷,它們都是當今CPU解決方案里的技術(shù)。我們現(xiàn)在談論的是沦零,定義產(chǎn)品時更少依賴硬件/軟件交互祭隔,更多依賴編譯好的邏輯器件、內(nèi)存和可編程器件路操,以實現(xiàn)產(chǎn)品的靈活性疾渴。”

這可能意味著改變對軟件的傳統(tǒng)看法屯仗。Ruparelia指出:“當今的FPGA工具鏈依然不支持軟件工程師在不了解FPGA的情況下直接使用它搞坝,這方面的進展甚微。不過魁袜,現(xiàn)在可以更加容易地針對特定領(lǐng)域或特定應用進行編程了桩撮。我們正在研究神經(jīng)網(wǎng)絡(luò)上使用的非常具體的中間件,它們抽象出了FPGA的復雜性峰弹,并保留了足夠的靈活性店量,可供上層軟件調(diào)用】遄浚”

除了處理單元垫桂,內(nèi)存架構(gòu)也存在進一步改進的壓力∷诎矗“硬件加速器正在部署更多可用內(nèi)存诬滩,”Shuler說霹粥。“芯片到DRAM或HBM2的通信越少疼鸟,效率就越高后控。我們該怎樣把所有數(shù)據(jù)都保存在處理單元中,并在處理單元之間交互空镜?處理器單元有時會有自己的暫存存儲器浩淘,有時會連接到網(wǎng)格里的存儲器中,那樣的話吴攒,存儲器就被分割開來张抄,在整個架構(gòu)中散落地無處不在⊥菡”

“我們結(jié)合芯片和處理器開發(fā)了多級緩存架構(gòu)署惯,將內(nèi)容可尋址內(nèi)存作為控制優(yōu)化的關(guān)鍵技術(shù),”Allan解釋道镣隶〖辏“然后我們開始研究一致緩存架構(gòu),其中安岂,多個處理器圍繞在共享內(nèi)存空間周圍轻猖,互相協(xié)作。現(xiàn)在域那,我們在計算器件中引入了神經(jīng)網(wǎng)絡(luò)咙边,內(nèi)存也是一個關(guān)鍵因素。內(nèi)存技術(shù)將繼續(xù)演進琉雳,我們會發(fā)現(xiàn)新的方案不斷出現(xiàn)样眠。HLS將發(fā)展為允許定制內(nèi)存架構(gòu),以幫助加速特定算法翠肘。在這個領(lǐng)域有許多創(chuàng)新檐束,可以將算法輸入到HLS流中,并使用智能內(nèi)存技術(shù)優(yōu)化解決方案束倍”簧ィ”

和通用CPU形態(tài)相差最遠的是專用硬件解決方案⌒髅茫“這是一種單線程編程模型甥桂,存在實打?qū)嵉南拗疲盞lein指出邮旷』蒲。“將一個算法從CPU上轉(zhuǎn)移到?jīng)]有引入任何并行性的定制硬件上固然也可以提高效率,但是達不到人們的預期。進一步提升效率的關(guān)鍵在于找出并利用算法里的并行性办陷∶蚕Γ”

最終,需要軟件思想的革新民镜,推動設(shè)計人員以并行的方式實現(xiàn)各種算法啡专。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市制圈,隨后出現(xiàn)的幾起案子们童,更是在濱河造成了極大的恐慌,老刑警劉巖鲸鹦,帶你破解...
    沈念sama閱讀 217,826評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件慧库,死亡現(xiàn)場離奇詭異,居然都是意外死亡亥鬓,警方通過查閱死者的電腦和手機完沪,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,968評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來嵌戈,“玉大人,你說我怎么就攤上這事听皿∈烨海” “怎么了?”我有些...
    開封第一講書人閱讀 164,234評論 0 354
  • 文/不壞的土叔 我叫張陵尉姨,是天一觀的道長庵朝。 經(jīng)常有香客問我,道長又厉,這世上最難降的妖魔是什么九府? 我笑而不...
    開封第一講書人閱讀 58,562評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮覆致,結(jié)果婚禮上侄旬,老公的妹妹穿的比我還像新娘。我一直安慰自己煌妈,他們只是感情好儡羔,可當我...
    茶點故事閱讀 67,611評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著璧诵,像睡著了一般汰蜘。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上之宿,一...
    開封第一講書人閱讀 51,482評論 1 302
  • 那天族操,我揣著相機與錄音,去河邊找鬼比被。 笑死色难,一個胖子當著我的面吹牛炕婶,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播莱预,決...
    沈念sama閱讀 40,271評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼柠掂,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了依沮?” 一聲冷哼從身側(cè)響起涯贞,我...
    開封第一講書人閱讀 39,166評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎危喉,沒想到半個月后宋渔,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,608評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡辜限,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,814評論 3 336
  • 正文 我和宋清朗相戀三年皇拣,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片薄嫡。...
    茶點故事閱讀 39,926評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡氧急,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出毫深,到底是詐尸還是另有隱情吩坝,我是刑警寧澤,帶...
    沈念sama閱讀 35,644評論 5 346
  • 正文 年R本政府宣布哑蔫,位于F島的核電站钉寝,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏闸迷。R本人自食惡果不足惜嵌纲,卻給世界環(huán)境...
    茶點故事閱讀 41,249評論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望腥沽。 院中可真熱鬧逮走,春花似錦、人聲如沸巡球。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,866評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽酣栈。三九已至险胰,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間矿筝,已是汗流浹背起便。 一陣腳步聲響...
    開封第一講書人閱讀 32,991評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人榆综。 一個月前我還...
    沈念sama閱讀 48,063評論 3 370
  • 正文 我出身青樓妙痹,卻偏偏與公主長得像,于是被迫代替她去往敵國和親鼻疮。 傳聞我的和親對象是個殘疾皇子怯伊,可洞房花燭夜當晚...
    茶點故事閱讀 44,871評論 2 354

推薦閱讀更多精彩內(nèi)容