深度學(xué)習(xí)帶動了本輪人工智能浪潮的大發(fā)展坏快,AI芯片成為人工智能產(chǎn)業(yè)發(fā)展的核心驅(qū)動力晒衩,AI芯片產(chǎn)業(yè)通過引入GPU突破了CPU并行計算短板增淹,AI芯片已經(jīng)成為業(yè)界研究熱點膛堤。本文分析了當(dāng)前四類主流AI芯片的技術(shù)特點奋构,認(rèn)為ASIC芯片更符合未來的發(fā)展趨勢壳影,并對通信運營商在AI芯片領(lǐng)域研發(fā)布局提出了四方面的建議。
一弥臼、AI芯片成為人工智能產(chǎn)業(yè)發(fā)展核心驅(qū)動力
深度學(xué)習(xí)帶動了本輪人工智能浪潮的大發(fā)展宴咧,而海量數(shù)據(jù)和AI芯片提供的高效算力是支撐深度學(xué)習(xí)算法實現(xiàn)的基礎(chǔ),AI芯片對人工智能的意義径缅,就像發(fā)動機之于汽車掺栅。當(dāng)前對AI芯片尚無公認(rèn)的標(biāo)準(zhǔn)定位烙肺,廣義上,能驅(qū)動AI程序的芯片都可叫AI芯片氧卧;狹義上桃笙,AI芯片是為適應(yīng)AI算法進(jìn)行特殊設(shè)計的芯片。
從功能上來看沙绝,AI芯片需滿足訓(xùn)練和推理兩個環(huán)節(jié)搏明。在訓(xùn)練環(huán)節(jié),通過大數(shù)據(jù)訓(xùn)練出一個復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型闪檬。目前訓(xùn)練環(huán)節(jié)主要使用英偉達(dá)的GPU(圖形處理單元)集群完成星著,谷歌的TPU2.0也支持訓(xùn)練環(huán)節(jié)和深度網(wǎng)絡(luò)加速。在推理環(huán)節(jié)粗悯,利用訓(xùn)練好的模型虚循,使用新數(shù)據(jù)推理出各種結(jié)論⊙總體來看横缔,訓(xùn)練環(huán)節(jié)對芯片性能要求比較高,推理環(huán)節(jié)對簡單指定的重復(fù)計算和低延遲的要求很高衫哥。
從應(yīng)用場景來看茎刚,AI芯片既用于云端也應(yīng)于設(shè)備端。在訓(xùn)練環(huán)節(jié)炕檩,需要極大的數(shù)據(jù)量和運算量,單一處理器無法獨立完成捌斧,只能在云端實現(xiàn)笛质。在設(shè)備端,智能終端的數(shù)量龐大捞蚂,需求差異較大妇押,比如VR設(shè)備對于實時性要求很高,推理環(huán)節(jié)無法在云端完成姓迅,要求設(shè)備有獨立的推理計算能力敲霍。
從技術(shù)架構(gòu)來看,人工智能芯片主要可分為四類丁存。一是通用性芯片肩杈,如GPU;二是以FPGA(現(xiàn)場可編程門陣列)為代表的半定制化芯片解寝,如深鑒科技的DPU扩然;三是ASIC(專用集成電路)全定制化芯片,如谷歌的TPU聋伦;四是類腦芯片夫偶。
二界睁、四類主流AI芯片技術(shù)特點分析
GPU:即圖形處理器,是一種大規(guī)模并行計算架構(gòu)的眾核處理器兵拢,專為同時處理多重任務(wù)而設(shè)計翻斟,原本是幫助CPU處理圖形顯示的任務(wù),尤其是3D圖形顯示说铃。為了執(zhí)行復(fù)雜的并行計算访惜,快速進(jìn)行圖形渲染,GPU的核數(shù)遠(yuǎn)超CPU截汪,但每個核擁有的緩存相對較小疾牲,數(shù)字邏輯運算單元也更簡單,更適合計算密集型的任務(wù)衙解。GPU硬件結(jié)構(gòu)固定阳柔,不具備可調(diào)整性。
FPGA:現(xiàn)場可編程門陣列蚓峦,利用門電路直接運算舌剂,速度快,用戶可自定義門電路和存儲器之間的布線暑椰,改變執(zhí)行方案霍转,以期得到最佳效果。FPGA可采用OpenCL等更高效的編程語言一汽,降低了硬件編程的難度避消,同時可以集成重要的控制功能,整合系統(tǒng)模塊召夹,提高了應(yīng)用的靈活性岩喷。FPGA作為專用集成電路領(lǐng)域中的一種半定制電路出現(xiàn),既解決了定制電路靈活性不足的問題监憎,又克服了原有可編程器件門電路數(shù)量有限的缺點纱意。與GPU相比,F(xiàn)PGA具備更強的計算能力和更低的功耗鲸阔。
ASIC是不可配置的高度定制專用計算芯片偷霉。不同于GPU和FPGA的靈活性,定制化的ASIC一旦制造完成將不能更改褐筛,所以初期成本高类少、開發(fā)周期長、進(jìn)入門檻高渔扎。但ASIC性能高于FPGA瞒滴,相同工藝的ASIC計算芯片比FPGA計算芯片快5-10倍,同時規(guī)模效應(yīng)會使ASIC成本大幅降低〖巳蹋總體來看虏两,ASIC芯片在功耗、可靠性世剖、體積方面均具備優(yōu)勢定罢,尤其適用于對性能、功耗旁瘫、體積要求較高的移動端設(shè)備祖凫。
類腦芯片還處于理論研究階段,主流理念采用電子技術(shù)模擬已被證明的生物腦的運作規(guī)則酬凳,構(gòu)建類似于生物腦的電子芯片惠况,即“仿生電子腦”。受到腦結(jié)構(gòu)研究的成果啟發(fā)宁仔,復(fù)雜神經(jīng)網(wǎng)絡(luò)在計算上具有低功耗稠屠、低延遲、高速處理翎苫、時空聯(lián)合等特點权埠。
四類AI芯片的技術(shù)特點總結(jié)如表1所示。
三煎谍、ASIC芯片更符合未來發(fā)展趨勢
分析可知攘蔽,GPU和FPGA都屬于AI通用芯片,在性能呐粘、應(yīng)用廣泛性等方面都有一些局限满俗。類腦芯片是一種相對處于概念階段的集成電路,面世的并不多作岖,大規(guī)模的商用進(jìn)展緩慢唆垃。而ASIC芯片作為全定制化芯片,從長遠(yuǎn)看更適用于行業(yè)人工智能解決方案鳍咱。因為算法復(fù)雜度越強降盹,越需要一套專用的芯片架構(gòu)與其進(jìn)行對應(yīng)与柑,ASIC基于人工智能算法進(jìn)行定制谤辜,其發(fā)展前景看好。
當(dāng)前价捧,ASIC芯片市場百家爭鳴丑念,國內(nèi)外主流芯片廠家均推出了相應(yīng)的芯片。英偉達(dá)(NVIDIA)發(fā)布了一款全新AI芯片Jetson Xavier结蟋,每秒可執(zhí)行30萬億次操作脯倚,功率僅為30瓦。谷歌發(fā)布了TPU3.0,性能進(jìn)一步提升推正。IBM提出的基于PCM的個性化AI芯片恍涂,可達(dá)到GPU 280倍的能源效率,并在同樣面積上實現(xiàn) 100倍的算力植榕。英特爾發(fā)布了專為機器學(xué)習(xí)而設(shè)計的神經(jīng)網(wǎng)絡(luò)處理器系列芯片Lake Crest再沧。百度宣布了首款A(yù)I芯片昆侖,是中國首款云端全功能AI芯片尊残,是目前為止設(shè)計算力最高的AI芯片炒瘸,且功耗僅為100+W。華為發(fā)布了昇騰910和昇騰310兩款A(yù)I芯片寝衫,前者的單芯片計算密度比目前最強的NVIDIA V100的125T還要高上一倍顷扩,后者是昇騰的mini系列。
四慰毅、對通信運營商在AI芯片領(lǐng)域布局的建議
AI賦能通信已成為通信運營商重要的發(fā)展戰(zhàn)略隘截,當(dāng)前國內(nèi)幾大通信運營商基于英偉達(dá)P40、P4事富、V100等系列GPU芯片產(chǎn)品技俐,研發(fā)支撐現(xiàn)網(wǎng)業(yè)務(wù)需求的人工智能基礎(chǔ)平臺和應(yīng)用,在網(wǎng)絡(luò)運維、在線客服统台、市場營銷雕擂、系統(tǒng)安全、企業(yè)管理等業(yè)務(wù)場景下贱勃,已經(jīng)做出了一些實踐和探索,但尚未有運營商直接開展AI芯片技術(shù)相關(guān)的研發(fā)工作井赌,在此筆者提出幾條建議,建議通信運營商在AI芯片領(lǐng)域提前布局贵扰,助力企業(yè)人工智能戰(zhàn)略推進(jìn)和相關(guān)工作開展仇穗。
一是加強與科研機構(gòu)和產(chǎn)業(yè)界的溝通與合作,支撐企業(yè)集采和投資分析戚绕。在開展網(wǎng)絡(luò)智能化重構(gòu)纹坐、5G創(chuàng)新試驗的同時,及時掌握AI芯片產(chǎn)業(yè)發(fā)展情況舞丛,分析和探索不同AI芯片在企業(yè)各種業(yè)務(wù)領(lǐng)域的具體應(yīng)用場景及選型策略耘子,支撐5G智能終端和AI芯片產(chǎn)品的集中采購工作。同時跟蹤AI芯片領(lǐng)域初創(chuàng)企業(yè)發(fā)展動態(tài)球切,適時開展AI芯片領(lǐng)域戰(zhàn)略性布局的投資或收購谷誓。
二是研發(fā)基于AI專用芯片的人工智能終端產(chǎn)品和應(yīng)用系統(tǒng),助力AI賦能垂直行業(yè)吨凑。加速AI終端產(chǎn)品和應(yīng)用系統(tǒng)的研發(fā)捍歪,不斷提升AI能力和產(chǎn)品覆蓋水平户辱。在用戶端積極布局智能終端產(chǎn)品;在網(wǎng)絡(luò)側(cè)致力于打造網(wǎng)絡(luò)運維大腦糙臼,提升面向下一代網(wǎng)絡(luò)的智能運維能力庐镐;在應(yīng)用側(cè)注重場景驅(qū)動,探索能力開放運營和生態(tài)合作变逃,積極切入智能家居焚鹊、智慧城市等垂直領(lǐng)域,推動AI變現(xiàn)韧献。
三是在網(wǎng)絡(luò)領(lǐng)域使用搭載AI專用芯片的定制化高性能服務(wù)器末患,增強云端訓(xùn)練和推理能力,提高通信網(wǎng)絡(luò)智能化水平锤窑。5G網(wǎng)絡(luò)將進(jìn)一步開放實現(xiàn)分層解耦璧针,網(wǎng)絡(luò)各層逐步使用搭載AI專用芯片的定制化高性能服務(wù)器,可促進(jìn)AI的應(yīng)用:在基礎(chǔ)設(shè)施層使用AI專用芯片渊啰,實現(xiàn)不同層級的訓(xùn)練和推理能力探橱,比如在核心數(shù)據(jù)中心引入AI專用芯片可以滿足全局性的策略或算法模型的集中訓(xùn)練以及推理需求;在基站內(nèi)嵌入AI專用芯片绘证,可以支撐設(shè)備級的AI策略及應(yīng)用隧膏;在網(wǎng)絡(luò)和業(yè)務(wù)控制層,可以利用AI專用芯片推理能力嚷那,對網(wǎng)絡(luò)和業(yè)務(wù)實現(xiàn)智能控制胞枕,如網(wǎng)絡(luò)智能運維及智能調(diào)優(yōu),通過機器學(xué)習(xí)快速攔截惡意行為魏宽、預(yù)防攻擊腐泻,維護(hù)網(wǎng)絡(luò)安全等;在運營及編排層队询,可以利用AI專用芯片云端訓(xùn)練能力派桩,對數(shù)據(jù)做深度、智能化挖掘蚌斩,從而指導(dǎo)運維和運營铆惑,實現(xiàn)運營智能化。
同時可嘗試CPU + FPGA + ASIC的芯片“混搭”架構(gòu)送膳,研究和試驗各類AI應(yīng)用場景下员魏,不同技術(shù)架構(gòu)芯片的組合使用方式,增強企業(yè)核心AI能力肠缨。
四是探索基于AI專用芯片的多接入邊緣計算技術(shù)應(yīng)用場景逆趋,提升5G網(wǎng)絡(luò)服務(wù)能力盏阶。研究邊緣計算設(shè)備與AI的結(jié)合晒奕,開展基于AI專用芯片的邊緣計算試點,研究和分析適合在終端計算節(jié)點上開展的業(yè)務(wù)應(yīng)用場景,如自動駕駛脑慧、安防魄眉、IR/VR等,設(shè)計匹配該類業(yè)務(wù)的網(wǎng)絡(luò)架構(gòu)闷袒,提升5G網(wǎng)絡(luò)服務(wù)能力坑律。
來源:《中國電信業(yè)》