了解AI芯片概況

AI芯片概述

一、AI芯片產(chǎn)生的背景

AI的三大關(guān)鍵基礎(chǔ)要素是數(shù)據(jù)、算法和算力上陕。隨著云計(jì)算的廣泛應(yīng)用桩砰,特別是深度學(xué)習(xí)成為當(dāng)前AI研究和運(yùn)用的主流方式拓春,AI對(duì)于算力的要求不斷快速提升。

AI的許多數(shù)據(jù)處理涉及矩陣乘法和加法亚隅。AI算法硼莽,在圖像識(shí)別等領(lǐng)域,常用的是CNN煮纵;語音識(shí)別懂鸵、自然語言處理等領(lǐng)域,主要是RNN行疏,這是兩類有區(qū)別的算法匆光;但是,他們本質(zhì)上酿联,都是矩陣或vector的乘法终息、加法,然后配合一些除法贞让、指數(shù)等算法周崭。

CPU可以拿來執(zhí)行AI算法,但因?yàn)閮?nèi)部有大量其他邏輯喳张,而這些邏輯對(duì)于目前的AI算法來說是完全用不上的续镇,所以,自然造成CPU并不能達(dá)到最優(yōu)的性價(jià)比销部。因此摸航,具有海量并行計(jì)算能力、能夠加速AI計(jì)算的AI芯片應(yīng)運(yùn)而生舅桩。

二酱虎、什么是AI芯片

一般的說,AI芯片被稱為AI加速器或計(jì)算卡江咳,即專門用于加速AI應(yīng)用中的大量計(jì)算任務(wù)的模塊(其他非計(jì)算任務(wù)仍由CPU負(fù)責(zé))逢净。

而從廣義范疇上講,面向AI計(jì)算應(yīng)用的芯片都可以稱為AI芯片。除了以GPU爹土、FPGA甥雕、ASIC為代表的AI加速芯片(基于傳統(tǒng)芯片架構(gòu),對(duì)某類特定算法或者場(chǎng)景進(jìn)行AI計(jì)算加速)胀茵,還有比較前沿性的研究社露,例如類腦芯片、可重構(gòu)通用AI芯片等(但距離大規(guī)模商用還有較長(zhǎng)距離)琼娘。

以GPU峭弟、FPGA、ASIC為代表的AI芯片脱拼,是目前可大規(guī)模商用的技術(shù)路線瞒瘸,是AI芯片的主戰(zhàn)場(chǎng),本文以下主要討論的就是這類AI芯片熄浓。

AI芯片的分類和市場(chǎng)劃分

一情臭、從兩個(gè)維度對(duì)AI芯片進(jìn)行分類

維度1:部署位置(云端、終端)

AI芯片部署的位置有兩種:云端赌蔑、終端俯在。所以根據(jù)部署的位置不同,AI芯片可以分為:云AI芯片娃惯、端AI芯片跷乐。

  • 云端,即數(shù)據(jù)中心趾浅,在深度學(xué)習(xí)的訓(xùn)練階段需要極大的數(shù)據(jù)量和大運(yùn)算量愕提,單一處理器無法獨(dú)立完成,因此訓(xùn)練環(huán)節(jié)只能在云端實(shí)現(xiàn)潮孽。

  • 終端揪荣,即手機(jī)、安防攝像頭往史、汽車仗颈、智能家居設(shè)備、各種IoT設(shè)備等執(zhí)行邊緣計(jì)算的智能設(shè)備椎例。終端的數(shù)量龐大挨决,而且需求差異較大。

云AI芯片的特點(diǎn)是性能強(qiáng)大订歪、能夠同時(shí)支持大量運(yùn)算脖祈、并且能夠靈活地支持圖片、語音刷晋、視頻等不同AI應(yīng)用盖高∩髁辏基于云AI芯片的技術(shù),能夠讓各種智能設(shè)備和云端服務(wù)器進(jìn)行快速的連接喻奥,并且連接能夠保持最大的穩(wěn)定席纽。

端AI芯片的特點(diǎn)是體積小、耗電少撞蚕,而且性能不需要特別強(qiáng)大润梯,通常只需要支持一兩種AI能力。

相比于云AI芯片來說甥厦,端AI芯片是需要嵌入進(jìn)設(shè)備內(nèi)部的纺铭,當(dāng)在設(shè)備內(nèi)部中嵌入了端AI芯片之后,能夠讓設(shè)備的AI能力進(jìn)一步提升刀疙,并且讓設(shè)備在沒有聯(lián)網(wǎng)的情況之下也能夠使用相應(yīng)的AI能力舶赔,這樣AI的覆蓋變得更為全面。

維度2:承擔(dān)任務(wù)(訓(xùn)練庙洼、推理)

AI的實(shí)現(xiàn)包括兩個(gè)環(huán)節(jié):訓(xùn)練顿痪、推理镊辕。所以根據(jù)承擔(dān)任務(wù)的不同油够,AI芯片可以分為:用于構(gòu)建神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練芯片,利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行推理預(yù)測(cè)的推理芯片征懈。

  • 訓(xùn)練石咬,是指通過大數(shù)據(jù)訓(xùn)練出一個(gè)復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,即用大量標(biāo)記過的數(shù)據(jù)來“訓(xùn)練”相應(yīng)的系統(tǒng)卖哎,使之可以適應(yīng)特定的功能鬼悠。訓(xùn)練需要極高的計(jì)算性能,需要較高的精度亏娜,需要能處理海量的數(shù)據(jù)焕窝,需要有一定的通用性,以便完成各種各樣的學(xué)習(xí)任務(wù)维贺。

  • 推理它掂,是指利用訓(xùn)練好的模型,使用新數(shù)據(jù)推理出各種結(jié)論溯泣。即借助現(xiàn)有神經(jīng)網(wǎng)絡(luò)模型進(jìn)行運(yùn)算虐秋, 利用新的輸入數(shù)據(jù)來一次性獲得正確結(jié)論的過程。也有叫做預(yù)測(cè)或推斷垃沦。

訓(xùn)練芯片客给,注重絕對(duì)的計(jì)算能力,而推斷芯片更注重綜合指標(biāo)肢簿, 單位能耗算力靶剑、時(shí)延蜻拨、成本等都要考慮。

訓(xùn)練將在很長(zhǎng)一段時(shí)間里集中在云端桩引,推理的完成目前也主要集中在云端官觅,但隨著越來越多廠商的努力,很多的應(yīng)用將逐漸轉(zhuǎn)移到終端阐污。

推理相對(duì)來說對(duì)性能的要求并不高休涤,對(duì)精度要求也要更低,在特定的場(chǎng)景下笛辟,對(duì)通用性要求也低功氨,能完成特定任務(wù)即可,但因?yàn)橥评淼慕Y(jié)果直接提供給終端用戶手幢,所以更關(guān)注用戶體驗(yàn)方面的優(yōu)化捷凄。

二、AI芯片市場(chǎng)劃分

image.png

以部署位置(云端围来、終端)和承擔(dān)任務(wù)(訓(xùn)練跺涤、推理)為橫縱坐標(biāo),可以清晰的劃分出AI芯片的市場(chǎng)領(lǐng)域监透,上表桶错,列出了適用于各個(gè)市場(chǎng)的技術(shù)路線及相應(yīng)廠商。

需要澄清一點(diǎn)胀蛮,模型訓(xùn)練需要的芯片院刁,雖然稱為云端芯片,實(shí)際上是絕大部分是部署在本地的粪狼,否則成本非常高昂退腥。

1、云端訓(xùn)練

訓(xùn)練芯片受算力約束再榄,一般只在云端部署狡刘。

CPU由于計(jì)算單元少,并行計(jì)算能力較弱困鸥,不適合直接執(zhí)行訓(xùn)練任務(wù)嗅蔬,因此訓(xùn)練一般采用“CPU+加速芯片”的異構(gòu)計(jì)算模式。目前NVIDIA的GPU+CUDA計(jì)算平臺(tái)是最成熟的AI訓(xùn)練方案窝革,除此還有兩種方案:

第三方異構(gòu)計(jì)算平臺(tái)OpenCL + AMD GPU或OpenCL + Intel/Xilinx FPGA

云計(jì)算服務(wù)商自研加速芯片(如Google的TPU)

訓(xùn)練市場(chǎng)目前能與NVIDIA競(jìng)爭(zhēng)的就是Google购城,傳統(tǒng)CPU/GPU廠家Intel和AMD也在努力進(jìn)入訓(xùn)練市場(chǎng)。

2虐译、云端推理

如果說云端訓(xùn)練芯片是NVIDIA一家獨(dú)大瘪板,那云端推理芯片則是百家爭(zhēng)鳴,各有千秋漆诽。

相比訓(xùn)練芯片侮攀,推理芯片考慮的因素更加綜合:?jiǎn)挝还乃懔β嘀Γ瑫r(shí)延,成本等等兰英。AI發(fā)展初期推理也采用GPU進(jìn)行加速撇叁,目前來看,競(jìng)爭(zhēng)態(tài)勢(shì)中英偉達(dá)依然占大頭畦贸,但由于應(yīng)用場(chǎng)景的特殊性陨闹,依據(jù)具體神經(jīng)網(wǎng)絡(luò)算法優(yōu)化會(huì)帶來更高的效率,F(xiàn)PGA/ASIC的表現(xiàn)可能更突出薄坏。除了Nvidia趋厉、Google蟆技、Xilinx逾条、Altera(Intel)等傳統(tǒng)芯片大廠涉足云端推理芯片以外,Wave computing瞎饲、Groq 等初創(chuàng)公司也加入競(jìng)爭(zhēng)沈善。中國公司里乡数,寒武紀(jì)、比特大陸等同樣積極布局云端芯片業(yè)務(wù)闻牡。

3净赴、終端推理

在面向智能手機(jī)、智能攝像頭澈侠、機(jī)器人/無人機(jī)劫侧、自動(dòng)駕駛、VR哨啃、智能家居設(shè)備、各種IoT設(shè)備等設(shè)備的終端推理AI芯片方面写妥,目前多采用ASIC拳球,還未形成一家獨(dú)大的態(tài)勢(shì)。

終端的數(shù)量龐大珍特,而且需求差異較大祝峻。AI芯片廠商可發(fā)揮市場(chǎng)作用,面向各個(gè)細(xì)分市場(chǎng)扎筒,研究應(yīng)用場(chǎng)景莱找,以應(yīng)用帶動(dòng)芯片。

傳統(tǒng)芯片大廠如NVIDIA嗜桌、Intel奥溺、ARM、高通等都積極布局骨宠,中國芯片創(chuàng)業(yè)企業(yè)浮定,如寒武紀(jì)相满、地平線等,也有不俗表現(xiàn)桦卒,在一些細(xì)分市場(chǎng)領(lǐng)域頗有建樹立美。

AI芯片技術(shù)路線

一、AI芯片主要技術(shù)路線

目前方灾,作為加速應(yīng)用的AI芯片建蹄,主要的技術(shù)路線有三種:GPU、FPGA裕偿、ASIC躲撰。

image.png

1、GPU

GPU(Graphics Processing Unit)击费,即圖形處理器拢蛋,是一種由大量核心組成的大規(guī)模并行計(jì)算架構(gòu),專為同時(shí)處理多重任務(wù)而設(shè)計(jì)蔫巩。GPU是專門處理圖像計(jì)算的谆棱,包括各種特效的顯示,更加針對(duì)圖像的渲染等計(jì)算算法圆仔。這些算法與深度學(xué)習(xí)的算法還是有比較大的區(qū)別垃瞧。當(dāng)然,GPU非常適合做并行計(jì)算坪郭,也可以用來給AI加速个从。

GPU因良好的矩陣計(jì)算能力和并行計(jì)算優(yōu)勢(shì),最早被用于AI計(jì)算歪沃,在數(shù)據(jù)中心中獲得大量應(yīng)用嗦锐。GPU采用并行架構(gòu),超過80%部分為運(yùn)算單元沪曙,具備較高性能運(yùn)算速度奕污。相比較下,CPU僅有20%為運(yùn)算單元液走,更多的是邏輯單元碳默,因此CPU擅長(zhǎng)邏輯控制與串行運(yùn)算,而GPU擅長(zhǎng)大規(guī)模并行運(yùn)算缘眶。GPU最早作為深度學(xué)習(xí)算法的芯片被引入人工智能領(lǐng)域嘱根,因其良好的浮點(diǎn)計(jì)算能力適用于矩陣計(jì)算,且相比CPU具有明顯的數(shù)據(jù)吞吐量和并行計(jì)算優(yōu)勢(shì)巷懈。

2011年谷歌大腦率先應(yīng)用GPU芯片该抒,當(dāng)時(shí)12顆英偉達(dá)的GPU可以提供約等于2000顆CPU的深度學(xué)習(xí)性能,展示了其驚人的運(yùn)算能力砸喻。目前GPU已經(jīng)成為人工智能領(lǐng)域最普遍最成熟的智能芯片柔逼,應(yīng)用于數(shù)據(jù)中心加速和部分智能終端領(lǐng)域蒋譬,在深度學(xué)習(xí)的訓(xùn)練階段其性能更是無所匹敵。

在深度學(xué)習(xí)上游訓(xùn)練端(主要用在云計(jì)算數(shù)據(jù)中心里)愉适,GPU是當(dāng)仁不讓的第一選擇犯助。目前GPU的市場(chǎng)格局以英偉達(dá)為主(超過70%),AMD為輔维咸,預(yù)計(jì)未來幾年內(nèi)GPU仍然是深度學(xué)習(xí)訓(xùn)練市場(chǎng)的第一選擇剂买。

另外,GPU無法單獨(dú)工作癌蓖,必須由CPU進(jìn)行控制調(diào)用才能工作瞬哼。CPU可單獨(dú)作用,處理復(fù)雜的邏輯運(yùn)算和不同的數(shù)據(jù)類型租副,當(dāng)需要大量的處理類型統(tǒng)一的數(shù)據(jù)時(shí)坐慰,則可調(diào)用GPU進(jìn)行并行計(jì)算。(GPU卡)

2用僧、FPGA

FPGA(Field-Programmable Gate Array)结胀,即現(xiàn)場(chǎng)可編程門陣列,作為專用集成電路領(lǐng)域中的一種半定制電路出現(xiàn)责循。FPGA利用門電路直接運(yùn)算糟港,速度快,而用戶可以自由定義這些門電路和存儲(chǔ)器之間的布線院仿,改變執(zhí)行方案秸抚,以期得到最佳效果。

FPGA可以采用OpenCL等更高效的編程語言歹垫,降低了硬件編程的難度剥汤,還可以集成重要的控制功能,整合系統(tǒng)模塊县钥,提高了應(yīng)用的靈活性秀姐,與GPU相比,F(xiàn)PGA具備更強(qiáng)的平均計(jì)算能力和更低的功耗若贮。

FPGA適用于多指令,單數(shù)據(jù)流的分析痒留,與GPU相反谴麦,因此常用于推理階段。FPGA是用硬件實(shí)現(xiàn)軟件算法伸头,因此在實(shí)現(xiàn)復(fù)雜算法方面有一定的難度匾效,缺點(diǎn)是價(jià)格比較高。

FPGA因其在靈活性和效率上的優(yōu)勢(shì)面哼,適用于虛擬化云平臺(tái)和推理階段,在2015年后異軍突起魔策。2015年Intel收購FPGA市場(chǎng)第二大企業(yè)Altera,開始了FPGA在人工智能領(lǐng)域的應(yīng)用熱潮虎敦。因?yàn)镕PGA靈活性較好其徙、處理簡(jiǎn)單指令重復(fù)計(jì)算比較強(qiáng),用在云計(jì)算架構(gòu)形成CPU+FPGA的混合異構(gòu)中相比GPU更加的低功效和高性能喷户,適用于高密度計(jì)算唾那,在深度學(xué)習(xí)的推理階段有著更高的效率和更低的成本,使得全球科技巨頭紛紛布局云端FPGA生態(tài)褪尝。

國外包括亞馬遜闹获、微軟都推出了基于FPGA的云計(jì)算服務(wù),而國內(nèi)包括騰訊云恼五、阿里云均在2017年推出了基于FPGA的服務(wù)昌罩,百度大腦也使用了FPGA芯片。中國剛剛被Xilinx收購的深鑒科技也是基于FPGA來設(shè)計(jì)深度學(xué)習(xí)的加速器架構(gòu)灾馒,可以靈活擴(kuò)展用于服務(wù)器端和嵌入式端茎用。

3、ASIC

ASIC(Application Specific Integrated Circuits)睬罗,即專用集成電路轨功,是一種為專用目的設(shè)計(jì)的,面向特定用戶需求的定制芯片容达,在大規(guī)模量產(chǎn)的情況下具備性能更強(qiáng)古涧、體積更小、功耗更低花盐、成本更低羡滑、可靠性更髙等優(yōu)點(diǎn)。

ASIC與GPU和FPGA不同算芯,GPU和FPGA除了是一種技術(shù)路線之外柒昏,還是實(shí)實(shí)在在的確定的產(chǎn)品,而ASIC就是一種技術(shù)路線或者方案有梆,其呈現(xiàn)出的最終形態(tài)與功能也是多種多樣的饺汹。

近年來越來越多的公司開始采用ASIC芯片進(jìn)行深度學(xué)習(xí)算法加速,其中表現(xiàn)最為突出的是Google的TPU。TPU比同時(shí)期的GPU或CPU平均提速1530倍胁塞,能效比提升3080倍。相比FPGA扰才,ASIC芯片具備更低的能耗與更高的計(jì)算效率。但是ASIC研發(fā)周期較長(zhǎng)琅捏、商業(yè)應(yīng)用風(fēng)險(xiǎn)較大等不足也使得只有大企業(yè)或背靠大企業(yè)的團(tuán)隊(duì)愿意投入到它的完整開發(fā)中。

AlphaGo就使用TPU搜吧,同時(shí)TPU也支持著Google的Cloud TPU平臺(tái)和基于此的機(jī)器學(xué)習(xí)超級(jí)計(jì)算機(jī)。此外据忘,國內(nèi)企業(yè)寒武紀(jì)開發(fā)的Cambricon系列芯片受到廣泛關(guān)注曼追。華為的麒麟980處理器所搭載的NPU就是寒武紀(jì)的處理器驹吮。

二、AI芯片技術(shù)路線走向

1族沃、短期:GPU仍延續(xù)AI芯片的領(lǐng)導(dǎo)地位,F(xiàn)PGA增長(zhǎng)較快

GPU短期將延續(xù)AI芯片的領(lǐng)導(dǎo)地位。目前GPU是市場(chǎng)上用于AI計(jì)算最成熟應(yīng)用最廣泛的通用型芯片烘嘱,在算法技術(shù)和應(yīng)用層次尚淺時(shí)期,GPU由于其強(qiáng)大的計(jì)算能力遗契、較低的研發(fā)成本和通用性將繼續(xù)占領(lǐng)AI芯片的主要市場(chǎng)份額。GPU的領(lǐng)軍廠商英偉達(dá)仍在不斷探尋GPU的技術(shù)突破,新推出的Volta架構(gòu)使得GPU一定程度上克服了在深度學(xué)習(xí)推理階段的短板从绘,在效率要求和場(chǎng)景應(yīng)用進(jìn)一步深入之前陕截,作為數(shù)據(jù)中心和大型計(jì)算力支撐的主力軍,GPU仍具有很大的優(yōu)勢(shì)。

FPGA是目前增長(zhǎng)點(diǎn)暮的,F(xiàn)PGA的最大優(yōu)勢(shì)在于可編程帶來的配置靈活性,在目前技術(shù)與運(yùn)用都在快速更迭的時(shí)期具有巨大的實(shí)用性微猖,而且FPGA還具有比GPU更高的功效能耗比凛剥。企業(yè)通過FPGA可以有效降低研發(fā)調(diào)試成本,提高市場(chǎng)響應(yīng)能力犁享,推出差異化產(chǎn)品。在專業(yè)芯片發(fā)展得足夠重要之前凤巨,F(xiàn)PGA是最好的過渡產(chǎn)品,所以科技巨頭紛紛布局云計(jì)算+FPGA的平臺(tái)彰檬。隨著FPGA的開發(fā)者生態(tài)逐漸豐富奕枝,適用的編程語言增加郎笆,F(xiàn)PGA運(yùn)用會(huì)更加廣泛宛蚓。因此短期內(nèi),F(xiàn)PGA作為兼顧效率和靈活性的硬件選擇仍將是熱點(diǎn)所在痕钢。

2、長(zhǎng)期:三大類技術(shù)路線各有優(yōu)劣,會(huì)長(zhǎng)期并存

1)GPU主攻高級(jí)復(fù)雜算法和通用型人工智能平臺(tái)

GPU未來的進(jìn)化路線可能會(huì)逐漸發(fā)展為兩條路拱她,一條主攻高端復(fù)雜算法的實(shí)現(xiàn),由于GPU相比FPGA和ASIC高性能計(jì)算能力較強(qiáng)氧猬,同時(shí)對(duì)于指令的邏輯控制上也更復(fù)雜一些,在面臨需求通用型AI計(jì)算的應(yīng)用方面具有較大優(yōu)勢(shì)妄均。第二條路則是通型人工智能平臺(tái)禁熏,GPU由于設(shè)計(jì)方面,通用性強(qiáng)宙彪,性能較高,應(yīng)用于大型人工智能平臺(tái)夠高效地完成不同種類的調(diào)用需求男图。

2) FPGA適用變化多的垂直細(xì)分行業(yè)

FPGA具有獨(dú)一無二的靈活性優(yōu)勢(shì)渗鬼,對(duì)于部分市場(chǎng)變化迅速的行業(yè)非常適用差牛。同時(shí),F(xiàn)PGA的高端器件中也可以逐漸增加DSP侦讨、ARM核等高級(jí)模塊崇猫,以實(shí)現(xiàn)較為復(fù)雜的算法屋厘。FPGA以及新一代ACAP芯片,具備了高度的靈活性溢谤,可以根據(jù)需求定義計(jì)算架構(gòu),開發(fā)周期遠(yuǎn)遠(yuǎn)小于設(shè)計(jì)一款專用芯片结笨,更適用于各種細(xì)分的行業(yè)包晰。ACAP的出現(xiàn),引入了AI核的優(yōu)點(diǎn)炕吸,勢(shì)必會(huì)進(jìn)一步拉近與專用芯片的差距伐憾。隨著 FPGA 應(yīng)用生態(tài)的逐步成熟,F(xiàn)PGA 的優(yōu)勢(shì)也會(huì)逐漸為更多用戶所了解赫模。

3) ASIC芯片是全定制芯片树肃,長(zhǎng)遠(yuǎn)看適用于人工智能

因?yàn)樗惴◤?fù)雜度越強(qiáng)斩祭,越需要一套專用的芯片架構(gòu)與其進(jìn)行對(duì)應(yīng),而ASIC基于人工智能算法進(jìn)行定制纸肉,其發(fā)展前景看好。ASIC是AI領(lǐng)域未來潛力較大的芯片屎蜓,AI算法廠商有望通過算法嵌入切入該領(lǐng)域荐吵。ASIC具有高性能低消耗的特點(diǎn)良风,可以基于多個(gè)人工智算法進(jìn)行定制婿失,其定制化的特點(diǎn)使其能夠針對(duì)不同環(huán)境達(dá)到最佳適應(yīng),在深度學(xué)習(xí)的訓(xùn)練和推理階段皆能占據(jù)一定地位赶撰。目前由于人工智能產(chǎn)業(yè)仍處在發(fā)展的初期磨镶,較高的研發(fā)成本和變幻莫測(cè)的市場(chǎng)使得很多企業(yè)望而卻步。未來當(dāng)人工智能技術(shù)论衍、平臺(tái)和終端的發(fā)展達(dá)到足夠成熟度,人工智能應(yīng)用的普及程使得專用芯片能夠達(dá)到量產(chǎn)水平汁蝶,此時(shí)ASIC芯片的發(fā)展將更上一層樓祖驱。

此外佣耐,AI算法提供商也有望將已經(jīng)優(yōu)化設(shè)計(jì)好的算法直接燒錄進(jìn)芯片洪己,從而實(shí)現(xiàn)算法IP的芯片化,這將為AI芯片的發(fā)展注入新的動(dòng)力。

AI芯片市場(chǎng)分析

一、AI芯片市場(chǎng)概覽

2018年全球AI芯片市場(chǎng)規(guī)模預(yù)計(jì)將超過20億美元,隨著包括谷歌、Facebook诫给、微軟楔壤、亞馬遜以及百度、阿里惯驼、騰訊在內(nèi)的互聯(lián)網(wǎng)巨頭相繼入局蹲嚣,預(yù)計(jì)到2020年全球市場(chǎng)規(guī)模將超過100億美元递瑰,其中中國的市場(chǎng)規(guī)模近25億美元,增長(zhǎng)非常迅猛端铛,發(fā)展空間巨大泣矛。

目前全球各大芯片公司都在積極進(jìn)行AI芯片的布局。在云端禾蚕,Nvidia的GPU芯片被廣泛應(yīng)用于深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推理您朽。Google TPU通過云服務(wù)Cloud TPU的形式把TPU開放商用。老牌芯片巨頭Intel推出了Nervana Neural Network Processors(NNP)换淆。而初創(chuàng)公司如Wave Computing哗总、Groq、寒武紀(jì)倍试、比特大陸等也加入了競(jìng)爭(zhēng)的行列讯屈,陸續(xù)推出了針對(duì)AI的芯片和硬件系統(tǒng)。

智能手機(jī)是目前應(yīng)用最為廣泛的邊緣計(jì)算終端設(shè)備县习,包括三星涮母、蘋果、華為躁愿、高通叛本、聯(lián)發(fā)科在內(nèi)的手機(jī)芯片廠商紛紛推出或者正在研發(fā)專門適應(yīng)AI應(yīng)用的芯片產(chǎn)品。另外彤钟,也有很多初創(chuàng)公司加入這個(gè)領(lǐng)域来候,為包括智能手機(jī)在內(nèi)的眾多類型邊緣計(jì)算設(shè)備提供芯片和系統(tǒng)方案,比如寒武紀(jì)逸雹、地平線等营搅。傳統(tǒng)的IP廠商,包括ARM梆砸、Synopsys转质、Cadence等公司也都為手機(jī)、平板電腦帖世、智能攝像頭峭拘、無人機(jī)、工業(yè)和服務(wù)機(jī)器人狮暑、智能音箱等邊緣計(jì)算設(shè)備開發(fā)專用IP產(chǎn)品。此外在終端應(yīng)用中還蘊(yùn)藏著IoT這一金礦辉饱,AI芯片只有實(shí)現(xiàn)從云端走向終端搬男,才能真正賦予“萬物智能”。

二彭沼、四大場(chǎng)景的芯片賽道

1缔逛、數(shù)據(jù)中心

在云計(jì)算數(shù)據(jù)中心,上游訓(xùn)練端GPU是當(dāng)仁不讓的第一選擇。目前GPU的市場(chǎng)格局以英偉達(dá)為主(超過70%)褐奴,AMD為輔按脚,預(yù)計(jì)未來幾年GPU仍然是深度學(xué)習(xí)市場(chǎng)的第一選擇。

下游推理端更接近終端應(yīng)用敦冬,更關(guān)注響應(yīng)時(shí)間而不是吞吐率辅搬,需求更加細(xì)分,除了主流的GPU芯片之外脖旱,下游推理端可容納FPGA堪遂、ASIC等芯片。競(jìng)爭(zhēng)態(tài)勢(shì)中英偉達(dá)依然占大頭萌庆,但隨著AI的發(fā)展溶褪,F(xiàn)PGA的低延遲、低功耗践险、可編程性(適用于傳感器數(shù)據(jù)預(yù)處理工作以及小型開發(fā)試錯(cuò)升級(jí)迭代階段)和ASIC的特定優(yōu)化和效能優(yōu)勢(shì)(適用于在確定性執(zhí)行模型)將凸顯出來猿妈。

2、自動(dòng)駕駛

自動(dòng)駕駛對(duì)芯片算力有很高的要求巍虫, 而受限于時(shí)延及可靠性彭则,有關(guān)自動(dòng)駕駛的計(jì)算不能在云端進(jìn)行,因此終端推理芯片升級(jí)勢(shì)在必行垫言。根據(jù)豐田公司的統(tǒng)計(jì)數(shù)據(jù)贰剥,實(shí)現(xiàn)L5級(jí)完全自動(dòng)駕駛,至少需要12TOPS的推理算力筷频,按照Nvidia PX2自動(dòng)駕駛平臺(tái)測(cè)算蚌成,差不多需要15塊PX2車載計(jì)算機(jī),才能滿足完全自動(dòng)駕駛的需求凛捏。

目前担忧,自動(dòng)駕駛上游系統(tǒng)解決方案逐漸形成英偉達(dá)與英特爾-Mobileye聯(lián)盟兩大競(jìng)爭(zhēng)者。

除了上述兩大主力汽車芯片競(jìng)爭(zhēng)方坯癣,百度雖然與英偉達(dá)合作密切(Apollo開放平臺(tái)從數(shù)據(jù)中心到自動(dòng)駕駛都將使用英偉達(dá)技術(shù)瓶盛,包括Tesla GPU和DRIVE PX 2,以及CUDA和TensorRT在內(nèi)的英偉達(dá)軟件)示罗,卻也采用Xilinx的FPGA芯片加速機(jī)器學(xué)習(xí)惩猫,用于語音識(shí)別和汽車自動(dòng)駕駛。

3蚜点、安防

AI正在以極其聲勢(shì)浩大的節(jié)奏全面“入侵”整個(gè)安防產(chǎn)業(yè)轧房。作為這一波人工智能浪潮最大落地領(lǐng)域——安防,是必爭(zhēng)之地绍绘。一大批AI芯片廠商扎堆涌入奶镶,其中既有AI芯片創(chuàng)業(yè)玩家迟赃,也有傳統(tǒng)安防芯片霸主海思的強(qiáng)勢(shì)入局。

總的來說厂镇,寒武紀(jì)纤壁、地平線等AI芯片公司提供的安防AI芯片屬于協(xié)處理器,需要搭配其他公司的攝像機(jī)SoC芯片使用捺信。而海思的安防AI芯片本身就是安防攝像機(jī)SoC芯片酌媒,只是新加入了AI模塊——這也是海思安防AI芯片的最大競(jìng)爭(zhēng)力。

也要看到残黑,AI與AI芯片離大規(guī)拟捎樱快速落地仍有距離,其中一大原因就是工程化困難——尤其是在安防這種產(chǎn)業(yè)鏈漫長(zhǎng)而復(fù)雜的產(chǎn)業(yè)梨水,新技術(shù)落地需要長(zhǎng)時(shí)間的積累與打磨拭荤,以及人力資源的不斷投入,這些都是擺在AI與AI芯片企業(yè)面前的難題疫诽。

4舅世、手機(jī)終端AI

手機(jī)芯片市場(chǎng)的玩家定位包括:

采用芯片+整機(jī)垂直商業(yè)模式的廠商:蘋果,三星奇徒,華為等

獨(dú)立芯片供應(yīng)商:高通雏亚,聯(lián)發(fā)科,展銳等

向芯片企業(yè)提供獨(dú)立IP授權(quán)的供應(yīng)商:ARM摩钙,Synopsys罢低,Cadence,寒武紀(jì)等

采用垂直商業(yè)模式廠商的芯片不對(duì)外發(fā)售胖笛,只服務(wù)于自身品牌的整機(jī)网持,性能針對(duì)自身軟件做出了特殊優(yōu)化,靠效率取勝长踊。獨(dú)立芯片供應(yīng)商以相對(duì)更強(qiáng)的性能指標(biāo)功舀,來獲得剩余廠商的市場(chǎng)份額。

從2017年開始身弊,蘋果辟汰、華為海思、高通阱佛、聯(lián)發(fā)科等主要芯片廠商相繼發(fā)布支持AI加速功能的新一代芯片帖汞,AI芯片逐漸向中端產(chǎn)品滲透。由于手機(jī)空間有限凑术,獨(dú)立的AI芯片很難被手機(jī)廠商采用翩蘸。在AI加速芯片設(shè)計(jì)能力上有先發(fā)優(yōu)勢(shì)的企業(yè)(如寒武紀(jì))一般通過IP授權(quán)的方式切入。

高通很有可能在手機(jī)AI賽道延續(xù)優(yōu)勢(shì)地位麦萤。近日發(fā)布的驍龍855被稱為當(dāng)前最強(qiáng)AI芯片鹿鳖,比起蘋果A12、華為麒麟980壮莹,性能提升1倍翅帜,并將成為全球第一款商用5G芯片。

AI芯片主要廠商介紹

在AI芯片領(lǐng)域命满,國外芯片巨頭占據(jù)了絕大部分市場(chǎng)份額涝滴,不論是在人才聚集還是公司合并等方面,都具有領(lǐng)先優(yōu)勢(shì)胶台。尤其是美國巨頭企業(yè)歼疮,憑借芯片領(lǐng)域多年的領(lǐng)先地位,迅速切入AI領(lǐng)域诈唬,積極布局韩脏,四處開花,目前處于引領(lǐng)產(chǎn)業(yè)發(fā)展的地位铸磅,并且在GPU和FPGA方面是完全壟斷地位赡矢。國內(nèi)AI芯片公司多為中小型初創(chuàng)公司,在一些細(xì)分市場(chǎng)也有建樹阅仔,誕生了多個(gè)獨(dú)角獸企業(yè)吹散。

一、國外主要廠商

image.png

image.png

1八酒、NVIDIA 英偉達(dá)

目前AI芯片領(lǐng)域主要的供應(yīng)商仍然是英偉達(dá)空民,占全球AI芯片50%以上市場(chǎng)份額。英偉達(dá)保持了極大的投入力度羞迷,快速提高GPU的核心性能界轩,增加新型功能,保持了在AI訓(xùn)練市場(chǎng)的霸主地位闭树,并積極拓展終端嵌入式產(chǎn)品形態(tài)耸棒,推出Xavier系列。

英偉達(dá)旗下產(chǎn)品線遍布自動(dòng)駕駛汽車报辱、高性能計(jì)算与殃、機(jī)器人、醫(yī)療保健碍现、云計(jì)算幅疼、游戲視頻等眾多領(lǐng)域。

英偉達(dá)擁有目前最為成熟的開發(fā)生態(tài)環(huán)境——CUDA 昼接,因其統(tǒng)一而完整的開發(fā)套件爽篷,豐富的庫以及對(duì)英偉達(dá)GPU的原生支持而成為開發(fā)主流,目前已開發(fā)至第9代慢睡,開發(fā)者人數(shù)超過51萬逐工。

英偉達(dá)還將聯(lián)合芯片巨頭ARM打造IoT設(shè)備的AI芯片專用IP铡溪,這款機(jī)器學(xué)習(xí)IP集成到ARM的Project Trillium平臺(tái)上,以實(shí)現(xiàn)機(jī)器學(xué)習(xí)泪喊,其技術(shù)源于英偉達(dá)Xavier芯片以及去年開源的DLA深度學(xué)習(xí)加速器項(xiàng)目棕硫。

2、Intel 英特爾

英特爾作為傳統(tǒng)PC芯片的老大袒啼,也在積極向PC以外的市場(chǎng)轉(zhuǎn)型哈扮。

為了加強(qiáng)在AI芯片領(lǐng)域的實(shí)力,英特爾收購FPGA生產(chǎn)商Altera蚓再,收購自動(dòng)駕駛技術(shù)公司Mobileye滑肉,以及機(jī)器視覺公司 Movidius和為自動(dòng)駕駛汽車芯片提供安全工具的公司Yogitech,收購人工智能軟硬件創(chuàng)業(yè)公司Nervana摘仅。在數(shù)據(jù)中心靶庙、自動(dòng)駕駛等重要領(lǐng)域布局扎實(shí)。

3实檀、Google 谷歌

Google在2016年宣布獨(dú)立開發(fā)一種名為TPU的全新處理系統(tǒng)惶洲。在2016年3月打敗了李世石和2017年5月打敗了柯杰的的AlphaGo,就是采用了谷歌的TPU系列芯片膳犹。

TPU是專門為機(jī)器學(xué)習(xí)應(yīng)用而設(shè)計(jì)的專用芯片恬吕。通過降低芯片的計(jì)算精度,減少實(shí)現(xiàn)每個(gè)計(jì)算操作所需的晶體管數(shù)量须床,從而能讓芯片的每秒運(yùn)行的操作個(gè)數(shù)更高铐料,這樣經(jīng)過精細(xì)調(diào)優(yōu)的機(jī)器學(xué)習(xí)模型就能在芯片上運(yùn)行得更快,加深了人工智能在訓(xùn)練和推理方面的能力豺旬,進(jìn)而更快地讓用戶得到更智能的結(jié)果钠惩。

2018年3月Google I/O大會(huì)推出TPU3.0。據(jù)官方數(shù)據(jù)族阅,TPU3.0的性能是TPU2.0的八倍篓跛,高達(dá) 100 petaflops。

Cloud TPU是谷歌設(shè)計(jì)的硬件加速器坦刀,為加速愧沟、拓展特定tensorflow機(jī)器學(xué)習(xí)workload而優(yōu)化。每個(gè)TPU里內(nèi)置了四個(gè)定制ASIC鲤遥,單塊板卡的計(jì)算能力達(dá)每秒180 teraflops沐寺,高帶寬內(nèi)存有64GB。這些板卡既能單獨(dú)使用盖奈,也可通過超高速專用網(wǎng)絡(luò)連接從而形成“TPU pod”混坞。谷歌已在谷歌云(GCP)開放Cloud TPU的計(jì)算能力,幫助機(jī)器學(xué)習(xí)專家更快速訓(xùn)練和運(yùn)行模型。

Edge TPU的尺寸約為1美分硬幣的1/8大小究孕,它可以在較小的物理尺寸以及功耗范圍內(nèi)提供不錯(cuò)的性能啥酱,支持PCIe以及USB接口。Edge TPU優(yōu)勢(shì)在于可以加速設(shè)備上的機(jī)器學(xué)習(xí)推理厨诸,或者也可以與Google Cloud配對(duì)以創(chuàng)建完整的云端到邊緣機(jī)器學(xué)習(xí)堆棧懈涛。

4、Xilinx 賽靈思

2018年3月泳猬,賽靈思宣布推出一款超越FPGA功能的新產(chǎn)品——ACAP(自適應(yīng)計(jì)算加速平臺(tái))。其核心是新一代的FPGA架構(gòu)宇植。10月得封,發(fā)布最新基于7nm工藝的ACAP平臺(tái)的第一款處理器——Versal。其使用多種計(jì)算加速技術(shù)指郁,可以為任何應(yīng)用程序提供強(qiáng)大的異構(gòu)加速忙上。Versal Prime系列和Versal AI Core系列產(chǎn)品也將于 2019 年推出。

Xilinx和Intel兩家不約而同把FPGA未來市場(chǎng)重心放到數(shù)據(jù)中心市場(chǎng)闲坎。

二疫粥、國內(nèi)主要廠商

國內(nèi)AI芯片廠商以中小公司為主,沒有巨頭腰懂,多集中于設(shè)備端AI ASIC的開發(fā)梗逮,并已有所建樹,如寒武紀(jì)成為全球AI芯片領(lǐng)域第一個(gè)獨(dú)角獸初創(chuàng)公司绣溜,其NPU IP已被應(yīng)用于全球首款手機(jī)AI芯片——麒麟970。

但是,中國在FPGA赖条、GPU領(lǐng)域缺乏有競(jìng)爭(zhēng)力的原創(chuàng)產(chǎn)品充蓝,只是基于FPGA/GPU做進(jìn)一步開發(fā),這主要與我國在芯片領(lǐng)域一直缺乏關(guān)鍵核心自主技術(shù)有關(guān)锚沸,F(xiàn)PGA/GPU的技術(shù)壁壘已很高跋选,很難有所突破。

image.png
image.png

1哗蜈、寒武紀(jì) Cambricon

寒武紀(jì)創(chuàng)立于2016年3月前标,是中科院孵化的高科技企業(yè)。

2018年5月恬叹,寒武紀(jì)推出第一款智能處理板卡候生,搭載了寒武紀(jì) MLU100 芯片,為云端推理提供強(qiáng)大的運(yùn)算能力支撐绽昼。等效理論計(jì)算能力高達(dá)128 TOPS唯鸭,支持4通道64 bit ECCDDR4內(nèi)存,并支持多種容量硅确。

1M是寒武紀(jì)第三代機(jī)器學(xué)習(xí)專用芯片目溉,使用TSMC 7nm工藝生產(chǎn)明肮,其8位運(yùn)算效能比達(dá) 5Tops/watt(每瓦 5 萬億次運(yùn)算)。寒武紀(jì)1M處理器延續(xù)了前兩代IP產(chǎn)品(1H/1A)的完備性缭付,可支持CNN柿估、RNN、SOM等多種深度學(xué)習(xí)模型陷猫,又進(jìn)一步支持了SVM秫舌、K-NN、K-Means绣檬、決策樹等經(jīng)典機(jī)器學(xué)習(xí)算法的加速足陨。這款芯片支持幫助終端設(shè)備進(jìn)行本地訓(xùn)練,可為視覺娇未、語音墨缘、自然語言處理等任務(wù)提供高效計(jì)算平臺(tái)。

寒武紀(jì)也推出了面向開發(fā)者的寒武紀(jì)人工智能軟件平臺(tái)Cambricon NeuWare零抬,這是在終端和云端的AI芯片共享的軟件接口和生態(tài)镊讼,包含開發(fā)、調(diào)試和調(diào)優(yōu)三大部分平夜,體現(xiàn)了創(chuàng)始人陳天石提出的“端云一體”的思路蝶棋。

2、華為海思 Hisilicon

海思半導(dǎo)體成立于2004年10月忽妒,是華為集團(tuán)的全資子公司嚼松。

麒麟970集成NPU神經(jīng)處理單元,是全球第一款手機(jī)AI芯片锰扶,它在處理靜態(tài)神經(jīng)網(wǎng)絡(luò)模型方面有得天獨(dú)厚的優(yōu)勢(shì)献酗;新一代的麒麟980用于最新的Mate20系列和榮耀Magic 2。二者均采用寒武紀(jì)的AI IP坷牛。

安防是一眾AI芯片公司紛紛瞄準(zhǔn)的重要落地場(chǎng)景罕偎,作為傳統(tǒng)安防芯片霸主,海思表示以后的所有IPC芯片新品京闰,都將搭載專用AI模塊颜及。

華為近期提出了全棧全場(chǎng)景AI解決方案,發(fā)布了兩款A(yù)I芯片蹂楣,昇騰910和昇騰310俏站。昇騰910是目前單芯片計(jì)算密度最大的芯片,計(jì)算力遠(yuǎn)超谷歌及英偉達(dá)痊土,而昇騰310芯片的最大功耗僅8W肄扎,是極致高效計(jì)算低功耗AI芯片。

3、地平線 Horizon Robotics

地平線成立于2015年7月犯祠,是一家注重軟硬件結(jié)合的AI初創(chuàng)公司旭等,由Intel、嘉實(shí)資本衡载、高瓴資本領(lǐng)投搔耕。

2017年12月,地平線自主設(shè)計(jì)研發(fā)了中國首款嵌入式人工智能視覺芯片——旭日1.0和征程1.0痰娱。

旭日1.0是面向智能攝像頭的處理器弃榨,具備在前端實(shí)現(xiàn)大規(guī)模人臉檢測(cè)跟蹤、視頻結(jié)構(gòu)化的處理能力梨睁,可廣泛用于智能城市惭墓、智能商業(yè)等場(chǎng)景。

征程1.0是面向自動(dòng)駕駛的處理器而姐,可同時(shí)對(duì)行人、機(jī)動(dòng)車划咐、非機(jī)動(dòng)車拴念、車道線交通標(biāo)識(shí)等多類目標(biāo)進(jìn)行精準(zhǔn)的實(shí)時(shí)監(jiān)測(cè)和識(shí)別,實(shí)現(xiàn)FCW/LDW/JACC等高級(jí)別輔助駕駛功能褐缠。

地平線今年又推出了基于旭日(Sunrise)2.0的架構(gòu)(BPU2.0政鼠,伯努利架構(gòu))的XForce邊緣AI計(jì)算平臺(tái),其主芯片為Intel A10 FPGA队魏,典型功耗35W公般,可用于視頻人臉識(shí)別、人體分割胡桨、肢體檢測(cè)等功能官帘。

4、比特大陸 Bitmain

比特大陸成立于2013年10月昧谊,是全球第一大比特幣礦機(jī)公司刽虹,目前占領(lǐng)了全球比特幣礦機(jī) 70%以上的市場(chǎng)。并已將業(yè)務(wù)拓展至AI領(lǐng)域呢诬,于2017年推出云端AI芯片BM1680涌哲,支持訓(xùn)練和推斷。目前已推出第二代產(chǎn)品BM1682尚镰,相較上一代性能提升5倍以上阀圾。

BM1880是比特大陸首款面向邊緣端計(jì)算的低功耗AI協(xié)處理器,采用28nm工藝狗唉,ARM A53雙核架構(gòu)初烘,RISC-V CPU,其典型功耗2W,int 8精度算力能夠達(dá)到1Tops账月。

比特大陸提供端云一體化的AI解決方案综膀,與終端AI芯片不同,比特大陸的云端AI芯片將不會(huì)單獨(dú)發(fā)售局齿,只搭載在板卡剧劝、云服務(wù)器中提供給合作伙伴。

比特大陸將其AI芯片落地產(chǎn)業(yè)拓展到了四大類抓歼,分別是:安防讥此、園區(qū)、智慧城市谣妻、互聯(lián)網(wǎng)萄喳。

三、互聯(lián)網(wǎng)巨頭入局與新模式

1蹋半、互聯(lián)網(wǎng)巨頭入局

全球互聯(lián)網(wǎng)巨頭紛紛高調(diào)宣布進(jìn)入半導(dǎo)體行業(yè)他巨,阿里、微軟减江、Google染突、Facebook、亞馬遜等都宣布在芯片領(lǐng)域的動(dòng)作辈灼。當(dāng)互聯(lián)網(wǎng)巨頭開始進(jìn)入芯片市場(chǎng)時(shí)份企,會(huì)對(duì)芯片行業(yè)產(chǎn)生巨大的影響。

首先巡莹,互聯(lián)網(wǎng)巨頭追求硬件能實(shí)現(xiàn)極致化的性能以實(shí)現(xiàn)差異化用戶體驗(yàn)用來吸引用戶司志。在摩爾定律即將遇到瓶頸之際,想要追求極致體驗(yàn)需要走異構(gòu)計(jì)算降宅,自己定制化芯片的道路骂远,光靠采購傳統(tǒng)半導(dǎo)體廠商的芯片,已經(jīng)沒法滿足互聯(lián)網(wǎng)巨頭對(duì)于硬件的需求腰根,至少在核心芯片部分是這樣吧史。因此,F(xiàn)acebook唠雕、Google贸营、阿里等互聯(lián)網(wǎng)巨頭都是異構(gòu)計(jì)算的積極擁護(hù)者,為了自己的硬件布局或計(jì)劃設(shè)計(jì)芯片岩睁,或已經(jīng)開始設(shè)計(jì)芯片钞脂。這么一來,原來是半導(dǎo)體公司下游客戶的互聯(lián)網(wǎng)公司現(xiàn)在不需要從半導(dǎo)體公司采購芯片了捕儒,這樣的產(chǎn)業(yè)分工變化會(huì)引起行業(yè)巨變冰啃。

其次邓夕,互聯(lián)網(wǎng)巨頭制造硬件的目的只是為了吸引用戶進(jìn)入自己的生態(tài),使用自己的服務(wù)阎毅,其最終盈利點(diǎn)并不在販賣硬件上而是在增值服務(wù)上焚刚。因此,互聯(lián)網(wǎng)巨頭在為了自己的硬件設(shè)計(jì)芯片時(shí)可以不計(jì)成本扇调。

從另一個(gè)角度來說矿咕,一旦自己設(shè)計(jì)核心芯片的互聯(lián)網(wǎng)公司進(jìn)入同一個(gè)領(lǐng)域,那些靠采購半導(dǎo)體公司標(biāo)準(zhǔn)芯片搭硬件系統(tǒng)的公司狼钮,就完全沒有競(jìng)爭(zhēng)力了碳柱,無論是從售價(jià)還是性能,擁有自己核心芯片的互聯(lián)網(wǎng)巨頭都能實(shí)施降維打擊熬芜。一旦這些硬件公司失去競(jìng)爭(zhēng)力莲镣,那么依賴于這些客戶的半導(dǎo)體公司的生存空間又會(huì)進(jìn)一步被壓縮。

總而言之涎拉,互聯(lián)網(wǎng)巨頭進(jìn)入芯片領(lǐng)域瑞侮,首先出于性能考慮不再從半導(dǎo)體公司采購核心芯片,這沖擊了傳統(tǒng)行業(yè)分工鼓拧,使傳統(tǒng)芯片公司失去了一類大客戶半火;另一方面互聯(lián)網(wǎng)巨頭的生態(tài)式打法可以讓自研硬件芯片不考慮成本,這又沖擊了那些從半導(dǎo)體公司采購芯片的傳統(tǒng)硬件公司毁枯,從而進(jìn)一步壓縮了半導(dǎo)體公司的市場(chǎng)。在這兩個(gè)作用下叮称,半導(dǎo)體芯片公司的傳統(tǒng)經(jīng)營模式必須發(fā)生改變才能追上新的潮流种玛。

2、Designless-Fabless模式

目前瓤檐,半導(dǎo)體行業(yè)領(lǐng)域的分工赂韵,大概可以分為定義、設(shè)計(jì)挠蛉、設(shè)計(jì)定案祭示、制造等幾個(gè)環(huán)節(jié)。

今天的半導(dǎo)體行業(yè)谴古,最為大家熟知的是Fabless模式质涛,即芯片設(shè)計(jì)公司負(fù)責(zé)定義、設(shè)計(jì)和設(shè)計(jì)定案掰担,而制造則是在提供代工的Fab完成汇陆;如高通,是Fabless的典型代表带饱。

在互聯(lián)網(wǎng)巨頭入局半導(dǎo)體行業(yè)后毡代,又出現(xiàn)了一種新的模式阅羹,即互聯(lián)網(wǎng)公司負(fù)責(zé)定義芯片、完成小部分設(shè)計(jì)教寂、并花錢完成設(shè)計(jì)定案流片捏鱼,設(shè)計(jì)服務(wù)公司負(fù)責(zé)大部分設(shè)計(jì),而代工廠負(fù)責(zé)芯片制造酪耕。這種新模式可以稱為Designless-Fabless模式导梆。

image.png

歷史上,半導(dǎo)體公司從傳統(tǒng)的IDM走到Fabless模式因妇,主要是因?yàn)镕ab開銷過高问潭,成為了半導(dǎo)體公司發(fā)展的包袱,而代工廠則提供了一個(gè)非常靈活的選項(xiàng)婚被。

今天狡忙,互聯(lián)網(wǎng)公司入局半導(dǎo)體后走Designless-Fabless模式,把大量設(shè)計(jì)外包址芯,則主要是因?yàn)闀r(shí)間成本灾茁。互聯(lián)網(wǎng)巨頭做芯片谷炸,追求的除了極致性能之外北专,還有快速的上市時(shí)間。對(duì)于他們來說旬陡,如果要像傳統(tǒng)半導(dǎo)體公司一樣拓颓,需要從頭開始培養(yǎng)自己的前端+后端設(shè)計(jì)團(tuán)隊(duì),從頭開始積累模塊IP描孟,恐怕第一塊芯片上市要到數(shù)年之后驶睦。這樣的節(jié)奏,是跟不上互聯(lián)網(wǎng)公司的快速迭代節(jié)奏的匿醒。

那么如何實(shí)現(xiàn)高性能加快速上市呢场航?最佳方案就是這些巨頭自己招募芯片架構(gòu)設(shè)計(jì)團(tuán)隊(duì)做芯片定義,用有豐富經(jīng)驗(yàn)的業(yè)界老兵來根據(jù)需求定制架構(gòu)以滿足性能需求廉羔,而具體的實(shí)現(xiàn)溉痢,包括物理版圖設(shè)計(jì)甚至前端電路設(shè)計(jì)都可以交給設(shè)計(jì)服務(wù)公司去做。半導(dǎo)體芯片的一個(gè)重要特點(diǎn)就是細(xì)節(jié)非常重要憋他,ESD孩饼、散熱、IR Drop等一個(gè)小細(xì)節(jié)出錯(cuò)就可能導(dǎo)致芯片性能大打折扣無法達(dá)到需求竹挡。因此捣辆,如果把具體設(shè)計(jì)工作交給有豐富經(jīng)驗(yàn)的設(shè)計(jì)服務(wù)公司,就可以大大減少細(xì)節(jié)出錯(cuò)的風(fēng)險(xiǎn)此迅,從而減小芯片需要重新設(shè)計(jì)延誤上市時(shí)間的風(fēng)險(xiǎn)汽畴。

隨著分工的進(jìn)一步細(xì)化旧巾,原先起輔助作用的設(shè)計(jì)服務(wù)公司,將越來越重要忍些,能夠與互聯(lián)網(wǎng)巨頭產(chǎn)生互補(bǔ)效應(yīng)鲁猩。不少半導(dǎo)體公司也注意到了設(shè)計(jì)服務(wù)的潮流,并開始向設(shè)計(jì)服務(wù)靠攏罢坝。聯(lián)發(fā)科前一陣高調(diào)公開設(shè)計(jì)服務(wù)業(yè)務(wù)廓握,就是半導(dǎo)體公司轉(zhuǎn)向的重要標(biāo)志。

對(duì)于國內(nèi)的AI芯片初創(chuàng)公司來說嘁酿,善用這種Designless-Fabless模式隙券,對(duì)于縮短產(chǎn)品研發(fā)周期,提升產(chǎn)品設(shè)計(jì)水平闹司,都有很大幫助娱仔。

未來兩種可能的通用AI芯片技術(shù)路線介紹

一、類腦芯片

這類AI芯片屬于神經(jīng)擬態(tài)芯片游桩,從結(jié)構(gòu)層面去模擬大腦牲迫,參考人腦神經(jīng)元結(jié)構(gòu)和人腦感知認(rèn)知方式來設(shè)計(jì)芯片,俗稱“類腦芯片”借卧。

類腦芯片在架構(gòu)上直接通過模仿大腦結(jié)構(gòu)進(jìn)行神經(jīng)擬態(tài)計(jì)算盹憎,完全開辟了另一條實(shí)現(xiàn)人工智能的道路,而不是作為人工神經(jīng)網(wǎng)絡(luò)或深度學(xué)習(xí)的加速器存在铐刘。類腦芯片可以將內(nèi)存陪每、CPU和通信部件完全集成在一起,實(shí)現(xiàn)極高的通信效率和極低的能耗镰吵。目前該類芯片還只是小規(guī)模研究與應(yīng)用檩禾,低能耗的優(yōu)勢(shì)也帶來預(yù)測(cè)精度不高等問題,沒有高效的學(xué)習(xí)算法支持使得類腦芯片的進(jìn)化較慢捡遍,還不能真正實(shí)現(xiàn)商用锌订。

image.png

目前神經(jīng)擬態(tài)芯片的設(shè)計(jì)方法主要分為非硅和硅技術(shù)竹握。非硅主要指采用憶阻器等新型材料和器件搭建的神經(jīng)形態(tài)芯片画株,還處于研究階段。硅技術(shù)包括模擬和數(shù)字兩種啦辐。模擬集成電路的代表是瑞士蘇黎世聯(lián)邦理工學(xué)院的ROLLS芯片和海德堡大學(xué)的BrainScales芯片谓传。數(shù)字集成電路又分為異步同步混合和純同步兩種。其中異步(無全局時(shí)鐘)數(shù)字電路的代表是IBM的TrueNorth芹关,純同步的數(shù)字電路代表是清華大學(xué)的“天機(jī)”系列芯片续挟。

另外,對(duì)于片上自學(xué)習(xí)能力侥衬,最近Intel推出了Loihi芯片诗祸,帶有自主片上學(xué)習(xí)能力跑芳,通過脈沖或尖峰傳遞信息,并自動(dòng)調(diào)節(jié)突觸強(qiáng)度直颅,能夠通過環(huán)境中的各種反饋信息進(jìn)行自主學(xué)習(xí)博个。中國研究類腦芯片的企業(yè)還有:西井科技,靈汐科技功偿,深思創(chuàng)芯等盆佣。

二、可重構(gòu)通用AI芯片

這類AI芯片遵循軟件定義芯片思想械荷,是基于可重構(gòu)計(jì)算架構(gòu)的芯片共耍,兼具處理器的通用性和ASIC的高性能與低功耗,是未來通用AI芯片的方向之一吨瞎。

可重構(gòu)計(jì)算技術(shù)允許硬件架構(gòu)和功能隨軟件變化而變化痹兜,兼具處理器的通用性和ASIC的高性能和低功耗,是實(shí)現(xiàn)軟件定義芯片的核心关拒,被公認(rèn)為是突破性的下一代集成電路技術(shù)佃蚜。清華大學(xué)微電子學(xué)研究所設(shè)計(jì)的AI芯片Thinker,采用可重構(gòu)計(jì)算架構(gòu)着绊,能夠支持卷積神經(jīng)網(wǎng)絡(luò)谐算、全連接神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)等多種AI算法。

值得一提的是归露,DARPA在電子振興計(jì)劃(ERI)中提出了三個(gè)支柱:材料洲脂、架構(gòu)、設(shè)計(jì)剧包,用于支撐美國2025 - 2030年之間的國家電子設(shè)計(jì)能力恐锦。這其中每一個(gè)方向都設(shè)置了一個(gè)課題,其中一個(gè)課題在架構(gòu)中提出了軟件定義硬件的概念疆液,也就是 Software defines Hardware一铅。

ERI中講道:所謂要建立運(yùn)行時(shí)可以實(shí)時(shí)重新配置的硬件和軟件,他們具備像ASIC一樣的性能堕油,而沒有犧牲數(shù)據(jù)密集型計(jì)算的可編程性潘飘。

現(xiàn)今的AI芯片在某些具體任務(wù)上可以大幅超越人的能力,但究其通用性與適應(yīng)性掉缺,與人類智能相比差距甚遠(yuǎn)卜录,大多處于對(duì)特定算法的加速階段。而AI芯片的最終成果將是通用AI芯片眶明,并且最好是淡化人工干預(yù)的自學(xué)習(xí)艰毒、自適應(yīng)芯片。因此未來通用 AI芯片應(yīng)包含以下特征搜囱。

  • 1)可編程性:適應(yīng)算法的演進(jìn)和應(yīng)用的多樣性丑瞧。

  • 2)架構(gòu)的動(dòng)態(tài)可變性:能適應(yīng)不同的算法柑土,實(shí)現(xiàn)高效計(jì)算。

  • 3)高效的架構(gòu)重構(gòu)能力或自學(xué)習(xí)能力绊汹。

  • 4)高計(jì)算效率:避免使用指令這類低效率的架構(gòu)冰单。

  • 5)高能量效率:能耗比大于5 Tops/W(即每瓦特進(jìn)行5×10^12次運(yùn)算)。

  • 6)低成本低功耗:能夠進(jìn)入物聯(lián)網(wǎng)設(shè)備及消費(fèi)類電子中灸促。

  • 7)體積薪肭贰:能夠加載在移動(dòng)終端上。

  • 8)應(yīng)用開發(fā)簡(jiǎn)便:不需要用戶具備芯片設(shè)計(jì)方面的知識(shí)浴栽。

對(duì)于可重構(gòu)架構(gòu)荒叼,大家可能覺得FPGA早就可以這樣做了,但實(shí)際上FPGA有很多局限性典鸡,包括以下這些:

  • 細(xì)粒度:由于要實(shí)現(xiàn)比特級(jí)運(yùn)算被廓,運(yùn)算顆粒度必須為細(xì)粒度;

  • 配置信息量大:通常為幾兆到十幾兆字節(jié)萝玷;

  • 配置時(shí)間長(zhǎng):通常需要十幾毫秒到幾十毫秒嫁乘;

  • 靜態(tài)編程:一旦配置完成,不可更改球碉。如果要改變 FPGA 的功能蜓斧,只能下電或在線重新載入配置信息;

  • 邏輯不可復(fù)用:所有電路必須全部裝入FPGA 睁冬,復(fù)用性為零挎春;

  • 面積效率低:每個(gè)LUT只能實(shí)現(xiàn)一位運(yùn)算,面積效率只有5%豆拨。一個(gè)千萬級(jí)的FPGA只能實(shí)現(xiàn)幾十萬門的邏輯電路直奋;

  • 能量效率低:由于邏輯利用率低,引發(fā)無效功耗巨大施禾;

  • 需要特種工藝:FPGA 往往需要最先進(jìn)的制造工藝脚线,且需對(duì)工藝進(jìn)行特別調(diào)整;

  • 電路設(shè)計(jì)技術(shù):應(yīng)用者必須具備電路設(shè)計(jì)知識(shí)和經(jīng)驗(yàn)弥搞;

  • 成本高昂:目前的FPGA價(jià)格為幾千到幾萬美元一片邮绿。

目前尚沒有真正意義上的通用AI芯片誕生,而基于可重構(gòu)計(jì)算架構(gòu)的軟件定義芯片(software defined chip)或許是通用AI芯片的出路拓巧。

參考:https://zhuanlan.zhihu.com/p/55282026

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末斯碌,一起剝皮案震驚了整個(gè)濱河市一死,隨后出現(xiàn)的幾起案子肛度,更是在濱河造成了極大的恐慌,老刑警劉巖投慈,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件承耿,死亡現(xiàn)場(chǎng)離奇詭異冠骄,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)加袋,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門凛辣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人职烧,你說我怎么就攤上這事扁誓。” “怎么了蚀之?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵蝗敢,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我足删,道長(zhǎng)寿谴,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任失受,我火速辦了婚禮讶泰,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘拂到。我一直安慰自己痪署,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布兄旬。 她就那樣靜靜地躺著惠桃,像睡著了一般。 火紅的嫁衣襯著肌膚如雪辖试。 梳的紋絲不亂的頭發(fā)上辜王,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天,我揣著相機(jī)與錄音罐孝,去河邊找鬼呐馆。 笑死,一個(gè)胖子當(dāng)著我的面吹牛莲兢,可吹牛的內(nèi)容都是我干的汹来。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼改艇,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼收班!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起谒兄,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤摔桦,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體邻耕,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡鸥咖,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了兄世。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片啼辣。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖御滩,靈堂內(nèi)的尸體忽然破棺而出鸥拧,到底是詐尸還是另有隱情,我是刑警寧澤削解,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布住涉,位于F島的核電站,受9級(jí)特大地震影響钠绍,放射性物質(zhì)發(fā)生泄漏舆声。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一柳爽、第九天 我趴在偏房一處隱蔽的房頂上張望媳握。 院中可真熱鬧,春花似錦磷脯、人聲如沸蛾找。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽打毛。三九已至,卻和暖如春俩功,著一層夾襖步出監(jiān)牢的瞬間幻枉,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來泰國打工诡蜓, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留熬甫,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓蔓罚,卻偏偏與公主長(zhǎng)得像椿肩,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子豺谈,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • 文章發(fā)布于公號(hào)【數(shù)智物語】(ID:decision_engine)茬末,關(guān)注公號(hào)不錯(cuò)過每一篇干貨厂榛。 轉(zhuǎn)自:硅谷密探 相...
    數(shù)智物語閱讀 319評(píng)論 0 0
  • 姓名:張璐 學(xué)號(hào):19021210845 轉(zhuǎn)載自:http://www.elecfans.com/d/809348...
    陌然_5236閱讀 425評(píng)論 0 0
  • 大多數(shù)人為了避免真正的思考,愿意去做任何事情。 據(jù)說這句話是美團(tuán)王興說的噪沙。 這句話讓我想到了上半年我的工作。我對(duì)于...
    Jiang江柳閱讀 201評(píng)論 0 0
  • 本文假定讀者有一定 javascript 和 D3 (《如何自學(xué) D3》) 基礎(chǔ)吐根,若對(duì) web 開發(fā)不太熟悉的同學(xué)...
    子龍0322閱讀 1,422評(píng)論 2 1
  • 學(xué)營銷正歼,必須學(xué)什么? 演講拷橘! 為什么要學(xué)演講局义? 因?yàn)椋葜v能讓你提升自信冗疮。 不自信萄唇,多講幾遍就自信了~ 只有堅(jiān)持不...
    章魚小洋子閱讀 252評(píng)論 0 4