英偉達的股價從20美元漲到200美元,只用了兩年芳悲。
這多半歸功于自2015年以來人工智能的興起立肘。機器學習消耗大量數(shù)字運算能力,CPU雖然能夠處理復雜問題名扛,但并不適合AI應用程序谅年。英偉達的GPU有數(shù)百甚至更多專用核心并行工作,天然適合AI肮韧。
2017年年底融蹂,英偉達推出了一款Titan V顯卡旺订,號稱最強顯卡,超越其前代性能9倍超燃,售價3000美元区拳。一家獨大,定價就這么任性意乓。
這個曾瀕臨破產(chǎn)的公司樱调,現(xiàn)在成為耀眼的千億美元明星企業(yè)。
技術(shù)變革帶來市場格局的巨變届良,也引來一群垂涎的新選手:寒武紀笆凌、地平線、深鑒科技……在這個千億美元競技場上伙窃,90后菩颖、深鑒科技創(chuàng)始人兼CEO姚頌是最年輕的競爭者。
01
人工智能中的「清華幫」
2015年为障,23歲的姚頌從清華大學本科畢業(yè)晦闰,拒了卡耐基梅隆大學給的offer。
本科導師汪玉勸他鳍怨,既然不想去呻右,那不如留下來做一年研究。姚頌覺得既然都是做事情鞋喇,不如創(chuàng)業(yè)声滥。
就這樣,姚頌拉著老師汪玉侦香,以及遠在美國斯坦福大學(當時PHD在讀落塑,后任教MIT)的韓松,創(chuàng)立了深鑒科技罐韩。作為創(chuàng)始團隊中唯一一個全職人員憾赁,姚頌成為了CEO,開始了從學生到公司創(chuàng)始人的角色轉(zhuǎn)變散吵。
時間來不及讓他慢慢適應龙考。
2015年11月28日做出決定,第二天姚頌就開始寫B(tài)P矾睦、見投資人晦款。一天見一位,白天談融資枚冗,晚上修改BP缓溅。一連十幾個投資人,都對他們表示疑慮:純學術(shù)的團隊赁温,一位太過年輕的CEO肛宋、一位大學老師州藕、一位美國PHD,到底能不能干成這件事酝陈?
深鑒科技聯(lián)合創(chuàng)始人汪玉告訴新經(jīng)濟100人:「講了無數(shù)遍BP,被人拍得死去活來的毁涉。我們回來接著改沉帮、接著講、再接著改贫堰、再接著講穆壕。」
他認為姚頌抗壓能力很強其屏,這也是為什么年輕的姚頌能做CEO的緣故之一喇勋。
「抗壓是第一位的,因為時時刻刻都在擔心偎行,融不到錢怎么辦川背,找不到人怎么辦,東西做不出來怎么辦蛤袒。外面也有不好的評論熄云,覺得這一撥小毛孩出來做芯片不靠譜。但是妙真,我們都頂過來了缴允。」
姚頌是長沙人珍德,霸蠻练般,「學生時代的我其實屬于支配欲望比較強的人,就是我認定了锈候,就這么干薄料,哪怕外面都在質(zhì)疑∏缂埃」
直到2016年2月份都办,姚頌到硅谷參加學術(shù)會議,遇到了金沙江創(chuàng)投在美國的合伙人林仁俊虑稼。兩人聊了一下午琳钉,從人工智能和半導體行業(yè)幾十年的發(fā)展,聊到后摩爾定律時代的芯片延續(xù)蛛倦,最后得到一個結(jié)論歌懒,交叉點一定會出現(xiàn)人工智能芯片,當場談定意向溯壶,第二周就簽了合同及皂。
從創(chuàng)始人到員工甫男,早期的深鑒充滿了學院氣息,有很多兼職學生和實習生验烧。雖然汪玉從2007年開始做硬件加速研究板驳,積累了一定的技術(shù),深鑒團隊已經(jīng)有組織架構(gòu)碍拆、產(chǎn)品形態(tài)若治,但技術(shù)部門之間沒有形成很好的合力,產(chǎn)品進度比較慢感混,滿足不了產(chǎn)品級要求端幼。
2016年年底,單羿加入深鑒科技弧满,擔任CTO婆跑,調(diào)整了團隊成員結(jié)構(gòu),將學生替換成社招人員庭呜,提高研發(fā)標準滑进,加速產(chǎn)品落地。
優(yōu)化后的團隊疟赊,分為算法郊供、軟件、硬件和芯片四個方向近哟。核心是做芯片系統(tǒng)驮审,由芯片提供算力,硬件為芯片打磨硬件系統(tǒng)吉执,同時用FPGA這種平臺做先期客戶的接觸和反饋疯淫。軟件把壓縮工具、量化工具戳玫、編譯器工具熙掺、部署工具穿到一起,形成一個產(chǎn)品系統(tǒng)咕宿。同時關(guān)注最新算法的演進趨勢币绩,為芯片架構(gòu)設計提供指導。
單羿是汪玉帶的第一位博士生府阀,后加入深鑒缆镣。隨著人工智能熱潮漸起,人才的爭奪戰(zhàn)日趨白熱化试浙。
工業(yè)界有兩個「黃埔軍校」董瞻,一個是百度,一個是微軟亞洲研究院田巴。曠視科技引入微軟亞洲研究院的首席研究員孫劍钠糊,擔任首席科學家挟秤,增強算法上的競爭力。商湯科技創(chuàng)始人湯曉鷗出身香港中文大學抄伍,其實驗室有關(guān)計算機視覺算法亞洲排行第一艘刚,與曠視創(chuàng)始人印奇是老師學生關(guān)系。二者分庭抗禮截珍,一直競爭到今天昔脯。
深鑒科技有著清華和斯坦福的雙重學術(shù)背景,吸引到的多是此類學術(shù)背景的人才笛臣,以電子系和微電子專業(yè)居多,更偏向工程類人才隧饼。目前公司100人有一半以上來自清華沈堡。
清華幫在國內(nèi)人工智能領(lǐng)域「呼風喚雨」,曠視科技團隊多來自清華計算機系燕雁。地平線軟件副總裁楊銘诞丽、算法副總裁黃暢也是來自清華電子系和計算機系。商湯科技副總裁楊帆亦是清華電子系出身拐格。
「全國清華相關(guān)專業(yè)畢業(yè)的碩博一年加起來也就百余人僧免,有BAT、華為捏浊、商湯懂衩、曠視,以及我們在搶金踪。所以每一家公司能夠分到幾個就已經(jīng)很不容易浊洞。」姚頌說胡岔。
引進人才的好處也是明顯的:2017年10月法希,深鑒一口氣推出6款深度學習產(chǎn)品,產(chǎn)品落地靶瘸、商業(yè)化速度明顯加快苫亦。
02
主打低功耗
一塊綠色的PCB板子上,數(shù)億晶體管集成到一張小小的黑色芯片里怨咪,約礦泉水瓶蓋大小屋剑。
板子前面連接著攝像頭,采集到的數(shù)據(jù)在前端實時處理惊暴。顯示屏上饼丘,可以看到來往人群中被框起來的每個人。
它的模組規(guī)格50mm*60mm辽话,每秒可處理18fps@1080p視頻肄鸽,單幀可30張以上人臉檢測卫病、建模及識別,支持GoogleNet典徘、VGG蟀苛、SSD、ResNet逮诲、YOLO等深度學習網(wǎng)絡部署帜平,功耗5W。
這是2017年深鑒重點推出的安防產(chǎn)品芯片梅鹦,一個方案大約400元裆甩,推出兩個月,接到幾萬個的訂單齐唆。
「我們對標英偉達嗤栓,但是效率更高。我們跟英偉達的芯片區(qū)別在于箍邮,他們在市面上賣幾千美元的板卡茉帅,對于我們來講,提供類似的算力锭弊,我們的芯片成本可能只有10美元堪澎。」單羿說味滞。
英偉達現(xiàn)在沒有旗鼓相當?shù)母偁帉κ钟8颍谀承﹫鼍袄镫S意定價。這也給后來的創(chuàng)業(yè)公司提供了機會桃犬,做到成本可控刹悴,為客戶提供更低的價格。
神經(jīng)網(wǎng)絡既是計算密集的任務攒暇,又是存儲密集的任務土匀。早年經(jīng)歷了從優(yōu)化計算引擎到優(yōu)化存儲系統(tǒng),如今算法和硬件分開的情況下已經(jīng)達到了優(yōu)化的極限形用,所以深鑒選擇軟硬件協(xié)同設計就轧,利用壓縮和稀疏化達到整體最高效的方案。這套解決方案中的主要技術(shù)田度,獲得ICLR 2016妒御、FPGA 2017最佳論文獎。
簡單來說镇饺,神經(jīng)網(wǎng)絡訓練模型時更在意精度的提升乎莉,有很多運算是冗余的。在獲得精度之后,找出其中的冗余部分惋啃,將其去掉哼鬓,以實現(xiàn)獲取收益減去負擔。
壓縮之后可以把模型變小边灭,比如變小50倍异希。芯片是一個運算單元、一個處理器绒瘦,外面掛著內(nèi)存以及硬盤等存儲設備称簿。如果模型變小,內(nèi)存縮小到一定程度時惰帽,可以把它放在芯片里憨降,不再需要外接內(nèi)存,幫助客戶省掉內(nèi)存的成本该酗。
此外券册,當模型變小以后,運算的次數(shù)也變少了垂涯,計算的時間會縮短,功耗也會進一步降低航邢。
深鑒科技宣稱耕赘,在算力同等的條件下,GPU的功耗在十幾瓦左右膳殷,深鑒芯片的功耗只有3瓦操骡。
深鑒科技商務副總裁劉競秀說:「算法本身不是我們最強的地方,我們強在可以利用我們獨門的壓縮技術(shù)赚窃,結(jié)合我們的DPU把算法發(fā)揮更好的端到端效果册招。」
但是硬件公司的普遍難處在于產(chǎn)品的穩(wěn)定性和良率勒极。
硬件的打磨周期很長是掰,相對投入很大。第一代芯片流片(像流水線一樣通過一系列工藝步驟制造芯片)出來辱匿,很難與有多年芯片設計制造經(jīng)驗的英偉達相抗衡键痛。英偉達與產(chǎn)業(yè)鏈的結(jié)合次數(shù)更多,配合關(guān)系更好匾七,能夠每個環(huán)節(jié)發(fā)揮出最優(yōu)的效果絮短,在這方面創(chuàng)業(yè)公司是有劣勢的。
并且昨忆,芯片設計中可能存在著一些風險和要迭代的地方丁频。比如,公司在設計時期待芯片能發(fā)揮出90%以上的利用率,但實際生產(chǎn)出來后可能只有80%或70%席里。這在沒做出芯片之前叔磷,很難預計會有怎樣的問題。但是改進的成本很高胁勺,不能隨意投片世澜,做不到像英偉達那樣快速迭代。
深鑒通過與A輪署穗、A+輪的投資方合作芯片寥裂,來解決一些財力、人力案疲、經(jīng)驗等方面不足的問題封恰,這其中包括三星、聯(lián)發(fā)科和賽靈思褐啡。同時诺舔,與這些廠商合作,也是滲入到其他行業(yè)的一塊敲門磚备畦。
「我們現(xiàn)在整體來看已經(jīng)比英偉達做得要好一些褥赊,但是不確定是不是真的有優(yōu)勢。因為對英偉達來說莉恼,他不著急把最好的東西放出來拌喉,只要市場上沒有競爭對手,他可以把先研發(fā)的東西緩一緩再拿出來俐银∧虮常」單羿說。
03
從安防撕開商業(yè)化口子
剛走出院校的深鑒科技在芯片落地上捶惜,也曾經(jīng)走過一段「彎路」田藐。
2016年,他們與一家無人機公司合作吱七,推出了一款只有巴掌大小的智能無人機坞淮,在滿足尺寸、功耗陪捷、價格的條件下回窘,通過Zynq FPGA平臺實現(xiàn)實時的多人檢測、姿態(tài)識別市袖、追蹤啡直。
對姚頌來說烁涌,這是他第一次用具體的產(chǎn)品將零散的技術(shù)串起來,無人機對芯片的要求并不高酒觅,是理想的試水產(chǎn)品撮执,但不是一個可以全身投入的行業(yè)。
因為市場太小了舷丹,養(yǎng)不活AI公司抒钱。大疆無人機占著市場70%以上,一年出貨百萬臺颜凯,剩下30%被幾百家公司瓜分谋币。
芯片本身是一個高投入、邊際成本很低的產(chǎn)品症概,它前期研發(fā)成本很高蕾额,后期批量生產(chǎn)成本非常低。硅片的硬件成本和原料成本彼城,姚頌把它戲稱為「沙子錢」诅蝶。芯片靠量產(chǎn)把研發(fā)成本攤薄,無人機市場顯然滿足不了「量」的要求募壕。
那自動駕駛呢调炬?三五年不會有量產(chǎn)車上路,創(chuàng)業(yè)公司拖不起舱馅。新經(jīng)濟100人最近采訪一家國內(nèi)無人駕駛公司筐眷,其提到研發(fā)早期調(diào)研了一圈國內(nèi)外芯片公司,發(fā)現(xiàn)國內(nèi)芯片普遍主打低功耗习柠、高性價比,但在運算能力和穩(wěn)定性上與國際一線仍有較大差距照棋,所以最終仍然選擇與英偉達合作资溃。
智能家居呢?風聲大雨點小烈炭,沒有幾個家庭真正用上溶锭。數(shù)據(jù)中心呢?英偉達打算接手英特爾的攤子符隙,正在全面布局趴捅,直接交鋒不理智。
人工智能的概念太熱霹疫,卻一直在為商業(yè)化苦苦掙扎拱绑。作為人工智能的技術(shù)底層芯片供應商,深鑒也在摸索類似的路徑丽蝎。
2016年末猎拨,姚頌做了好幾個月的調(diào)研,他認為公司應該嘗試轉(zhuǎn)型安防領(lǐng)域,并且在春節(jié)前后召開核心成員的閉門會議討論最終決策红省。
安防的水很深额各,整個系統(tǒng)格局非常復雜,是一個相對封閉的環(huán)境吧恃。合豪玻康威視、大華這種安防產(chǎn)品的行業(yè)巨頭痕寓,掌握了大部分的資源傲醉,而一些小的安防設備公司,也在各自的地盤有著不錯的營生厂抽。
「我們不想做盒杵担康、大華的競爭對手筷凤,也不想做本地經(jīng)銷商的競爭對手昭殉,我們是想做海康藐守、大華背后AI方案的提供商挪丢。我們最擅長的就是做跟AI相關(guān)的一整套方案。這些做安防設備的公司他們最缺的也是這個能力卢厂,因為他們都是傳統(tǒng)公司乾蓬,都是靠做硬件、軟件起家的慎恒,沒有做AI的經(jīng)驗任内。」劉競秀說融柬。
深鑒與安防廠商合作死嗦,可以一到兩個月幫他們出一款有AI能力的新產(chǎn)品。硬件的模組粒氧、算法越除、軟件都是現(xiàn)成的,客戶只要做硬件的對接外盯,把硬件插到機器里就可以工作摘盆。如果他們自己研發(fā)的話至少要半年、一年甚至更長的時間饱苟。
在新經(jīng)濟100人訪談中孩擂,姚頌和其他高管們多次提到英偉達。英偉達依靠GPU在數(shù)據(jù)中心箱熬、自動駕駛(英偉達拿到了特斯拉訂單)等領(lǐng)域橫沖直撞肋殴。在安防領(lǐng)域囤锉,基于GPU的智能安防成本比較高。GPU高性能护锤、高功耗官地、高成本,最低功耗在15瓦以上烙懦,這要求GPU布局在服務器端驱入,一般能夠承擔起這個成本的是公安。
像小區(qū)安防布置視頻監(jiān)控氯析,有4到8個攝像頭亏较,不可能布置服務器在小區(qū),也不會直接連到公安掩缓,只會連到保安室讓人在電腦上盯著雪情。
將英偉達視作對標的深鑒,主打的是低功耗你辣,范圍在1-20瓦巡通。這可以滿足小區(qū)視頻監(jiān)控的需求,做成一個功耗十幾瓦到二十瓦的小盒子舍哄,能做八路視頻識別宴凉,攝像頭直接連接小盒子,數(shù)據(jù)再傳到電腦上看表悬。
金溢科技弥锄,全國最大的ETC公司,主營公路收費蟆沫、停車收費籽暇。傳統(tǒng)ETC在地底下埋一個線圈,車通過的時候饭庞,上面的雷達探測到車輛戒悠,線圈會感應上面ETC的芯片卡,進行收費但绕。
它的痛點在于線圈昂貴、易損耗惶看,只能進口捏顺,廣泛應用在停車場,成本會非常高纬黎。此外幅骄,如果不是ETC的車,開到ETC通道本今,還要倒車出去換一個通道拆座。他們希望在傳統(tǒng)的線圈電磁感應之外主巍,加一塊視頻作為輔助,在路邊吊個桿掛一個小攝像頭挪凑,識別車型和車牌號孕索。在高速公路通行雷達上面加一個攝像頭,遠遠就看到車輛牌照躏碳,如果不是ETC的車輛搞旭,就請車輛走另外的車道。
金溢科技也是深鑒第一批軟件客戶菇绵。軟件對于AI的芯片來說非常關(guān)鍵肄渗,英特爾之所以成功與和微軟深度綁定有關(guān),AMD之所以市值才百億美元咬最,也與軟件做得很差脫不開干系翎嫡。
「我們做了國內(nèi)第一個,現(xiàn)在唯一敢拿出來給用戶使用的神經(jīng)網(wǎng)絡開發(fā)軟件DNNDK永乌。開發(fā)軟件有很多預設惑申,但是用戶的使用情況是千般萬種,不會按照規(guī)定去做,所以也給了我們很多的反饋螺句〕筛#」姚頌說。
目前碗脊,深鑒與大華等大型廠商的接觸還在測試階段,第二梯隊的安防公司許多已經(jīng)進入了聯(lián)合研發(fā)階段橄妆。
04
AI芯片:中國彎道超車機會
國內(nèi)研發(fā)AI芯片的公司衙伶,除了深鑒以外,還有寒武紀害碾、地平線等矢劲。寒武紀側(cè)重于通用芯片,既做訓練又做應用慌随,首先布局在智能終端芬沉。
「我們的芯片叫做DPU,這是深度學習處理器阁猜。AI分訓練和應用兩層丸逸,我們只做深度學習應用端,不做訓練端剃袍』聘眨」姚頌告訴新經(jīng)濟100人。
地平線則是提供一個閉環(huán)的封閉系統(tǒng)民效,客戶購買算法加上硬件的全套解決方案憔维,算法加硬件都固定在一個「黑盒子」里涛救。
深鑒的用戶則可以選擇用不用他們的算法。這導致整個產(chǎn)品設計思路完全不同业扒。
「比如我就想用這一袋面粉做饅頭检吆,那我可能做幾種樣子的饅頭,但是如果我想用這個面粉做面點凶赁,那你在后廚需要準備的東西肯定要比只做饅頭復雜很多咧栗。」劉競秀說虱肄。
這是為了迎合客戶的需求致板,打造一整套生態(tài)環(huán)境。在「數(shù)據(jù)為王」的時代咏窿,客戶都希望把數(shù)據(jù)掌握在自己手中斟或,利用手里的數(shù)據(jù)形成對行業(yè)的理解,做定制的算法集嵌,從而增加公司的附加價值萝挤。
就像英特爾最開始做了CPU之后,定下標準的接口根欧,交由主板公司解決硬件層問題怜珍。之后在上層跑一個Windows操作系統(tǒng),通過中間的程序支持鼠標凤粗、鍵盤酥泛、攝像頭等外接設備,最終才能在系統(tǒng)上運行諸如Office這樣的應用嫌拣。所以英特爾做了大量工作柔袁,讓微軟把操作系統(tǒng)部署在上面,才有了今天英特爾CPU在PC的廣泛應用异逐。
到了AI時代捶索,打造生態(tài)又變成所有芯片行業(yè)巨頭和創(chuàng)業(yè)公司最大的挑戰(zhàn)。英偉達發(fā)布了工具TensorRT灰瞻,深鑒也公開發(fā)布了類似編譯器和工具腥例。
在半導體芯片領(lǐng)域,中國在全球一直處于追趕者的角色酝润。CPU芯片一直被英特爾等國外巨頭壟斷燎竖,2016年中國在半導體芯片進口上的花費已經(jīng)接近原油的兩倍。
人工智能的興起袍祖,正在引發(fā)各行各業(yè)的變革底瓣。舊型芯片不能完全滿足機器學習的需求谢揪,英特爾與英偉達多年的技術(shù)積累不再作為壁壘(GPU非專門的AI芯片)蕉陋,而是與國內(nèi)創(chuàng)業(yè)公司站在同一個起跑線上捐凭,為機器學習研發(fā)專門的新型芯片。
「我們是一個人工智能平臺的公司凳鬓,在技術(shù)角度茁肠,我希望所有行業(yè)都可以用我的產(chǎn)品。從商業(yè)角度缩举,我們希望在這兩年把一個大的市場吃下來垦梆,站住腳,再五年的階段能夠吃下來三個不同的市場仅孩⊥行桑」姚頌接著靦腆一笑,「我現(xiàn)在要多聽取批評辽慕,少年得志容易驕傲京腥,還是要多打壓一下〗︱龋」
他帶著半框眼鏡公浪,穿著深灰色連帽衫,看起來像剛從實驗室走出來船侧,接著又要去圖書館的學生欠气。
正如現(xiàn)在的AI行業(yè)一樣,一切才剛剛開始镜撩。