神經(jīng)網(wǎng)絡(luò)急需專用處理器

最近AlphaGo的勝利引起很大反響鸠珠,大眾對于AI的關(guān)注一下子熱火了起來∥『模現(xiàn)在的人工智能領(lǐng)域,神經(jīng)網(wǎng)絡(luò)已經(jīng)是一個(gè)相對比較成熟的領(lǐng)域渐排,深度學(xué)習(xí)目前不僅僅依靠神經(jīng)網(wǎng)絡(luò)炬太,但是它本身仍然是一個(gè)基礎(chǔ)的、不可避免的底層組成部分驯耻,而且也是整個(gè)體系里面消耗計(jì)算量的大頭亲族。制作專用處理器看來已經(jīng)成為一種剛需。

神經(jīng)網(wǎng)絡(luò)的專用機(jī)可缚?聽起來不妙霎迫。

在當(dāng)初日本為了趕超美國開發(fā)“第五代計(jì)算機(jī)”的時(shí)候,出現(xiàn)了很多推理(lisp帘靡、prolog)專用機(jī)知给,但是最后都落得了一個(gè)黯然收場的結(jié)果。主要是專用機(jī)很難利用現(xiàn)有的技術(shù)積累描姚,一旦理論領(lǐng)域發(fā)生極小的變化涩赢,由于沒有動機(jī)在商業(yè)上得到持續(xù)的優(yōu)化投入,于是最后只會在價(jià)格和速度上雙雙落敗轩勘,成為雞肋筒扒。

但是現(xiàn)在神經(jīng)網(wǎng)絡(luò)的計(jì)算量問題基本上可以比較確信的成為一個(gè)必須突破的瓶頸,和相對成熟穩(wěn)定的應(yīng)用前景赃阀。神經(jīng)網(wǎng)絡(luò)有訓(xùn)練和應(yīng)用兩塊霎肯,訓(xùn)練的部分要比應(yīng)用略微復(fù)雜一點(diǎn)擎颖。但是兩者都是簡單的乘法和加法的疊加,從而是一個(gè)原理相對簡單观游、相對比較容易設(shè)計(jì)搂捧、兼容和可替代性、可升級性比較簡單的應(yīng)用懂缕,制作專用處理器完全可以一步一步來允跑。

舉例來說,中科院現(xiàn)在已經(jīng)有人研制出有專用指令的處理器

可以把神經(jīng)網(wǎng)絡(luò)推理部分的“乘以系數(shù)疊加然后判斷是否超過閾值”的多個(gè)指令搪柑,做成一個(gè)指令聋丝,從而把一百多個(gè)cpu指令簡化成一個(gè),從而加速運(yùn)算工碾。

但是熟悉cpu設(shè)計(jì)的人可能會指出弱睦,現(xiàn)代cpu已經(jīng)作了高度優(yōu)化,這種把多個(gè)指令打包成一個(gè)指令的做法渊额,除了保證了計(jì)算路徑的無關(guān)度况木、深挖了cpu計(jì)算單元的并行效率外,增加的速度其實(shí)非常有限旬迹。但是鑒于現(xiàn)代cpu往往有很多核每個(gè)核有多個(gè)計(jì)算單元火惊,而缺省并行效率并不好,這種做法在不大幅度改變現(xiàn)有計(jì)算體系的情況下奔垦,能夠輕松得到幾倍的冗余效率提升屹耐,不失為一種物廉價(jià)美的應(yīng)急方案,但比起另一個(gè)類似方案而言并不算好椿猎。

神經(jīng)網(wǎng)絡(luò)計(jì)算的特點(diǎn)是數(shù)據(jù)量大惶岭,單位數(shù)據(jù)的計(jì)算次數(shù)卻并不大,并行性好鸵贬,這些都和圖像計(jì)算非常類似俗他,屬于計(jì)算強(qiáng)度不如IO強(qiáng)度重要的范圍,于是使用GPU進(jìn)行神經(jīng)網(wǎng)絡(luò)計(jì)算就成了一個(gè)很好的選擇阔逼。這次使用的阿法狗軟件除了cpu外兆衅,也使用了大量的GPU。但是我們要看到嗜浮,通用的GPU使用的計(jì)算單元數(shù)目多羡亩,獨(dú)立性強(qiáng),相對CPU而言流程并行優(yōu)化度沒那么高危融,從而專用指令相對原生指令的優(yōu)化提升更大畏铆,從而引入專用指令的“提速、降能耗”程度也就更高吉殃。我想隨著神經(jīng)網(wǎng)絡(luò)的流行辞居,在GPU里面加入“多個(gè)數(shù)同時(shí)相乘楷怒、大小判斷、相加”一氣呵成的專用指令瓦灶,想必和“三個(gè)數(shù)平方和的平方根倒數(shù)”指令一樣會成為非常自然的流行選擇鸠删。

除了GPU專用指令外,是否還能有更加激進(jìn)的專用神經(jīng)網(wǎng)絡(luò)計(jì)算體系設(shè)計(jì)呢贼陶?

我們可以看到刃泡,到了后來,神經(jīng)網(wǎng)絡(luò)最大的瓶頸是數(shù)據(jù)帶寬而不是計(jì)算能力碉怔。在視覺識別烘贴、聲音識別等領(lǐng)域,訓(xùn)練數(shù)據(jù)并不大而且可以固化在硬件中撮胧,而大部分計(jì)算數(shù)據(jù)是不需要存儲的桨踪,只要有最后一個(gè)“是或者否”的結(jié)果即可,因此神經(jīng)網(wǎng)絡(luò)計(jì)算完全可以用“輸入流”-DSP-“輸出流”的方法工作趴樱,使用大規(guī)模多級DSP串聯(lián)的方法即可對數(shù)據(jù)進(jìn)行即時(shí)處理馒闷,從而進(jìn)一步簡化設(shè)計(jì)酪捡、提高并行性叁征,降低計(jì)算時(shí)間和能耗。但是這種方法過于簡單逛薇,顯然是無法在圍棋這種更復(fù)雜的神經(jīng)網(wǎng)絡(luò)計(jì)算中應(yīng)用的捺疼。

那么能否更更更激進(jìn)一點(diǎn)呢?

現(xiàn)代計(jì)算體系永罚,很多人認(rèn)為優(yōu)點(diǎn)在于“CPU的通用化”以及程序存儲在內(nèi)存里面啤呼,從而極大的提高了靈活性和降低設(shè)計(jì)難度。但是這個(gè)優(yōu)點(diǎn)的隱含意義呢袱,其實(shí)是在于存儲設(shè)備的廉價(jià)和快速上」倏郏現(xiàn)代的很多大數(shù)據(jù)處理,其實(shí)對于數(shù)據(jù)的加工超級簡單羞福,無非就是“查找有沒有某個(gè)字符串”“一串?dāng)?shù)字中過濾出大于某個(gè)值的數(shù)據(jù)”“按權(quán)重求總和”“從一塊內(nèi)存集體拷貝到另外一個(gè)內(nèi)存”這幾個(gè)需求惕蹄。一個(gè)數(shù)據(jù)庫軟件,把大量數(shù)據(jù)運(yùn)輸?shù)絚pu治专,處理后又送回存儲器卖陵,其實(shí)想想這些需求根本無需由cpu或者gpu處理,為什么不直接在存儲器端就做出來呢张峰?

有人會說泪蔫,這樣不是把存儲器端做復(fù)雜了嗎?我們的cpu再復(fù)雜喘批,也無非是幾億個(gè)CMOS管撩荣,相當(dāng)于幾兆內(nèi)存所用的晶體管數(shù)目而已铣揉,你這樣搞相當(dāng)于把存儲器復(fù)雜度翻幾番,假設(shè)用到的新型存儲器有幾G餐曹,等于是多做了幾千個(gè)cpu老速。這怎么可能劃算呢?
或者說你這個(gè)方案不就等于每個(gè)內(nèi)存都是一個(gè)小型單片機(jī)凸主,這樣并沒有什么新鮮內(nèi)容橘券?

我認(rèn)為

  1. 新型內(nèi)置計(jì)算功能內(nèi)存的復(fù)雜度沒有cpu那么高,獨(dú)立性強(qiáng)卿吐,做壞了某個(gè)區(qū)域標(biāo)記為壞塊即可旁舰,不像cpu或者單片機(jī)那么嚴(yán)格,成品率高得多嗡官,制備價(jià)格并不會提高太多箭窜。而且所有內(nèi)存提價(jià)幾倍,也不過和一塊cpu的提價(jià)相當(dāng)衍腥。
    對于數(shù)據(jù)庫處理磺樱、神經(jīng)網(wǎng)絡(luò)這種應(yīng)用,相同計(jì)算量前提下利用智能內(nèi)存可以極大減小CPU體系婆咸、多處理器體系竹捉、并行處理的復(fù)雜度和IO瓶頸,減少需要的CPU數(shù)量尚骄,等于就是降低了處理器的總價(jià)格佑吝。

  2. 計(jì)算價(jià)格的主要費(fèi)用現(xiàn)在越來越從cpu的價(jià)格蜡饵,轉(zhuǎn)變?yōu)殡娰M(fèi)了。減少IO就大幅度減少計(jì)算能耗了,長期節(jié)能看比硬件價(jià)格更省錢开仰。

  3. cpu提高并行度是有IO瓶頸的丧裁,而且很快就會達(dá)到讼撒。這個(gè)方法可以極大減少IO交換再菊。

  4. 專用方案的最大問題并不在于價(jià)格,而是在通用性宏邮。隨著數(shù)據(jù)庫需求分解的穩(wěn)定泽示,和神經(jīng)網(wǎng)絡(luò)計(jì)算需求的穩(wěn)定,保證了通用性蜀铲,那么就有做出來的可能

仿生學(xué)的角度

從仿生學(xué)的角度來看边琉,人類的神經(jīng)元細(xì)胞,是使用電流脈沖來實(shí)現(xiàn)半數(shù)字半模擬信號的神經(jīng)網(wǎng)絡(luò)的记劝。從這個(gè)角度來說变姨,如果使用憶阻器,也就是可以隨外加電流而改變電阻的元器件厌丑,把整個(gè)神經(jīng)網(wǎng)絡(luò)做成基于電流脈沖的半數(shù)字運(yùn)算形式定欧,那么使用十多個(gè)晶體管完成一個(gè)神經(jīng)網(wǎng)絡(luò)計(jì)算單元代替幾千個(gè)晶體管的計(jì)算單元渔呵,最后把存儲和計(jì)算完全一體化,并不是難以實(shí)現(xiàn)的事情砍鸠。當(dāng)然扩氢,一旦要用到半模擬電路,在相同計(jì)算頻率的前提下爷辱,隨著計(jì)算能力提升耗電量相比數(shù)字電路就直線上升了录豺,這點(diǎn)簡化并不一定劃算。

不過考慮到人腦的耗電量大大小于阿法狗饭弓,在保證相同計(jì)算量的前提下双饥,使用頻率只有數(shù)字電路千分之一的脈沖半數(shù)字半模擬電路,這就完全值得考慮了弟断。當(dāng)然咏花,這個(gè)時(shí)候,真正的問題反而在于如何編程了阀趴。這樣的體系昏翰,由于存儲和計(jì)算合一,在編程上會變成全新的系統(tǒng)刘急,可能要在理論上進(jìn)行進(jìn)一步突破才有可能棚菊。

后記

我本人是贊同技術(shù)進(jìn)步的。但是對于神經(jīng)網(wǎng)絡(luò)排霉,我卻并不希望在應(yīng)用上做過了頭窍株。畢竟,神經(jīng)網(wǎng)絡(luò)往往“知其然而不知其所以然”攻柠,理論上我們是無法保證其算法是魯棒性好、在未知環(huán)境穩(wěn)定發(fā)揮的后裸,而我們的生活永遠(yuǎn)充滿著例外瑰钮。

日常的神經(jīng)網(wǎng)絡(luò)應(yīng)用,大家可以試用一下waifu2x這個(gè)軟件微驶。它的降噪和放大圖片功能都非常強(qiáng)浪谴。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市因苹,隨后出現(xiàn)的幾起案子苟耻,更是在濱河造成了極大的恐慌,老刑警劉巖扶檐,帶你破解...
    沈念sama閱讀 207,248評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件凶杖,死亡現(xiàn)場離奇詭異,居然都是意外死亡款筑,警方通過查閱死者的電腦和手機(jī)智蝠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,681評論 2 381
  • 文/潘曉璐 我一進(jìn)店門腾么,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人杈湾,你說我怎么就攤上這事解虱。” “怎么了漆撞?”我有些...
    開封第一講書人閱讀 153,443評論 0 344
  • 文/不壞的土叔 我叫張陵殴泰,是天一觀的道長。 經(jīng)常有香客問我浮驳,道長艰匙,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,475評論 1 279
  • 正文 為了忘掉前任抹恳,我火速辦了婚禮员凝,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘奋献。我一直安慰自己健霹,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,458評論 5 374
  • 文/花漫 我一把揭開白布瓶蚂。 她就那樣靜靜地躺著糖埋,像睡著了一般。 火紅的嫁衣襯著肌膚如雪窃这。 梳的紋絲不亂的頭發(fā)上瞳别,一...
    開封第一講書人閱讀 49,185評論 1 284
  • 那天,我揣著相機(jī)與錄音杭攻,去河邊找鬼祟敛。 笑死,一個(gè)胖子當(dāng)著我的面吹牛兆解,可吹牛的內(nèi)容都是我干的馆铁。 我是一名探鬼主播,決...
    沈念sama閱讀 38,451評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼锅睛,長吁一口氣:“原來是場噩夢啊……” “哼埠巨!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起现拒,我...
    開封第一講書人閱讀 37,112評論 0 261
  • 序言:老撾萬榮一對情侶失蹤辣垒,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后印蔬,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體勋桶,經(jīng)...
    沈念sama閱讀 43,609評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,083評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了哥遮。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片岂丘。...
    茶點(diǎn)故事閱讀 38,163評論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖眠饮,靈堂內(nèi)的尸體忽然破棺而出奥帘,到底是詐尸還是另有隱情,我是刑警寧澤仪召,帶...
    沈念sama閱讀 33,803評論 4 323
  • 正文 年R本政府宣布寨蹋,位于F島的核電站,受9級特大地震影響扔茅,放射性物質(zhì)發(fā)生泄漏已旧。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,357評論 3 307
  • 文/蒙蒙 一召娜、第九天 我趴在偏房一處隱蔽的房頂上張望运褪。 院中可真熱鬧,春花似錦玖瘸、人聲如沸秸讹。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,357評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽璃诀。三九已至,卻和暖如春蔑匣,著一層夾襖步出監(jiān)牢的瞬間劣欢,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,590評論 1 261
  • 我被黑心中介騙來泰國打工裁良, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留凿将,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,636評論 2 355
  • 正文 我出身青樓趴久,卻偏偏與公主長得像丸相,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子彼棍,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,925評論 2 344

推薦閱讀更多精彩內(nèi)容

  • 在情人節(jié)后的一天,我陪小伙伴踏進(jìn)了午夜場的電影院觀看這部提名無數(shù)的《愛樂之城》膳算∽叮看完過后,我倆都是唏噓不已涕蜂,因?yàn)閷?shí)...
    維枷閱讀 510評論 0 2
  • 剛讀了第一部华匾,看看怎么回事就得了,總體寫得還可以,千年的局會不會有點(diǎn)牽強(qiáng)蜘拉,人物性格有點(diǎn)琢磨不透萨西。文筆沒感覺怎么驚艷...
    EAST叁日閱讀 206評論 0 0
  • 這是第一次寫影評,自己作為電影的渣渣一般不敢造次旭旭,但是看完這個(gè)確實(shí)讓我忍不住要寫一下自己的感受谎脯。 不再分析故事梗概...
    子震閱讀 1,113評論 0 7
  • 現(xiàn)在很多小伙伴使用的電腦是WIN10系統(tǒng),win10使用過程中有時(shí)候會出現(xiàn)電腦很卡持寄,但是電腦內(nèi)存源梭,CPU使用率很正...
    牧鋒閱讀 1,594評論 0 2