從CPU、GPU到TPU

我們知道器一,任何一臺(tái)計(jì)算機(jī)课锌,也包括智能手機(jī),游戲機(jī)等有計(jì)算能力的設(shè)備,都有一個(gè)計(jì)算的核心芯片渺贤,叫做CPU(Central Processing Unit)雏胃,即中央處理器,它負(fù)責(zé)所有的計(jì)算志鞍,并且控制計(jì)算機(jī)的全部工作瞭亮。

CPU的性能從上個(gè)世紀(jì)60年代中期開(kāi)始,幾乎按照每18個(gè)月翻一番的速度在進(jìn)步固棚,從1965年至今统翩,差不多翻了34次了,也就是說(shuō)計(jì)算速度提高了160億倍此洲。如果再把這個(gè)進(jìn)步分解一下厂汗,又可以分成兩個(gè)維度,一個(gè)是主頻的提高呜师,另一個(gè)是集成電路芯片密度(稱為集成度)的提高面徽。

主頻提高后,本來(lái)一秒鐘算10萬(wàn)個(gè)周期匣掸,現(xiàn)在可以算30億個(gè)趟紊,增加了幾萬(wàn)倍。密度提高后碰酝,本來(lái)幾個(gè)周期完成一次計(jì)算任務(wù)霎匈,現(xiàn)在可以流水作業(yè)、分工合作送爸,一個(gè)周期完成好幾次計(jì)算铛嘱。兩者的加速是疊加的,使得今天計(jì)算機(jī)的速度變得飛快袭厂。

但是墨吓,CPU的主頻不可能無(wú)限制提高,因?yàn)楣馑偈且粋€(gè)絕對(duì)的瓶頸纹磺,今天計(jì)算機(jī)CPU內(nèi)部帖烘,電子運(yùn)動(dòng)的速度已經(jīng)接近光速所給的極限了,幾乎沒(méi)有了再提高的可能性橄杨,事實(shí)上從10年前開(kāi)始秘症,這條路就走不通了。

那么怎么辦呢式矫?英特爾公司的辦法是乡摹,將計(jì)算機(jī)CPU的集成度進(jìn)一步提高,最早一個(gè)集成電路中只有幾千個(gè)晶體管采转,今天最多的有60億個(gè)聪廉,這樣計(jì)算可以并行開(kāi)展,這也是為什么我們計(jì)算機(jī)和手機(jī)CPU有什么四核、八核之說(shuō)板熊。

那么接下來(lái)框全,為什么不能做成16核、32核甚至100核呢邻邮?因?yàn)橐越裉斓墓に嚳⒖觯龅侥敲炊嗪颂幚砥鞯捏w積要大得不得了克婶,光是散熱問(wèn)題就沒(méi)法解決筒严。面對(duì)這個(gè)問(wèn)題怎么辦呢?英特爾總的態(tài)度是情萤,沒(méi)法解決鸭蛙,你們多買我一些處理器,多建造一些服務(wù)器筋岛,再把計(jì)算中心修得大一點(diǎn)就好了娶视。且不說(shuō)這個(gè)法子靈不靈,在很多場(chǎng)合也沒(méi)有條件這么做睁宰,比如在無(wú)人駕駛汽車中肪获,總不能扛著一個(gè)機(jī)柜上路吧。

我們知道柒傻,有主動(dòng)性的人孝赫,總是想方設(shè)法尋找更好的解決方法。英偉達(dá)的創(chuàng)始人黃仁勛就是這樣的人红符。黃仁勛和他在英偉達(dá)的同事就想青柄,CPU的計(jì)算速度之所以不夠快,是因?yàn)樗辉O(shè)計(jì)成能夠適應(yīng)所有的計(jì)算了预侯,里面很多晶體管都用來(lái)搭建控制電路了致开。

另外,因?yàn)橛?jì)算太復(fù)雜萎馅,因此處理器本身設(shè)計(jì)得太復(fù)雜双戳。而在計(jì)算機(jī)里面,有一種計(jì)算相對(duì)單一糜芳,就是控制顯示器的圖形計(jì)算拣技,于是英偉達(dá)就為這一類計(jì)算專門設(shè)計(jì)了一種處理器,叫做GPU耍目,即圖形處理器膏斤。

當(dāng)然,在英偉達(dá)之前邪驮,做圖形工作站的太陽(yáng)公司和SGI公司也設(shè)計(jì)出類似的產(chǎn)品莫辨,但是不通用。GPU比CPU的好處有兩個(gè):

第一,控制電路簡(jiǎn)單了沮榜,因此更多的晶體管用于了計(jì)算盘榨,而不是控制,這樣本來(lái)10億個(gè)晶體管可以搭建四個(gè)內(nèi)核蟆融,還有希望搭建八個(gè)草巡、十六個(gè)甚至更多。

第二型酥,將單個(gè)兒?jiǎn)蝹€(gè)兒的計(jì)算山憨,變成一批一批的計(jì)算。在現(xiàn)實(shí)生活中弥喉,大部分的計(jì)算每次都是在兩個(gè)數(shù)之間進(jìn)行的郁竟,比如A+B=C,它是一個(gè)運(yùn)算指令(“+”)帶上兩個(gè)數(shù)字(“A”和“B”)由境,下一次做X-Y棚亩,是另一個(gè)運(yùn)算指令(“-”)帶上另外兩個(gè)數(shù)字(“X”和“Y”)。因此計(jì)算機(jī)處理器實(shí)際上是按照一個(gè)指令通道(流)對(duì)應(yīng)一個(gè)數(shù)據(jù)通道設(shè)計(jì)的(被稱為SISD)虏杰。打個(gè)不很恰當(dāng)?shù)谋确郊ン。话愕挠?jì)算就如同你蹲在地上一個(gè)個(gè)地?fù)於棺印?/p>

而圖形計(jì)算是整個(gè)一條線(在計(jì)算機(jī)科學(xué)里被稱為向量)按照同一種操作一口氣算完,比如A1+B1=C1纺阔,A2+B2=C2瘸彤,……,最后A1000+B1000=C1000州弟,對(duì)于這些計(jì)算來(lái)講钧栖,指令都是一樣的,只是使用不同的數(shù)據(jù)而已婆翔,因此它可以設(shè)計(jì)出非常多的功能簡(jiǎn)單的計(jì)算核心拯杠,然后對(duì)一條指令開(kāi)發(fā)很多數(shù)據(jù)通道(即所謂的SIMD)即可。

這就相當(dāng)于用一個(gè)吸塵器在地上吸豆子啃奴,你走過(guò)一條線潭陪,就吸起一大堆,效率就高多了最蕾。對(duì)此依溯,英偉達(dá)提出一種所謂的“統(tǒng)一計(jì)算架構(gòu)”(CUDA)的概念,就是很多很多核都做同一件事情瘟则,并且在此基礎(chǔ)上設(shè)計(jì)出圖形處理器GPU黎炉。

有了GPU,很多重復(fù)一致的計(jì)算就可以并行了醋拧。GPU最早是針對(duì)圖形計(jì)算設(shè)計(jì)的慷嗜,但是后來(lái)英偉達(dá)發(fā)現(xiàn)機(jī)器學(xué)習(xí)的算法也可以用這種方式實(shí)現(xiàn)淀弹,于是到了2016年,英偉達(dá)又針對(duì)機(jī)器學(xué)習(xí)的特點(diǎn)庆械,設(shè)計(jì)了針對(duì)機(jī)器學(xué)習(xí)的GPU薇溃,它最新的P40處理器內(nèi)部有多達(dá)3000個(gè)所謂“統(tǒng)一計(jì)算架構(gòu)”的內(nèi)核。

雖然每一個(gè)能力都比不上英特爾四核處理器中的一個(gè)內(nèi)核缭乘,但是P40等GPU的內(nèi)核數(shù)量非常多沐序,因此做人工智能計(jì)算就非常快堕绩。今天特斯拉搞的輔助駕駛策幼,一片這樣的處理器就能解決所有的問(wèn)題。在去年對(duì)陣?yán)钍朗腁lphaGo中逛尚,就是用了176個(gè)英偉達(dá)的GPU垄惧,承擔(dān)了主要的計(jì)算功能刁愿。

但是畢竟機(jī)器學(xué)習(xí)中的向量計(jì)算和通用的向量計(jì)算還是有所不同绰寞,能否讓計(jì)算的內(nèi)核功能再專一一點(diǎn),只做和一種非常特定的機(jī)器學(xué)習(xí)算法(即Google的人工神經(jīng)網(wǎng)絡(luò)算法)相關(guān)的向量計(jì)算呢铣口?

于是滤钱,Google提出了一種張量(Tensor)計(jì)算的概念。所謂張量脑题,它原本是一個(gè)數(shù)學(xué)概念件缸,表示各種向量或者數(shù)值之間的關(guān)系。比如你的兩張照片是兩個(gè)不同的向量叔遂,它們之間的一些相似性就是一個(gè)張量他炊。人工神經(jīng)網(wǎng)絡(luò)的算法可以看成是張量的計(jì)算,至于為什么已艰,大家不必細(xì)究痊末,記住這個(gè)結(jié)論就可以了。

接下來(lái)哩掺,Google就在英偉達(dá)等公司GPU的基礎(chǔ)上凿叠,進(jìn)一步讓計(jì)算變得專注,設(shè)計(jì)了一種僅僅針對(duì)特定張量計(jì)算的處理器嚼吞,叫做TPU盒件,其中T就代表張量(Tensor)。Google宣稱舱禽,一個(gè)TPU對(duì)AlphaGo這樣的任務(wù)炒刁,效率抵得上15-30個(gè)英偉達(dá)的GPU,這也就是為什么這一次Google講新版的AlphaGo在硬件上瘦身了的原因誊稚。

去年戰(zhàn)勝李世石的AlphaGo的耗電量是人腦的300倍翔始,如今的AlphaGo用的機(jī)器少了很多飒筑,至少少了一個(gè)數(shù)量級(jí),也就是說(shuō)耗電量從人腦的300倍下降到30倍以下绽昏,這個(gè)進(jìn)步速度還是很驚人的协屡。

當(dāng)然,英偉達(dá)表示不服氣全谤,說(shuō)你Google是在拿蘋果和橘子比肤晓,而用我的測(cè)試處理器性能的程序來(lái)評(píng)測(cè),我的P40可比你的TPU快多了认然。其實(shí)TPU和GPU誰(shuí)更好补憾,完全要看做什么事情了。

從CPU到GPU卷员,再到TPU盈匾,效率提升的根本原因在于兩個(gè)字——專注,相比之下毕骡,我們手機(jī)和電腦的CPU是非诚鞫“不專注”的。

在社會(huì)生活中未巫,情況和計(jì)算機(jī)處理器其實(shí)很相似窿撬。工業(yè)革命開(kāi)始后,英國(guó)工廠主把分工做得特別細(xì)叙凡,于是效率大增劈伴。亞當(dāng)·斯密在《國(guó)富論》中講,即使是制作縫衣服針這件事握爷,當(dāng)分工很細(xì)致后跛璧,一個(gè)工人一天能生產(chǎn)上千根,如果一個(gè)工人做所有的工序新啼,一天恐怕連10根都做不了追城。因此,英國(guó)工業(yè)革命后师抄,就把整個(gè)歐洲的加工業(yè)碾壓了漓柑。這其實(shí)就好比TPU和CPU的關(guān)系。

但是叨吮,TPU的使用有一個(gè)前提辆布,就是這種芯片的市場(chǎng)至少要有上百萬(wàn)片,否則就不值得做茶鉴,因?yàn)樗鲆粋€(gè)樣片的成本就得上百萬(wàn)美元锋玲,而設(shè)計(jì)成本則是上千萬(wàn)。如果市場(chǎng)需求量只有幾萬(wàn)片涵叮,還不如用很多CPU來(lái)工作呢惭蹂。這就如同制作縫衣服針伞插,一年僅歐洲恐怕要用到上億根,才值得做社會(huì)分工盾碗。如果只用三五十根媚污,還不如讓幾個(gè)工人慢慢磨呢!因此廷雅,分工和專注的前提都是市場(chǎng)規(guī)模足夠大耗美。

最后講一下人的技能,什么時(shí)候需要專而精航缀,什么時(shí)候需要廣博商架,其實(shí)沒(méi)有一定之規(guī),但是一個(gè)很好的判斷標(biāo)準(zhǔn)就是市場(chǎng)是否大到需要非常專而精芥玉。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末蛇摸,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子灿巧,更是在濱河造成了極大的恐慌赶袄,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,490評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件砸烦,死亡現(xiàn)場(chǎng)離奇詭異弃鸦,居然都是意外死亡绞吁,警方通過(guò)查閱死者的電腦和手機(jī)幢痘,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)家破,“玉大人颜说,你說(shuō)我怎么就攤上這事√” “怎么了门粪?”我有些...
    開(kāi)封第一講書人閱讀 165,830評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)烹困。 經(jīng)常有香客問(wèn)我玄妈,道長(zhǎng),這世上最難降的妖魔是什么髓梅? 我笑而不...
    開(kāi)封第一講書人閱讀 58,957評(píng)論 1 295
  • 正文 為了忘掉前任拟蜻,我火速辦了婚禮,結(jié)果婚禮上枯饿,老公的妹妹穿的比我還像新娘酝锅。我一直安慰自己,他們只是感情好奢方,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,974評(píng)論 6 393
  • 文/花漫 我一把揭開(kāi)白布搔扁。 她就那樣靜靜地躺著爸舒,像睡著了一般。 火紅的嫁衣襯著肌膚如雪稿蹲。 梳的紋絲不亂的頭發(fā)上扭勉,一...
    開(kāi)封第一講書人閱讀 51,754評(píng)論 1 307
  • 那天,我揣著相機(jī)與錄音苛聘,去河邊找鬼剖效。 笑死,一個(gè)胖子當(dāng)著我的面吹牛焰盗,可吹牛的內(nèi)容都是我干的璧尸。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼熬拒,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼爷光!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起澎粟,我...
    開(kāi)封第一講書人閱讀 39,357評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤蛀序,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后活烙,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體徐裸,經(jīng)...
    沈念sama閱讀 45,847評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,995評(píng)論 3 338
  • 正文 我和宋清朗相戀三年啸盏,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了重贺。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,137評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡回懦,死狀恐怖气笙,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情怯晕,我是刑警寧澤潜圃,帶...
    沈念sama閱讀 35,819評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站舟茶,受9級(jí)特大地震影響谭期,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜吧凉,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,482評(píng)論 3 331
  • 文/蒙蒙 一隧出、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧客燕,春花似錦鸳劳、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 32,023評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)涵紊。三九已至,卻和暖如春幔摸,著一層夾襖步出監(jiān)牢的瞬間峻呕,已是汗流浹背秀姐。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 33,149評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工脯厨, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留邑雅,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,409評(píng)論 3 373
  • 正文 我出身青樓患雇,卻偏偏與公主長(zhǎng)得像跃脊,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子苛吱,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,086評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 鄭文盼 16020150021 【嵌牛導(dǎo)讀】指數(shù)增長(zhǎng)的數(shù)據(jù)量和逐漸陷入瓶頸的芯片性能酪术,二者的不匹配會(huì)帶來(lái)芯片架...
    吹不散的煙火閱讀 2,267評(píng)論 0 3
  • 上個(gè)月底绘雁,阿爾法狗的升級(jí)版 Master毫無(wú)懸念的贏了我們的柯潔,他下出來(lái)的棋被業(yè)內(nèi)贊為神一樣的存在援所,在為柯潔惋惜...
    PM小A閱讀 1,141評(píng)論 2 7
  • 網(wǎng)絡(luò)請(qǐng)求是android客戶端很重要的部分庐舟。下面從入門級(jí)開(kāi)始介紹下自己Android網(wǎng)絡(luò)請(qǐng)求的實(shí)踐歷程。希望能給剛...
    passiontim閱讀 1,389評(píng)論 0 17
  • 命運(yùn)已經(jīng)多舛住拭,孩子們又何必慌張挪略,急著成長(zhǎng),看看飄零的人兒废酷,見(jiàn)到的滿是無(wú)奈的張望瘟檩。 人生很長(zhǎng),總會(huì)要經(jīng)歷幾十年的時(shí)光...
    隱于世間浮華閱讀 197評(píng)論 2 2
  • “意婷澈蟆,這周末同學(xué)會(huì)別忘了呀!你再放我鴿子卓研,我跟你沒(méi)完趴俘!” “安啦!小雅我會(huì)如期赴約的奏赘!”莫意婷無(wú)奈道...
    倚風(fēng)聽(tīng)雪閱讀 131評(píng)論 0 1