Tang, J., Yuan, F., Shen, X., Wang, Z., Rao, M., He, Y., Li, X., Zhang, W., Li, Y., Gao, B., Qian, H., Bi, G., Song, S., Yang, J., Wu, H. (2019).?Bridging Biological and Artificial Neural Networks with Emerging Neuromorphic Devices: Fundamentals, Progress, and Challenges. Advanced Materials, 1902761.?
4.可塑性
第四節(jié)討論了神經(jīng)科學(xué)和大腦啟發(fā)式計(jì)算的關(guān)鍵概念:可塑性龙致。概述了突觸可塑性掐禁,非突觸可塑性,超可塑性浴鸿,突觸整合,災(zāi)難性遺忘蔬顾,以及其電子實(shí)現(xiàn)(如果有)郊供。
生物系統(tǒng)中的神經(jīng)可塑性是指神經(jīng)元或突觸改變其特性的能力,通常依賴于神經(jīng)活動(dòng)瞎惫,并被認(rèn)為是大腦學(xué)習(xí)和記憶功能的基礎(chǔ)。在人工計(jì)算中译株,可塑性通常由器件電導(dǎo)的變化來表示瓜喇。
4.1 .突觸和非突觸可塑性
突觸可塑性是突觸性質(zhì)改變的能力,最常見的是增強(qiáng)或減弱突觸強(qiáng)度歉糜。它是神經(jīng)可塑性研究最深入的形式乘寒,被認(rèn)為是生物學(xué)學(xué)習(xí)和記憶中神經(jīng)可塑性最突出的形式。
此處說明了三種機(jī)制:i)EPSP擴(kuò)增:可以通過調(diào)節(jié)樹突離子通道來增強(qiáng)興奮性突觸后電位踊兜。 這類似于增加的突觸重量竿滨。 ii)降低峰值閾值:可以通過調(diào)節(jié)軸突初始段上的電壓門控通道來降低觸發(fā)動(dòng)作電位的電壓閾值,因此神經(jīng)元更易于發(fā)射捏境。 iii)靜息電位去極化:通過調(diào)節(jié)電壓門控通道可以提高膜靜息電位于游,這也使尖峰閾值更容易達(dá)到。
短期突觸可塑性(STSP)持續(xù)幾分鐘或更短垫言。STSP對(duì)突觸效能(突觸前輸入影響突觸后輸出的能力)的影響可以是增強(qiáng)或抑制贰剥。STSP讓不同的突觸充當(dāng)信息傳輸?shù)牡屯ā⒏咄ɑ驇V波器筷频。STSP在電子突觸中已被實(shí)現(xiàn)鸠澈。
長期突觸可塑性(LTSP)可以持續(xù)數(shù)小時(shí)或更長時(shí)間。持續(xù)增加的突觸強(qiáng)度稱為長時(shí)程增強(qiáng)(LTP)截驮,突觸強(qiáng)度的持續(xù)下降被稱為長時(shí)程抑制(LTD)〖识龋基本上模仿LTSP的大多數(shù)方案都是基于設(shè)備的非易失性開關(guān)特性葵袭。
連線可塑性是指可以在神經(jīng)單元之間完全形成或消除連接(圖8c)。計(jì)算模型中的結(jié)構(gòu)學(xué)習(xí)類似于連接大腦中的可塑性乖菱。連線可塑性不是突觸可塑性的延伸坡锡。連線可塑性擴(kuò)展了大腦編碼信息的能力蓬网,并被認(rèn)為與多種學(xué)習(xí)形式相關(guān)(知覺學(xué)習(xí)、運(yùn)動(dòng)學(xué)習(xí)鹉勒、空間學(xué)習(xí)等)帆锋。僅在計(jì)算算法中得到了廣泛應(yīng)用。
內(nèi)在可塑性涉及通過調(diào)節(jié)電壓依賴性離子通道來改變神經(jīng)元興奮性禽额,并且可以被視為神經(jīng)元輸入輸出功能的變化锯厢。內(nèi)在可塑性是雙向的。研究發(fā)現(xiàn)內(nèi)在可塑性與LTP或LTD具有協(xié)同作用脯倒,并表現(xiàn)出穩(wěn)態(tài)特性实辑。從行為的角度來看,調(diào)節(jié)電子設(shè)備的閾值似乎是模仿神經(jīng)元興奮性調(diào)節(jié)的一種可能方法藻丢。
4.2?超可塑性和突觸整合
突觸可塑性不僅取決于當(dāng)前的刺激剪撬,還取決于突觸狀態(tài)的歷史。此外悠反,突觸可塑性與記憶的形成和維持密切相關(guān)残黑。計(jì)算模型表明,通過快速和慢速級(jí)聯(lián)隱藏變量的復(fù)雜相互作用可以解決保持舊記憶和編碼新記憶的難題斋否。
超可塑性是指一種神經(jīng)元產(chǎn)生突觸可塑性的能力受到其活動(dòng)歷史的調(diào)節(jié)的現(xiàn)象梨水。它是“突觸可塑性的可塑性”。在突觸特異的可塑性中如叼,突觸的歷史活動(dòng)影響其自身的可塑性冰木。另一方面,突觸的可塑性也可能受到其鄰近突觸的歷史活動(dòng)的影響笼恰。Kim等人提出了一種二階憶阻器器件踊沸,表現(xiàn)出類似Ca2 +的動(dòng)力學(xué)特性,可編碼時(shí)序信息并調(diào)節(jié)突觸權(quán)重社证,還可以接受基于歷史的響應(yīng)逼龟,以呈現(xiàn)可塑性的調(diào)制,即極性和電導(dǎo)率變化率追葡。
突觸整合也稱為后期LTSP(L-LTSP)佑刷,突觸強(qiáng)度的變化在最初的誘導(dǎo)事件后數(shù)分鐘至數(shù)小時(shí)內(nèi)穩(wěn)定下來莉擒,是記憶整合的第一步。它關(guān)系到如何保持STSP和早期LTSP(E-LTSP)以轉(zhuǎn)移到LTSP瘫絮,或者由于被動(dòng)衰減涨冀,干擾或主動(dòng)抑制而被遺忘。重復(fù)演示可以極大地增強(qiáng)突觸的整合(圖9a)麦萤,尤其是分布式學(xué)習(xí)鹿鳖。突觸整合的標(biāo)準(zhǔn)模型表明,突觸蛋白合成的改變和膜電位的改變是通過激活細(xì)胞內(nèi)轉(zhuǎn)導(dǎo)級(jí)聯(lián)反應(yīng)實(shí)現(xiàn)的频鉴,從而導(dǎo)致基因轉(zhuǎn)錄和蛋白合成(圖9b)栓辜。解釋突觸整合過程的一種著名理論是突觸標(biāo)記和捕獲假設(shè)(圖9c)。由于某些憶阻器的雙重開關(guān)行為垛孔,可以獲得揮發(fā)性和非易失性電導(dǎo)狀態(tài)藕甩。兩種切換行為之間的過渡與此處的突觸整合非常相似。
突觸可塑性在多個(gè)時(shí)間尺度上起作用周荐,并受歷史狀態(tài)的影響狭莱。據(jù)此開發(fā)了級(jí)聯(lián)模型,該模型具有不同時(shí)間尺度和雙向連接的級(jí)聯(lián)變量來表示過程(圖9d)概作。最快的變量表示突觸權(quán)重腋妙,而較慢的變量表示突觸中信號(hào)傳導(dǎo),信號(hào)強(qiáng)度和調(diào)節(jié)分子的濃度讯榕。由于復(fù)雜的級(jí)聯(lián)變量骤素,該模型使突觸具有很大的編碼內(nèi)存容量。它可以在一個(gè)統(tǒng)一的框架中解釋超可塑性和記憶整合愚屁。研究人員已將此模型應(yīng)用于人工神經(jīng)網(wǎng)絡(luò)中的災(zāi)難性遺忘济竹。
5.學(xué)習(xí)和記憶的理論和原理
第五節(jié)介紹生物神經(jīng)系統(tǒng)中學(xué)習(xí)和記憶的經(jīng)典理論的機(jī)制、現(xiàn)象和相關(guān)的電子演示(如果有)霎槐。并討論了生物邏輯學(xué)習(xí)和人工仿真之間的差距送浊,試圖指出神經(jīng)系統(tǒng)中是否有一些重要的記憶和學(xué)習(xí)功能,但尚未用電子設(shè)備演示過丘跌。
5.1 .生物神經(jīng)系統(tǒng)的學(xué)習(xí)和記憶理論
生物學(xué)習(xí)和深度學(xué)習(xí)規(guī)則之間的主要區(qū)別是局部性和整體性袭景。理論研究一直在努力彌合這一差距,但成果甚少闭树。
赫布學(xué)習(xí)規(guī)則的簡單描述是,突觸效能的增加是由突觸前細(xì)胞對(duì)突觸后細(xì)胞的反復(fù)和持續(xù)激活(圖10a)鸵赫。該原理經(jīng)常被概括為“一起放電的神經(jīng)元連接在一起”衣屏。峰值速率相關(guān)的可塑性(SRDP):赫布規(guī)則的數(shù)學(xué)模型最初是根據(jù)平均發(fā)射速率來制定的射速指的是每單位時(shí)間的平均AP數(shù)。SRDP是電子領(lǐng)域而不是神經(jīng)科學(xué)領(lǐng)域用來描述這些規(guī)則的術(shù)語辩棒。它根據(jù)一定尖峰速率的尖峰列的仿真描述了憶阻器的電導(dǎo)變化(圖10b)狼忱。STDP規(guī)則指出,當(dāng)突觸前??活動(dòng)進(jìn)行到突觸后活動(dòng)時(shí)一睁,突觸的連接會(huì)增強(qiáng)钻弄。突觸前和突觸后活動(dòng)的時(shí)間順序相反時(shí),持續(xù)數(shù)十毫秒的時(shí)間會(huì)減弱(圖10c)者吁。對(duì)大腦和物種的不同區(qū)域進(jìn)行的許多研究都支持這種定時(shí)學(xué)習(xí)規(guī)則窘俺。
穩(wěn)態(tài)可塑性是一種穩(wěn)定特定平衡點(diǎn)周圍神經(jīng)元或神經(jīng)回路活動(dòng)的可塑性。與穩(wěn)態(tài)可塑性對(duì)應(yīng)的是赫布可塑性复凳。盡管LTP和LTD的作用方向相反瘤泪,但是僅靠赫布可塑性不能維持神經(jīng)回路的穩(wěn)態(tài),因?yàn)榻?jīng)歷LTP的突觸更有可能激活突觸后神經(jīng)元育八,從而比LTD進(jìn)行進(jìn)一步的LTP对途。因此,需要穩(wěn)態(tài)可塑性作為負(fù)反饋髓棋,以保持神經(jīng)回路的正常激活水平实檀。穩(wěn)態(tài)可塑性通常在幾天的時(shí)間尺度上起作用。已經(jīng)提出了幾種潛在的體內(nèi)穩(wěn)態(tài)可塑性機(jī)制(圖10d)按声。
記憶印記是大腦中特定的變化膳犹,由經(jīng)驗(yàn)形成并以靜止?fàn)顟B(tài)儲(chǔ)存,在適當(dāng)?shù)耐獠看碳ず蜅l件下可以被重新激活并發(fā)揮功能儒喊,從而導(dǎo)致記憶儲(chǔ)存的恢復(fù)镣奋。赫布提出,記憶是與神經(jīng)元群體一起儲(chǔ)存在大腦中的怀愧,這種群體被稱為赫布集合侨颈。利用突觸可塑性的赫布規(guī)則,通過加強(qiáng)由特定刺激激活的神經(jīng)元之間的聯(lián)系芯义,形成了赫布集合哈垢。印記的存在解釋了記憶的持久性。
在更長的時(shí)間尺度上扛拨,記憶也可以從神經(jīng)系統(tǒng)的一部分轉(zhuǎn)移到另一部分耘分。系統(tǒng)整合是一個(gè)緩慢動(dòng)態(tài)過程,突觸整合只需幾分鐘到幾小時(shí)。系統(tǒng)整合是記憶的空間轉(zhuǎn)移求泰,而突觸整合是時(shí)間轉(zhuǎn)移央渣。這種機(jī)制被深度思維借鑒,啟發(fā)了構(gòu)建人工智能系統(tǒng)方面的工作渴频。
5.2?生物神經(jīng)系統(tǒng)的記憶和學(xué)習(xí)原理
突觸競(jìng)爭(zhēng)是指突觸競(jìng)爭(zhēng)大腦中有限的資源芽丹。Miller等人提出了兩種類型的競(jìng)爭(zhēng)或規(guī)范化——?dú)w一化的乘法形式&歸一化的減法形式。STDP規(guī)則表現(xiàn)出與減法歸一化相似的屬性卜朗。在人工神經(jīng)網(wǎng)絡(luò)文獻(xiàn)中拔第,已證明諸如權(quán)重衰減,權(quán)重歸一化之類的方案對(duì)于加速網(wǎng)絡(luò)學(xué)習(xí)至關(guān)重要场钉。
中樞神經(jīng)系統(tǒng)的另一個(gè)突出特性是它看起來非常嘈雜蚊俺。大腦利用其收到的刺激對(duì)外界進(jìn)行建模(通常是不確定的)。在數(shù)學(xué)中逛万,有兩種進(jìn)行推理的方法:基于抽樣的推理和基于優(yōu)化的推理泳猬。 Markov Chain Monte Carlo是最著名的基于抽樣的推理之一。學(xué)習(xí)也可以被視為抽樣過程泣港。突觸抽樣可以幫助網(wǎng)絡(luò)達(dá)到全局最小值并更快地收斂暂殖。突觸抽樣理論可能是人類比計(jì)算機(jī)更好的學(xué)習(xí)能力的來源。
赫布學(xué)習(xí)指出当纱,突觸可塑性取決于突觸前和突觸后神經(jīng)元的放電速率呛每,因此該規(guī)則被認(rèn)為是局部的。神經(jīng)元系統(tǒng)中兩個(gè)神經(jīng)元之間的突觸強(qiáng)度可能會(huì)受到系統(tǒng)中其他參數(shù)的影響和控制坡氯。控制可塑性的三種主要途徑為:1)神經(jīng)調(diào)節(jié)劑是一類化學(xué)分子晨横,它結(jié)合樹突上的受體并調(diào)節(jié)神經(jīng)元的活性。神經(jīng)調(diào)節(jié)劑可以擴(kuò)散釋放并影響和控制一定體積內(nèi)的許多突觸箫柳。2)局部回路的可塑性可由抑制性中間神經(jīng)元控制手形。3)可塑性的控制也可以通過樹突計(jì)算來實(shí)現(xiàn)。這種機(jī)制可能會(huì)提供最好的可塑性控制悯恍。
6 展望
盡管人工神經(jīng)網(wǎng)絡(luò)受到了生物神經(jīng)系統(tǒng)的啟發(fā)库糠,但它們之間的差距仍然很大。下表簡要總結(jié)了生物和人工神經(jīng)系統(tǒng)的研究現(xiàn)狀涮毫。
6.1 多樣性
在生物系統(tǒng)中,有多種神經(jīng)元協(xié)同工作罢防。 最重要的劃分是劃分為興奮性和抑制性神經(jīng)元艘虎,而在當(dāng)前的人工神經(jīng)網(wǎng)絡(luò)中,神經(jīng)元發(fā)出的興奮性和抑制性突觸混合在一起咒吐。?
6.2 信息處理的時(shí)間協(xié)調(diào)與控制
大腦使用尖峰信號(hào)進(jìn)行交流野建。 這提供了使用復(fù)雜的時(shí)空代碼和協(xié)調(diào)方案進(jìn)行計(jì)算的機(jī)會(huì)属划。 此外,大腦活動(dòng)很大程度上取決于歷史事件候生,而人工神經(jīng)網(wǎng)絡(luò)則更多地強(qiáng)調(diào)當(dāng)前的輸入同眯。 大腦不斷對(duì)未來進(jìn)行預(yù)測(cè),這可能是其某些先進(jìn)智能的基礎(chǔ)唯鸭。最大的差距之一是大腦使用復(fù)雜的控件來調(diào)節(jié)信息流和可塑性嗽测。?
6.3 高級(jí)學(xué)習(xí)能力
盡管近年來深度學(xué)習(xí)取得了長足的進(jìn)步,但生物系統(tǒng)的自動(dòng)學(xué)習(xí)能力仍然在魯棒性和靈活性方面無與倫比肿孵。
神經(jīng)科學(xué)技術(shù)的最新進(jìn)展已使我們能夠觀察和操縱一群編碼記憶印記,印記細(xì)胞的神經(jīng)元疏魏。這將對(duì)學(xué)習(xí)和記憶的研究帶到了細(xì)胞群體和電路水平停做。 此類存儲(chǔ)器可能不像通常在計(jì)算機(jī)存儲(chǔ)器中那樣由白板隨意形成,而是可以根據(jù)先天原理進(jìn)行嚴(yán)格的管理和組織大莫。
當(dāng)前的深度學(xué)習(xí)算法通過學(xué)習(xí)大量標(biāo)記數(shù)據(jù)來取得成功蛉腌。 但是生物神經(jīng)系統(tǒng)能夠從幾個(gè)例子中學(xué)習(xí),并且在沒有明確指示的情況下就可以繼續(xù)自動(dòng)學(xué)習(xí)只厘,同時(shí)在整個(gè)生命周期中執(zhí)行功能烙丛,而不僅僅是在專門的時(shí)間。