程序=算法+數(shù)據(jù)結(jié)構(gòu)觉鼻。神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一種大數(shù)據(jù)分析算法嚣艇,任何算法得以運行,都必須依靠特定的數(shù)據(jù)結(jié)構(gòu)蜕企,而用于將各種數(shù)據(jù)統(tǒng)一封裝并輸入網(wǎng)絡(luò)模型的數(shù)據(jù)結(jié)構(gòu)叫tensor,也就是張量例证。張量在不同的情況下存有不同的形式路呜,接下來我們逐一分解。
張量一大特征是維度织咧,一個0維張量就是一個常量胀葱,在Python中,一個張量的維度可以通過讀取它的ndim屬性來獲取烦感,例如下面代碼:
我們常用的數(shù)值就等價與一維張量巡社,例如:
同理可得膛堤,一個二維數(shù)組就是一個二維張量手趣,相關(guān)代碼如下:
從上面例子我們可以看成張量定義的規(guī)律,所謂n維張量肥荔,其實就是一維數(shù)組绿渣,數(shù)組中的每個元素都是n-1維張量。由此可見燕耿,3維張量其實就是一個一維數(shù)組中符,數(shù)組中的每個元素就是2維數(shù)組,相關(guān)代碼如下:
3維張量就是元素為2維數(shù)組的一維數(shù)組誉帅,同理4維張量就是元素為3維張量的一維數(shù)組淀散。一個n維張量經(jīng)常用一組數(shù)據(jù)來表示,例如上面的3維張量蚜锨,它可以用(3,2,2)這組數(shù)據(jù)結(jié)合來表示档插,一個張量是幾維度,那么括號里面就有幾個數(shù)字亚再,面對(3,2,2) 我們可以這么解讀郭膛,由于括號里有3個數(shù)字,因此它表示一個3維張量氛悬,這個張量包含3個元素则剃,每個元素是一個2維張量耘柱,2維度張量含有兩個元素(第二個2),每個元素是一維張量棍现,每個一維張量含有兩個(第三個2)常量调煎。
在上一節(jié)的例子中,我們加載的用于培訓(xùn)網(wǎng)絡(luò)的圖像數(shù)據(jù)就是一個三維張量:
上面代碼的運行結(jié)果就表示轴咱,train_images是一個三維張量汛蝙,張量中含有60000個二維張量,也就是二維數(shù)組朴肺,每個二維數(shù)組表示一張數(shù)字圖片窖剑。
我們可以從張量截取出一部分,例如:
在上面代碼中戈稿,train_images是含有60000個2維張量的3維張量西土,代碼把從第10個開始,到第100個2維張量抽取出來鞍盗,形成一個3維張量需了。在上一節(jié)代碼中,涉及到一個概念叫batch,batch指的是從全部數(shù)據(jù)中抽取出一部分形成一個子集般甲,上面代碼中的my_slice就是一個batch肋乍。
在實際應(yīng)用中,最多能使用到的張量是5維敷存,一維張量是很常見的墓造,就是一維數(shù)組,如果我們需要記錄一個人的年齡[27歲]锚烦,身高[1.78米]觅闽,收入[10000每月],我們就可以使用一個一維張量[27,1.78,10000]涮俄。
如果我們的數(shù)據(jù)中涉及到時間時蛉拙,那么很可能需要3維張量。例如每分鐘股票的價格彻亲,假設(shè)我們要記錄一分鐘內(nèi)股票的最高點和最低點孕锄,那么我們可以用含有3個數(shù)據(jù)點的一維數(shù)組表示,第一個數(shù)據(jù)點表示分鐘苞尝,第二個點表示最高點畸肆,第三個點表示最低點,例如一天有390分鐘野来,假設(shè)第20分鐘股票的最高點是10恼除,最低點是8,那么這一分鐘的張量表示為[20, 10, 9], 于是一整天的股票信息就可以用一個二維張量表示(390, 3),390表示一天的分鐘數(shù)。如果我們要記錄250天的數(shù)據(jù)豁辉,那么就得使用三維張量(250, 390, 3)令野。
對于圖片來說,假如每個像素點我們用RGB值表示徽级,于是一個像素點就可以用含有三個數(shù)據(jù)點的一維數(shù)組表示气破,例如紅色就是[255,0,0]。一張大小為256*256的圖片就可以用3維張量表示(256, 256, 3), 那么一個128張圖片的集合就可以用4維數(shù)組表示(128, 256, 256, 3)餐抢。
我們接著看看張量運算现使。在上一節(jié)實例中,有一行代碼是這樣的:
layers.Dense(512, activation='relu')
其中的relu其實一種張量操作旷痕,也就是max(x,0), 假設(shè)x是[1, -1, -2], 那么作為relu操作后碳锈,x變?yōu)閇1, 0, 0], 也就是把x中小于0的元素全部變成0,大于0則保持不變欺抗,我們用代碼來實現(xiàn)relu操作:
同維度的張量可以做點乘操作售碳,例如[1,2,3] * [4,5,6] = 1*4 + 2*5 + 3*6,我們看看一維張量的點乘操作如何用代碼實現(xiàn):
如果是一個2維張量與一個1維張量做點乘時,有前提要求就是2維張量中的每個元素绞呈,也就是一維張量它元素的個數(shù)要與做點乘的1維度張量中元素的個數(shù)相同贸人,例如:
[ [1,2], [3*4]] * [5,6] = [ [1,2] * [5,6], [3,4] * [5,6]] = [17, 39]
對應(yīng)的實現(xiàn)代碼如下:
本節(jié)我們主要介紹了神經(jīng)網(wǎng)絡(luò)算法中最基本的一種數(shù)據(jù)結(jié)構(gòu)叫張量,以及涉及張量基本運算佃声,下一節(jié)我們將深入神經(jīng)網(wǎng)絡(luò)的構(gòu)建細節(jié)艺智,拋棄框架,使用代碼重新構(gòu)造一個神經(jīng)網(wǎng)絡(luò)圾亏,通過把輪子重新建造一遍的辦法十拣,搞清楚神經(jīng)網(wǎng)絡(luò)的算法原理。
更多技術(shù)信息父晶,包括操作系統(tǒng)哮缺,編譯器弄跌,面試算法,機器學(xué)習(xí)尝苇,人工智能铛只,請關(guān)照我的公眾號: