TensorFlow入門1-手寫數(shù)字mnist數(shù)據(jù)集識別(單層Softmax神經(jīng)網(wǎng)絡)

1 手寫字體MNIST數(shù)據(jù)集介紹

當我們開始學習編程的時候听皿,第一件事往往是學習打印“Hello World”阳欲,機器學習(深度學習)入門的MNIST就相當于編程入門的“Hello World”者蠕。

MNIST是一個入門級的計算機視覺數(shù)據(jù)集檩奠,總共有70000張圖片翁锡,其中60000張圖片作為訓練數(shù)據(jù)蔓挖,10000張圖片作為測試數(shù)據(jù)。(實際上馆衔,TensorFlow將60000張圖片的訓練數(shù)據(jù)拆分成了兩部分瘟判,一部分是55000張的圖片訓練數(shù)據(jù),另一部分是5000張的圖片驗證數(shù)據(jù)哈踱。)MNIST數(shù)據(jù)集官方網(wǎng)址為:http://yann.lecun.com/exdb/mnist/ 荒适,在MNIST數(shù)據(jù)集中的每一張圖片都代表了0-9中的一個數(shù)字,每張圖片的像素都是28x28开镣,且數(shù)字都會出現(xiàn)在圖片的正中間刀诬。

我們把這個數(shù)組展開成一個一維數(shù)組,長度是28x28=784邪财,以方便TensorFlow將圖片的像素矩陣提供給神經(jīng)網(wǎng)絡的輸入層陕壹。這樣的話,訓練集中的圖片就相當于一個[60000树埠,784]的張量糠馆,第一個維度數(shù)字用來索引圖片,第二個維度數(shù)字用來索引每張圖片中的像素點怎憋。在此張量里的每一個元素又碌,都表示某張圖片里的某個像素的強度值九昧,值介于0和1之間。

相對應的MNIST數(shù)據(jù)集的標簽是介于0到9的數(shù)字毕匀,用來描述給定圖片里表示的數(shù)字铸鹰。使用one-hot編碼,一個one-hot向量除了某一位的數(shù)字是1以外其余各維度數(shù)字都是0皂岔。數(shù)字n將表示成一個只有在第n維度(從0開始)數(shù)字為1的10維向量蹋笼。比如,標簽3將表示成[0躁垛,0剖毯,0,1教馆,0逊谋,0,0活玲,0涣狗,0,0舒憾,0]镀钓。因此,訓練集中的標簽是一個[60000镀迂,10] 的張量丁溅。


2 Softmax回歸

MNIST的每一張圖片都表示一個數(shù)字,我們希望得到給定圖片代表每個數(shù)字的概率探遵。比如窟赏,一張包含9的圖片,模型可能預測為數(shù)字9的概率是80%箱季,預測為數(shù)字8的概率是10%(因為8和9都有上半部分的小圓)涯穷,然后給予它代表其他數(shù)字的概率更小的值。

對于二分類問題藏雏,可以使用Logistic回歸模型拷况,多分類問題可以使用Softmax回歸。Softmax回歸模型是Logistic回歸模型在多分類問題上的推廣掘殴,在多分類問題中赚瘦,類標簽 y 可以取兩個以上的值,Softmax模型可以求出不同標簽值對應的分配概率奏寨。對于MNIST手寫數(shù)字分類問題起意,其目的是辨識10個不同的單個數(shù)字,所以可以使用Softmax回歸模型病瞳。

為了得到一張給定圖片屬于某個特定數(shù)字類的證據(jù)(evidence)揽咕,我們對圖片像素值進行加權(quán)求和奴烙。如果這個像素具有很強的證據(jù)說明這張圖片不屬于該類拓萌,那么相應的權(quán)值為負數(shù)攒岛,相反如果這個像素擁有有利的證據(jù)支持這張圖片屬于這個類萄唇,那么權(quán)值是正數(shù)般堆。

下面的圖片顯示了一個模型學習到的圖片上每個像素對于特定數(shù)字類的權(quán)值莫矗。紅色代表負數(shù)權(quán)值绑蔫,藍色代表正數(shù)權(quán)值蛔垢。

我們也需要加入一個額外的偏置量(bias)嚎于,因為輸入往往會帶有一些無關(guān)的干擾量掘而。

相關(guān)的計算公式為:


這里的softmax可看成是一個激勵(activation)函數(shù),把我們定義的線性函數(shù)的輸出轉(zhuǎn)換成我們想要的樣式于购,也就是關(guān)于10個數(shù)字類的概率分布袍睡。因此,給定一張圖片肋僧,它對于每一個數(shù)字的吻合度可以被softmax函數(shù)轉(zhuǎn)換成為一個概率值斑胜。

假設(shè)預測模型的結(jié)果總共有A、B嫌吠、C三類止潘,一個樣本經(jīng)過權(quán)重和偏差的作用之后,得到的結(jié)果為[-1辫诅,2凭戴,3],那么對應的softmax值為[exp(-1)炕矮,exp(2)么夫,exp(3)]=[0.36788,7.38906肤视,20.08554]档痪,總和為0.36788+7.38906+20.08554=27.84248,歸一化之后的結(jié)果為[0.36788/27.84248邢滑,7.38906/27.84248腐螟,20.08554/27.84248]=[0.013213,0.269429殊鞭,0.717358]遭垛,也就是該樣本屬于A、B操灿、C類的概率分別為0.013213锯仪,0.269429,0.717358趾盐。

實際上庶喜,在計算過程中小腊,為了防止出現(xiàn)數(shù)據(jù)溢出(+∞),在進行softmax的時候久窟,會在分母求和的時候加上一個很小的數(shù)字秩冈,比如10的-8次方。


3 代碼講解

關(guān)于Windows系統(tǒng)下安裝TensorFlow斥扛,參考鏈接:http://www.reibang.com/p/c3a4a0ff82a6入问。

# 1 導入相關(guān)包
from time import time              # 計算訓練模型總時間
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

# 2 加載mnist數(shù)據(jù)
start_time = time()
mnist = input_data.read_data_sets('MNIST_data/', one_hot=True)

# 3 定義模型參數(shù)(權(quán)重、偏差)及占位符
x = tf.placeholder(tf.float32, [None, 784])
W = tf.Variable(tf.zeros([784, 10]))
b = tf.Variable(tf.zeros([10]))

# 4 計算y的預測值稀颁,定義y標簽值的占位符
y_predict = tf.nn.softmax(tf.matmul(x, W) + b)
y_label = tf.placeholder(tf.float32, [None, 10])

# 5 定義交叉熵損失芬失,選擇梯度下降優(yōu)化方法
cross_entropy  = tf.reduce_mean(-tf.reduce_sum( y_label * tf.log(y_predict), axis=[1]))
train_step = tf.train.GradientDescentOptimizer(learning_rate=0.5).minimize(cross_entropy)

# 6 創(chuàng)建會話,初始化所有變量
init = tf.global_variables_initializer()
sess = tf.InteractiveSession() 
sess.run(init)

# 7 用批數(shù)據(jù)循環(huán)訓練模型1000次匾灶,評估模型
for _ in range(1000):
    batch_xs, batch_ys = mnist.train.next_batch(100)
    sess.run(train_step, feed_dict={x: batch_xs, y_label: batch_ys})
correct_predict = tf.equal(tf.argmax(y_predict,1), tf.argmax(y_label, 1))
accuracy = tf.reduce_mean(tf.cast(correct_predict, dtype='float'))
print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_label: mnist.test.labels}))
print('模型訓練總耗時:%.4f' %(time() - start_time)+'秒')
sess.close()

第6步和第7步也可以合并為:

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for _ in range(1000):
        batch_xs, batch_ys = mnist.train.next_batch(100)
        sess.run(train_step, feed_dict={x: batch_xs, y_label: batch_ys})
    correct_predict = tf.equal(tf.argmax(y_predict,1), tf.argmax(y_label, 1))
    accuracy = tf.reduce_mean(tf.cast(correct_predict, dtype='float'))
    print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_label: mnist.test.labels}))
    print('模型訓練總耗時:%.4f' %(time() - start_time)+'秒')
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末棱烂,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子阶女,更是在濱河造成了極大的恐慌颊糜,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,348評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件秃踩,死亡現(xiàn)場離奇詭異衬鱼,居然都是意外死亡,警方通過查閱死者的電腦和手機吞瞪,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,122評論 2 385
  • 文/潘曉璐 我一進店門馁启,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人芍秆,你說我怎么就攤上這事惯疙。” “怎么了妖啥?”我有些...
    開封第一講書人閱讀 156,936評論 0 347
  • 文/不壞的土叔 我叫張陵霉颠,是天一觀的道長。 經(jīng)常有香客問我荆虱,道長蒿偎,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,427評論 1 283
  • 正文 為了忘掉前任怀读,我火速辦了婚禮诉位,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘菜枷。我一直安慰自己苍糠,他們只是感情好,可當我...
    茶點故事閱讀 65,467評論 6 385
  • 文/花漫 我一把揭開白布啤誊。 她就那樣靜靜地躺著岳瞭,像睡著了一般拥娄。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上瞳筏,一...
    開封第一講書人閱讀 49,785評論 1 290
  • 那天稚瘾,我揣著相機與錄音,去河邊找鬼姚炕。 笑死摊欠,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的柱宦。 我是一名探鬼主播凄硼,決...
    沈念sama閱讀 38,931評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼捷沸!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起狐史,我...
    開封第一講書人閱讀 37,696評論 0 266
  • 序言:老撾萬榮一對情侶失蹤痒给,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后骏全,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體苍柏,經(jīng)...
    沈念sama閱讀 44,141評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,483評論 2 327
  • 正文 我和宋清朗相戀三年姜贡,在試婚紗的時候發(fā)現(xiàn)自己被綠了试吁。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,625評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡楼咳,死狀恐怖熄捍,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情母怜,我是刑警寧澤余耽,帶...
    沈念sama閱讀 34,291評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站苹熏,受9級特大地震影響碟贾,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜轨域,卻給世界環(huán)境...
    茶點故事閱讀 39,892評論 3 312
  • 文/蒙蒙 一袱耽、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧干发,春花似錦朱巨、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽恶座。三九已至,卻和暖如春沥阳,著一層夾襖步出監(jiān)牢的瞬間跨琳,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工桐罕, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留脉让,地道東北人。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓功炮,卻偏偏與公主長得像溅潜,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子薪伏,可洞房花燭夜當晚...
    茶點故事閱讀 43,492評論 2 348

推薦閱讀更多精彩內(nèi)容