機器學習入坑指南（九）：TensorFlow 實戰(zhàn)——手寫數(shù)字識別（MNIST 數(shù)據(jù)集）

上篇文章簡要介紹了「深度學習」例证，接下來迷捧，我們將從最經(jīng)典的例子入手進行實戰(zhàn)漠秋。

一庆锦、背景知識簡介

1 TensorFlow

Tensor：張量（即多維數(shù)組），F(xiàn)low：（數(shù)據(jù)）流

TensorFlow艇搀，是一個使用數(shù)據(jù)流圖（data flow graohs）技術來進行科學計算的開源軟件庫焰雕，它由Google Brain 團隊開發(fā)芳杏，被廣泛應用于各種感知和語言理解任務的機器學習爵赵。

點擊訪問：TensorFlow 官網(wǎng)空幻，可以查閱官方文檔、獲取一手資訊和下載最新版本约郁。

或者訪問：GitHub - tensorflow 來達到同樣的效果

英文閱讀有困難的同學參考：TensorFlow 中文文檔

在本次實戰(zhàn)中我們還將使用 Keras棍现，它是一個基于 Theano（另一個開源庫）和 TensorFlow 構建的高級神經(jīng)網(wǎng)絡 API己肮，能夠在 Theano、TensorFlow 或 Microsoft Cognitive Toolkit 上運行娄柳。

點擊訪問：Keras 中文文檔

2 MNIST 數(shù)據(jù)集

在上篇文章中我們已經(jīng)提到過 MNIST 了赤拒，它是一個收錄了許多 28 x 28 像素手寫數(shù)字圖片（以灰度值矩陣存儲）及其對應的數(shù)字的數(shù)據(jù)集挎挖，可以把它理解成下圖這個樣子：

MNIST 數(shù)據(jù)集

圖片來源：3Blue1Brown 的視頻蕉朵，強烈推薦觀看系列視頻：B 站播放地址

二始衅、Python 實現(xiàn)

這里我們依舊使用 Jupyter Notebook 作為開發(fā)環(huán)境缭保，沒有使用過的同學參考我的文章「機器學習入坑指南（一）：Python 環(huán)境搭建」艺骂。

當然彻亲，使用 Pycharm 等 IDE 也沒有問題。

1 安裝并導入 TensorFlow、Keras

在 Anaconda 終端中輸入命令

conda install tf-nightly

或輸入（Python Shell 中也可以使用此命令）

pip install tf-nightly

Keras 已經(jīng)被集成進了 TensorFlow 中宙址。我們可以通過 tensorflow.keras來訪問它抡砂。

接下來，導入這兩個庫

import tensorflow.keras as keras
import tensorflow as tf

可以通過簡單的代碼測試導入是否成功

print(tf.__version__)

image

2 導入并測試 MNIST 數(shù)據(jù)集

Keras 默認從 googleapis 下載 MNIST，如果無法訪問厦瓢，可在 GitHub 上下載啤月，點擊這里谎仲，下載到本地后更改 mnist.py 中的引用路徑郑诺。

TensorFlow 中存在多個 mnist.py ，這里我們需要修改的是 Keras 下的辙售，我的路徑為

C:\ProgramData\Anaconda3\Lib\site-packages\tensorflow\python\keras\datasets

打開之后圾亏，把

origin_folder = 'https://storage.googleapis.com/tensorflow/tf-keras-datasets/'

中的路徑修改為你存放數(shù)據(jù)集的位置即可志鹃。進入正題

mnist = tf.keras.datasets.mnist #導入mnist
(x_train,y_train),(x_test,y_test) = mnist.load_data() #分割
print(x_train[0]) # 查看第一個測試數(shù)據(jù)的輸入

然后你就看到了如下的輸出：

image

讓我們把這個矩陣用圖像表示出來

import matplotlib.pyplot as plt
%matplotlib inline # 加上這句才能顯示圖像
plt.imshow(x_train[0],cmap=plt.cm.binary) # 顯示黑白圖像
plt.show()

image

可以通過以下代碼對數(shù)據(jù)進行歸一化處理

x_train = tf.keras.utils.normalize(x_train, axis=1)
x_test = tf.keras.utils.normalize(x_test, axis=1)

再次查看圖像

plt.imshow(x_train[0],cmap=plt.cm.binary)
plt.show()

image

圖像的像素值被限定在了 [0,1] 捧杉。可以通過

print(x_train[0])

查看矩陣數(shù)據(jù)评甜。

3 構建與訓練模型

終于進入核心環(huán)節(jié)了忍坷。在這里，我們使用 Keras 的 Sequential 模型（順序模型）柑肴。Sequential 模型是最常用的模型晰骑，也就是一個按照順序向前傳遞的神經(jīng)網(wǎng)絡硕舆。

model = tf.keras.models.Sequential()

接下來為模型添加圖層政模。神經(jīng)網(wǎng)絡的輸入層是一個一維向量,所以我們需要把輸入的圖像矩陣展平淋样，從 28 x 28 變?yōu)?1 x 784 趁猴。Keras 為我們提供了如下方法：

model.add(tf.keras.layers.Flatten())

之后，為神經(jīng)網(wǎng)絡添加隱藏層娱挨。這里我們使用最簡單的 Dense 層（即全連接層跷坝，每一個神經(jīng)元與前后兩層的所有神經(jīng)元相連）

model.add(tf.keras.layers.Dense(128, activation=tf.nn.relu))

這個層有 128 個單元柴钻，激活函數(shù)選擇 reLU垢粮，最初人們喜歡用 Sigmoid 函數(shù)蜡吧，但后來發(fā)現(xiàn) reLU 效果更好昔善，所以可以當做一個默認的選擇。

接下來再加入一個相同的層

model.add(tf.keras.layers.Dense(128, activation=tf.nn.relu))

再加入輸出層

model.add(tf.keras.layers.Dense(10, activation=tf.nn.softmax))

輸出層有 10 個結點柬批，代表 10 種不同的數(shù)字氮帐。這里使用 softmax 函數(shù)作為激活函數(shù)上沐，因為我們想要找到預測結果的概率分布参咙。（使用 reLU 得到的數(shù)字并沒有這個意義）

我們構建出的模型大概是這個樣子的（示意圖來自 3Blue1Brown，隱藏層只有 16 個單元硫眯，實際上我們有 128 個）

image

添加好所有的層后蕴侧，“編譯”這個模型。

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

optimizer 即優(yōu)化器两入，我們一般默認使用 adam净宵。
loss 指損失函數(shù)，這里我們將其指定為 sparse_categorical_crossentropy裹纳，即計算分類結果的交叉熵損失择葡。
metrics 列表，參數(shù)為評估模型性能的指標剃氧，典型用法即 metrics=['accuracy']

最后，擬合這個模型

model.fit(x_train, y_train, epochs=3)

image

在訓練的過程中朋鞍，我們會發(fā)現(xiàn)損失值（loss）在降低已添，而準確度（accuracy）在提高，最后達到了一個令人滿意的程度滥酥。

4 測試模型

讓我們利用測試集試試這個模型是不是真的學會了識別數(shù)字

val_loss, val_acc = model.evaluate(x_test, y_test)
print(val_loss)
print(val_acc)

image

損失和準確度看起來還湊合更舞，嘗試識別訓練集

predictions = model.predict(x_test)
print(predictions)

image

看不出來這是個啥？別急恨狈，用 argmax 解析一下（就是找出最大數(shù)對應的索引疏哗，即為識別出的數(shù)字）

import numpy as np

print(np.argmax(predictions[0]))

image

啊哈，來看看 x_test[0] 這個圖像是什么樣的

plt.imshow(x_test[0],cmap=plt.cm.binary)
plt.show()

image

OK禾怠，妥妥的返奉，相信你也認為這就是個 7，我們的模型已經(jīng)可以識別數(shù)字啦吗氏！當然芽偏，這只是一個簡單的開始，后面的路還有很長弦讽，要多思考多動手污尉，堅持學習膀哲，才能早日成為大牛！

最后附上可以跑起來的完整代碼被碗，來自Deep Learning basics with Python, TensorFlow and Keras p.1

import tensorflow as tf  # 深度學習庫某宪，Tensor 就是多維數(shù)組

mnist = tf.keras.datasets.mnist  # mnist 是 28x28 的手寫數(shù)字圖片和對應標簽的數(shù)據(jù)集
(x_train, y_train),(x_test, y_test) = mnist.load_data()  # 分割數(shù)據(jù)集

x_train = tf.keras.utils.normalize(x_train, axis=1)  # 把數(shù)據(jù)值縮放到 0 到 1
x_test = tf.keras.utils.normalize(x_test, axis=1)  

model = tf.keras.models.Sequential()  # 基礎的前饋神經(jīng)網(wǎng)絡模型
model.add(tf.keras.layers.Flatten())  # 把圖片展平成 1x784
model.add(tf.keras.layers.Dense(128, activation=tf.nn.relu))  # 簡單的全連接圖層,，128 個單元锐朴，激活函數(shù)為 relu
model.add(tf.keras.layers.Dense(128, activation=tf.nn.relu)) 
model.add(tf.keras.layers.Dense(10, activation=tf.nn.softmax))  # 輸出層 兴喂，10 個單元， 使用 Softmax 獲得概率分布

model.compile(optimizer='adam',  # 默認的較好的優(yōu)化器
              loss='sparse_categorical_crossentropy',  # 評估“錯誤”的損失函數(shù)焚志，模型應該盡量降低損失
              metrics=['accuracy'])  # 評價指標

model.fit(x_train, y_train, epochs=3)  # 訓練模型

val_loss, val_acc = model.evaluate(x_test, y_test)  # 評估模型對樣本數(shù)據(jù)的輸出結果
print(val_loss)  # 模型的損失值
print(val_acc)  # 模型的準確度

您的認真閱讀就是對我最大的鼓勵衣迷！如果覺得我的文章對您有幫助，想要和我一起不斷學習新的知識酱酬、不斷進步壶谒，歡迎點擊頭像旁邊的「關注」按鈕，讓我好跟基友們吹個牛逼膳沽！

歡迎關注 evan 的博客

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末汗菜，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子贵少，更是在濱河造成了極大的恐慌呵俏，老刑警劉巖，帶你破解...
沈念sama閱讀 217,277評論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件滔灶，死亡現(xiàn)場離奇詭異普碎，居然都是意外死亡，警方通過查閱死者的電腦和手機录平，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,689評論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門麻车，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人斗这，你說我怎么就攤上這事动猬。” “怎么了表箭？”我有些...
開封第一講書人閱讀 163,624評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵赁咙，是天一觀的道長。經(jīng)常有香客問我免钻，道長彼水，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,356評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任极舔，我火速辦了婚禮凤覆，結果婚禮上，老公的妹妹穿的比我還像新娘拆魏。我一直安慰自己盯桦，他們只是感情好慈俯，可當我...
茶點故事閱讀 67,402評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著拥峦，像睡著了一般贴膘。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上事镣，一...
開封第一講書人閱讀 51,292評論 1贊 301
城市分裂傳說
那天步鉴，我揣著相機與錄音，去河邊找鬼璃哟。笑死，一個胖子當著我的面吹牛喊递，可吹牛的內容都是我干的随闪。我是一名探鬼主播，決...
沈念sama閱讀 40,135評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼骚勘，長吁一口氣：“原來是場噩夢啊……” “哼铐伴！你這毒婦竟也來了？” 一聲冷哼從身側響起俏讹，我...
開封第一講書人閱讀 38,992評論 0贊 275
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤当宴，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后泽疆，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體户矢，經(jīng)...
沈念sama閱讀 45,429評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,636評論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年殉疼，在試婚紗的時候發(fā)現(xiàn)自己被綠了梯浪。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 39,785評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡瓢娜，死狀恐怖挂洛，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情眠砾，我是刑警寧澤虏劲，帶...
沈念sama閱讀 35,492評論 5贊 345
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站褒颈，受9級特大地震影響柒巫，放射性物質發(fā)生泄漏。R本人自食惡果不足惜哈肖，卻給世界環(huán)境...
茶點故事閱讀 41,092評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一吻育、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧淤井，春花似錦布疼、人聲如沸摊趾。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,723評論 0贊 22
一樁弒父案游两，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽砾层。三九已至，卻和暖如春贱案，著一層夾襖步出監(jiān)牢的瞬間肛炮，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,858評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工宝踪，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留侨糟，地道東北人。一個月前我還...
沈念sama閱讀 47,891評論 2贊 370
代替公主和親
正文我出身青樓瘩燥，卻偏偏與公主長得像秕重，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子厉膀，可洞房花燭夜當晚...
茶點故事閱讀 44,713評論 2贊 354

機器學習入坑指南（九）：TensorFlow 實戰(zhàn)——手寫數(shù)字識別（MNIST 數(shù)據(jù)集）

一庆锦、背景知識簡介

1 TensorFlow

2 MNIST 數(shù)據(jù)集

二始衅、Python 實現(xiàn)

1 安裝并導入 TensorFlow、Keras

2 導入并測試 MNIST 數(shù)據(jù)集

3 構建與訓練模型

4 測試模型

推薦閱讀更多精彩內容