TensorFlow 入門

CS224d－Day 2:

在 Day 1 里誓篱，先了解了一下 NLP 和 DP 的主要概念朋贬，對它們有了一個大體的印象，用向量去表示研究對象窜骄，用神經(jīng)網(wǎng)絡去學習锦募，用 TensorFlow 去訓練模型，基本的模型和算法包括 word2vec邻遏，softmax糠亩，RNN，LSTM准验，GRU赎线，CNN，大型數(shù)據(jù)的 seq2seq糊饱，還有未來比較火熱的研究方向 DMN垂寥，還有模型的調(diào)優(yōu)。

今天先不直接進入理論學習另锋，而是先學習一下 TensorFlow滞项，在原課程里，這部分在第7講夭坪，但是我覺得最高效地學習算法的方式文判，就是一邊學理論，一邊寫代碼室梅，實踐中才能理解更深刻戏仓。

Day 2 先認識 TensorFlow潭流，了解一下基本用法，下一次就寫代碼來訓練模型算法柜去，以問題為導向，以項目為驅(qū)動拆宛。

本文結構：

1. TensorFlow 是什么
2. 為什么需要 TensorFlow
3. TensorFlow 的優(yōu)點
4. TensorFlow 的工作原理
5. 安裝
6. TensorFlow 基本用法
- 要點
- 例子
- 概念
  - 圖
  - 張量
  - 會話

1. TensorFlow 是什么

是一個深度學習庫嗓奢，由 Google 開源，可以對定義在 Tensor(張量)上的函數(shù)自動求導浑厚。

Tensor(張量)意味著 N 維數(shù)組股耽，F(xiàn)low(流)意味著基于數(shù)據(jù)流圖的計算，TensorFlow即為張量從圖的一端流動到另一端钳幅。

它的一大亮點是支持異構設備分布式計算物蝙，它能夠在各個平臺上自動運行模型，從電話敢艰、單個CPU / GPU到成百上千GPU卡組成的分布式系統(tǒng)诬乞。

支持CNN、RNN和LSTM算法钠导，是目前在 Image震嫉，NLP 最流行的深度神經(jīng)網(wǎng)絡模型。

2. 為什么需要 TensorFlow 等庫

深度學習通常意味著建立具有很多層的大規(guī)模的神經(jīng)網(wǎng)絡牡属。

除了輸入X票堵，函數(shù)還使用一系列參數(shù)，其中包括標量值逮栅、向量以及最昂貴的矩陣和高階張量悴势。

在訓練網(wǎng)絡之前，需要定義一個代價函數(shù)措伐，常見的代價函數(shù)包括回歸問題的方差以及分類時候的交叉熵特纤。

訓練時，需要連續(xù)的將多批新輸入投入網(wǎng)絡废士，對所有的參數(shù)求導后叫潦，代入代價函數(shù)，從而更新整個網(wǎng)絡模型官硝。

這個過程中有兩個主要的問題：1. 較大的數(shù)字或者張量在一起相乘百萬次的處理矗蕊，使得整個模型代價非常大。2. 手動求導耗時非常久氢架。

所以 TensorFlow 的對函數(shù)自動求導以及分布式計算傻咖，可以幫我們節(jié)省很多時間來訓練模型。

3. TensorFlow 的優(yōu)點

第一岖研，基于Python卿操，寫的很快并且具有可讀性警检。

第二，在多GPU系統(tǒng)上的運行更為順暢害淤。

第三扇雕，代碼編譯效率較高。

第四窥摄，社區(qū)發(fā)展的非常迅速并且活躍镶奉。

第五，能夠生成顯示網(wǎng)絡拓撲結構和性能的可視化圖崭放。

4. TensorFlow 的工作原理

TensorFlow是用數(shù)據(jù)流圖(data flow graphs)技術來進行數(shù)值計算的哨苛。

數(shù)據(jù)流圖是描述有向圖中的數(shù)值計算過程。

有向圖中币砂，節(jié)點通常代表數(shù)學運算建峭，邊表示節(jié)點之間的某種聯(lián)系，它負責傳輸多維數(shù)據(jù)(Tensors)决摧。

節(jié)點可以被分配到多個計算設備上亿蒸，可以異步和并行地執(zhí)行操作。因為是有向圖蜜徽，所以只有等到之前的入度節(jié)點們的計算狀態(tài)完成后祝懂，當前節(jié)點才能執(zhí)行操作。

5. 安裝

極客學院有官方文檔翻譯版拘鞋，講的很清楚砚蓬，有各種安裝方式的講解。

我選擇基于 Anaconda 的安裝盆色，因為這個很方便灰蛙。

Anaconda 是一個集成許多第三方科學計算庫的 Python 科學計算環(huán)境，用 conda 作為自己的包管理工具隔躲，同時具有自己的計算環(huán)境摩梧，類似 Virtualenv。

安裝 Anaconda
我之前已經(jīng)安裝過 Anaconda 了宣旱，直接從下面進行：
建立一個 conda 計算環(huán)境

# 計算環(huán)境名字叫 tensorflow:
# Python 2.7
$ conda create -n tensorflow python=2.7

激活環(huán)境仅父，使用 conda 安裝 TensorFlow

$ source activate tensorflow
(tensorflow)$  # Your prompt should change

# Mac OS X, CPU only:
(tensorflow)$ pip install --ignore-installed --upgrade https://storage.googleapis.com/tensorflow/mac/tensorflow-0.8.0rc0-py2-none-any.whl

安裝成功后，每次使用 TensorFlow 的時候需要激活 conda 環(huán)境
conda 環(huán)境激活后浑吟，你可以測試是否成功笙纤，在終端進入 python，輸入下面代碼组力，沒有提示錯誤省容，說明安裝 TensorFlow 成功：

$ python
...
>>> import tensorflow as tf
>>> hello = tf.constant('Hello, TensorFlow!')
>>> sess = tf.Session()
>>> print(sess.run(hello))
Hello, TensorFlow!
>>> a = tf.constant(10)
>>> b = tf.constant(32)
>>> print(sess.run(a + b))
42
>>>

當你不用 TensorFlow 的時候，關閉環(huán)境:

(tensorflow)$ source deactivate

$  # Your prompt should change back

再次使用的時候再激活:

$ source activate tensorflow
(tensorflow)$  # Run Python programs that use TensorFlow.
...

(tensorflow)$ source deactivate

在 Jupyter notebook 里用 TensorFlow
我在 (tensorflow)$ 直接輸入 jupyter notebook 后燎字，輸入 import tensorflow as tf 是有錯誤的腥椒，可以參考這里阿宅。

6. TensorFlow 基本用法

接下來按照官方文檔中的具體代碼，來看一下基本用法笼蛛。

你需要理解在TensorFlow中洒放，是如何：

將計算流程表示成圖；
通過Sessions來執(zhí)行圖計算滨砍；
將數(shù)據(jù)表示為tensors拉馋；
使用Variables來保持狀態(tài)信息；
分別使用feeds和fetches來填充數(shù)據(jù)和抓取任意的操作結果惨好；

先看個栗子：
例1，生成三維數(shù)據(jù)随闺，然后用一個平面擬合它：

# (tensorflow)$ python   用 Python API 寫 TensorFlow 示例代碼

import tensorflow as tf
import numpy as np

# 用 NumPy 隨機生成 100 個數(shù)據(jù)
x_data = np.float32(np.random.rand(2, 100)) 
y_data = np.dot([0.100, 0.200], x_data) + 0.300

# 構造一個線性模型
b = tf.Variable(tf.zeros([1]))
W = tf.Variable(tf.random_uniform([1, 2], -1.0, 1.0))
y = tf.matmul(W, x_data) + b

# 最小化方差
loss = tf.reduce_mean(tf.square(y - y_data))
optimizer = tf.train.GradientDescentOptimizer(0.5)
train = optimizer.minimize(loss)

# 初始化變量
init = tf.initialize_all_variables()

# 啟動圖 (graph)
sess = tf.Session()
sess.run(init)

# 擬合平面
for step in xrange(0, 201):
    sess.run(train)
    if step % 20 == 0:
        print step, sess.run(W), sess.run(b)

# 輸出結果為：
0 [[-0.14751725  0.75113136]] [ 0.2857058]
20 [[ 0.06342752  0.32736415]] [ 0.24482927]
40 [[ 0.10146417  0.23744738]] [ 0.27712563]
60 [[ 0.10354312  0.21220125]] [ 0.290878]
80 [[ 0.10193551  0.20427427]] [ 0.2964265]
100 [[ 0.10085492  0.201565  ]] [ 0.298612]
120 [[ 0.10035028  0.20058727]] [ 0.29946309]
140 [[ 0.10013894  0.20022322]] [ 0.29979277]
160 [[ 0.1000543   0.20008542]] [ 0.29992008]
180 [[ 0.10002106  0.20003279]] [ 0.29996923]
200 [[ 0.10000814  0.20001261]] [ 0.29998815]

注意這幾條代碼：

W = tf.Variable(tf.random_uniform([1, 2], -1.0, 1.0))

y = tf.matmul(W, x_data) + b

init = tf.initialize_all_variables()

sess = tf.Session()
sess.run(init)

sess.run(train) 
print step, sess.run(W), sess.run(b)

接下來看具體概念：

TensorFlow 用圖來表示計算任務日川，圖中的節(jié)點被稱之為operation，縮寫成op矩乐。
一個節(jié)點獲得 0 個或者多個張量 tensor龄句，執(zhí)行計算，產(chǎn)生0個或多個張量散罕。
圖必須在會話(Session)里被啟動分歇，會話(Session)將圖的op分發(fā)到CPU或GPU之類的設備上，同時提供執(zhí)行op的方法欧漱，這些方法執(zhí)行后职抡，將產(chǎn)生的張量(tensor)返回。

1. 構建圖
例2误甚，計算矩陣相乘：

import tensorflow as tf

# 創(chuàng)建一個 常量 op, 返回值 'matrix1' 代表這個 1x2 矩陣.
matrix1 = tf.constant([[3., 3.]])

# 創(chuàng)建另外一個 常量 op, 返回值 'matrix2' 代表這個 2x1 矩陣.
matrix2 = tf.constant([[2.],[2.]])

# 創(chuàng)建一個矩陣乘法 matmul op , 把 'matrix1' 和 'matrix2' 作為輸入.
# 返回值 'product' 代表矩陣乘法的結果.
product = tf.matmul(matrix1, matrix2)

默認圖有三個節(jié)點, 兩個 constant() op, 和一個 matmul() op. 為了真正進行矩陣相乘運算, 并得到矩陣乘法的結果, 你必須在會話里啟動這個圖.

2. 張量 Tensor
從向量空間到實數(shù)域的多重線性映射(multilinear maps)（v是向量空間缚甩，v*是對偶空間）
例如代碼中的 [[3., 3.]]，Tensor 可以看作是一個 n 維的數(shù)組或列表窑邦。在 TensorFlow 中用 tensor 數(shù)據(jù)結構來代表所有的數(shù)據(jù), 計算圖中, 操作間傳遞的數(shù)據(jù)都是 tensor擅威。

3. 在一個會話中啟動圖
創(chuàng)建一個 Session 對象, 如果無任何創(chuàng)建參數(shù), 會話構造器將啟動默認圖。
會話負責傳遞 op 所需的全部輸入冈钦，op 通常是并發(fā)執(zhí)行的郊丛。

# 啟動默認圖.
sess = tf.Session()

# 調(diào)用 sess 的 'run()' 方法, 傳入 'product' 作為該方法的參數(shù)，
# 觸發(fā)了圖中三個 op (兩個常量 op 和一個矩陣乘法 op)瞧筛，
# 向方法表明, 我們希望取回矩陣乘法 op 的輸出.
result = sess.run(product)

# 返回值 'result' 是一個 numpy `ndarray` 對象.
print result
# ==> [[ 12.]]

# 任務完成, 需要關閉會話以釋放資源厉熟。
sess.close()

交互式使用
在 Python API 中，使用一個會話 Session 來啟動圖, 并調(diào)用 Session.run() 方法執(zhí)行操作.

為了便于在 IPython 等交互環(huán)境使用 TensorFlow驾窟，需要用 InteractiveSession 代替 Session 類, 使用 Tensor.eval() 和 Operation.run() 方法代替 Session.run()庆猫。

例3，計算 'x' 減去 'a'：

# 進入一個交互式 TensorFlow 會話.
import tensorflow as tf
sess = tf.InteractiveSession()

x = tf.Variable([1.0, 2.0])
a = tf.constant([3.0, 3.0])

# 使用初始化器 initializer op 的 run() 方法初始化 'x' 
x.initializer.run()

# 增加一個減法 sub op, 從 'x' 減去 'a'. 運行減法 op, 輸出結果 
sub = tf.sub(x, a)
print sub.eval()
# ==> [-2. -1.]

變量 Variable

上面用到的張量是常值張量(constant)绅络。

變量 Variable月培，是維護圖執(zhí)行過程中的狀態(tài)信息的. 需要它來保持和更新參數(shù)值嘁字，是需要動態(tài)調(diào)整的。

下面代碼中有 tf.initialize_all_variables杉畜，是預先對變量初始化纪蜒，
Tensorflow 的變量必須先初始化，然后才有值此叠！而常值張量是不需要的纯续。

下面的 assign() 操作和 add() 操作，在調(diào)用 run() 之前, 它并不會真正執(zhí)行賦值和加和操作灭袁。

例4猬错，使用變量實現(xiàn)一個簡單的計數(shù)器：

# －創(chuàng)建一個變量, 初始化為標量 0.  初始化定義初值
state = tf.Variable(0, name="counter")

# 創(chuàng)建一個 op, 其作用是使 state 增加 1
one = tf.constant(1)
new_value = tf.add(state, one)
update = tf.assign(state, new_value)

# 啟動圖后, 變量必須先經(jīng)過`初始化` (init) op 初始化,
# 才真正通過Tensorflow的initialize_all_variables對這些變量賦初值
init_op = tf.initialize_all_variables()

# 啟動默認圖, 運行 op
with tf.Session() as sess:

  # 運行 'init' op
  sess.run(init_op)
  
  # 打印 'state' 的初始值
  # 取回操作的輸出內(nèi)容, 可以在使用 Session 對象的 run() 調(diào)用 執(zhí)行圖時, 
  # 傳入一些 tensor, 這些 tensor 會幫助你取回結果. 
  # 此處只取回了單個節(jié)點 state，
  # 也可以在運行一次 op 時一起取回多個 tensor: 
  # result = sess.run([mul, intermed])
  print sess.run(state)
  
  # 運行 op, 更新 'state', 并打印 'state'
  for _ in range(3):
    sess.run(update)
    print sess.run(state)

# 輸出:

# 0
# 1
# 2
# 3

上面的代碼定義了一個如下的計算圖：

Ok茸歧，總結一下倦炒，來一個清晰的代碼：
過程就是：建圖->啟動圖->運行取值

計算矩陣相乘：

import tensorflow as tf

# 建圖
matrix1 = tf.constant([[3., 3.]])
matrix2 = tf.constant([[2.],[2.]])

product = tf.matmul(matrix1, matrix2)

# 啟動圖
sess = tf.Session()

# 取值
result = sess.run(product)
print result

sess.close()

上面的幾個代碼介紹了基本用法，通過觀察软瞎，有沒有覺得 tf 和 numpy 有點像呢逢唤。

TensorFlow和普通的Numpy的對比
在cs224d的課件中有下面這個代碼，來看一下二者之間的區(qū)別：

eval()

在 Python 中定義完 a 后涤浇，直接打印就可以看到 a鳖藕。

In [37]: a = np.zeros((2,2))

In [39]: print(a)
[[ 0.  0.]
 [ 0.  0.]]

但是在 Tensorflow 中需要顯式地輸出(evaluation，也就是說借助eval()函數(shù))只锭！

In [38]: ta = tf.zeros((2,2))

In [40]: print(ta)
Tensor("zeros_1:0", shape=(2, 2), dtype=float32)

In [41]: print(ta.eval())
[[ 0.  0.]
[ 0. 0.]]

**通過幾個例子了解了基本的用法著恩，feed 在上面的例子中還沒有寫到，下一次就能用到了蜻展，其他的可以查詢這里页滚。 **

Day 1 宏觀了解了 NLP，Day 2 搞定了工具铺呵，下次要直接先進入實戰(zhàn)裹驰，訓練模型，先從 Logistic 和 NN 開始片挂，一邊看模型一邊寫代碼一邊思考模型原理幻林，這樣理解才會更深刻！

[cs224d]

Day 1. 深度學習與自然語言處理主要概念一覽
Day 2. TensorFlow 入門
Day 3. word2vec 模型思想和代碼實現(xiàn)
Day 4. 怎樣做情感分析
Day 5. CS224d－Day 5: RNN快速入門
Day 6. 一文學會用 Tensorflow 搭建神經(jīng)網(wǎng)絡
Day 7. 用深度神經(jīng)網(wǎng)絡處理NER命名實體識別問題
Day 8. 用 RNN 訓練語言模型生成文本
Day 9. RNN與機器翻譯
Day 10. 用 Recursive Neural Networks 得到分析樹
Day 11. RNN的高級應用

最后編輯于：2017.12.04 01:22:51

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末音念，一起剝皮案震驚了整個濱河市沪饺，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌闷愤，老刑警劉巖整葡，帶你破解...
沈念sama閱讀 206,311評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異讥脐，居然都是意外死亡遭居，警方通過查閱死者的電腦和手機啼器，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,339評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來俱萍，“玉大人端壳，你說我怎么就攤上這事∏鼓ⅲ” “怎么了损谦？”我有些...
開封第一講書人閱讀 152,671評論 0贊 342
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長岳颇。經(jīng)常有香客問我照捡，道長，這世上最難降的妖魔是什么话侧？我笑而不...
開封第一講書人閱讀 55,252評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任麻敌，我火速辦了婚禮，結果婚禮上掂摔，老公的妹妹穿的比我還像新娘。我一直安慰自己赢赊，他們只是感情好乙漓，可當我...
茶點故事閱讀 64,253評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著释移，像睡著了一般叭披。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上玩讳，一...
開封第一講書人閱讀 49,031評論 1贊 285
城市分裂傳說
那天涩蜘，我揣著相機與錄音，去河邊找鬼熏纯。笑死同诫，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的樟澜。我是一名探鬼主播误窖，決...
沈念sama閱讀 38,340評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼秩贰！你這毒婦竟也來了霹俺？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 36,973評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤毒费，失蹤者是張志新（化名）和其女友劉穎丙唧，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體觅玻，經(jīng)...
沈念sama閱讀 43,466評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡想际，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 35,937評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年培漏，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片沼琉。...
茶點故事閱讀 38,039評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡北苟，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出打瘪，到底是詐尸還是另有隱情友鼻，我是刑警寧澤，帶...
沈念sama閱讀 33,701評論 4贊 323
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布闺骚，位于F島的核電站彩扔，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏僻爽。R本人自食惡果不足惜虫碉，卻給世界環(huán)境...
茶點故事閱讀 39,254評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望胸梆。院中可真熱鬧敦捧，春花似錦、人聲如沸碰镜。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,259評論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽绪颖。三九已至秽荤，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間柠横，已是汗流浹背窃款。一陣腳步聲響...
開封第一講書人閱讀 31,485評論 1贊 262
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留牍氛，地道東北人晨继。一個月前我還...
沈念sama閱讀 45,497評論 2贊 354
代替公主和親
正文我出身青樓，卻偏偏與公主長得像搬俊，于是被迫代替她去往敵國和親踱稍。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 42,786評論 2贊 345