keras的優(yōu)點(diǎn)是讓用戶專注于網(wǎng)絡(luò)模型本身,而不是花大量時(shí)間去學(xué)tf那些構(gòu)建圖的各種編程套路腾务,
Keras 的核心數(shù)據(jù)結(jié)構(gòu)是 model尤莺,一種組織網(wǎng)絡(luò)層的方式
經(jīng)常用到的庫:
1曹铃、首先創(chuàng)建模型
from keras.models import Sequential
model = Sequential()
2妓局、創(chuàng)建網(wǎng)絡(luò)層,一下創(chuàng)建了兩層喊衫,
from keras.layers import Dense
model.add(Dense(25,activation="relu",input_dim=1))#第一層有25個(gè)節(jié)點(diǎn)跌造,使用的激活函數(shù)為relu,輸入的數(shù)據(jù)為一維數(shù)據(jù)
3族购、在完成了模型的構(gòu)建后, 可以使用 .compile() 來配置學(xué)習(xí)過程
model.compile(loss='categorical_crossentropy',
? ? ? ? ? ? ? optimizer='sgd',
? ? ? ? ? ? ? metrics=['accuracy'])
或者自己配置優(yōu)化器:
model.compile(loss=keras.losses.categorical_crossentropy,
? ? ? ? ? ? ? optimizer=keras.optimizers.SGD(lr=0.01, momentum=0.9, nesterov=True))
我們只需添加輸入層壳贪,隱藏層和輸出層。在他們之間寝杖,我們使用dropout來防止過擬合违施。請注意,你應(yīng)始終使用20%到50%之間的dropout率瑟幕。
4磕蒲、在訓(xùn)練集上訓(xùn)練網(wǎng)絡(luò)(以 32 個(gè)樣本為一個(gè) batch 進(jìn)行迭代)
model.fit(x_train, y_train, epochs=5, batch_size=32)或者model.train_on_batch(x_batch, y_batch)
5留潦、只需一行代碼就能評估模型性能
loss_and_metrics = model.evaluate(x_test, y_test, batch_size=128)
6、對新的數(shù)據(jù)生成預(yù)測
classes = model.predict(x_test, batch_size=128)
在每一層辣往,我們使用“Dense”兔院,這意味著單元全連接。在隱藏層中站削,我們使用ReLU函數(shù)坊萝,因?yàn)檫@在大多數(shù)情況下會產(chǎn)生令人滿意的結(jié)果。
優(yōu)化器optimizer,它可以是現(xiàn)有優(yōu)化器的字符串標(biāo)識符许起,如rmsprop或adagrad十偶,也可以是 Optimizer 類的實(shí)例≡跋福可以自己寫優(yōu)化器設(shè)置優(yōu)化器的參數(shù)惦积,例如:optimizer=keras.optimizers.SGD(learning_rate=xxx).
損失函數(shù)loss,模型試圖最小化的目標(biāo)函數(shù)猛频。它可以是現(xiàn)有損失函數(shù)的字符串標(biāo)識符狮崩,如categorical_crossentropy或mse,也可以是一個(gè)目標(biāo)函數(shù)鹿寻。
評估標(biāo)準(zhǔn)metrics厉亏。對于任何分類問題,你都希望將其設(shè)置為metrics = ['accuracy']烈和。評估標(biāo)準(zhǔn)可以是現(xiàn)有的標(biāo)準(zhǔn)的字符串標(biāo)識符,也可以是自定義的評估標(biāo)準(zhǔn)函數(shù)皿淋。
# 多分類問題model.compile(optimizer='rmsprop',
? ? ? ? ? ? ? loss='categorical_crossentropy',
? ? ? ? ? ? ? metrics=['accuracy'])
# 二分類問題model.compile(optimizer='rmsprop',
? ? ? ? ? ? ? loss='binary_crossentropy',
? ? ? ? ? ? ? metrics=['accuracy'])
# 均方誤差回歸問題model.compile(optimizer='rmsprop',
? ? ? ? ? ? ? loss='mse')
#在分類時(shí)有時(shí)需要將y數(shù)據(jù)轉(zhuǎn)換為one-hot編碼招刹,one_hot_labels = keras.utils.to_categorical(labels, num_classes=10)
keras保存模型:盡量不要使用pickle,可以使用model.save(filepath).
keras加載模型:keras.model.load_model(filepath)
keras只保存權(quán)重信息:model.save_weights().加載權(quán)重信息:model.load_weights()
示例
主要輸入接收新聞標(biāo)題本身窝趣,即一個(gè)整數(shù)序列(每個(gè)整數(shù)編碼一個(gè)詞)疯暑。
這些整數(shù)在 1 到 10,000 之間(10,000 個(gè)詞的詞匯表),且序列長度為 100 個(gè)詞哑舒。
from keras.layers import Input, Embedding, LSTM, Dense
from keras.models import Mode
l# 標(biāo)題輸入:接收一個(gè)含有 100 個(gè)整數(shù)的序列妇拯,每個(gè)整數(shù)在 1 到 10000 之間。# 注意我們可以通過傳遞一個(gè) "name" 參數(shù)來命名任何層洗鸵。
main_input = Input(shape=(100,), dtype='int32', name='main_input')
# Embedding 層將輸入序列編碼為一個(gè)稠密向量的序列Embedding描述的是一種功能:數(shù)據(jù)降維和稠密表示(≈向量化)越锈,且通常所指的Embedding是中間的產(chǎn)物,為了方便后面的處理膘滨,# 每個(gè)向量維度為 512甘凭。
x = Embedding(output_dim=512, input_dim=10000, input_length=100)(main_input)
# LSTM 層把向量序列轉(zhuǎn)換成單個(gè)向量,# 它包含整個(gè)序列的上下文信息
lstm_out = LSTM(32)(x)