Keras中Masking和padding的使用

? ? ? ?Keras中用于masking以及padding的兩個函數(shù)分別是keras.preprocessing.sequence.pad_sequences(sequences, maxlen=None, dtype='int32', padding='pre', truncating='pre', value=0.0)以及keras.layers.Masking(mask_value=0.0)践宴。
? ? ? ?pad_sequences用于將序列填充到相同的長度对室。可以將一個由num_samples個序列(每個序列又是一個整數(shù)的列表,每個數(shù)字對應(yīng)詞典中的詞的ID)構(gòu)成的列表轉(zhuǎn)化為一個形狀為(num_samples, num_timesteps)的二維numpy數(shù)組宇色。num_timesteps這個量可以由參數(shù)maxlen來控制;如果maxlen為None嘲恍,那么num_timesteps默認(rèn)為原來的序列當(dāng)中最長那個序列的長度息堂。相應(yīng)的嚷狞,如果序列長度小于num_timesteps,那么就在其后填充0直到長度為num_timesteps荣堰。如果序列長于num_timesteps感耙,將會被削短。填充或者是削短的位置由參數(shù)padding和truncating的值來控制持隧,默認(rèn)填充位置在序列開始位置之前即硼。
? ? ? ?幾個傳入?yún)?shù)的說明:
? ? ? ?sequences: List of lists, where each element is a sequence.
? ? ? ?maxlen: Int, maximum length of all sequences.
? ? ? ?dtype: Type of the output sequences. To pad sequences with variable length strings, you can use object.
? ? ? ?padding: String, 'pre' or 'post': pad either before or after each sequence.
? ? ? ?truncating: String, 'pre' or 'post': remove values from sequences larger than maxlen, either at the beginning or at the end of the sequences.
? ? ? ?value: Float or String, padding value.
? ? ? ?舉一個簡單的例子:

input:
seqs = [[1,2,3,4],[2,3,4,5,6,6,6]] # list of integar lists

op:
K.preprocessing.sequence.pad_sequences(a, maxlen=10, dtype='int32', padding='pre', truncating='pre', value=0.0)

output:
array([[0, 0, 0, 0, 0, 0, 1, 2, 3, 4],[0, 0, 0, 2, 3, 4, 5, 6, 6, 6]])

? ? ? ?keras.layers.Masking(mask_value=0.0)是用于對值為指定值的位置進行掩蔽的操作,以忽略對應(yīng)的timestep屡拨。在輸入張量的每個時刻(即輸入張量的第一個維度)只酥,如果輸入張量在這一時刻的所有值都等于指定的mask_value,那么這一時刻將會在接下來的下游層都會被跳過(只要其支持masking操作)呀狼。如果下游層不支持masking操作裂允,那么就會報錯。
? ? ? ?舉例如下:考慮一個numpy數(shù)據(jù)x哥艇,其具有(samples, timesteps, features)的形狀绝编。這組數(shù)據(jù)將會被送入到LSTM層中。由于數(shù)據(jù)缺乏貌踏,想要掩蔽第三個和第五個時刻十饥,首先應(yīng)當(dāng)將數(shù)據(jù)操作如下:

x[:, 3, :] = 0.
x[:, 5, :] = 0.

然后,在原來的基礎(chǔ)上添加掩蔽層:

model = Sequential()
model.add(Masking(mask_value=0., input_shape=(timesteps, features)))
model.add(LSTM(32))
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末祖乳,一起剝皮案震驚了整個濱河市逗堵,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌眷昆,老刑警劉巖蜒秤,帶你破解...
    沈念sama閱讀 211,123評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異亚斋,居然都是意外死亡作媚,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,031評論 2 384
  • 文/潘曉璐 我一進店門帅刊,熙熙樓的掌柜王于貴愁眉苦臉地迎上來纸泡,“玉大人,你說我怎么就攤上這事厚掷〉茏疲” “怎么了?”我有些...
    開封第一講書人閱讀 156,723評論 0 345
  • 文/不壞的土叔 我叫張陵冒黑,是天一觀的道長田绑。 經(jīng)常有香客問我,道長抡爹,這世上最難降的妖魔是什么掩驱? 我笑而不...
    開封第一講書人閱讀 56,357評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮冬竟,結(jié)果婚禮上欧穴,老公的妹妹穿的比我還像新娘。我一直安慰自己泵殴,他們只是感情好涮帘,可當(dāng)我...
    茶點故事閱讀 65,412評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著笑诅,像睡著了一般调缨。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上吆你,一...
    開封第一講書人閱讀 49,760評論 1 289
  • 那天弦叶,我揣著相機與錄音,去河邊找鬼妇多。 笑死伤哺,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的者祖。 我是一名探鬼主播立莉,決...
    沈念sama閱讀 38,904評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼七问!你這毒婦竟也來了桃序?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,672評論 0 266
  • 序言:老撾萬榮一對情侶失蹤烂瘫,失蹤者是張志新(化名)和其女友劉穎媒熊,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體坟比,經(jīng)...
    沈念sama閱讀 44,118評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡芦鳍,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,456評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了葛账。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片柠衅。...
    茶點故事閱讀 38,599評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖籍琳,靈堂內(nèi)的尸體忽然破棺而出菲宴,到底是詐尸還是另有隱情贷祈,我是刑警寧澤,帶...
    沈念sama閱讀 34,264評論 4 328
  • 正文 年R本政府宣布喝峦,位于F島的核電站势誊,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏谣蠢。R本人自食惡果不足惜粟耻,卻給世界環(huán)境...
    茶點故事閱讀 39,857評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望眉踱。 院中可真熱鬧挤忙,春花似錦、人聲如沸谈喳。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,731評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽婿禽。三九已至茄厘,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間谈宛,已是汗流浹背次哈。 一陣腳步聲響...
    開封第一講書人閱讀 31,956評論 1 264
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留吆录,地道東北人窑滞。 一個月前我還...
    沈念sama閱讀 46,286評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像恢筝,于是被迫代替她去往敵國和親哀卫。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,465評論 2 348