基于深度學(xué)習(xí)的情感分析

一、傳統(tǒng)機器學(xué)習(xí)與深度學(xué)習(xí)

1茎辐、傳統(tǒng)機器學(xué)習(xí)方法

  • tf-idf
  • Topic Model(LDA)
  • SMT
  • ...

2、深度學(xué)習(xí)

  • CNN
    • TextCNN
    • FastText+TextCNN
    • CNN+RNN
    • ...
  • RNN
    • TextRNN
    • RNN+CNN
    • LSTM/GRU+RCNN
    • Seq2Seq+Attention
    • ...

二、模型(基于 Keras)

1贾节、TextCNN

  • 句子 maxlen 的確定(一般選定為語料中最大長度或平均長度為佳)
  • 卷積核大小(2/3/4/5)


    TextCNN 網(wǎng)絡(luò)結(jié)構(gòu).png
def text_cnn(maxlen=15, max_features=10000, embed_size=300):

    # input layers
    comment_seq = Input(shape=[maxlen], name='x_seq')
    # Embeddings layers
    emb_comment = Embedding(max_features, embed_size)(comment_seq)
    # conv layers
    convs = []
    filter_sizes = [2, 3, 4, 5]
    for fsz in filter_sizes:
        l_conv = Conv1D(filters=100, kernel_size=fsz, activation='relu')(emb_comment)
        l_pool = MaxPooling1D(maxlen - fsz + 1)(l_conv)
        l_pool = Flatten()(l_pool)
        convs.append(l_pool)
    merge = concatenate(convs, axis=1)
    # out = Dropout(0.1)(merge)
    output = Dense(64, activation='relu')(merge)
    output = Dense(units=1, activation='sigmoid')(output)

    model = Model([comment_seq], output)
    model.compile(loss="binary_crossentropy", optimizer=optimizers.RMSprop(lr=1e-4), metrics=['acc'])
    return model

2、TextRNN

循環(huán)神經(jīng)網(wǎng)絡(luò)彌補卷積神經(jīng)網(wǎng)絡(luò)中卷積核大小固定,導(dǎo)致了卷積神經(jīng)網(wǎng)絡(luò)無法抽取到與當(dāng)前詞距離更長的詞信息表達苇侵。經(jīng)驗表明,循環(huán)神經(jīng)網(wǎng)絡(luò)更適于自然語言處理問題斤程,能夠更好表達文本或語句上下文信息。

TextRNN 網(wǎng)絡(luò)結(jié)構(gòu)圖.png

輸入詞向量的最后一維對應(yīng)的輸出直接作為預(yù)測分類的基準(zhǔn)菩混,這樣設(shè)計的好處節(jié)省訓(xùn)練時間忿墅,同時也因為通過 LSTM 編碼的最后一層的隱藏層輸出已經(jīng)攜帶了前后所有序列的信息表達,因此效果尚佳墨吓。

3球匕、CRNN

CRNN 模型是基于 CNN 和 RNN 的拼接式神經(jīng)網(wǎng)絡(luò),其中 CNN 主要用于文本特征抽取帖烘,RNN 主要用于后續(xù)基于全局序列的情感分類亮曹。


CRNN 結(jié)構(gòu)圖.png
def text_c_lstm(num_labels=1,maxlen=15, max_features=10000, embed_size=300):
    model=Sequential()
    model.add(Embedding(max_features, embed_size, input_length=maxlen))
    model.add(Conv1D(256, 3, padding='same', strides=1))
    model.add(Activation('relu'))
    model.add(MaxPooling1D(pool_size=2))
    model.add(GRU(32, dropout=0.2, recurrent_dropout=0.1, return_sequences=True))
    model.add(GRU(32, dropout=0.2, recurrent_dropout=0.1))
    model.add(Dense(num_labels,activation='sigmoid'))
    model.compile(loss="binary_crossentropy", optimizer=optimizers.RMSprop(lr=1e-4), metrics=['acc'])
    return model

CRNN 結(jié)構(gòu)與編碼器-解碼器(Encoder-Decoder)結(jié)構(gòu)非常相似,用 CNN 的卷積 + relu + 池化操作作為編碼器秘症,其輸出作為解碼器 LSTM 的輸入照卦,最終仍然經(jīng)過 Softmax 得出最終概率值。

三乡摹、模型優(yōu)化與思考

  • 訓(xùn)練時間方面役耕,標(biāo)準(zhǔn)化基于正態(tài)分布的平移和拉伸,其變換的目的在于把每個值向后續(xù)要進行的非線性變化區(qū)域靠近聪廉,從而使所有梯度值的計算不至于停留在飽和區(qū)域(梯度值接近于 0 )瞬痘,進而加快模型訓(xùn)練和收斂速度。
  • 泛化能力方面板熊,考慮訓(xùn)練樣本的正負比例框全,及其樣本的多樣性以及正負樣本間打亂的程度

四、個性化輔導(dǎo)

*如果需要輔導(dǎo)干签,請私聊
如果需要輔導(dǎo)津辩,請私聊
如果需要輔導(dǎo),請私聊

四、參考資料

  • 《美團機器學(xué)習(xí)實踐——評論挖掘》
  • 《A C-LSTM Neural Network for Text Classification》
  • 《Convolutional Neural Networks for Sentence Classification》
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末喘沿,一起剝皮案震驚了整個濱河市闸度,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌蚜印,老刑警劉巖莺禁,帶你破解...
    沈念sama閱讀 212,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異晒哄,居然都是意外死亡睁宰,警方通過查閱死者的電腦和手機肪获,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,755評論 3 385
  • 文/潘曉璐 我一進店門寝凌,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人孝赫,你說我怎么就攤上這事较木。” “怎么了青柄?”我有些...
    開封第一講書人閱讀 158,369評論 0 348
  • 文/不壞的土叔 我叫張陵伐债,是天一觀的道長。 經(jīng)常有香客問我致开,道長峰锁,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,799評論 1 285
  • 正文 為了忘掉前任双戳,我火速辦了婚禮虹蒋,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘飒货。我一直安慰自己魄衅,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,910評論 6 386
  • 文/花漫 我一把揭開白布塘辅。 她就那樣靜靜地躺著晃虫,像睡著了一般。 火紅的嫁衣襯著肌膚如雪扣墩。 梳的紋絲不亂的頭發(fā)上哲银,一...
    開封第一講書人閱讀 50,096評論 1 291
  • 那天,我揣著相機與錄音呻惕,去河邊找鬼荆责。 笑死,一個胖子當(dāng)著我的面吹牛蟆融,可吹牛的內(nèi)容都是我干的草巡。 我是一名探鬼主播,決...
    沈念sama閱讀 39,159評論 3 411
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼山憨!你這毒婦竟也來了查乒?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,917評論 0 268
  • 序言:老撾萬榮一對情侶失蹤郁竟,失蹤者是張志新(化名)和其女友劉穎玛迄,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體棚亩,經(jīng)...
    沈念sama閱讀 44,360評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡蓖议,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,673評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了讥蟆。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片勒虾。...
    茶點故事閱讀 38,814評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖瘸彤,靈堂內(nèi)的尸體忽然破棺而出修然,到底是詐尸還是另有隱情,我是刑警寧澤质况,帶...
    沈念sama閱讀 34,509評論 4 334
  • 正文 年R本政府宣布愕宋,位于F島的核電站,受9級特大地震影響结榄,放射性物質(zhì)發(fā)生泄漏中贝。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,156評論 3 317
  • 文/蒙蒙 一臼朗、第九天 我趴在偏房一處隱蔽的房頂上張望邻寿。 院中可真熱鬧,春花似錦依溯、人聲如沸老厌。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽枝秤。三九已至,卻和暖如春慷嗜,著一層夾襖步出監(jiān)牢的瞬間淀弹,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,123評論 1 267
  • 我被黑心中介騙來泰國打工庆械, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留薇溃,地道東北人。 一個月前我還...
    沈念sama閱讀 46,641評論 2 362
  • 正文 我出身青樓缭乘,卻偏偏與公主長得像沐序,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,728評論 2 351

推薦閱讀更多精彩內(nèi)容