Opinion mining and sentiment analysis: Sentiment Classification

Neil Zhu,簡書ID Not_GOD,University AI 創(chuàng)始人 & Chief Scientist,致力于推進世界人工智能化進程虎眨。制定并實施 UAI 中長期增長戰(zhàn)略和目標,帶領團隊快速成長為人工智能領域最專業(yè)的力量镶摘。
作為行業(yè)領導者嗽桩,他和UAI一起在2014年創(chuàng)建了TASA(中國最早的人工智能社團), DL Center(深度學習知識中心全球價值網(wǎng)絡),AI growth(行業(yè)智庫培訓)等凄敢,為中國的人工智能人才建設輸送了大量的血液和養(yǎng)分碌冶。此外,他還參與或者舉辦過各類國際性的人工智能峰會和活動贡未,產(chǎn)生了巨大的影響力种樱,書寫了60萬字的人工智能精品技術內容,生產(chǎn)翻譯了全球第一本深度學習入門書《神經(jīng)網(wǎng)絡與深度學習》俊卤,生產(chǎn)的內容被大量的專業(yè)垂直公眾號和媒體轉載與連載嫩挤。曾經(jīng)受邀為國內頂尖大學制定人工智能學習規(guī)劃和教授人工智能前沿課程,均受學生和老師好評消恍。

情感分類

當我們知道 觀點持有者岂昭、目標、內容和上下文的時候狠怨,就可以嘗試進行 觀點的情感分析了

任務的定義

  • 輸入: 包含觀點的文本對象
  • 輸出:觀點的標簽
  • 極性分析:如 正面 反面 中立约啊;{5, 4, 3, 2, 1}
  • 情感分析:如 高興 悲傷 恐懼 憤怒 驚奇 反感
  • 這是文本分類一種特殊情形:任何文本分類的方法都可以被用作情感分類
  • 更多的提升
  • 更加細致精密的特征選擇
  • 考慮分類的順序(ordinal regression)

經(jīng)常使用的文本特征

  • 字符的n-gram:可以混合使用不同的 n
  • 更加通用,不受拼寫識別的錯誤影響佣赖,但是相比于詞區(qū)分度低
  • 詞的n-gram:可以混合使用不同的 n
  • unigram 不適合情感分類(比如 it's not good 或者 it's not as good as)
  • 長的 n-gram 區(qū)分度好恰矩,但也會造成 過匹配
  • POS tag n-gram:將詞和位置的tag混合使用
  • 如 “ADJECTIVE NOUN” 或者 great NOUN
  • 詞的類別
  • 語法(=POS tag)
  • 語義概念:如 thesaurus/ontology, 已經(jīng)識別的實體
  • 經(jīng)驗上的詞聚類(e.g., cluster of paradigmatically or syntagmatically related words)
  • 文本中頻繁模式(如 頻繁詞集合,collocations)
  • 比詞更加具體和具有區(qū)分度
  • 比純的 n-gram 泛化性更好
  • 分析樹(頻繁的子樹憎蛤,路徑)
  • 更加具有區(qū)分度外傅,不過也需解決過匹配的問題
  • 模式發(fā)現(xiàn)算法在特征構造的過程中非常有用

NLP 增強了文本表示,獲得更加復雜的特征

Paste_Image.png

用作文本分類的特征構造

  • 特征設計顯著影響分類的準確性
  • 機器學習俩檬、誤差分析和領域知識的并用更加有效
  • 領域知識:種子特征 特征空間
  • 機器學習:特征選擇 特征學習
  • 誤差分析:特征驗證
  • NLP 增強了文本的表示:特征空間(更可能會過匹配)
  • 優(yōu)化 the tradeoff between exhaustivity and specificity
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末萎胰,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子棚辽,更是在濱河造成了極大的恐慌技竟,老刑警劉巖,帶你破解...
    沈念sama閱讀 223,002評論 6 519
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件屈藐,死亡現(xiàn)場離奇詭異榔组,居然都是意外死亡,警方通過查閱死者的電腦和手機估盘,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,357評論 3 400
  • 文/潘曉璐 我一進店門瓷患,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人遣妥,你說我怎么就攤上這事擅编。” “怎么了箫踩?”我有些...
    開封第一講書人閱讀 169,787評論 0 365
  • 文/不壞的土叔 我叫張陵爱态,是天一觀的道長。 經(jīng)常有香客問我境钟,道長锦担,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,237評論 1 300
  • 正文 為了忘掉前任慨削,我火速辦了婚禮洞渔,結果婚禮上套媚,老公的妹妹穿的比我還像新娘。我一直安慰自己磁椒,他們只是感情好堤瘤,可當我...
    茶點故事閱讀 69,237評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著浆熔,像睡著了一般本辐。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上医增,一...
    開封第一講書人閱讀 52,821評論 1 314
  • 那天慎皱,我揣著相機與錄音,去河邊找鬼叶骨。 笑死茫多,一個胖子當著我的面吹牛,可吹牛的內容都是我干的忽刽。 我是一名探鬼主播地梨,決...
    沈念sama閱讀 41,236評論 3 424
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼缔恳!你這毒婦竟也來了宝剖?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 40,196評論 0 277
  • 序言:老撾萬榮一對情侶失蹤歉甚,失蹤者是張志新(化名)和其女友劉穎万细,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體纸泄,經(jīng)...
    沈念sama閱讀 46,716評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡赖钞,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,794評論 3 343
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了聘裁。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片雪营。...
    茶點故事閱讀 40,928評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖衡便,靈堂內的尸體忽然破棺而出献起,到底是詐尸還是另有隱情,我是刑警寧澤镣陕,帶...
    沈念sama閱讀 36,583評論 5 351
  • 正文 年R本政府宣布谴餐,位于F島的核電站,受9級特大地震影響呆抑,放射性物質發(fā)生泄漏岂嗓。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,264評論 3 336
  • 文/蒙蒙 一鹊碍、第九天 我趴在偏房一處隱蔽的房頂上張望厌殉。 院中可真熱鬧食绿,春花似錦、人聲如沸公罕。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,755評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽熏兄。三九已至,卻和暖如春树姨,著一層夾襖步出監(jiān)牢的瞬間摩桶,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,869評論 1 274
  • 我被黑心中介騙來泰國打工帽揪, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留硝清,地道東北人。 一個月前我還...
    沈念sama閱讀 49,378評論 3 379
  • 正文 我出身青樓转晰,卻偏偏與公主長得像芦拿,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子查邢,可洞房花燭夜當晚...
    茶點故事閱讀 45,937評論 2 361

推薦閱讀更多精彩內容