Syntagmatic 關系發(fā)現(xiàn):條件熵

Neil Zhu,簡書ID Not_GOD,University AI 創(chuàng)始人 & Chief Scientist责鳍,致力于推進世界人工智能化進程。制定并實施 UAI 中長期增長戰(zhàn)略和目標榆俺,帶領團隊快速成長為人工智能領域最專業(yè)的力量。
作為行業(yè)領導者坞淮,他和UAI一起在2014年創(chuàng)建了TASA(中國最早的人工智能社團), DL Center(深度學習知識中心全球價值網(wǎng)絡)茴晋,AI growth(行業(yè)智庫培訓)等,為中國的人工智能人才建設輸送了大量的血液和養(yǎng)分回窘。此外诺擅,他還參與或者舉辦過各類國際性的人工智能峰會和活動,產(chǎn)生了巨大的影響力啡直,書寫了60萬字的人工智能精品技術內(nèi)容烁涌,生產(chǎn)翻譯了全球第一本深度學習入門書《神經(jīng)網(wǎng)絡與深度學習》,生產(chǎn)的內(nèi)容被大量的專業(yè)垂直公眾號和媒體轉載與連載酒觅。曾經(jīng)受邀為國內(nèi)頂尖大學制定人工智能學習規(guī)劃和教授人工智能前沿課程撮执,均受學生和老師好評。

Syntagmatic 關系發(fā)現(xiàn):條件熵

Paste_Image.png

如果我們關于 Text segment 知道的更多呢舷丹?

預測問題:“meat” 出現(xiàn)在這個 segment 中么抒钱?

Paste_Image.png
  • “eats”的出現(xiàn)幫助“meat”出現(xiàn)預測么?
  • 會降低關于“meat”的不確定性么颜凯,ie谋币,H(X_{meat})?

或者如果我們知道“eats”沒有出現(xiàn)的知識症概,會有類似的幫助么蕾额?

條件熵

Paste_Image.png

條件熵:完備定義

Paste_Image.png

一般來說,對于任何的離散隨機變量 X 和 Y穴豫,我們有 H(X) >= H(X|Y)
那么 H(X|Y) 最小可能的值是什么凡简?

使用條件熵來刻畫 syntagmatic 關系

Paste_Image.png

哪個更小精肃?H(X_meat | X_the) 還是 H(X_meat | X_eats)?
對于哪個詞 w帜乞,H(X_meat | X_w) 能取到其最小值(0)司抱?
對于哪個詞 w,H(X_meat | X_w) 能取到其最大值黎烈,H(X_meat)习柠?

用來挖掘 syntagmatic 關系的條件熵

  • 對每個詞 W1
  • 對每個其他詞 W2匀谣,計算條件熵 H(X_W1 | X_W2)
  • 對所有候選詞按照 H(X_W1 | X_W2) 進行升序排序
  • 選擇前面的候選詞作為潛在的于 W1 有 syntagmatic 關系
  • 然而,盡管 H(X_W1 | X_W2) 和 H(X_W1 | X_W3) 是可比得资溃, H(X_W1 | X_W2) 和 H(X_W3 | X_W2) 卻不可以武翎!

** 我們?nèi)绾文軌驈囊粋€ collection 中挖掘出 最強 K 個 syntagmatic 關系**

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市溶锭,隨后出現(xiàn)的幾起案子宝恶,更是在濱河造成了極大的恐慌,老刑警劉巖趴捅,帶你破解...
    沈念sama閱讀 218,525評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件垫毙,死亡現(xiàn)場離奇詭異,居然都是意外死亡拱绑,警方通過查閱死者的電腦和手機综芥,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,203評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來猎拨,“玉大人膀藐,你說我怎么就攤上這事『焓。” “怎么了消请?”我有些...
    開封第一講書人閱讀 164,862評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長类腮。 經(jīng)常有香客問我臊泰,道長,這世上最難降的妖魔是什么蚜枢? 我笑而不...
    開封第一講書人閱讀 58,728評論 1 294
  • 正文 為了忘掉前任缸逃,我火速辦了婚禮,結果婚禮上厂抽,老公的妹妹穿的比我還像新娘需频。我一直安慰自己,他們只是感情好筷凤,可當我...
    茶點故事閱讀 67,743評論 6 392
  • 文/花漫 我一把揭開白布昭殉。 她就那樣靜靜地躺著,像睡著了一般藐守。 火紅的嫁衣襯著肌膚如雪挪丢。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,590評論 1 305
  • 那天卢厂,我揣著相機與錄音乾蓬,去河邊找鬼。 笑死慎恒,一個胖子當著我的面吹牛任内,可吹牛的內(nèi)容都是我干的撵渡。 我是一名探鬼主播,決...
    沈念sama閱讀 40,330評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼死嗦,長吁一口氣:“原來是場噩夢啊……” “哼趋距!你這毒婦竟也來了?” 一聲冷哼從身側響起越除,我...
    開封第一講書人閱讀 39,244評論 0 276
  • 序言:老撾萬榮一對情侶失蹤节腐,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后廊敌,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體铜跑,經(jīng)...
    沈念sama閱讀 45,693評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,885評論 3 336
  • 正文 我和宋清朗相戀三年骡澈,在試婚紗的時候發(fā)現(xiàn)自己被綠了锅纺。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,001評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡肋殴,死狀恐怖囤锉,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情护锤,我是刑警寧澤官地,帶...
    沈念sama閱讀 35,723評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站烙懦,受9級特大地震影響驱入,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜氯析,卻給世界環(huán)境...
    茶點故事閱讀 41,343評論 3 330
  • 文/蒙蒙 一亏较、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧掩缓,春花似錦雪情、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,919評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至舍哄,卻和暖如春宴凉,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蠢熄。 一陣腳步聲響...
    開封第一講書人閱讀 33,042評論 1 270
  • 我被黑心中介騙來泰國打工跪解, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人签孔。 一個月前我還...
    沈念sama閱讀 48,191評論 3 370
  • 正文 我出身青樓叉讥,卻偏偏與公主長得像,于是被迫代替她去往敵國和親饥追。 傳聞我的和親對象是個殘疾皇子图仓,可洞房花燭夜當晚...
    茶點故事閱讀 44,955評論 2 355

推薦閱讀更多精彩內(nèi)容