UniformML:trick1 負采樣Negative Sampling

在訓練word2vec的時候贡未,會介紹到兩種模型優(yōu)化方式:

  1. Hierarchical Softmax
  2. Negative Sampling

由于softmax在實際訓練過程中需要構(gòu)建一棵樹种樱,在比較少出現(xiàn)的類別對應的節(jié)點比較深蒙袍,實際工程也比較麻煩,所以目前很多模型優(yōu)化方法都采用負采樣的方式嫩挤,今天我們就簡單介紹這種方法害幅。

以word2vec為例子,已知中心詞w為我們預測的詞語岂昭,對應上下文的信息context(w)則為2c長度的詞語矫限,我們希望通過context(w)來預測w。

我們隨機采樣n個和w不相等的負樣本佩抹,這些負樣本和w共同組成一組訓練樣本,對于正例取董,我們希望最大化概率:
max P(context(w^+), w^+)
對于負例棍苹,我們希望最小化概率
min P(context(w^+), w^{-}_i)
i=1,2,...,n
統(tǒng)一用最大化形式表示得到
max\ P(context(w^+), w^+)\prod_{i=1}^{n}(1-P(context(w^+), w^-_i))
我們假設正例用i=0表示,則上述公式可以表示為:

L = P(context(w_0),w_0)\prod_{i=1}^{n}{(1-P(context(w_0),w_i))}
= \sigma(x_{w_0}^T\theta^{w_0})\prod_{i=1}^{n}{(1-\sigma(x_{w_0}^T\theta^{w_i}))}
=\prod_{i=0}^{n}\sigma(x_{w_0}^T\theta^{w_i})^{y_i}{(1-\sigma(x_{w_0}^T\theta^{w_i}))^{1-y_i}}
logL =\sum_{i=0}^{n} y_ilog(\sigma(x_{w_0}^T\theta^{w_i}))+{(1-y_i)log(1-\sigma(x_{w_0}^T\theta^{w_i}))}

然后對\theta求導
\frac{\partial L}{\partial \theta^{w_i}} =y_i\frac{\sigma(1-\sigma)x^T_{w_0}}{\sigma}+(1-y_i)\frac{-\sigma(1-\sigma)}{1-\sigma}x^T_{w_0}
=(y_i-\sigma)x^T_{w_0}
=(y_i-\sigma(x^T_{w_0}\theta^{w_i}))x^T_{w_0}

對x求導
\frac{\partial L}{\partial x^{w_0}} =\sum_{i=0}^{n}[y_i-\sigma(x^T_{w_0}\theta^{w_i})]\theta^{w_i}

然然后采用梯度下降法可以進行\theta\ and \ x_{w_i}的學習茵汰。
在word2vec中枢里,這里學習到的w表示的是context(w)的平均向量之和,如果繼續(xù)采用鏈式法則蹂午,可以得到每個詞向量的解栏豺,這里的\theta表示每個詞類別的邏輯回歸分類參數(shù)。

負采樣的訓練方式在訓練word2vec的時候非常高效豆胸,相當于原來一個大的softmax分類改成多個邏輯回歸奥洼,提高訓練的效率。

負采樣這個訓練方式一般在改進的word2vec方法中都有用到晚胡,另外在softmax面臨多個分類的時候也可以用到(例如大家熟悉的fasttext)

我會在后續(xù)經(jīng)典論文解讀中介紹用到negative sampling的相關(guān)論文

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末灵奖,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子估盘,更是在濱河造成了極大的恐慌瓷患,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,290評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件遣妥,死亡現(xiàn)場離奇詭異擅编,居然都是意外死亡,警方通過查閱死者的電腦和手機箫踩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,107評論 2 385
  • 文/潘曉璐 我一進店門爱态,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人班套,你說我怎么就攤上這事肢藐。” “怎么了吱韭?”我有些...
    開封第一講書人閱讀 156,872評論 0 347
  • 文/不壞的土叔 我叫張陵吆豹,是天一觀的道長鱼的。 經(jīng)常有香客問我,道長痘煤,這世上最難降的妖魔是什么凑阶? 我笑而不...
    開封第一講書人閱讀 56,415評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮衷快,結(jié)果婚禮上宙橱,老公的妹妹穿的比我還像新娘。我一直安慰自己蘸拔,他們只是感情好师郑,可當我...
    茶點故事閱讀 65,453評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著调窍,像睡著了一般宝冕。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上邓萨,一...
    開封第一講書人閱讀 49,784評論 1 290
  • 那天地梨,我揣著相機與錄音,去河邊找鬼缔恳。 笑死宝剖,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的歉甚。 我是一名探鬼主播万细,決...
    沈念sama閱讀 38,927評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼纸泄!你這毒婦竟也來了雅镊?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,691評論 0 266
  • 序言:老撾萬榮一對情侶失蹤刃滓,失蹤者是張志新(化名)和其女友劉穎仁烹,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體咧虎,經(jīng)...
    沈念sama閱讀 44,137評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡卓缰,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,472評論 2 326
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了砰诵。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片征唬。...
    茶點故事閱讀 38,622評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖茁彭,靈堂內(nèi)的尸體忽然破棺而出总寒,到底是詐尸還是另有隱情,我是刑警寧澤理肺,帶...
    沈念sama閱讀 34,289評論 4 329
  • 正文 年R本政府宣布摄闸,位于F島的核電站善镰,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏年枕。R本人自食惡果不足惜炫欺,卻給世界環(huán)境...
    茶點故事閱讀 39,887評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望熏兄。 院中可真熱鬧品洛,春花似錦、人聲如沸摩桶。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽硝清。三九已至岛宦,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間耍缴,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工挽霉, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留防嗡,地道東北人。 一個月前我還...
    沈念sama閱讀 46,316評論 2 360
  • 正文 我出身青樓侠坎,卻偏偏與公主長得像蚁趁,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子实胸,可洞房花燭夜當晚...
    茶點故事閱讀 43,490評論 2 348

推薦閱讀更多精彩內(nèi)容