揭秘深度學(xué)習(xí):“弱監(jiān)督”下的神經(jīng)排序模型

作者:紀(jì)尚宏? 班級(jí):1402019 學(xué)號(hào):14020199038

【嵌牛導(dǎo)讀】:近年來唯竹,無監(jiān)督的深度神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺技術(shù)、自然語言處理和語音識(shí)別任務(wù)上都已經(jīng)取得了很大的進(jìn)步,而在信息檢索的排序上卻仍在原地踏步徒像,沒有太大的改進(jìn)。

【嵌牛鼻子:深度學(xué)習(xí) 弱監(jiān)督 神經(jīng)排序模型 信息檢索

【嵌牛提問】:弱監(jiān)督是什么蛙讥,什么是神經(jīng)排序模型

【嵌牛正文】:近年來锯蛀,無監(jiān)督的深度神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺技術(shù)、自然語言處理和語音識(shí)別任務(wù)上都已經(jīng)取得了很大的進(jìn)步次慢,而在信息檢索的排序上卻仍在原地踏步旁涤,沒有太大的改進(jìn)。

其中的原因可能在于排序問題本身的復(fù)雜性迫像,因?yàn)樵跊]有監(jiān)督信號(hào)的情況下劈愚,神經(jīng)網(wǎng)絡(luò)很難從查詢內(nèi)容和文檔中獲取信息。因此闻妓,我們?cè)谶@篇文章中提出了使用“弱監(jiān)督”來訓(xùn)練神經(jīng)排序模型菌羽。也就是說,所有訓(xùn)練所需的標(biāo)簽都是機(jī)器自己獲取的由缆,不存在任何人工輸入的標(biāo)簽注祖。

為此猾蒂,我們把一個(gè)“無監(jiān)督”排序模型的輸出結(jié)果,比如BM25是晨,當(dāng)做一個(gè)“弱監(jiān)督”模型的信號(hào)來使用婚夫。

接下來,我們會(huì)進(jìn)一步基于“前饋神經(jīng)網(wǎng)絡(luò)”對(duì)一系列簡(jiǎn)單卻十分高效的排序模型進(jìn)行訓(xùn)練署鸡。我們還會(huì)考察它們?cè)诓煌挠?xùn)練場(chǎng)景下的效果,例如:使用不同的輸入表征(密集/稀疏表征向量限嫌,或者是“嵌入”文字表征)靴庆,分別訓(xùn)練“逐點(diǎn)模型”和“成對(duì)模型”。

我們能夠從無監(jiān)督IR模型中輕易地獲得“弱標(biāo)記數(shù)據(jù)”怒医,實(shí)驗(yàn)的結(jié)果反映炉抒,提前對(duì)大量的“弱標(biāo)記數(shù)據(jù)”進(jìn)行訓(xùn)練,對(duì)有監(jiān)督的神經(jīng)排序模型非常有益稚叹。

我們調(diào)查的三個(gè)主要問題:

問題一:?jiǎn)螒{來自無監(jiān)督IR模型的標(biāo)簽作為弱監(jiān)督訓(xùn)練數(shù)據(jù)焰薄,比如BM25,有可能完成一個(gè)神經(jīng)排序模型的訓(xùn)練嗎扒袖?

問題二:在這樣的情況下塞茅,什么樣的輸入表征和學(xué)習(xí)目標(biāo)是最適合模型訓(xùn)練的?

問題三:弱監(jiān)督的操作過程季率,尤其是在標(biāo)記數(shù)據(jù)有限的情況下野瘦,能否優(yōu)化有監(jiān)督的學(xué)習(xí)模型?

排序的體系結(jié)構(gòu)

我們對(duì)三種神經(jīng)排序模型進(jìn)行了嘗試:

1飒泻、分?jǐn)?shù)模型

這種架構(gòu)實(shí)際上是一個(gè)預(yù)測(cè)“查詢文檔”組合的檢索分?jǐn)?shù)的逐點(diǎn)排序模型鞭光。專業(yè)地來說,這種架構(gòu)的目標(biāo)就是掌握一個(gè)“分?jǐn)?shù)功能”泞遗,這一功能能夠決定一個(gè)“查詢文檔”的檢索分?jǐn)?shù)惰许。我們可以用線性回歸圖來大致地表示這個(gè)問題:

2、排序模型

與第一種“分?jǐn)?shù)模型”相同的是史辙,“排序模型”的目標(biāo)也是掌握“分?jǐn)?shù)功能”汹买。但不同的是,“排序模型”并不是為了使分?jǐn)?shù)搜索功能標(biāo)準(zhǔn)化髓霞。因此我們?cè)凇芭判蚰P汀钡挠?xùn)練中使用了“雙情境”卦睹。

具體來說就是我們?cè)谟?xùn)練中使用了兩個(gè)參數(shù)相同的逐點(diǎn)模型。為了最大程度地降低損耗方库,我們更新了其中的參數(shù):

在推導(dǎo)過程中结序,由于兩個(gè)模型是完全一樣的,我們只取了其中一個(gè)作為最終的分?jǐn)?shù)功能模型纵潦,并且把經(jīng)過訓(xùn)練的模型以逐點(diǎn)的方式使用徐鹤。

3垃环、試驗(yàn)排序模型

第三種排序架構(gòu)的基礎(chǔ)是一個(gè)包括訓(xùn)練和推導(dǎo)的“雙情境”。這種模型是為了學(xué)習(xí)包含一個(gè)查詢內(nèi)容和兩個(gè)文檔(d1和d2)的“排序功能”而設(shè)計(jì)的返敬。根據(jù)查詢內(nèi)容遂庄,模型會(huì)預(yù)測(cè)d1文檔排名高于d2文檔的可能性。這個(gè)問題可以用回歸圖大致表達(dá):

輸入表征

輸入層表征能夠把一個(gè)輸入的“查詢文檔組合”用一個(gè)固定大小的向量表示出來劲赠,接著涛目,這個(gè)固定大小的向量就會(huì)被輸入至完全的連接層。

在實(shí)驗(yàn)中凛澎,我們對(duì)三種不同的輸入層表征展開了研究:

1霹肝、密集向量表征

一個(gè)常規(guī)的密集向量表征涵蓋了各種各樣的輸入“查詢文檔組合”的數(shù)據(jù)信息。我們還特別建立了一個(gè)包含BM25特征的密集向量表征塑煎,讓網(wǎng)絡(luò)在收到相同輸入的時(shí)候沫换,也能適應(yīng)BM25公式中所描述的功能。

2最铁、稀疏向量表征

現(xiàn)在讯赏,我們?cè)囍蝗ス苣切﹥H包含聚合數(shù)據(jù)的、完全是特制的表征冷尉,讓機(jī)器自己幫我們完成特征的提取漱挎。通過提取查詢內(nèi)容和文檔中的詞頻向量,我們專門建立了一個(gè)“詞袋”表征网严,并且將這三個(gè)向量的串聯(lián)輸入至網(wǎng)絡(luò)中识樱。

3、“嵌入”表征

前面兩種輸入表征最大的不足就在于震束,文字被當(dāng)成了離散的單元怜庸。正因?yàn)槿绱耍W(wǎng)絡(luò)無法在語義上相似的文字中執(zhí)行“軟匹配”垢村。在這一個(gè)輸入表征中割疾,我們依靠文字嵌入來達(dá)到一個(gè)更加強(qiáng)大的查詢文檔表征,一個(gè)能夠跨越詞法鴻溝的表征嘉栓。

機(jī)器能夠從訓(xùn)練數(shù)據(jù)中提取有識(shí)別力的信號(hào)宏榕,而這些輸入表征決定了網(wǎng)絡(luò)提取信號(hào)的能力,也決定了不同的網(wǎng)絡(luò)推廣行為侵佃。

不同的排序結(jié)構(gòu)的組合麻昼,以及不同的輸入表征都可以被納入排名模型的改進(jìn)方案。我們用了來自兩個(gè)標(biāo)準(zhǔn)集——同質(zhì)的新聞集(Robust)和一個(gè)大規(guī)模的異結(jié)構(gòu)網(wǎng)絡(luò)集(ClueWeb)——的超過六百萬個(gè)查詢和文檔馋辈,來進(jìn)行網(wǎng)絡(luò)訓(xùn)練抚芦。

我們的實(shí)驗(yàn)結(jié)果顯示,如果我們采用了恰當(dāng)?shù)哪繕?biāo)函數(shù),并且讓網(wǎng)絡(luò)根據(jù)“弱監(jiān)督數(shù)據(jù)”(實(shí)驗(yàn)排名模型+嵌入模型)來學(xué)習(xí)輸入表征叉抡,我們的網(wǎng)絡(luò)就能有非常出色的表現(xiàn)尔崔。

因?yàn)槲覀儍H使用了BM25作為模型訓(xùn)練的監(jiān)督,并且經(jīng)過訓(xùn)練的模型甚至還超越了BM25褥民,所以現(xiàn)在來說季春,模型的表現(xiàn)已經(jīng)非常了不起了。

一方面消返,盡管完全的“詞匹配”是檢索和排序的一個(gè)重要特征载弄,但它還不足以獲得相關(guān)性的概念。另一方面撵颊,BM25仍是一個(gè)相對(duì)高效的文字匹配方法侦锯。

如何工作

我們向我們的神經(jīng)網(wǎng)絡(luò)提供的雖然只是一些弱標(biāo)記的案例,但是我們成功地讓網(wǎng)絡(luò)超越了信號(hào)本身秦驯,并從不同的角度看到了這些案例中的相關(guān)性。

因此挣棕,當(dāng)“詞匹配”無法正確指示相關(guān)性的時(shí)候译隘,模型可以自己完成相關(guān)性的推導(dǎo)。舉個(gè)例子:學(xué)習(xí)密集表征(比如“嵌入表征”)能幫助網(wǎng)絡(luò)捕捉語義匹配洛心,檢測(cè)語義相關(guān)性固耘;而BM25就無法做到這些。

從我們的“弱監(jiān)督”模型訓(xùn)練實(shí)驗(yàn)中词身,我大致總結(jié)了一些關(guān)鍵信息:

主要內(nèi)容:利用大量的無監(jiān)督數(shù)據(jù)來推斷“弱標(biāo)簽”厅目,并把那些“弱標(biāo)簽”的弱信號(hào)用于有監(jiān)督模型的學(xué)習(xí)。

定一個(gè)能夠讓你的模型遠(yuǎn)離弱監(jiān)督數(shù)據(jù)缺陷的目標(biāo)法严。

讓機(jī)器自己決定采用哪種表征损敷,并讓它自己提取其中的特征。向機(jī)器人工輸入特征深啤,會(huì)扼殺模型的創(chuàng)造力拗馒!

如果輸入的特征數(shù)據(jù)是經(jīng)過設(shè)計(jì)的,那么模型的普遍性就很有可能會(huì)被削弱溯街,你可能會(huì)面臨“過度擬合”的問題诱桂。

假如你有足夠多的訓(xùn)練數(shù)據(jù),那么你的機(jī)器就能僅通過一個(gè)個(gè)本地的案例呈昔,輕松掌握全球范圍內(nèi)的信息挥等。

如果你有足夠的數(shù)據(jù)源,你可以學(xué)習(xí)與你的任務(wù)更加匹配的“嵌入”堤尾。通過不斷的更新肝劲,“嵌入”與你的任務(wù)會(huì)更加匹配。但前提是你有足夠多的數(shù)據(jù)源。

當(dāng)你的模型中不存在表征學(xué)習(xí)時(shí)涡相,神經(jīng)網(wǎng)絡(luò)中的非線性部分的用處不大哲泊。深度神經(jīng)網(wǎng)絡(luò)最重要的優(yōu)越性在于它高效的表征學(xué)習(xí)的能力,當(dāng)你的深度網(wǎng)絡(luò)“深”到一定程度的時(shí)候催蝗,它的優(yōu)越性就不起作用了切威。

來源:鈦媒體

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市丙号,隨后出現(xiàn)的幾起案子先朦,更是在濱河造成了極大的恐慌,老刑警劉巖犬缨,帶你破解...
    沈念sama閱讀 212,454評(píng)論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件喳魏,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡怀薛,警方通過查閱死者的電腦和手機(jī)刺彩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來枝恋,“玉大人创倔,你說我怎么就攤上這事》俾担” “怎么了畦攘?”我有些...
    開封第一講書人閱讀 157,921評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)十电。 經(jīng)常有香客問我知押,道長(zhǎng),這世上最難降的妖魔是什么鹃骂? 我笑而不...
    開封第一講書人閱讀 56,648評(píng)論 1 284
  • 正文 為了忘掉前任台盯,我火速辦了婚禮,結(jié)果婚禮上畏线,老公的妹妹穿的比我還像新娘爷恳。我一直安慰自己,他們只是感情好象踊,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,770評(píng)論 6 386
  • 文/花漫 我一把揭開白布温亲。 她就那樣靜靜地躺著,像睡著了一般杯矩。 火紅的嫁衣襯著肌膚如雪栈虚。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,950評(píng)論 1 291
  • 那天史隆,我揣著相機(jī)與錄音魂务,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛粘姜,可吹牛的內(nèi)容都是我干的鬓照。 我是一名探鬼主播,決...
    沈念sama閱讀 39,090評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼孤紧,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼豺裆!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起号显,我...
    開封第一講書人閱讀 37,817評(píng)論 0 268
  • 序言:老撾萬榮一對(duì)情侶失蹤臭猜,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后押蚤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蔑歌,經(jīng)...
    沈念sama閱讀 44,275評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,592評(píng)論 2 327
  • 正文 我和宋清朗相戀三年揽碘,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了次屠。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,724評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡雳刺,死狀恐怖帅矗,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情煞烫,我是刑警寧澤,帶...
    沈念sama閱讀 34,409評(píng)論 4 333
  • 正文 年R本政府宣布累颂,位于F島的核電站滞详,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏紊馏。R本人自食惡果不足惜料饥,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,052評(píng)論 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望朱监。 院中可真熱鬧岸啡,春花似錦、人聲如沸赫编。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,815評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽擂送。三九已至悦荒,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間嘹吨,已是汗流浹背搬味。 一陣腳步聲響...
    開封第一講書人閱讀 32,043評(píng)論 1 266
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人碰纬。 一個(gè)月前我還...
    沈念sama閱讀 46,503評(píng)論 2 361
  • 正文 我出身青樓萍聊,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親悦析。 傳聞我的和親對(duì)象是個(gè)殘疾皇子寿桨,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,627評(píng)論 2 350

推薦閱讀更多精彩內(nèi)容