Large-Scale Music Annotation and Retrieval:Learning to Rank in Joint Semantic Spaces

這篇文章主要介紹聯(lián)合多個(gè)空間(下面介紹有哪些空間)進(jìn)行學(xué)習(xí)艾扮,使用learning to rank 訓(xùn)練得到排序函數(shù)谒主,完成音樂方面的預(yù)測(cè)任務(wù)
每一個(gè)預(yù)測(cè)任務(wù)可任務(wù)是一個(gè)空間:
1.Artist prediction:輸入一首歌曲,或一個(gè)音樂片段也拜,返回一個(gè)有序的歌手列表
2.Song prediction:輸入一個(gè)歌手以舒,返回一個(gè)有序的歌曲列表
3.Similar Artists:輸入一個(gè)歌手,返回一個(gè)有序的相似歌手列表
4.Similar Songs:輸入一首歌曲慢哈,返回一個(gè)有序的相似歌曲的列表
5.Tag prediction:輸入一首歌曲蔓钟,返回一個(gè)適合該歌曲的標(biāo)簽列表

模型結(jié)構(gòu):
文章假設(shè)跟音樂相關(guān)的歌曲,歌手卵贱,標(biāo)簽都可以用一個(gè)d維的向量來(lái)表征滥沫,兩個(gè)向量的相似性用點(diǎn)積(dot product)來(lái)衡量

歌手:
對(duì)于一個(gè)給定的歌手,下標(biāo)用j表示侣集,j ∈ 1, . . . , |A|,這個(gè)歌手的特征向量表示為:
ΦA(chǔ)rtist(i):{1,...,|A|}→Rd = Ai
其中A = [A1,...,A|A|] ,A是一個(gè)d × |A|大小的矩陣兰绣,d表示用于表征歌手特征向量的維度世分, |A|表示歌手的個(gè)數(shù),矩陣A將在學(xué)習(xí)中獲得

標(biāo)簽:
相似的缀辩,對(duì)于一個(gè)標(biāo)簽臭埋,用j表示下標(biāo),j ∈ 1, . . . , |T |,這個(gè)標(biāo)簽的特征向量表示為:
ΦTag(i):{1,...,|T|}→Rd = Ti
其中T = [T1,...,T|T|]雌澄,A是一個(gè)d × |T|大小的矩陣斋泄,d表示用于表征標(biāo)簽特征向量的維度, |T|表示標(biāo)簽的個(gè)數(shù)镐牺,矩陣T將在學(xué)習(xí)的獲得

歌曲:
最后炫掐,對(duì)于一首歌曲,其聲學(xué)特征向量用s′表示睬涧,我們使用線性轉(zhuǎn)移矩陣V募胃,將聲學(xué)特征轉(zhuǎn)移到d維向量上:
ΦSong(s′):R|S|→ Rd = Vs′
矩陣V是一個(gè)d × |S|大小的矩陣,矩陣V也將在學(xué)習(xí)階段獲得

這樣便獲得了歌手畦浓,歌曲痹束,標(biāo)簽的表征方法
實(shí)體類別

特征向量

大小

獲得方式

歌手

ΦA(chǔ)rtist(i)=Ai

d × |A|

A:學(xué)習(xí)獲得

歌曲

ΦTag(i)=Ti

d × |T|

T:學(xué)習(xí)獲得

標(biāo)簽

ΦSong(s′)=Vs′

d × |S|

V:學(xué)習(xí)獲得,s`聲學(xué)特征

那么針對(duì)之前提到的預(yù)測(cè)任務(wù)讶请,我們用f(x)表示排序函數(shù)祷嘶,例如Artist prediction:



其中候選的歌手i ∈ {1, . . . , |A|}會(huì)根據(jù)fi(x)的magnitude大小進(jìn)行排序,高的排在前面夺溢,對(duì)于其他的task也有相似的排序函數(shù):





從上面的排序函數(shù)中可以看出论巍,許多預(yù)測(cè)任務(wù)都含有相同的參數(shù)。例如song prediction 和 similar artist都用到歌手的特征矩陣A风响,tag prediction 和song prediction 都用到了線性轉(zhuǎn)移矩陣V嘉汰。因此,我們可以在多個(gè)任務(wù)下状勤,同時(shí)訓(xùn)練參數(shù)矩陣A,T,V,使得系統(tǒng)獲得更好的效果鞋怀。

訓(xùn)練模型:

multi-Task Training

假設(shè)任務(wù)是tag prediction 和artist prediction,可以將這兩個(gè)任務(wù)聯(lián)合起來(lái)訓(xùn)練參數(shù)持搜,目標(biāo)函數(shù)定義為:



這里err表示損失函數(shù)

文章中一共使用了兩種損失函數(shù):
1.AUC Marginine Ranking Loss


其中x表示輸入密似,y表示輸出(標(biāo)注集),這個(gè)損失函數(shù)考慮所有的可能的輸出葫盼,根據(jù)排序函數(shù)f計(jì)算magnitude残腌,只要k(不在標(biāo)注集的所有結(jié)果)的模大于標(biāo)注集里任意結(jié)果,或者兩者只差小于1,都會(huì)累加到損失結(jié)果中废累。如果兩個(gè)輸出結(jié)果的margin violation(損失函數(shù)值)相同,那這個(gè)兩個(gè)結(jié)果將被視為等同的脱盲。隨意這個(gè)損失函數(shù)在優(yōu)化前k個(gè)排序結(jié)果時(shí)邑滨,不太適用。

2.WARP Loss
*WARP Loss這個(gè)損失函數(shù)最初設(shè)計(jì)的時(shí)候用于學(xué)習(xí)得到矩陣參數(shù)钱反,給圖片打標(biāo)簽掖看,并且標(biāo)簽之間是沒有序的
這個(gè)損失函數(shù)定義為:



其中ranky(f(x))是通過矩陣函數(shù)f(x)計(jì)算得到的實(shí)際排名:



其中I()為指示函數(shù),I(True) = 1, I(False) = 0面哥,L()將這個(gè)排名轉(zhuǎn)換成一種懲罰度

接著原作者將指示函數(shù)做了調(diào)整哎壳,使用hinge loss,使得損失函數(shù)是代替指示函數(shù)連續(xù)的尚卫。(沒看懂)



其中|t|+表示正數(shù)部分归榕,如果t<0 ,則|t|+ = 0,
吱涉,表示帶有邊緣懲罰的排名刹泄,那么我們的目標(biāo)就是最小化風(fēng)險(xiǎn)函數(shù):

對(duì)于P(x,y)上的任意一點(diǎn)
,其中
怎爵,對(duì)整個(gè)風(fēng)險(xiǎn)函數(shù)的貢獻(xiàn)是:

使得改點(diǎn)的積分為0特石,一次來(lái)更新參數(shù)矩陣A,T,V

其中βt表示參數(shù)矩陣,βt+1表示更新后的參數(shù)矩陣鳖链。問章采用的就是這種隨機(jī)梯度下降的方式更新參數(shù)矩陣姆蘸,具體步驟如下:

其中

*疑問:這個(gè)隨時(shí)函數(shù)可以通過訓(xùn)練學(xué)習(xí)計(jì)算給定輸出情況下,哪些輸出合理芙委,但并沒有考慮輸出結(jié)果的順序

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末逞敷,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子题山,更是在濱河造成了極大的恐慌兰粉,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,509評(píng)論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件顶瞳,死亡現(xiàn)場(chǎng)離奇詭異玖姑,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)慨菱,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門焰络,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人符喝,你說(shuō)我怎么就攤上這事闪彼。” “怎么了?”我有些...
    開封第一講書人閱讀 163,875評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵畏腕,是天一觀的道長(zhǎng)缴川。 經(jīng)常有香客問我,道長(zhǎng)描馅,這世上最難降的妖魔是什么把夸? 我笑而不...
    開封第一講書人閱讀 58,441評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮铭污,結(jié)果婚禮上恋日,老公的妹妹穿的比我還像新娘。我一直安慰自己嘹狞,他們只是感情好岂膳,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,488評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著磅网,像睡著了一般谈截。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上知市,一...
    開封第一講書人閱讀 51,365評(píng)論 1 302
  • 那天傻盟,我揣著相機(jī)與錄音,去河邊找鬼嫂丙。 笑死娘赴,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的跟啤。 我是一名探鬼主播诽表,決...
    沈念sama閱讀 40,190評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼隅肥!你這毒婦竟也來(lái)了竿奏?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,062評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤腥放,失蹤者是張志新(化名)和其女友劉穎泛啸,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體秃症,經(jīng)...
    沈念sama閱讀 45,500評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡候址,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,706評(píng)論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了种柑。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片岗仑。...
    茶點(diǎn)故事閱讀 39,834評(píng)論 1 347
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖聚请,靈堂內(nèi)的尸體忽然破棺而出荠雕,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 35,559評(píng)論 5 345
  • 正文 年R本政府宣布炸卑,位于F島的核電站既鞠,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏盖文。R本人自食惡果不足惜损趋,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,167評(píng)論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望椅寺。 院中可真熱鬧,春花似錦蒋失、人聲如沸返帕。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,779評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)荆萤。三九已至,卻和暖如春铣卡,著一層夾襖步出監(jiān)牢的瞬間链韭,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,912評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工煮落, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留敞峭,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,958評(píng)論 2 370
  • 正文 我出身青樓蝉仇,卻偏偏與公主長(zhǎng)得像旋讹,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子轿衔,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,779評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容