在騰訊大廈聽了周志華老師團(tuán)隊(duì)的報(bào)告,主要講機(jī)器學(xué)習(xí)的下一步研究?jī)?nèi)容娩井。其中有一些比較個(gè)人覺得挺有趣的名詞谐檀。
機(jī)器學(xué)習(xí)的魯棒性(robustness of machine learning):機(jī)器學(xué)習(xí)曾經(jīng)只是為了輔助人類決策,而隨著應(yīng)用深入铁追,人們對(duì)機(jī)器學(xué)習(xí)的要求越來越高咳燕,甚至要好于人類勿决。在這個(gè)情況下,機(jī)器學(xué)習(xí)對(duì)算法的魯棒性有了更高的要求招盲。是一個(gè)值得深入的研究方向低缩。這里還順帶批評(píng)了一下深度學(xué)習(xí)在處理問題上的一些非魯棒性的問題。
多標(biāo)記學(xué)習(xí)的細(xì)節(jié)(multi-label learning):人對(duì)事物的標(biāo)簽是含糊的曹货,這體現(xiàn)在標(biāo)記的多義性和非互斥性咆繁,如何對(duì)標(biāo)記的關(guān)聯(lián)性、錯(cuò)誤性進(jìn)行機(jī)器學(xué)習(xí)顶籽?傳統(tǒng)的方法是 one-vs-rest 的方式進(jìn)行二分類編碼玩般,訓(xùn)練N個(gè)分類器,而實(shí)際上這樣做忽略了標(biāo)簽之間的關(guān)聯(lián)性礼饱,還導(dǎo)致標(biāo)記不平衡的問題坏为。
-
標(biāo)記分布學(xué)習(xí)應(yīng)用(label distribution learning):這部分是我比較感興趣的,感覺是一種貝葉斯的方法看待問題慨仿。生活中有很多事情都不是絕對(duì)的久脯,他們可能或多或少屬于某一個(gè)類別。與其學(xué)習(xí)標(biāo)簽镰吆,不如學(xué)習(xí)標(biāo)記分布。
另外舉了3個(gè)和標(biāo)記分布有關(guān)的應(yīng)用:因?yàn)槿藗儷C奇的心里特點(diǎn)跑慕,電影評(píng)分的非正態(tài)分布比平均分的預(yù)測(cè)更有參考價(jià)值——爭(zhēng)議大的可能對(duì)票房更有幫助万皿。利用心理學(xué)家對(duì)標(biāo)記的先驗(yàn)分布在表情的情感分析得出表情隱含的意義。這讓我想起以前做的幾個(gè)分類應(yīng)用核行,例如公交線路選乘牢硅、購(gòu)物行為預(yù)測(cè)、點(diǎn)擊預(yù)測(cè)等芝雪,負(fù)樣本實(shí)際上都是模糊的减余。不買也可能是對(duì)方根本沒看到而不是不感興趣。
半監(jiān)督學(xué)習(xí)和圖學(xué)習(xí)(semi-supervise learning):如果判斷事物的標(biāo)記很困難的時(shí)候惩系,如何進(jìn)行監(jiān)督學(xué)習(xí)位岔?利用無標(biāo)記樣本是更廉價(jià)的方法如筛,但是也會(huì)導(dǎo)致學(xué)習(xí)偏差的問題,加入了無標(biāo)記的樣本抒抬,可能還會(huì)導(dǎo)致分類正確性的降低杨刨。