推薦系統(tǒng) —— LFM隱語義模型

前言

本文是推薦系統(tǒng)系列的第三篇了,主要來講一下 LFM 算法贤笆,與之前一樣蝇棉,注重原理方面,不會在算術(shù)上多做糾結(jié)芥永,以方便快速理解該算法

什么是 LFM篡殷?

一種基于矩陣分解的用來預(yù)測用戶對物品興趣度的推薦算法

這里大概只是我自己的理解,其具體定義埋涧,還真沒找到板辽。。棘催。

LFM 原理

在談LFM前劲弦,我們先來看下這么一種大白話推薦方法:

  • 假設(shè)我們知道用戶A對于帶有 喜劇,動漫標(biāo)簽的電影感興趣程度分別是 0.8 和 0.9
  • 現(xiàn)在我們有一部電影 《熊出沒》醇坝,其對應(yīng)標(biāo)簽 喜劇邑跪,動漫 的符合程度分別是 0.85 和 0.95
  • 那么我們就可以推測 用戶A 對 《熊出沒》的喜歡程度是 R = 0.8 * 0.85 + 0.9 * 0.95 = 1.535
    這種根據(jù) 用戶 和 物品 之間對應(yīng)的分類權(quán)重來衡量 用戶 對 物品 喜歡程度的方式就是 LFM 的原型

上面這種方式推薦方式有個(gè)問題就在于,如何給用戶打上合適的標(biāo)簽?zāi)兀坑秩绾谓o 物品 分好合適的類呢画畅?我們知道砸琅,這種任務(wù)是很難的。轴踱。症脂。至于為什么難,請自行腦補(bǔ)淫僻。诱篷。。哈哈雳灵,也正是因?yàn)榉诸惖睦щy棕所,所以才有了我們的 LFM 算法,我們完全可以從 用戶 對 物品 產(chǎn)生的行為细办,來實(shí)現(xiàn)對 物品 和 用戶的 自動分類橙凳;

  • 我們收集到的數(shù)據(jù)蕾殴,一般都是 用戶 對 物品的 打分笑撞;

    user item1 item2 item3
    A 2 3 0
    B 3 4 1
    C 0 3 5
  • 現(xiàn)在我們假設(shè)有 K 個(gè)分類,然后就可以讓 LFM 幫我們把 用戶 和 物品 進(jìn)行自動分到這 K 個(gè)類中

  • 那么怎么分呢钓觉?
    我們以 用戶A 和 item1 為例茴肥,從數(shù)據(jù)上我們知道 用戶A 對 item1 的打分是 2
    假設(shè) 用戶A 對分類 K_i 的喜歡程度為 p_i
    假設(shè) item1 對分類 K_i的符合程度為 q_i
    那么我們就可以推測 用戶A 對 item1 的打分 ps
    ps = \sum_{i=0}^K{p_i}{q_i}
    真實(shí)打分 2 和 我們預(yù)測的打分 ps 越接近,我們則認(rèn)為我們的分類越可靠

    ok荡灾!上面應(yīng)該還是很好看懂的瓤狐。。批幌。我們可以將上面的公式泛化一下就可以得到 用戶u 對于 物品w 的打分的預(yù)測公式:
    ps_{uw} = \sum_{i=0}^K{p_{ui}}{q_{wi}}
    其中:
    ps_{uw}: 用戶u 對于 物品w 的預(yù)測打分
    p_{ui}:用戶u 喜歡 分類 K_i 的程度
    q_{wi}:物品w 對分類 K_i 的符合程度
    K :分類數(shù)目

    這里我們假設(shè) 用戶u 對于 物品w 的真實(shí)打分為 rs_{uw},那么衡量 真實(shí)打分 和 預(yù)測打分 的差距就可以用他們的 平方和的大小础锐,即可得下面公式
    \sum (ps_{uw} - rs_{uw})^2

    當(dāng)然為了模型得泛化能力,可能需要再加一些正則化的尾巴荧缘。皆警。。為了加快計(jì)算截粗,可能還需要將公式做一些向量化處理信姓。。绸罗。等等一些機(jī)器學(xué)習(xí)方面通用規(guī)則就不一一提了意推,這里主要還是講解 LFM 的原理為主。最后就是一個(gè)梯度下降法求解的問題了,將上面的公式作為我們的目標(biāo)函數(shù)珊蟀,通過梯度下降法就可以求出 用戶對每個(gè)分類的喜好程度 以及 物品對于分類的符合程度菊值,即公式中的 p_{ui}q_{wi},這也就是說,LFM 最后就是 給每個(gè)用戶 和 物品 都進(jìn)行了分類腻窒,盡管這個(gè)分類你并不知道他叫什么略步。。定页。趟薄。這也正是 隱語義的 含義了。

ok典徊,原理方面就說到這里了杭煎,文中公式主要是為了理解而寫的,很多地方不是很標(biāo)準(zhǔn)卒落,更不能作為算法的實(shí)現(xiàn)來用羡铲,如果你想要標(biāo)準(zhǔn)的公式,相信隨便搜一搜就可以找到了儡毕!

LFM的優(yōu)劣勢

  • 從 LFM 的原型上就知道也切,該算法具有比較好的理論基礎(chǔ)。這種做法很符合我們的思維方式
  • 非常節(jié)省空間腰湾,比較我們前面講到的協(xié)同過濾算法,在用戶 和 物品 數(shù)量都很大的情況下雷恃,LFM 無疑是可以節(jié)省大量空間的。
  • 計(jì)算復(fù)雜度上略高于 協(xié)同過濾费坊,但是還是在一個(gè)量級
  • LFM 不適合做實(shí)時(shí)推薦算法倒槐,因?yàn)樗荒茴A(yù)測 用戶對物品的打分,如果單一的LFM推薦附井,無疑將要多所有物品進(jìn)行一次打分才能得出哪些物品需要推薦讨越,想當(dāng)然的我們就知道,這個(gè)肯定不是一個(gè)短時(shí)間能做到的任務(wù)永毅,而相對的把跨, 用 LFM 來做推薦系統(tǒng)的精排部分倒是挺合適的。
  • 不具備較好的解釋性沼死,雖然看起來是分類了着逐,但是其實(shí)這些分類是什么,還是很難說的漫雕。不過就我實(shí)際來看滨嘱,其分類很多時(shí)候還是具有不錯(cuò)的解釋性的。反正你一眼大概也能看出浸间,每個(gè)分類的屬性太雨,但是確實(shí)會有一些很難解釋明白

ok,就到這里啦魁蒜,還是比較簡單的一種推薦算法囊扳,嗯吩翻,應(yīng)該說,原理比較簡單的算法锥咸。狭瞎。。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末搏予,一起剝皮案震驚了整個(gè)濱河市熊锭,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌雪侥,老刑警劉巖碗殷,帶你破解...
    沈念sama閱讀 217,657評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異速缨,居然都是意外死亡锌妻,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,889評論 3 394
  • 文/潘曉璐 我一進(jìn)店門旬牲,熙熙樓的掌柜王于貴愁眉苦臉地迎上來仿粹,“玉大人,你說我怎么就攤上這事原茅】岳” “怎么了?”我有些...
    開封第一講書人閱讀 164,057評論 0 354
  • 文/不壞的土叔 我叫張陵员咽,是天一觀的道長毒涧。 經(jīng)常有香客問我贮预,道長贝室,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,509評論 1 293
  • 正文 為了忘掉前任仿吞,我火速辦了婚禮滑频,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘唤冈。我一直安慰自己峡迷,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,562評論 6 392
  • 文/花漫 我一把揭開白布你虹。 她就那樣靜靜地躺著绘搞,像睡著了一般。 火紅的嫁衣襯著肌膚如雪傅物。 梳的紋絲不亂的頭發(fā)上夯辖,一...
    開封第一講書人閱讀 51,443評論 1 302
  • 那天,我揣著相機(jī)與錄音董饰,去河邊找鬼蒿褂。 笑死圆米,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的啄栓。 我是一名探鬼主播娄帖,決...
    沈念sama閱讀 40,251評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼昙楚!你這毒婦竟也來了近速?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,129評論 0 276
  • 序言:老撾萬榮一對情侶失蹤堪旧,失蹤者是張志新(化名)和其女友劉穎数焊,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體崎场,經(jīng)...
    沈念sama閱讀 45,561評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡佩耳,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,779評論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了谭跨。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片干厚。...
    茶點(diǎn)故事閱讀 39,902評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖螃宙,靈堂內(nèi)的尸體忽然破棺而出蛮瞄,到底是詐尸還是另有隱情,我是刑警寧澤谆扎,帶...
    沈念sama閱讀 35,621評論 5 345
  • 正文 年R本政府宣布挂捅,位于F島的核電站,受9級特大地震影響堂湖,放射性物質(zhì)發(fā)生泄漏闲先。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,220評論 3 328
  • 文/蒙蒙 一无蜂、第九天 我趴在偏房一處隱蔽的房頂上張望伺糠。 院中可真熱鬧,春花似錦斥季、人聲如沸训桶。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,838評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽舵揭。三九已至,卻和暖如春躁锡,著一層夾襖步出監(jiān)牢的瞬間午绳,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,971評論 1 269
  • 我被黑心中介騙來泰國打工稚铣, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留箱叁,地道東北人墅垮。 一個(gè)月前我還...
    沈念sama閱讀 48,025評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像耕漱,于是被迫代替她去往敵國和親算色。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,843評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 你是否想過:如果有一天螟够,我們的環(huán)境由于各種原因差到讓我們無法在此生存灾梦,我們該怎么辦呢?想想看我們身邊堆積成山的垃圾...
    FunnyLU閱讀 237評論 0 1
  • 佛陀在臨涅槃前妓笙,曾告誡眾弟子說:“我不住此涅槃后若河,直至年數(shù)八之久,鄔堅(jiān)地域西北界寞宫,達(dá)納郭熙海林中萧福,蓮花莖干花蕊上,...
    白瑪延畔閱讀 1,982評論 0 6
  • 或許聊天以后才能明白什么是思念辈赋,不是因?yàn)闆]話聊才不打電話鲫忍,而是因?yàn)樘肽钜种撇蛔⊙蹨I。 在漫山遍野花開滿地的時(shí)候钥屈,...
    無聊的水母閱讀 415評論 1 2
  • 請思考什么是積極主動悟民,積極主動的語言有哪些,它與成長型思維有什么共同之處篷就? 積極主動不僅是指行事的態(tài)度射亏,還意味著人...
    簡悅健身閱讀 357評論 0 3
  • 2019,我們相見了竭业,昨晚為了迎接你智润,我和一群朋友相聚在廣場上,倒數(shù)十秒來接你永品。 你款款而來做鹰,如約而來,很開心遇到...
    嘗酥品甜閱讀 289評論 0 0