基于內(nèi)容的新聞推薦

? ? ? ? 基于內(nèi)容的個性化新聞推薦系統(tǒng)可以分為三層: 語義處理層梳侨、興趣模型層和用戶交互層. 在語義處理層主要通過語義處理完成新聞分類; 在興趣模型層主要實現(xiàn)興趣模型的建立與更新,以及興趣的發(fā)現(xiàn)與新聞推薦; 在用戶交互層記錄用戶的相關(guān)行為信息,為用戶興趣模型的更新提供依據(jù).如下圖所示

? ? ? ? ?用特征項的頻數(shù)權(quán)重與其所屬對象權(quán)重之積來描述該特征項的權(quán)重,并將權(quán)重大于某一閾值的前 n 個關(guān)鍵詞作為該文檔的特征項,以此建立新聞文檔的特征模型. 新聞文檔模型采用向量空間模型表示篓冲,:NDMi = { ( T1,W1 ) 宠哄,( T2壹将,W2 ) …( Tn,Wn ) }其中毛嫉,NDMi 表示第 i 個新聞文檔的特征模型诽俯,Tj表示該新聞文檔的第 j 個特征項,Wj表示此特征項 Tj在該文檔中的權(quán)重. 在該模型中承粤,閾值取得越大暴区,特征項越少,計算越簡單辛臊,分類也越粗糙;閾值越小仙粱,特征項越多,計算越復(fù)雜彻舰,分類越精準(zhǔn).特征項取多少合適伐割,這與個體的興趣取向的維度有關(guān)系。


? ? ? ? ? 用戶興趣模型表示用戶對信息的穩(wěn)定需求刃唤,能夠反應(yīng)用戶在一段時間內(nèi)對新聞的主要傾向.用戶興趣模型在個性化推薦系統(tǒng)中起到核心作用隔心,真實地表現(xiàn)了用戶的偏好,在很大程度上決定個性化推薦的效果. 用戶興趣模型有一個動態(tài)更新的過程尚胞,更新依據(jù)主要是用戶行為信息. 良好的用戶興趣模型有利于個性化推薦硬霍,本文設(shè)計的用戶興趣模型具有指向性和持久性. 用戶興趣模型亦用向量空間模型表示,在結(jié)構(gòu)上與新聞文檔模型一致笼裳,如式( 3) :UIMi = { ( C1唯卖,W1 ) ,( C2躬柬,W2 ) …( Cn耐床,Wn ) }其中,UIMi表示用戶 Ui的用戶興趣模型楔脯,Cj表示用戶感興趣的類別,Wj表示該用戶對該類別感興趣的程度胯甩,即權(quán)重. 如: { ( 軍事昧廷,0. 2) 堪嫂,( 經(jīng)濟,0.1) 木柬,( 食品安全皆串,0. 2) ,……} .


? ? ? 基于內(nèi)容的個性化新聞推薦興趣模型. 并依據(jù)該模型進行新聞推薦眉枕,同時根據(jù)用戶的行為對用戶興趣模型動態(tài)更新. 這樣用戶可以不用花時間從大量的新聞中去尋找自己感興趣的新聞.用戶興趣模型和新聞文檔模型都是基于向量空間的表示方法恶复,利用向量空間模型的相似度計算得到與用戶興趣模型匹配的新聞文檔集,并完成新聞推薦. 關(guān)鍵代碼見下圖

基于pytion 語言的訓(xùn)練測試速挑,十萬行紀(jì)錄經(jīng)過去重后谤牡,前三分之二作為訓(xùn)練集 后面的紀(jì)錄作為測試集。

? ? ? 推薦系統(tǒng)向用戶推薦新聞姥宝,可以向同一用戶推薦多條新聞翅萤,也可以向多個用戶推薦同一新聞.不同的用戶收到新聞后,會表現(xiàn)出不同的興趣度腊满,其具體表現(xiàn)在用戶的不同的眼神和面部肌肉表情中. 對于系統(tǒng)向用戶推薦的新聞套么,假設(shè)共得到 n 人次的用戶體驗,且第 i 人次用戶體驗的興趣度為Ii ( 已進行了歸一化處理) 碳蛋,則定義推薦系統(tǒng)的推薦效率即命中率 h 為:h = 1n ∑ni = 1Ii該式表明胚泌,系統(tǒng)推薦命中率的計算總是從第一條信息開始的. 初期的較低的推薦命中率對后期的推薦命中率有較大的影響. 總的說來,推薦系統(tǒng)的命中率高肃弟,則推薦效率高玷室,用戶體驗好。

所用技術(shù)和工具: IDEA(java IDE) ?pycharm(pytion IDE)愕乎、jieba分詞工具 +盤古分詞阵苇、mathematics ?數(shù)學(xué)實驗工具.Numbers

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市感论,隨后出現(xiàn)的幾起案子绅项,更是在濱河造成了極大的恐慌,老刑警劉巖比肄,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件快耿,死亡現(xiàn)場離奇詭異,居然都是意外死亡芳绩,警方通過查閱死者的電腦和手機掀亥,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來妥色,“玉大人搪花,你說我怎么就攤上這事。” “怎么了撮竿?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵吮便,是天一觀的道長。 經(jīng)常有香客問我幢踏,道長髓需,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任房蝉,我火速辦了婚禮僚匆,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘搭幻。我一直安慰自己咧擂,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布粗卜。 她就那樣靜靜地躺著屋确,像睡著了一般。 火紅的嫁衣襯著肌膚如雪续扔。 梳的紋絲不亂的頭發(fā)上攻臀,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天,我揣著相機與錄音纱昧,去河邊找鬼刨啸。 笑死,一個胖子當(dāng)著我的面吹牛识脆,可吹牛的內(nèi)容都是我干的设联。 我是一名探鬼主播,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼灼捂,長吁一口氣:“原來是場噩夢啊……” “哼离例!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起悉稠,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤宫蛆,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后的猛,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體耀盗,經(jīng)...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年卦尊,在試婚紗的時候發(fā)現(xiàn)自己被綠了叛拷。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,096評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡岂却,死狀恐怖忿薇,靈堂內(nèi)的尸體忽然破棺而出裙椭,到底是詐尸還是另有隱情,我是刑警寧澤煌恢,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布骇陈,位于F島的核電站,受9級特大地震影響瑰抵,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜器联,卻給世界環(huán)境...
    茶點故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一二汛、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧拨拓,春花似錦肴颊、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至醋界,卻和暖如春竟宋,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背形纺。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工丘侠, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人逐样。 一個月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓蜗字,卻偏偏與公主長得像,于是被迫代替她去往敵國和親脂新。 傳聞我的和親對象是個殘疾皇子挪捕,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內(nèi)容