推薦系統(tǒng)的主要方法
一层释、基于內(nèi)容的推薦算法
網(wǎng)絡(luò)基于內(nèi)容的推薦系統(tǒng)芜繁,也稱CB(Content-based Recommendations):根據(jù)用戶基于item時(shí)的歷史信息(如評(píng)分盾碗、評(píng)價(jià)鸳粉、分享富纸、和收藏過的文檔)構(gòu)造用戶偏好文檔审姓,計(jì)算推薦項(xiàng)目與用戶偏好文檔的相似度珍特,將最相似的項(xiàng)目推薦給用戶。例如魔吐,在書籍推薦中扎筒,基于內(nèi)容的系統(tǒng)首先分析用戶已經(jīng)購買過的打分比較高的書籍的共性(作者、風(fēng)格等)酬姆,再推薦與這些用戶感興趣的書籍內(nèi)容相似度高的其他電影嗜桌。再例如一個(gè)推薦飯店的系統(tǒng)可以依據(jù)某個(gè)用戶之前喜歡很多的烤肉店而為他推薦烤肉店。CB最早主要是應(yīng)用在信息檢索系統(tǒng)當(dāng)中辞色,所以很多信息檢索及信息過濾里的方法都能用于CB中症脂。CB中大致包括三步驟:
Item Representation;為每個(gè)item抽取出一些特征(也就是item的content了)來表示此item淫僻。
Profile Learning :用一個(gè)用戶過去的item的特征數(shù)據(jù)诱篷,來學(xué)習(xí)出此用戶的喜好特征(profile)。
Recommendation Generation雳灵;通過比較上一步得到的用戶profile與候選item的特征棕所,為此用戶推薦一組相關(guān)性最大的item。
真實(shí)應(yīng)用中的item往往都會(huì)有一些可以描述它的屬性悯辙。這些屬性通沉帐。可以分為兩種:結(jié)構(gòu)化的(structured)屬性與非結(jié)構(gòu)化的(unstructured)屬性。所謂結(jié)構(gòu)化的屬性就是這個(gè)屬性的意義比較明確躲撰,其取值限定在某個(gè)范圍针贬;而非結(jié)構(gòu)化的屬性往往其意義不太明確,取值也沒什么限制拢蛋,不好直接使用桦他。比如在交友網(wǎng)站上,item就是人谆棱,一個(gè)item會(huì)有結(jié)構(gòu)化屬性如身高快压、學(xué)歷、籍貫等垃瞧,也會(huì)有非結(jié)構(gòu)化屬性(如item自己寫的交友宣言蔫劣,博客內(nèi)容等等)。對(duì)于結(jié)構(gòu)化數(shù)據(jù)个从,我們自然可以拿來就用脉幢;但對(duì)于非結(jié)構(gòu)化數(shù)據(jù)(如文章)歪沃,我們往往要先把它轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)后才能在模型里加以使用。真實(shí)場(chǎng)景中碰到最多的非結(jié)構(gòu)化數(shù)據(jù)可能就是文章了(如個(gè)性化閱讀中)嫌松。將文本這種非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化成結(jié)構(gòu)行數(shù)據(jù)沪曙,常用的方法是IF-IDF(term frequency-inverse document frequency)[58]
1)基于item的特征學(xué)習(xí)
所有文章集合為,而所有文章中出現(xiàn)的詞的集合(對(duì)于中文章豆瘫,首先得對(duì)所有文章進(jìn)行分詞),也稱為詞典菊值,即外驱。也就是說,我們有篇要處理的文章腻窒,而這些文章里包含了個(gè)不同的詞昵宇。我們最終要使用一個(gè)向量來表示一篇文章,比如第篇文章被表示為儿子,其中表示第1個(gè)詞在文章中的權(quán)重瓦哎,值越大表示越重要叭喜;中其他向量的解釋類似瓣窄。所以洗贰,為了表示第篇文章桃犬,現(xiàn)在關(guān)鍵的就是如何計(jì)算各分量的值了陨瘩。例如啸盏,我們可以選取為1住诸,如果詞出現(xiàn)在第篇文章中暑脆;選取為0维咸,如果未出現(xiàn)在第篇文章中剂买。我們也可以選取為詞出現(xiàn)在第篇文章中的次數(shù)(frequency)。但是用的最多的計(jì)算方法還是信息檢索中常用的詞頻-逆文檔頻率(term frequency–inverse document frequency癌蓖,簡(jiǎn)稱)瞬哼。
2)基于用戶profile特征學(xué)習(xí)
假設(shè)用戶u已經(jīng)對(duì)一些item給出了他的喜好判斷,喜歡其中的一部分item租副,不喜歡其中的另一部分坐慰。那么,這一步要做的就是通過用戶u過去的這些喜好判斷用僧,為他產(chǎn)生一個(gè)模型讨越。有了這個(gè)模型,我們就可以根據(jù)此模型來判斷用戶u是否會(huì)喜歡一個(gè)新的item永毅。所以把跨,我們要解決的是一個(gè)典型的有監(jiān)督分類問題,應(yīng)用機(jī)器學(xué)習(xí)中的分類算法可以解決分類問題沼死。常用的分類機(jī)器學(xué)習(xí)算法有KNN着逐,決策樹,樸素貝葉斯,隨機(jī)森林耸别,支持向量機(jī)健芭,神經(jīng)網(wǎng)絡(luò)等。
最后通過通過用戶profile模型特征與item特征進(jìn)行相似度運(yùn)算秀姐,將得分高的Item推薦給用戶慈迈。基于內(nèi)容的推薦方法原理簡(jiǎn)單,推薦結(jié)果也易于理解;沒有流行度偏見省有;沒有冷啟動(dòng)問題;不需要慣用數(shù)據(jù),可以使用用戶內(nèi)容特性來提供解釋痒留。但是也存在一定的缺點(diǎn):對(duì)于物品的特征具有較高要求,對(duì)于視頻、音頻等這種多媒體資源無法進(jìn)行理想的推薦;推薦結(jié)果相對(duì)固定,用戶的個(gè)性化偏好在與內(nèi)容匹配度高時(shí)才能獲得推薦,很難為用戶發(fā)現(xiàn)新的感興趣信息;缺少多樣性蠢沿,新穎性伸头。
二、基于協(xié)同過濾的推薦算法
協(xié)同過濾推薦舷蟀,Collaborative Filtering Recommendations(簡(jiǎn)稱CF)是目前最流行的推薦方法,在研究界和工業(yè)界得到大量使用恤磷。很多有名的推薦系統(tǒng)都是利用協(xié)同過濾推薦策略,如Netflix的電影推薦系統(tǒng)、亞馬遜的商品推薦系統(tǒng)野宜、Tapestry郵件處理系統(tǒng)等扫步。協(xié)同過濾能夠基于一組興趣相同的用戶或項(xiàng)目進(jìn)行推薦,它根據(jù)鄰居用戶(與目標(biāo)用戶興趣相似的用戶)的偏好信息產(chǎn)生對(duì)目標(biāo)用戶的推薦列表。Schafer匈子,F(xiàn)rankowski等[74]曾提出锌妻,協(xié)同過濾推薦是“使用其他用戶的觀點(diǎn)來過濾和評(píng)價(jià)商品的過程”。這種協(xié)同過濾機(jī)制的主要目的在于根據(jù)已有數(shù)據(jù)之間的關(guān)系旬牲,計(jì)算用戶之間的相似度仿粹,找到有共同興趣愛好的用戶,從而產(chǎn)生推薦原茅。協(xié)同過濾簡(jiǎn)理解就是利用某興趣相投吭历、擁有共同經(jīng)驗(yàn)之群體的喜好來推薦用戶感興趣的信息,個(gè)人通過合作的機(jī)制給予信息相當(dāng)程度的回應(yīng)(如評(píng)分)并記錄下來以達(dá)到過濾的目的進(jìn)而幫助別人篩選信息擂橘,回應(yīng)(或評(píng)分)不一定局限于特別感興趣的晌区,特別不感興趣信息的紀(jì)錄也相當(dāng)重要。
協(xié)同過濾推薦算法一般可以分為基于用戶協(xié)同推薦(User-based Collaborative Filtering)通贞、基于物品協(xié)同推薦(Item -Based Collaborative Filtering)和基于模型的系統(tǒng)推薦(Model-Based Collaborative Filtering)朗若。協(xié)同過濾是在海量數(shù)據(jù)中挖掘出小部分與你品味類似的用戶,在協(xié)同過濾中昌罩,這些用戶成為鄰居哭懈,然后根據(jù)他們喜歡的東西組織成一個(gè)排序的目錄推薦給你。關(guān)于協(xié)同過濾的一個(gè)最經(jīng)典的例子就是看電影茎用,有時(shí)候不知道哪一部電影是我們喜歡的或者評(píng)分比較高的遣总,那么通常的做法就是問問周圍的朋友睬罗,看看最近有什么好的電影推薦。在問的時(shí)候旭斥,都習(xí)慣于問跟自己口味差不多的朋友容达,這就是協(xié)同過濾的核心思想。簡(jiǎn)單的說就是:人以類聚垂券,物以群分花盐。
1、基于用戶的協(xié)同過濾算法(user-based collaboratIve filtering)
基于用戶的協(xié)同過濾算法是通過用戶的歷史行為數(shù)據(jù)發(fā)現(xiàn)用戶對(duì)商品或內(nèi)容的喜歡(如商品購買菇爪,收藏算芯,內(nèi)容評(píng)論或分享),并對(duì)這些喜好進(jìn)行度量和打分娄帖。根據(jù)不同用戶對(duì)相同商品或內(nèi)容的態(tài)度和偏好程度計(jì)算用戶之間的關(guān)系也祠。在有相同喜好的用戶間進(jìn)行商品推薦昙楚。簡(jiǎn)單的說就是如果A,B兩個(gè)用戶都購買了x,y,z三本圖書近速,并且給出了5星的好評(píng)。那么A和B就屬于同一類用戶堪旧∠鞔校可以將A看過的圖書w也推薦給用戶B。
協(xié)同過濾推薦算法的核心是尋找目標(biāo)用戶的最近鄰居是User-based協(xié)同過濾推薦算法淳梦,其所找到的鄰居質(zhì)量和尋找的效率,直接影響整個(gè)推薦算法的推薦質(zhì)量和推薦效率析砸。User-based協(xié)同過濾推薦算法的主要工作內(nèi)容是,用戶偏好搜索并進(jìn)行相似度度量爆袍,最近鄰居查詢首繁,預(yù)測(cè)評(píng)分,為相似的用戶提供推薦物品陨囊。
2弦疮、基于物品的協(xié)同過濾算法(item-based collaborative filtering)
基于物品的協(xié)同過濾算法與基于用戶的協(xié)同過濾算法很像,將商品和用戶互換蜘醋。通過計(jì)算不同用戶對(duì)不同物品的評(píng)分獲得物品間的關(guān)系胁塞。基于物品間的關(guān)系對(duì)用戶進(jìn)行相似物品的推薦压语。這里的評(píng)分代表用戶對(duì)商品的態(tài)度和偏好啸罢。簡(jiǎn)單來說就是如果用戶A同時(shí)購買了商品1和商品2,那么說明商品1和商品2的相關(guān)度較高胎食。當(dāng)用戶B也購買了商品1時(shí)扰才,可以推斷他也有購買商品2的需求。
Item-Based協(xié)同過濾算法的核心是計(jì)算Item間的相似度厕怜,來預(yù)測(cè)用戶評(píng)分训桶。主要通過用戶評(píng)分?jǐn)?shù)據(jù)累驮、計(jì)算Item相似度矩陣,主要的工作:1.尋找相似的物品舵揭,2并選擇相似性度量方式計(jì)算相似性谤专,3為用戶提供基于相似物品的推薦。
3午绳、基于模型的協(xié)同過濾
基于模型的協(xié)同過濾作為目前最主流的協(xié)同過濾類型之一置侍,其相關(guān)算法非常多,這里針對(duì)其思想做一個(gè)歸類概括拦焚。這里有m個(gè)物品蜡坊,m個(gè)用戶的數(shù)據(jù),只有部分用戶和部分?jǐn)?shù)據(jù)之間是有評(píng)分?jǐn)?shù)據(jù)的赎败,其它部分評(píng)分是空白秕衙,此時(shí)我們要用已有的部分稀疏數(shù)據(jù)來預(yù)測(cè)那些空白的物品和數(shù)據(jù)之間的評(píng)分關(guān)系,找到最高評(píng)分的物品推薦給用戶僵刮。對(duì)于這類問題据忘,常用方法是利用機(jī)器學(xué)習(xí)來建模進(jìn)行問題解決,主流的方法可以分為:關(guān)聯(lián)規(guī)則類算法搞糕,聚類算法勇吊,分類算法,回歸算法窍仰,矩陣分解汉规,神經(jīng)網(wǎng)絡(luò),圖模型以及隱語義模型等來解決。
a)關(guān)聯(lián)規(guī)則類算法的協(xié)同過濾算法
基于關(guān)聯(lián)規(guī)則的推薦技術(shù)是以關(guān)聯(lián)規(guī)則為基礎(chǔ)驹吮,其反映了一個(gè)事物與其他事物之間的相互依存性和關(guān)聯(lián)性针史,主要結(jié)合用戶當(dāng)前的購買行為向用戶推薦合適的項(xiàng)目。其關(guān)鍵點(diǎn)在于利用數(shù)據(jù)挖掘技術(shù)找出具有某種關(guān)聯(lián)關(guān)系的數(shù)據(jù)項(xiàng)碟狞。在電子商務(wù)網(wǎng)站中啄枕,基于關(guān)聯(lián)規(guī)則的推薦主要是分析用戶的購物車、用戶檢索信息篷就、瀏覽信息以及已購買的商品信息射亏,通過數(shù)據(jù)挖掘技術(shù)統(tǒng)計(jì)這些商品之間的相關(guān)性,從而向用戶推薦其可能感興趣的商品竭业。常用關(guān)聯(lián)推薦算法有Apriori智润,F(xiàn)P Tree PrefixSpan。
一般我們可以找出用戶購買的所有物品數(shù)據(jù)里頻繁出現(xiàn)的項(xiàng)集小程序列未辆,來做頻繁集挖掘窟绷,找到滿足支持閾的關(guān)聯(lián)物品的頻繁N項(xiàng)集或者序列。如果用戶購買了頻繁N項(xiàng)集或者序列里的部分物品咐柜,那么我們可以將頻繁項(xiàng)集或序列里的其他物品按一定的評(píng)分準(zhǔn)則推薦給用戶兼蜈,這個(gè)評(píng)分準(zhǔn)則可以包括支持度攘残,置信度和提升度等。
關(guān)聯(lián)規(guī)則的算法優(yōu)點(diǎn)是不需要用戶輸入評(píng)分?jǐn)?shù)據(jù)为狸,能發(fā)現(xiàn)用戶的新興趣歼郭,推薦的結(jié)果也較為精確。但它也有一些缺點(diǎn)[30]:1)龐大的用戶信息在前期需要經(jīng)過數(shù)據(jù)清洗辐棒,數(shù)據(jù)轉(zhuǎn)換等工作病曾,比較復(fù)雜;2)關(guān)聯(lián)規(guī)則需要對(duì)巨大的用戶信息和項(xiàng)目信息做分析漾根,提取規(guī)則較難泰涂,個(gè)性化程度較低。
b)用聚類算法做協(xié)同過濾
用聚類做協(xié)同過濾就和前面的基于用戶或者項(xiàng)目的協(xié)同過濾有些類似了辐怕。我們可以按照用戶或者按照物品基于一定的距離度量來進(jìn)行聚類逼蒙。如果基于用戶聚類,則可以將用戶按照一定距離度量方式分成不同的目標(biāo)人群寄疏,將同樣目標(biāo)人群評(píng)分高的物品推薦給目標(biāo)用戶是牢。基于物品聚類赁还,則是將用戶評(píng)分高物品的相似同類物品推薦給用戶妖泄。常用聚類推薦算法有K-Means驹沿,BIRCH艘策,DBSCAN和譜聚類 。
c)用分類算法做協(xié)同過濾
如果我們根據(jù)用戶評(píng)分的高低渊季,將分?jǐn)?shù)分成幾段朋蔫,則這個(gè)問題就變成了分類問題。比如最直接的却汉,設(shè)置一個(gè)評(píng)分閾值驯妄,評(píng)分高于閾值就推薦,評(píng)分低于閾值就不推薦合砂,我們將問題變成了一個(gè)二分類問題青扔。常用的分類算法是邏輯回歸,支持向量翩伪,樸素貝葉斯等微猖。
d)用回歸算法的協(xié)同過濾
用回歸算法做協(xié)同過濾比分類算法解釋性更強(qiáng),評(píng)分可是是連續(xù)值也是在離散值缘屹,通過回歸算法模型得到目標(biāo)用戶對(duì)某商品的預(yù)測(cè)打分凛剥。常用的駕照推薦算法有Ridge回歸,回歸樹和支持向量回歸轻姿。
e)用矩陣分解做協(xié)同過濾
用矩陣分解做協(xié)同過濾是目前使用也很廣泛的一種方法犁珠。由于傳統(tǒng)的奇異值分解SVD要求矩陣不能有缺失數(shù)據(jù)逻炊,必須是稠密的,而我們的用戶物品評(píng)分矩陣是一個(gè)很典型的稀疏矩陣犁享,直接使用傳統(tǒng)的SVD到協(xié)同過濾是比較復(fù)雜的余素。目前主流的矩陣分解算法主要有SVD的一些變種,比如FunkSVD炊昆,BiasSVD,RSVD[97]和SVD++[98]溺森。
f)用神經(jīng)網(wǎng)絡(luò)做協(xié)同過濾
用神經(jīng)網(wǎng)絡(luò)乃至深度學(xué)習(xí)做協(xié)同過濾應(yīng)該是以后的一個(gè)趨勢(shì)。目前比較主流的用兩層神經(jīng)網(wǎng)絡(luò)來做推薦算法的是限制玻爾茲曼機(jī)(RBM)窑眯。在目前的Netflix算法比賽中屏积,RBM算法的表現(xiàn)很良好。
CF推薦具有較強(qiáng)的個(gè)性化磅甩,且得到了廣泛的應(yīng)用炊林,CF的優(yōu)點(diǎn)體現(xiàn)在:1)推薦的結(jié)果對(duì)于用戶來說比較新奇,可以發(fā)現(xiàn)內(nèi)容上完全不相似的物品;2)對(duì)于非結(jié)構(gòu)化的對(duì)象有很好的推薦效果比如電影、音樂卷要、圖片等;3)不需要很專業(yè)的知識(shí)就可以推薦渣聚。但仍然存在著以下幾點(diǎn)問題:1)冷啟動(dòng)問題,要是一個(gè)用戶從來沒有對(duì)任何項(xiàng)目進(jìn)行評(píng)價(jià)僧叉,那么該用戶就不能得到推薦奕枝,同樣如果從來沒有用戶對(duì)某一商品加以價(jià),則這個(gè)商品就不可能被推薦瓶堕;2)稀疏性問題隘道,實(shí)際的網(wǎng)站中用戶和項(xiàng)目的數(shù)量十分巨大,而用戶通常只對(duì)其中小部分項(xiàng)目進(jìn)行評(píng)分郎笆,用戶-項(xiàng)目評(píng)分矩陣是非常稀疏的谭梗,可用于計(jì)算用戶之間相似度的數(shù)據(jù)非常有限,使得搜索的最近鄰不夠可靠宛蚓,推薦質(zhì)量較差激捏;3)可擴(kuò)展性問題,即隨著用戶和項(xiàng)目數(shù)量的增多凄吏,算法的計(jì)算復(fù)雜度急劇增加远舅,嚴(yán)重影響了個(gè)性化推薦的實(shí)時(shí)性。
三痕钢、基于社交網(wǎng)絡(luò)的推薦算法
最在線社交網(wǎng)絡(luò)使得人們可以在網(wǎng)絡(luò)上面分享心情,發(fā)表看法,獲取興趣話題,但是面對(duì)海量的用戶信息與內(nèi)容信息图柏。
社會(huì)推薦(Social Recommendation),是指在各種社會(huì)化媒體(Social Media)上通過社會(huì)化的群體行為對(duì)信息內(nèi)容進(jìn)行推薦或分享[78],基于社交網(wǎng)絡(luò)的推薦mj是社會(huì)推薦的重要研究部分,研究涉及社會(huì)科學(xué)、物理學(xué)盖喷、信息科學(xué)爆办、和管理科學(xué)等多門學(xué)科,屬于典型的跨學(xué)科交叉研究.基于傳統(tǒng)的推薦決策過程中引入用戶的社交網(wǎng)絡(luò)信息,一方面是考慮傳統(tǒng)協(xié)同過濾推薦方法的數(shù)據(jù)稀疏性的缺陷;另一方面社會(huì)網(wǎng)絡(luò)中的用戶間關(guān)系能夠體現(xiàn)出用戶之間的興趣相似性和影響能力.
鄰居節(jié)點(diǎn)的社會(huì)影響力同樣也是影響用戶信任度的一個(gè)重要因素,一般來說,人們往往更傾向于相信權(quán)威,權(quán)威用戶(即意見領(lǐng)袖)對(duì)周圍人們的影響較大,可以理解為社會(huì)影響力高的用戶有較高的影響力和用戶信任度,在推薦過程中所占據(jù)的權(quán)重也相對(duì)更大.文獻(xiàn)[79,80]認(rèn)為鄰居節(jié)點(diǎn)的社會(huì)影響力比歷史行為的相似性在商品推薦效果方面顯得更加顯著.Internet時(shí)代放大了社會(huì)影響力的價(jià)值,“口碑營(yíng)銷”和“病毒式營(yíng)銷”[81]在線社交網(wǎng)絡(luò)中即是通過重點(diǎn)節(jié)點(diǎn)基于一種高信任度的角度,通過傳播的一種方式將產(chǎn)品或者信息等推薦給鄰居節(jié)點(diǎn),由于網(wǎng)絡(luò)的實(shí)時(shí)性、信息發(fā)送的便捷性课梳、用戶節(jié)點(diǎn)數(shù)目的海量性距辆,信息則以更快的傳播到更多的網(wǎng)絡(luò)結(jié)點(diǎn).基于社會(huì)影響力的角度進(jìn)行推薦余佃,取得了一定的效果,文獻(xiàn)[54]通過對(duì)豆瓣網(wǎng)站和Goodreads網(wǎng)站(“美國(guó)版豆瓣”)的實(shí)證分析,發(fā)現(xiàn)來自朋友的社會(huì)推薦除了可以提高商品的銷售量外,還可以提升用戶的售后評(píng)價(jià)滿意程度.
實(shí)際上,社交網(wǎng)絡(luò)中的許多推薦問題都可以歸結(jié)為兩類問題:產(chǎn)品推薦和用戶推薦。產(chǎn)品推薦主要是向用戶推薦他們可能會(huì)感興趣的歌曲跨算、電影爆土、書或者產(chǎn)品等。例如Liu等[82]通過給網(wǎng)絡(luò)新用戶推薦一組“影響力”較大的產(chǎn)品集合,以此來引導(dǎo)用戶的興趣愛好诸蚕。一些工作考慮影響力傳播的效果,如向新用戶推薦一些社交影響力比較大的用戶[83],這個(gè)向新用戶做推薦有點(diǎn)類似推薦系統(tǒng)的冷啟動(dòng)問題步势。
在現(xiàn)實(shí)生活中,當(dāng)我們?cè)谛枰龀鰶Q策的時(shí)候背犯,通常會(huì)受到兩個(gè)方面的影響坏瘩,一個(gè)是社會(huì)影響,一個(gè)是自身影響漠魏。社會(huì)影響指的是人們?cè)谏鐣?huì)生活中倔矾,會(huì)受到周圍環(huán)境中,其他社會(huì)個(gè)體的影響柱锹。比如自己的親戚哪自、朋友或同事等。在社會(huì)影響中禁熏,同時(shí)也需要考慮兩個(gè)因素壤巷,一個(gè)是社會(huì)個(gè)體影響力,一個(gè)是對(duì)社會(huì)個(gè)體的信任度瞧毙。在自身影響中胧华,也會(huì)受到兩個(gè)因素的影響,一個(gè)是自身愛好升筏,另一個(gè)是物品特點(diǎn)撑柔。
具有高影響力節(jié)點(diǎn)用戶瘸爽,從某個(gè)角度上可以說明了他在網(wǎng)絡(luò)中的口碑與地位的衡量您访,在一定程度上他的言行舉止具有一定的信任度,會(huì)影響著他人對(duì)用戶的看法和信任程度剪决,所以具有影響力節(jié)點(diǎn)在基于自身影響力的同時(shí)若是發(fā)布負(fù)能量發(fā)文灵汪,或者長(zhǎng)期發(fā)布用戶不感興趣的微博,那他很可能就會(huì)“掉粉”柑潦,所以高影響力用戶的每一個(gè)發(fā)文都會(huì)主題明確享言,例如有些影響力用戶專門發(fā)布萌寵的相關(guān)信息,有些用戶專門發(fā)布穿衣搭配的圖片渗鬼,有些用戶專門發(fā)布時(shí)尚的家居裝修览露,有些用戶專門發(fā)布各種美食,有些用戶專門發(fā)布心靈雞湯譬胎,有些用戶專門發(fā)布實(shí)時(shí)政事差牛,或者新聞命锄,以及最近有很多商家會(huì)在微博上進(jìn)行商品的發(fā)布,用戶直接通過點(diǎn)擊鏈接可以進(jìn)行購買偏化。因此除了一些大V用戶或者營(yíng)銷用戶會(huì)發(fā)布廣告性質(zhì)的發(fā)文脐恩,還有很多有影響力節(jié)點(diǎn)會(huì)發(fā)布自己的主題微博。
[1][58] Ramage D,Dumais S,Liebling D. Characterizing micro blogs with topic models[C]/ /Proceedings of International AAAI Conference on Weblogs and Social Media. Menlo Park. CA: AAAI,2010: 130-137.
[2][59]張晨逸,孫建,丁軼群.基于MB-LDA模型的微博主題挖掘[ J ] .計(jì)算機(jī)研究與發(fā)展,2 0 1 1 ,4 8 ( 1 0 ) : 1 7 9 5 - 1 8 0 2 .
[3][60]謝昊,江紅.一種面向微博主題挖掘的改進(jìn)LDA模型[ J ] .華東師范大學(xué)學(xué)報(bào):自然科學(xué)版,2 0 1 3 ,1 1 ( 6 ) : 9 3 - 100.
[4][61]馮普超.基于CMBLDA的微博主題挖掘[D].杭州:浙江大學(xué),2014: 37-47.
[5][62] Philip R,Eric H. Gibbs sampling for the uninitiated[R]. Technical Reports from UMIACS,2010.
[6][63]貝克,曉冬.社會(huì)資本制勝:如何挖掘個(gè)人與企業(yè)網(wǎng)絡(luò)中的隱性資源[M].上海交通大學(xué)出版社,2002.
[7][64]天涯.六度分隔理論和150法則[EB/OL].http://blog.sina.com.cn/s/blog_62bae1640100|5f3.html.[2010-07-14].
[8][65]Granovetter M S.The Strength of Weak Ties[J]. American journal of sociology, 1973: 1360-1380.
[9][66]王梓.社交網(wǎng)絡(luò)中節(jié)點(diǎn)影響力評(píng)估算法研究[D].北京郵電大學(xué), 2014.
[10][67] Meeyoung Cha, Hamed Haddadi,Fabricio Benevenutoets. Measuring User Influence in Twitter: The Million Follower Fallacy[C]. Proceedings of the 4th International AAAI Conference on Weblogs and Social Media (ICWSM),2010:10-17
[11][68] ?Page, Lawrence, Brin, et al. The PageRank citation ranking[C]// BringingOrder to the Web. Stanford InfoLab. 1998: 1-14.
[12][69]Kleinberg J M. Authoritative sources in a hyperlinked environment[J]. Journal of the ACM, 1999, 46(5): 604-632.
[13][70]Zibin Yin, Ya Zhang. Measuring Pair-Wise Social Influence inMicroblog[C], 2012 ASE/IEEE International Conference on SocialComputing and 2012 ASE/IEEE International Conference on Privacy,Security, Risk and Trust, 2012: 502-507.
[14][71]Lu Liu, Jie Tang, Jiawei Han, Meng Jiang, Shiqiang Yang. Mining topic-level influence in heterogeneous networks[C]. Proceedings of the 19th ACMinternational conference on information and knowledge management, 2010: 199-208.
[15][72] Qianni Deng, Yunjing Dai. How Your Friends Influence You: Quantifying Pairwise Influences on Twitter[C], International Conference on Cloud and Service Computing, 2012:185-192.
[16][73] Bi, Bin, et al. Scalable Topic-Specific Influence Analysis on Microblogs[C], Proceedings of the 7th ACM international conference on Web search and data mining,2014: 513-522.
[17][74]Schafer.J., et al. Collaborative filtering recommender systems. The adaptive web, 2007. 291-324.
[18][75]徐小偉.基于信任的協(xié)同過濾推薦算法在電子商務(wù)推薦系統(tǒng)的應(yīng)用研究[D].東華大學(xué), 2013.
[19][76] Paterek A. Improving regularized singular value decomposition for collaborative filtering[C]//Proceedings of KDD cup and workshop. 2007, 2007: 5-8.
[20][77] Koren Y.Factorization meets die neighborhood: a multifaceted collaborative filtering model[C]//Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2008: 426-434.
[21][78]Guy I,Carmel D. Social recommender systems[C]. Proceedings of the 20th International Conference Companion on World Wide Web,2011 .
[22][79]Salganik M J,Dodds P S,Watts D J. Experimental study of inequality and unpredictability in an artificial culturalmarket[J]. Science,2006,311: 854-856.
[23][80]BonhardP,SasseMA."Knowingmeknowingyou"—usingpro- files and social networking to improve recommender systems[J]. BT Technology Journal,2006,24: 84-98.
[24][81]Leskovec J,Adamic L A,Huberman B A. The dynamics of viral marketing[C]. Proceedings of ACM Conference on Electronic Commerce,2006.
[25][82]Liu Q, Xiang B, Chen E,et al. Influential seed items recommendation[C].Proceedings of the sixth ACM conference on Recommender systems, 2012: 245-248.