開學(xué)到現(xiàn)在浆竭,可以說(shuō)我還沒(méi)有從假期的狀態(tài)中恢復(fù)過(guò)來(lái),計(jì)劃好的每天要看兩篇文獻(xiàn)卻遲遲沒(méi)有付諸行動(dòng)惨寿,直到今天(不好意思中)邦泄。所以一直很佩服那些自制力強(qiáng)的人。
細(xì)讀了兩篇裂垦,只有以下一篇讓我收獲最多顺囊,因此對(duì)此進(jìn)行總結(jié),并非個(gè)人想法蕉拢。
[1]荊永君,李兆君,李 昕.基礎(chǔ)教育資源網(wǎng)中個(gè)性化資源推薦服務(wù)研究[J].中國(guó)電化教育,2009,(8)102-105.
該文章建立用戶興趣模型和資源描述模型特碳,通過(guò)將兩種模型進(jìn)行匹配,從而向用戶推薦所需要的資源晕换。
一午乓、建模
1.用戶興趣模型
信息來(lái)源通過(guò)在線興趣調(diào)查和行為跟蹤(使用、搜索和定制資源等行為)闸准。對(duì)收集到的信息采用關(guān)鍵詞向量空間來(lái)表示擁護(hù)興趣模型益愈。由于對(duì)某一關(guān)鍵詞所表示的內(nèi)容不同知識(shí)背景的用戶會(huì)有不用的理解。所以模型中引入學(xué)科夷家、學(xué)段作為知識(shí)背景限制蒸其。在關(guān)鍵詞向量空間中引入基于時(shí)態(tài)變化的興趣權(quán)重,來(lái)表示用戶興趣的衰減與更新库快。根據(jù)艾賓浩斯的遺忘曲線摸袁,對(duì)于興趣權(quán)重,采用基于時(shí)間窗原理進(jìn)行用戶興趣的衰減和更新缺谴。即:在時(shí)間窗Δt內(nèi)但惶,如果關(guān)鍵詞kn每出現(xiàn)一次,則關(guān)鍵詞kn的興趣權(quán)重增加單位a湿蛔;否則興趣權(quán)重衰減單位b膀曾。如某學(xué)科教師用戶興趣模型為:
{語(yǔ)文,小學(xué)一年,{(唐詩(shī),0.9),(李白,0.9),(靜夜思,5.95),(領(lǐng)讀,1.9),(司馬光,2),(歷史典故,2)}}
2.資源描述模型
在描述資源模型時(shí),下面兩方面因素是應(yīng)該考慮的:(1)資源的適用對(duì)象和所屬學(xué)科阳啥。因?yàn)橥瑯拥年P(guān)于“三角形”的資源添谊,五年級(jí)介紹的是認(rèn)識(shí)三角形的邊、角及面積計(jì)算察迟,而在七年級(jí)介紹的是三角形的三線及內(nèi)斩狱、外角和的定理耳高。(2)描述資源內(nèi)容特征的屬性。其中所踊,關(guān)鍵詞是最能體現(xiàn)資源內(nèi)容特征的屬性泌枪。一個(gè)資源一般由多個(gè)關(guān)鍵詞項(xiàng)(5—10個(gè))組成,權(quán)重則表示關(guān)鍵詞對(duì)描述資源內(nèi)容的重要程度秕岛。所以碌燕,系統(tǒng)中的資源描述采用和用戶興趣模型類似的表示方法,每個(gè)資源由學(xué)科继薛、學(xué)段為知識(shí)背景的關(guān)鍵詞向量空間表示修壕,資源描述信息(所屬學(xué)科、學(xué)段遏考、關(guān)鍵詞列表以及關(guān)鍵詞的權(quán)重值)慈鸠,都在資源設(shè)計(jì)階段由資源創(chuàng)意人員給出。如:一個(gè)七年級(jí)數(shù)學(xué)關(guān)于多邊形內(nèi)角和的課件灌具,其資源描述模型為:{數(shù)學(xué),初中七年,{(多邊形,0.4),(內(nèi)角和,0.4),(探究,0.2)}}
二青团、模型
個(gè)性化服務(wù)可以通過(guò)基于內(nèi)容和基于協(xié)作的信息過(guò)濾技術(shù)來(lái)實(shí)現(xiàn)』鳎基于內(nèi)容的過(guò)濾技術(shù)是通過(guò)比較資源與用戶興趣模型來(lái)推薦資源壶冒,其優(yōu)點(diǎn)是簡(jiǎn)單缕题、有效截歉,缺點(diǎn)是只能發(fā)現(xiàn)與用戶已有興趣相似的資源,不能為用戶發(fā)現(xiàn)新的感興趣資源烟零”袼桑基于協(xié)作的過(guò)濾技術(shù)是比較用戶興趣模型,根據(jù)用戶的相似性來(lái)推薦資源锨阿。其優(yōu)點(diǎn)是有可能為用戶推薦出新的感興趣資源宵睦,缺點(diǎn)是用戶過(guò)少或過(guò)多時(shí)該方法性能很低。為了提高個(gè)性化推薦服務(wù)的性能墅诡,本文討論的資源推薦方法壳嚎,將基于內(nèi)容和基于協(xié)作結(jié)合起來(lái),實(shí)現(xiàn)混合推薦末早。
在模型中烟馅,用戶信息收集模塊是個(gè)性化服務(wù)系統(tǒng)的基礎(chǔ)模塊,負(fù)責(zé)收集用戶興趣信息然磷,一方面通過(guò)在線興趣調(diào)查獲得用戶主動(dòng)描述出來(lái)的顯式興趣信息郑趁,如媒體類型偏好,興趣主題描述等姿搜;另一方面通過(guò)行為跟蹤收集用戶在資源使用過(guò)程中的隱式興趣信息寡润。行為跟蹤主要包括:(1)用戶的資源使用信息捆憎。(2)用戶的資源搜索信息。(3)用戶的資源定制信息梭纹。
用戶建模模塊根據(jù)收集到的用戶興趣信息躲惰,進(jìn)行去噪、加權(quán)变抽、構(gòu)建或更新用戶興趣模型礁扮,通過(guò)聚類分析等數(shù)據(jù)挖掘技術(shù),形成用戶興趣小組存入用戶興趣小組信息庫(kù)瞬沦。通過(guò)混合推薦技術(shù)太伊,形成顯性和潛在興趣資源組成的用戶個(gè)性化資源列 表 提 供 給 用戶。資源列表呈現(xiàn)方式根據(jù)用戶的選擇可以采用網(wǎng)頁(yè)或e-Mail的方式推送給用戶逛钻。模型中虛線表示用戶的反饋信息僚焦。
三、個(gè)性化資源推薦的實(shí)現(xiàn)方法
在個(gè)性化服務(wù)模型中基于內(nèi)容過(guò)濾的處理是通過(guò)比較資源與用戶興趣模型來(lái)推薦資源曙痘,其關(guān)鍵步驟是資源和用戶興趣相似度的計(jì)算芳悲。對(duì)于向量空間模型來(lái)說(shuō),通常采用的方法有歐氏距離边坤、余弦距離和內(nèi)積名扛。
用戶興趣關(guān)鍵詞向量和資源描述關(guān)鍵詞向量的距離越大表明它們的相似度也就越大,反之則越小茧痒。實(shí)現(xiàn)流程為:首先提取用戶興趣肮韧,然后選取與用戶具有相同背景(學(xué)科、學(xué)段)的資源旺订,分別計(jì)算資源與用戶興趣的歐氏距離存入資源與興趣距離列表中并按照相似度大小降序排列弄企,最后按照TOPn原則從距離列表中,選擇前n個(gè)相關(guān)度較高的資源推薦給用戶区拳。
基于協(xié)作過(guò)濾技術(shù)的關(guān)鍵是建立用戶興趣小組拘领,在用戶興趣小組聚類時(shí),以相同背景為前提樱调,對(duì)同一學(xué)科和學(xué)段的所有用戶興趣關(guān)鍵詞采用成熟的聚類算法(如蟻群聚類)進(jìn)行聚類约素,從而形成用戶興趣小組。
用戶興趣小組建立后笆凌,便可以根據(jù)用戶興趣小組來(lái)推薦資源圣猎。在選擇資源時(shí),對(duì)每個(gè)資源計(jì)算它和興趣小組的相似度菩颖,將相似度高并且不在用戶已推薦資源列表中的資源作為該用戶潛在感興趣的資源推薦給用戶样漆。為用戶興趣小組進(jìn)行個(gè)性化資源選擇的處理方法和基于內(nèi)容過(guò)濾的資源選擇方法相同。