個(gè)性化資源推送的方法(日诚目椋總結(jié)0920)

[1]楊曉江,李麗娟,田俊華,李藝.面向基礎(chǔ)教育的Web資源垂直服務(wù)體系研究[J].數(shù)字鄉(xiāng)愿,2006,(7):53-57.

一蠢护、搜索引擎更加專業(yè)化

互聯(lián)網(wǎng)的發(fā)展讓資源得到更廣泛的共享惕蹄,與此同時(shí)資源不管在種類和數(shù)量上都呈爆炸式增長(zhǎng)绎狭。人們迫切需要從眾多資源中找到自己需要的資源关带,但目前搜索引擎的檢索結(jié)果往往并不全部符合需求侥涵,這就需要用戶依據(jù)自身經(jīng)驗(yàn)進(jìn)行二次檢索沼撕。搜索引擎就是利用關(guān)鍵字將計(jì)算機(jī)中存儲(chǔ)的數(shù)據(jù)與用戶需求進(jìn)行匹配,搜索結(jié)果覆蓋范圍大芜飘,這也有可能使得資源針對(duì)性變?nèi)酢?br>

通過(guò)使搜索引擎只服務(wù)于特定領(lǐng)域用戶务豺,提高檢索效果。楊曉江提出Web資源垂直服務(wù)體系[1]就是為用戶提供特定領(lǐng)域的web資源服務(wù)嗦明。

基礎(chǔ)教育搜索引擎的工作流程如下: 首先, 網(wǎng)絡(luò)蜘蛛根據(jù)某種策略在互聯(lián)網(wǎng)上自動(dòng)尋找基礎(chǔ)教育相關(guān)的資源, 下載并保存新發(fā)現(xiàn)的資源及其URL笼沥;然后, 經(jīng)過(guò)資源預(yù)處理程序除去其中不相關(guān)的信息 ( 噪音) 娶牌,再交由文檔自動(dòng)分類器對(duì)文檔進(jìn)行過(guò)濾奔浅、 分類處理; 接著交由文檔標(biāo)引程序建立倒排索引诗良, 形成基礎(chǔ)教育搜索引擎索引數(shù)據(jù)庫(kù)汹桦, 這樣,當(dāng)用戶向基礎(chǔ)教育搜索引擎提交查詢請(qǐng)求時(shí)鉴裹,用戶檢索子系統(tǒng)就可以從基礎(chǔ)教育資源索引數(shù)據(jù)庫(kù)中檢索出相匹配的資源及其URL舞骆,用戶根據(jù)此URL就能訪問(wèn)Web上的原始資源。 其中,径荔,文檔自動(dòng)分類器需要事先對(duì)人工提供的已分類樣本文檔進(jìn)行機(jī)器學(xué)習(xí)督禽,從中提取出基礎(chǔ)教育資源的各類別特征,形成基礎(chǔ)教育資源特征庫(kù)总处。 在此基礎(chǔ)上, 文檔自動(dòng)分類器即可對(duì)網(wǎng)絡(luò)蜘蛛下載下來(lái)的資源進(jìn)行判斷和自動(dòng)分類狈惫。[1]

其中涉及到的關(guān)鍵技術(shù)有:

網(wǎng)絡(luò)蜘蛛:不斷從互聯(lián)網(wǎng)上爬取新資源,同時(shí)定期更新資源辨泳。

文檔預(yù)處理:從互聯(lián)網(wǎng)上獲取的資源格式各種各樣虱岂,每一個(gè)格式的資源都要有一個(gè)解析器程序,這樣才能忽略各種奇怪的符號(hào)菠红,提取有用的信息第岖。

中文分詞:將句子分解成一個(gè)個(gè)詞語(yǔ),判斷詞性和命名實(shí)體(比如將“iphone 6”作為一個(gè)詞试溯,而不是 “iphone” 一個(gè)蔑滓, “6” 一個(gè))。

文檔特征提扔鼋省:目的是從文檔中提取出最能夠表達(dá)文檔內(nèi)容和特性的關(guān)鍵信息, 從而在準(zhǔn)確描述文檔的同時(shí), 盡可能減少計(jì)算機(jī)的計(jì)算工作量键袱。[1]

文檔自動(dòng)分類:根據(jù)文檔特征,對(duì)數(shù)字化文檔資源進(jìn)行分類摹闽。

文檔實(shí)時(shí)自動(dòng)摘要:文檔自動(dòng)摘要能對(duì)一篇網(wǎng)絡(luò)文檔自動(dòng)提取其內(nèi)容摘要, 摘要文本的長(zhǎng)度可以根據(jù)需要調(diào)節(jié)蹄咖。 摘要結(jié)果可以用于在羅列檢索結(jié)果時(shí), 讓用戶迅速地瀏覽到該資源的內(nèi)容提要。[1]

分布式信息檢索:“ 分布式” 包括索引數(shù)據(jù)的多節(jié)點(diǎn)分布和查詢?nèi)蝿?wù)執(zhí)行的多節(jié)點(diǎn)分布兩個(gè)方面付鹿。 分布式檢索系統(tǒng)由一個(gè)中心服務(wù)器負(fù)責(zé)接受用戶的檢索請(qǐng)求澜汤、 分發(fā)檢索請(qǐng)求到具體的查詢?nèi)蝿?wù)執(zhí)行子節(jié)點(diǎn)蚜迅、 接收合并的查詢結(jié)果并返回給用戶。[1]

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末俊抵,一起剝皮案震驚了整個(gè)濱河市谁不,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌徽诲,老刑警劉巖刹帕,帶你破解...
    沈念sama閱讀 221,635評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異谎替,居然都是意外死亡偷溺,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,543評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門院喜,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)亡蓉,“玉大人,你說(shuō)我怎么就攤上這事喷舀】潮簦” “怎么了?”我有些...
    開封第一講書人閱讀 168,083評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵硫麻,是天一觀的道長(zhǎng)爸邢。 經(jīng)常有香客問(wèn)我,道長(zhǎng)拿愧,這世上最難降的妖魔是什么杠河? 我笑而不...
    開封第一講書人閱讀 59,640評(píng)論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮浇辜,結(jié)果婚禮上券敌,老公的妹妹穿的比我還像新娘。我一直安慰自己柳洋,他們只是感情好待诅,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,640評(píng)論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著熊镣,像睡著了一般卑雁。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上绪囱,一...
    開封第一講書人閱讀 52,262評(píng)論 1 308
  • 那天测蹲,我揣著相機(jī)與錄音,去河邊找鬼鬼吵。 笑死扣甲,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的齿椅。 我是一名探鬼主播文捶,決...
    沈念sama閱讀 40,833評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼荷逞,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了粹排?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,736評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤涩澡,失蹤者是張志新(化名)和其女友劉穎顽耳,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體妙同,經(jīng)...
    沈念sama閱讀 46,280評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡射富,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,369評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了粥帚。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片胰耗。...
    茶點(diǎn)故事閱讀 40,503評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖芒涡,靈堂內(nèi)的尸體忽然破棺而出柴灯,到底是詐尸還是另有隱情,我是刑警寧澤费尽,帶...
    沈念sama閱讀 36,185評(píng)論 5 350
  • 正文 年R本政府宣布赠群,位于F島的核電站,受9級(jí)特大地震影響旱幼,放射性物質(zhì)發(fā)生泄漏查描。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,870評(píng)論 3 333
  • 文/蒙蒙 一柏卤、第九天 我趴在偏房一處隱蔽的房頂上張望冬三。 院中可真熱鬧,春花似錦缘缚、人聲如沸勾笆。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,340評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)匠襟。三九已至,卻和暖如春该园,著一層夾襖步出監(jiān)牢的瞬間酸舍,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,460評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工里初, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留啃勉,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,909評(píng)論 3 376
  • 正文 我出身青樓双妨,卻偏偏與公主長(zhǎng)得像淮阐,于是被迫代替她去往敵國(guó)和親叮阅。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,512評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容