如何規(guī)劃詞庫(kù)

一.詞庫(kù)的基礎(chǔ)搭建

詞庫(kù)結(jié)構(gòu)主要由三部份組成,如下圖

直達(dá)詞庫(kù):用于特殊活動(dòng)/專(zhuān)題跳轉(zhuǎn)到指定頁(yè)面,例如用戶(hù)在搜索雙十一,那直接跳轉(zhuǎn)到雙十一分會(huì)場(chǎng)芹助;

聯(lián)想詞:用戶(hù)輸入關(guān)鍵詞,系統(tǒng)根據(jù)關(guān)鍵詞聯(lián)想出用戶(hù)可能需要輸入的詞匯;

分詞詞庫(kù):用于對(duì)用戶(hù)輸入的關(guān)鍵詞進(jìn)行拆分状土,再對(duì)拆分的結(jié)果進(jìn)行頁(yè)面指向

分詞詞庫(kù)一般需要建立三種機(jī)制:

1)開(kāi)源詞:這種詞可以直接在網(wǎng)上進(jìn)行搜索无蜂,然后給到技術(shù)讓他們存放;

2)自建分詞:這模塊主要給到做分詞的人進(jìn)行編輯維護(hù)蒙谓,優(yōu)化使用斥季;

3)停用詞:這模塊用于讓服務(wù)器知道,用戶(hù)輸入的哪些詞匯不用回傳給到指定頁(yè)面累驮;

二.建立緩存存儲(chǔ)機(jī)制

緩很多人會(huì)問(wèn)酣倾,為什么要有個(gè)緩存存儲(chǔ)機(jī)制,直接根據(jù)用戶(hù)搜索的關(guān)鍵詞去服務(wù)器讀取數(shù)據(jù)不就行了嗎谤专,這個(gè)理解是有誤的躁锡,如果直接去服務(wù)器查閱信息,查詢(xún)響應(yīng)速度會(huì)慢(如果sku數(shù)量有幾千萬(wàn)置侍,自己想想映之,這只是一方面),所以需要有個(gè)緩存存儲(chǔ)機(jī)制蜡坊,每天設(shè)置幾個(gè)時(shí)間段定時(shí)去服務(wù)器根據(jù)關(guān)鍵詞刷一批數(shù)據(jù)存儲(chǔ)到緩存惕医,效率會(huì)提升

三.命中邏輯

1.用戶(hù)輸入關(guān)鍵詞

2.讀取緩存

3.判斷是否聯(lián)想詞

4.是,將匹配的聯(lián)想詞在輸入框下顯示(排序和顯示數(shù)量每個(gè)人自己決定)算色,否的話不聯(lián)想

5.1選擇系統(tǒng)給到的聯(lián)想詞,1)把聯(lián)想詞已有的數(shù)據(jù)傳給用戶(hù)螟够;2)查詢(xún)直達(dá)詞庫(kù)判斷是否直達(dá)詞庫(kù)灾梦,如果是直達(dá)詞庫(kù),跳轉(zhuǎn)到直達(dá)詞庫(kù)對(duì)應(yīng)的頁(yè)面路徑妓笙,不是直達(dá)詞則進(jìn)行分詞處理:通過(guò)查閱自建詞若河,開(kāi)源詞,停用詞寞宫,分詞完成后萧福,查詢(xún)商品庫(kù),商品標(biāo)題中是否包含用戶(hù)的詞匯辈赋,如果有的話鲫忍,直接把命中商品搜索結(jié)果頁(yè)傳給前端,沒(méi)有的話則提示找不到相關(guān)商品等

5.2不選擇系統(tǒng)給到的聯(lián)想詞/不是聯(lián)想詞钥屈,查詢(xún)直達(dá)詞庫(kù)判斷是否直達(dá)詞庫(kù)悟民,如果是直達(dá)詞庫(kù),跳轉(zhuǎn)到直達(dá)詞庫(kù)對(duì)應(yīng)的頁(yè)面路徑篷就,不是直達(dá)詞則進(jìn)行分詞處理:通過(guò)查閱自建詞射亏,開(kāi)源詞,停用詞,分詞完成后智润,查詢(xún)商品庫(kù)及舍,商品標(biāo)題中是否包含用戶(hù)的詞匯,如果有的話窟绷,直接把命中商品搜索結(jié)果頁(yè)傳給前端锯玛,沒(méi)有的話則提示找不到相關(guān)商品等

四.記錄用戶(hù)搜索詞

這個(gè)機(jī)制用于擴(kuò)大詞庫(kù)數(shù)據(jù)量,同時(shí)也能知道用戶(hù)習(xí)慣輸入哪些詞匯钾麸,對(duì)于后期的分析起到一定的幫助更振,把搜索詞匯大的同步到詞庫(kù)中等

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市饭尝,隨后出現(xiàn)的幾起案子肯腕,更是在濱河造成了極大的恐慌,老刑警劉巖钥平,帶你破解...
    沈念sama閱讀 222,807評(píng)論 6 518
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件实撒,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡涉瘾,警方通過(guò)查閱死者的電腦和手機(jī)知态,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,284評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)立叛,“玉大人负敏,你說(shuō)我怎么就攤上這事∶厣撸” “怎么了其做?”我有些...
    開(kāi)封第一講書(shū)人閱讀 169,589評(píng)論 0 363
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)赁还。 經(jīng)常有香客問(wèn)我妖泄,道長(zhǎng),這世上最難降的妖魔是什么艘策? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 60,188評(píng)論 1 300
  • 正文 為了忘掉前任蹈胡,我火速辦了婚禮,結(jié)果婚禮上朋蔫,老公的妹妹穿的比我還像新娘罚渐。我一直安慰自己,他們只是感情好驯妄,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,185評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布搅轿。 她就那樣靜靜地躺著,像睡著了一般富玷。 火紅的嫁衣襯著肌膚如雪璧坟。 梳的紋絲不亂的頭發(fā)上既穆,一...
    開(kāi)封第一講書(shū)人閱讀 52,785評(píng)論 1 314
  • 那天,我揣著相機(jī)與錄音雀鹃,去河邊找鬼幻工。 笑死,一個(gè)胖子當(dāng)著我的面吹牛黎茎,可吹牛的內(nèi)容都是我干的囊颅。 我是一名探鬼主播,決...
    沈念sama閱讀 41,220評(píng)論 3 423
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼傅瞻,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼踢代!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起嗅骄,我...
    開(kāi)封第一講書(shū)人閱讀 40,167評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤胳挎,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后溺森,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體慕爬,經(jīng)...
    沈念sama閱讀 46,698評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,767評(píng)論 3 343
  • 正文 我和宋清朗相戀三年屏积,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了医窿。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,912評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡炊林,死狀恐怖姥卢,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情渣聚,我是刑警寧澤独榴,帶...
    沈念sama閱讀 36,572評(píng)論 5 351
  • 正文 年R本政府宣布,位于F島的核電站饵逐,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏彪标。R本人自食惡果不足惜倍权,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,254評(píng)論 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望捞烟。 院中可真熱鬧薄声,春花似錦、人聲如沸题画。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,746評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)苍息。三九已至缩幸,卻和暖如春壹置,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背表谊。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,859評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工钞护, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人爆办。 一個(gè)月前我還...
    沈念sama閱讀 49,359評(píng)論 3 379
  • 正文 我出身青樓难咕,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親距辆。 傳聞我的和親對(duì)象是個(gè)殘疾皇子余佃,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,922評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容

  • 常用概念: 自然語(yǔ)言處理(NLP) 數(shù)據(jù)挖掘 推薦算法 用戶(hù)畫(huà)像 知識(shí)圖譜 信息檢索 文本分類(lèi) 常用技術(shù): 詞級(jí)別...
    御風(fēng)之星閱讀 9,207評(píng)論 1 25
  • Day1:搜索框的設(shè)計(jì)(2days 4hours) 【學(xué)習(xí)part1—交互】 輸入框和提交按鈕的組合,頻率最高的組...
    外加劑_閱讀 723評(píng)論 0 2
  • 1. 案例分析:什么時(shí)全文檢索跨算,如何實(shí)現(xiàn)全文檢索 ? 1.1 案例 ? 實(shí)現(xiàn)一個(gè)文件的搜索功能爆土,通過(guò)關(guān)鍵字搜索文件...
    東方舵手閱讀 1,184評(píng)論 0 1
  • 鏈接分析 我們?cè)谧铋_(kāi)始說(shuō)過(guò),搜索引擎在查找能夠滿足用戶(hù)需求的網(wǎng)頁(yè)時(shí)漂彤,主要會(huì)考慮兩方面的因素雾消,一方面是用戶(hù)發(fā)出的查詢(xún)...
    我偏笑_NSNirvana閱讀 3,249評(píng)論 1 12
  • 傍晚在馬路等紅綠燈的時(shí)候看到兩個(gè)穿校服的女孩立润。隔的有些遠(yuǎn)聽(tīng)不清她們?cè)谡f(shuō)些什么但應(yīng)該是很值得開(kāi)心的事情。...
    少女私奔到月球閱讀 134評(píng)論 0 0