產(chǎn)品目標(biāo):高效地獲取信息
需求復(fù)雜又多變,不同用戶輸入同一個(gè)query表達(dá)的需求可能也不一致浇冰,同一用戶在不同場(chǎng)景下輸入同一個(gè)query表達(dá)的需求也可能不一致
一可霎、需求理解:廣義的query解析
1.需求明確(讓機(jī)器按照人對(duì)文字的理解處理)
2.需求不明確樊卓,需要進(jìn)行需求擴(kuò)展和預(yù)測(cè)趴生。如楊冪,需要拓展為楊冪圖片凶伙、楊冪的電視劇等
需求明確的query
a.結(jié)構(gòu)簡(jiǎn)單清晰的query:經(jīng)過(guò)切詞處理即可進(jìn)行后續(xù)檢索
栗子:黃山火車(chē)站訂票電話 — 黃山? 火車(chē) 站? 訂 票? 電話 (距離和緊密度成正比)
b.口語(yǔ)化的query:需要進(jìn)行糾錯(cuò)郭毕、同義轉(zhuǎn)換等語(yǔ)義處理
栗子:杭州至鹽城高速怎么走 — 杭州? 至? 鹽城? 高速? 怎么? 走(通過(guò)”怎么走“是地圖需求,”至“表示方向的鏈接 可以識(shí)別前面的杭州和后面的鹽城函荣,”高速“識(shí)別為駕車(chē)這個(gè)路線優(yōu)先铣卡,所以可以將這些詞放到地圖垂直引擎里)
c.表達(dá)方式復(fù)雜的query:需要進(jìn)行更加unique的語(yǔ)義處理
栗子:披星()月、吾嘗終日而思矣偏竟,后面(),無(wú)法用通用的處理方法需要 后續(xù)單獨(dú)拎出來(lái)看
d.需求明確敞峭,對(duì)答案有特殊要求:除了統(tǒng)一的query變換外踊谋,需要將特定要求轉(zhuǎn)換成搜索引擎可以理解的特征
栗子:豬肉的最新價(jià)格 — 資源的時(shí)效性
需求不明確的query
需要進(jìn)行需求擴(kuò)展和預(yù)測(cè)
例如:歡樂(lè)頌 — 歡樂(lè)頌視頻、劇情介紹旋讹、演員表殖蚕、評(píng)論...
怎么進(jìn)行需求擴(kuò)展?
上下文數(shù)據(jù):搜了歡樂(lè)頌后沉迹,用戶是否主動(dòng)更改qurey搜索歡樂(lè)頌視頻
類(lèi)目數(shù)據(jù):對(duì)于 [歡樂(lè)頌] 這種電視劇專名睦疫,天然就有視頻、劇情等需求鞭呕。pm可以提前梳理針對(duì)各類(lèi)目的需求list
個(gè)性化數(shù)據(jù):對(duì)于特定類(lèi)目可以進(jìn)行地域擴(kuò)展蛤育,家樂(lè)福—北京家樂(lè)福葫松,有用戶更傾向于看電影劇情瓦糕,有的更喜歡看評(píng)論
需求理解
經(jīng)過(guò)上述的需求理解后,一個(gè)query會(huì)進(jìn)過(guò)以上分類(lèi)處理后腋么,會(huì)統(tǒng)一成這樣的輸出咕娄,來(lái)進(jìn)行接下來(lái)的檢索:需求類(lèi)目/需求詞,需求強(qiáng)度珊擂,待檢索term圣勒,其他限定特征(如地域等)
二、衡量指標(biāo)
1.評(píng)估各個(gè)分析規(guī)則的召回率和準(zhǔn)確率
2.用戶搜索滿足度
基于用戶行為的搜索滿足度
a.摘取滿足型需求摧扇;? b.單結(jié)果滿足型需求? 圣贸;c.主動(dòng)變換query比例低 ;d.翻頁(yè)比例低等
基于人為評(píng)估的搜索滿意度
a.query評(píng)估前n個(gè)結(jié)果相關(guān)性—認(rèn)為需求潘盾扛稽,當(dāng)前結(jié)果是否能滿足旁趟,與競(jìng)品對(duì)比是否有更好的結(jié)果未收錄、排序是否更優(yōu);b.session滿意度锡搜,可從用戶一個(gè)行為片段分析其是否滿足
三橙困、解決方案:排序和展現(xiàn)
排序邏輯
不同需求間,根據(jù)需求強(qiáng)度排序耕餐,如命中需求的概率凡傅;
同一需求間,根據(jù)結(jié)果質(zhì)量排序肠缔,如相關(guān)性(文本角度)夏跷、權(quán)威性、時(shí)效性明未、可用性槽华。
所有排序都是基于點(diǎn)擊行為的,實(shí)際上會(huì)把需求強(qiáng)度趟妥、結(jié)果質(zhì)量作為初始排序猫态,把用戶點(diǎn)擊行為作為后續(xù)不斷調(diào)整排序的依據(jù)
展現(xiàn)邏輯
通用策略:將結(jié)果頁(yè)中與query相關(guān)的信息提取為標(biāo)題/摘要,進(jìn)行標(biāo)紅等處理幫助用戶篩選信息
細(xì)化策略:針對(duì)不同需求披摄,又有如下不同的細(xì)化策略:
a.單一明確信息需求亲雪,直接在摘要中展現(xiàn);
b.對(duì)于用戶接下來(lái)路徑相對(duì)收斂的需求疚膊,可以講下一步需求前置义辕,縮短步驟。例如搜素結(jié)果中網(wǎng)易郵箱可直接登錄寓盗;
c.對(duì)于不同資源類(lèi)型結(jié)果灌砖,可以針對(duì)性優(yōu)化摘要。例如視頻類(lèi)傀蚌、圖片類(lèi)周崭、新聞?lì)悺⒌貓D類(lèi)喳张。
四续镇、資源支撐
自然語(yǔ)言相關(guān)度與頁(yè)面類(lèi)型的支撐
1.各類(lèi)基礎(chǔ)詞庫(kù):用于query切詞處理、同義轉(zhuǎn)換销部、糾錯(cuò)摸航;2.語(yǔ)義理解和處理規(guī)則:用于query解析;3.網(wǎng)頁(yè)收錄(spider):保證各類(lèi)網(wǎng)頁(yè)收錄覆蓋度舅桩、網(wǎng)頁(yè)收錄的時(shí)效性:根據(jù)網(wǎng)頁(yè)類(lèi)型定義更新頻率酱虎,重要或時(shí)效性要求高扥資源可選擇站長(zhǎng)主動(dòng)要求提交的方式;4.頁(yè)面分析:對(duì)頁(yè)面類(lèi)型進(jìn)行識(shí)別擂涛,頁(yè)面中內(nèi)容解析读串、為term賦權(quán)等