搜索功能的產(chǎn)品邏輯

如果老板扔一個(gè)需求:做個(gè)搜索的功能。作為一名產(chǎn)品經(jīng)理,千萬(wàn)不要只畫一個(gè)搜索框、一個(gè)“搜索”按鈕行疏,然后交給開發(fā):一周內(nèi)把這個(gè)功能做出來(lái)! 一頭霧水的程序猿問(wèn):搜索的結(jié)果該怎么呈現(xiàn)套像?結(jié)果該怎么排序酿联? 作為功能的設(shè)計(jì)者,如果你沒(méi)深入的思考搜索功能的產(chǎn)品邏輯夺巩,被鄙視贞让、被噴、被嘲諷在所難免柳譬!

那搜索功能的原理是怎樣的呢喳张?

對(duì)用戶來(lái)說(shuō),在什么情況下需要搜索呢美澳?根據(jù)實(shí)際使用場(chǎng)景销部,無(wú)非兩種:1.用戶明確知道自己要什么內(nèi)容,直奔主題快速搜索自己想要的內(nèi)容制跟;2.不清楚或者大致知道自己想要什么內(nèi)容舅桩,通過(guò)搜索篩選出自己目標(biāo)內(nèi)容。不管何種場(chǎng)景雨膨,搜索滿足了用戶快速尋找自己感興趣內(nèi)容的需求江咳。用戶輸入一個(gè)query,一般系統(tǒng)會(huì)做出如下的處理流程:

? ? ? 第一步:系統(tǒng)對(duì)用戶輸入的信息進(jìn)行解讀

? ? ? 第二步:根據(jù)用戶輸入信息對(duì)內(nèi)容進(jìn)行篩選

? ? ? 第三步:對(duì)篩選的結(jié)果進(jìn)行排序

這是三個(gè)步驟是搜索機(jī)制的核心哥放,可以通過(guò)服務(wù)端和系統(tǒng)的角度對(duì)搜索的原理進(jìn)行解讀歼指。我們先看一下數(shù)據(jù)的存儲(chǔ)邏輯:以一個(gè)電商平臺(tái)的搜索功能舉例來(lái)說(shuō),平臺(tái)內(nèi)會(huì)有多種分類或品牌甥雕,如下:

數(shù)據(jù)庫(kù)的存儲(chǔ)結(jié)構(gòu)就是類似于這個(gè)樣子的踩身,左邊就是所謂的“詞庫(kù)”:只要一次搜索的輸入詞能匹配到詞庫(kù),就可以快速的查找詞庫(kù)到對(duì)應(yīng)的內(nèi)容社露;右邊就是具體的內(nèi)容索引庫(kù)挟阻。這種搜索模式就像圖書館的索引結(jié)構(gòu),一步一步的引導(dǎo),找出用戶想要的內(nèi)容附鸽。所以用一句話歸納:一個(gè)系統(tǒng)詞庫(kù)脱拼,一個(gè)內(nèi)容索引庫(kù),而且詞庫(kù)和索引庫(kù)是相互關(guān)聯(lián)的坷备。

?根據(jù)這個(gè)原理熄浓,我們對(duì)上面的搜索核心步驟一步步進(jìn)行解讀。

?第一步:系統(tǒng)對(duì)用戶輸入的信息進(jìn)行解讀

通過(guò)詞庫(kù)找與之對(duì)應(yīng)的內(nèi)容省撑,再把內(nèi)容呈現(xiàn)給用戶赌蔑,這當(dāng)然是一個(gè)比較理想的狀態(tài)。但現(xiàn)實(shí)問(wèn)題來(lái)了竟秫,我們系統(tǒng)不可能限制用戶的輸入行為娃惯,而我們系統(tǒng)的詞庫(kù)是有限的。比如肥败,用戶輸入“我的滑板鞋子”趾浅,系統(tǒng)里不可能有這個(gè)詞,直接的結(jié)果就是搜索結(jié)束馒稍,用戶搜不到自己想要的結(jié)果皿哨。對(duì)于這種特殊情況,怎么才能展現(xiàn)結(jié)果呢筷黔?那就是分詞!? ?何為分詞仗颈,就是把用戶輸入的關(guān)鍵詞(字符串)進(jìn)行拆分佛舱,比如用戶輸入的“我的天啊鞋子”可以進(jìn)行如下拆分:“我的” ?“滑板鞋”,經(jīng)過(guò)這樣的處理挨决,用戶非標(biāo)準(zhǔn)的query就變成了標(biāo)準(zhǔn)的詞庫(kù)请祖,可以進(jìn)行下一步的流程處理了。

?第二步:根據(jù)用戶輸入信息對(duì)內(nèi)容進(jìn)行篩選

對(duì)用戶的query進(jìn)行解讀之后脖祈,會(huì)得到一些標(biāo)準(zhǔn)化的詞肆捕,這些詞會(huì)對(duì)應(yīng)一些內(nèi)容,接下來(lái)就是對(duì)內(nèi)容進(jìn)行篩選了盖高,對(duì)內(nèi)容的篩選會(huì)涉及到兩個(gè)概念:召回率和準(zhǔn)確率慎陵,看如下矩陣:

準(zhǔn)確率指的是搜到內(nèi)容中相關(guān)內(nèi)容的比例;召回率指的是搜索到內(nèi)容中喻奥,真正被搜索出來(lái)的比例席纽。這兩個(gè)指標(biāo)的比例越靠近1,效果越好撞蚕,但是有些情況下润梯,準(zhǔn)確率和召回率是一組相互矛盾的指標(biāo),比如我們只搜索出一個(gè)搜索結(jié)果,且是正確的纺铭,那準(zhǔn)確率就達(dá)到了100%寇钉,但是召回率卻很低。這兩個(gè)概念在搜索優(yōu)化中是關(guān)鍵性指標(biāo)舶赔,涉及到更高級(jí)的搜索機(jī)制扫倡,這里不做深入探討。這里需提醒一點(diǎn)顿痪,不是所有包含用戶query關(guān)鍵詞的結(jié)果都應(yīng)該被召回镊辕。

?第三步:對(duì)搜索的結(jié)果進(jìn)行排序

其實(shí)搜索的邏輯應(yīng)該是通用的:用戶輸入一個(gè)文本(字符串),該文本會(huì)轉(zhuǎn)化為標(biāo)準(zhǔn)詞庫(kù)中的詞蚁袭,搜索系統(tǒng)根據(jù)每個(gè)具體內(nèi)容是否包含這些詞來(lái)決定是否展示這些內(nèi)容征懈,同時(shí)搜索系統(tǒng)根據(jù)文本的相關(guān)性給這些展示的內(nèi)容一個(gè)分?jǐn)?shù),分?jǐn)?shù)的高低決定的排序的先后揩悄。

因此卖哎,對(duì)搜索結(jié)果進(jìn)行排序十分關(guān)鍵,排序位置的高低決定了點(diǎn)擊率删性、轉(zhuǎn)化率等一系列關(guān)鍵性運(yùn)營(yíng)指標(biāo)亏娜,很顯然排序越靠前的結(jié)果更容易獲得用戶的點(diǎn)擊。好的搜索不僅僅是把應(yīng)該搜索的內(nèi)容盡可能的搜索出來(lái)蹬挺,同時(shí)還要考慮應(yīng)該把容易吸引用戶的內(nèi)容展示在前面维贺。但是如何對(duì)篩選出來(lái)的內(nèi)容進(jìn)行排序呢?這里涉及到了較復(fù)雜的算法規(guī)則巴帮。

下面這個(gè)Lucene的核心排序公式的原理溯泣,有專業(yè)文章詳細(xì)介紹:

(http://www.cnblogs.com/ibook360/archive/2011/10/19/2217638.html)

當(dāng)然還有很多這種公式的變形式,所有的變形式都基于這個(gè)準(zhǔn)則:賦予每個(gè)因子不同的權(quán)重榕茧,所賦予權(quán)重的值直接影響排序的先后垃沦。如搜索出來(lái)的商品,價(jià)格用押、銷量等元素都可作為排序的因子肢簿,如果把“銷量”這個(gè)因子賦予較高的權(quán)重,那么銷量較大的商品搜索出來(lái)會(huì)靠前蜻拨。當(dāng)然池充,對(duì)某個(gè)因子賦權(quán)的大小視業(yè)務(wù)的需求而定。

搜索的原理基本是這樣的缎讼,其中涉及到的一些復(fù)雜算法不在此篇文章的探討范圍之內(nèi)纵菌,也無(wú)法進(jìn)行深度探討。了解了搜索的原理休涤,下次我們?cè)O(shè)計(jì)搜索系統(tǒng)咱圆、碰到搜索相關(guān)的功能時(shí)笛辟,腦子里就會(huì)有一個(gè)清晰的邏輯。原理了解了序苏,那設(shè)計(jì)搜索功能還會(huì)遇到一些搜索的交互以及界面細(xì)節(jié)問(wèn)題手幢,下回找時(shí)間寫一篇文章介紹如何對(duì)搜索功能進(jìn)行界面設(shè)計(jì)以及用戶體驗(yàn)提升的細(xì)節(jié)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末忱详,一起剝皮案震驚了整個(gè)濱河市围来,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌匈睁,老刑警劉巖监透,帶你破解...
    沈念sama閱讀 219,188評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異航唆,居然都是意外死亡胀蛮,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門糯钙,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)粪狼,“玉大人,你說(shuō)我怎么就攤上這事任岸≡匍” “怎么了?”我有些...
    開封第一講書人閱讀 165,562評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵享潜,是天一觀的道長(zhǎng)困鸥。 經(jīng)常有香客問(wèn)我,道長(zhǎng)剑按,這世上最難降的妖魔是什么疾就? 我笑而不...
    開封第一講書人閱讀 58,893評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮吕座,結(jié)果婚禮上虐译,老公的妹妹穿的比我還像新娘瘪板。我一直安慰自己吴趴,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,917評(píng)論 6 392
  • 文/花漫 我一把揭開白布侮攀。 她就那樣靜靜地躺著锣枝,像睡著了一般。 火紅的嫁衣襯著肌膚如雪兰英。 梳的紋絲不亂的頭發(fā)上撇叁,一...
    開封第一講書人閱讀 51,708評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音畦贸,去河邊找鬼陨闹。 笑死楞捂,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的趋厉。 我是一名探鬼主播寨闹,決...
    沈念sama閱讀 40,430評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼君账!你這毒婦竟也來(lái)了繁堡?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,342評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤乡数,失蹤者是張志新(化名)和其女友劉穎椭蹄,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體净赴,經(jīng)...
    沈念sama閱讀 45,801評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡绳矩,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,976評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了劫侧。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片埋酬。...
    茶點(diǎn)故事閱讀 40,115評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖烧栋,靈堂內(nèi)的尸體忽然破棺而出写妥,到底是詐尸還是另有隱情,我是刑警寧澤审姓,帶...
    沈念sama閱讀 35,804評(píng)論 5 346
  • 正文 年R本政府宣布珍特,位于F島的核電站,受9級(jí)特大地震影響魔吐,放射性物質(zhì)發(fā)生泄漏扎筒。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,458評(píng)論 3 331
  • 文/蒙蒙 一酬姆、第九天 我趴在偏房一處隱蔽的房頂上張望嗜桌。 院中可真熱鬧,春花似錦辞色、人聲如沸骨宠。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,008評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)层亿。三九已至,卻和暖如春立美,著一層夾襖步出監(jiān)牢的瞬間匿又,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,135評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工建蹄, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留碌更,地道東北人裕偿。 一個(gè)月前我還...
    沈念sama閱讀 48,365評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像痛单,于是被迫代替她去往敵國(guó)和親击费。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,055評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 最近由于工作需要桦他,調(diào)研學(xué)習(xí)各類產(chǎn)品的搜索功能蔫巩,于是準(zhǔn)備做個(gè)筆記和大家分享,也督促自己總結(jié)抽象快压。 首先思考一個(gè)問(wèn)題圆仔,...
    兔子的產(chǎn)品實(shí)驗(yàn)田閱讀 7,505評(píng)論 11 70
  • 不知不覺(jué),歲寒輸入法的更新歷史已經(jīng)可以列出這么一長(zhǎng)串來(lái)了蔫劣。從中可以看出坪郭,歲寒的發(fā)展過(guò)程也是一個(gè)不斷試錯(cuò)的過(guò)程,其中...
    臨歲之寒閱讀 33,978評(píng)論 1 6
  • Android 自定義View的各種姿勢(shì)1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 172,178評(píng)論 25 707
  • 概述及標(biāo)簽體系搭建 1 概述 隨著信息技術(shù)的迅速發(fā)展和信息內(nèi)容的日益增長(zhǎng)脉幢,“信息過(guò)載”問(wèn)題愈來(lái)愈嚴(yán)重歪沃,愈發(fā)帶來(lái)很大...
    JinkeyAI閱讀 22,799評(píng)論 10 241
  • (嚴(yán)重劇透,多圖嫌松。) 中國(guó)的同性電影我看得不多沪曙,細(xì)想來(lái),印象深刻的有《美少年之戀》《藍(lán)宇》《春光乍瀉》《安非他命》...
    颼飗紅葉閱讀 1,896評(píng)論 13 21