搜索引擎“相關(guān)推薦”策略介紹

廣義上搜索引擎的“相關(guān)推薦”包含這么幾個(gè)模塊:
1户敬、suggest模塊:輸入query(關(guān)鍵詞)過(guò)程中出現(xiàn)在搜索框下方的智能推薦落剪。
2、相關(guān)搜索模塊:就是搜索結(jié)果底部的那堆文字鏈模塊尿庐。
3忠怖、右側(cè)相關(guān)推薦模塊:出現(xiàn)在搜索結(jié)果右上角的圖文推薦模塊。
以上三個(gè)模塊所起到的作用各不相同抄瑟,下面逐個(gè)拆解凡泣。

suggest模塊
與其它2個(gè)模塊不同,suggest是在搜索結(jié)果展示之前出現(xiàn),所以它起到的主要作用是在用戶完成輸入query之前命中用戶的搜索需求问麸,從而減少用戶的輸入成本往衷。
如用戶輸入“4”時(shí)钞翔,推薦“4399小游戲”严卖;輸入“明朝”時(shí),推薦“明朝那些事”布轿;輸入“邢剩花”時(shí),推薦“刑ぃ花的貼身高手”等等稠肘。
為了命中用戶需求的概率更高,suggest需要重點(diǎn)滿足幾個(gè)條件:
1萝毛、要相關(guān)项阴,符合用戶輸入習(xí)慣,這是最基本的笆包。
2环揽、要足夠熱門,同等情況下搜索量越高越好庵佣,這里的搜索量指的是較長(zhǎng)一段時(shí)間內(nèi)的均值歉胶。
3、要足夠多樣化巴粪,集中于某個(gè)特定的主題通今,不如分散到多個(gè)主題。如搜索“明朝那些事”肛根,全部出在線閱讀辫塌、txt下載、有聲閱讀這些下位需求派哲,不如適當(dāng)穿插“明朝那些事2(3臼氨、4)”等。
4狮辽、適當(dāng)關(guān)注時(shí)效性一也。推薦的時(shí)候需要考慮近期搜索量增長(zhǎng)很快的一些query,如搜索“劉曉慶”喉脖,前段時(shí)間劉曉慶吐槽機(jī)場(chǎng)面條貴那個(gè)事件就需要推薦椰苟。
5、如果技術(shù)允許树叽,可以參考用戶的搜索日志做個(gè)性化推薦舆蝴,這或許是目前各搜索引擎提升空間最大的地方,上面4個(gè)方面各主要搜索引擎都做的不錯(cuò)了。有機(jī)會(huì)可以針對(duì)suggest的個(gè)性化專門寫一篇文章來(lái)分析洁仗。

相關(guān)搜索模塊
該模塊的典型使用場(chǎng)景是用戶輸入query后在搜索結(jié)果中沒(méi)有發(fā)現(xiàn)自己需要的內(nèi)容层皱,在拉到搜索結(jié)果底部時(shí)點(diǎn)擊相關(guān)搜索繼續(xù)尋找自己需要的內(nèi)容。
做好該模塊的要素大體上和suggest差不多赠潦,相關(guān)性叫胖、熱門度、多樣性她奥、時(shí)效性等都挺重要瓮增。但因?yàn)?b>相關(guān)搜索模塊是在搜索結(jié)果顯示后才出現(xiàn)的,所以根據(jù)搜索結(jié)果對(duì)用戶需求的滿足程度不同哩俭,出現(xiàn)的相關(guān)搜索推薦也有所差異绷跑。
1、當(dāng)用戶需求滿足度較好時(shí)凡资,和query語(yǔ)義重復(fù)的推薦要做打壓砸捏,多推薦一些和query互補(bǔ)或者領(lǐng)域相關(guān)的內(nèi)容。如“花千骨”隙赁,主需求是在線觀看該電視劇垦藏,當(dāng)然搜索結(jié)果滿足的非常好。那么“花千骨全集”鸳谜、“花千骨在線觀看”等語(yǔ)義重復(fù)的推薦就不要出了膝藕。這時(shí)適當(dāng)偏離主需求的推薦就可以推薦,如“花千骨2015”咐扭、“花千骨 優(yōu)酷”芭挽、“花千骨小說(shuō)”以及類型相似的電視劇如“瑯琊榜”、“云中歌”等蝗肪。
2袜爪、當(dāng)用戶需求滿足度較差時(shí),和query語(yǔ)義重復(fù)的推薦就不能盲目打壓薛闪。比如很典型的盜版電影需求辛馆,如目前網(wǎng)上還沒(méi)有免費(fèi)正版資源的煎餅俠。用戶搜索“煎餅俠免費(fèi)版”豁延,如果用戶需求滿足度較差(這很可能發(fā)生)昙篙,那么推薦“煎餅俠在線觀看”、“煎餅俠西瓜影音”等就很合適诱咏,因?yàn)閷?duì)這類需求苔可,query稍微做一些更改搜索結(jié)果就會(huì)有很大的不同,滿足用戶需求的可能性就更高袋狞。此時(shí)就不能對(duì)原語(yǔ)義做太多的偏離焚辅,如弱需求“煎餅俠票房”映屋、“煎餅俠演員表”等就不要做太多推薦,至少位置要盡可能靠后同蜻;同樣類型相似的影視“屌絲男士”棚点、“港囧”等都需要做適當(dāng)打壓。

右側(cè)相關(guān)推薦
該模塊獨(dú)特的地方有兩個(gè)方面:
1湾蔓、其它2個(gè)模塊都是純文本展示形式瘫析,該模塊是唯一使用圖文展現(xiàn)形式的模塊。
2卵蛉、其它2個(gè)模塊著重于文本相關(guān)颁股,通俗點(diǎn)說(shuō)就是和原query都有重復(fù)的文字么库;而該模塊更注重領(lǐng)域相關(guān)傻丝,在文本上基本和原query無(wú)重復(fù)的地方,起到的更多的是發(fā)現(xiàn)探索的作用诉儒。
如果說(shuō)搜索引擎目前還只是做到符合用戶預(yù)期葡缰,那么未來(lái)超出用戶預(yù)期的部分最有可能是通過(guò)這個(gè)模塊來(lái)提供。一個(gè)典型的場(chǎng)景是某個(gè)新人剛進(jìn)入互聯(lián)網(wǎng)行業(yè)忱反,某段時(shí)間對(duì)行業(yè)資訊非常感興趣泛释,剛開始它只知道虎嗅網(wǎng),在搜索引擎中搜索“虎嗅網(wǎng)”的過(guò)程中温算,他發(fā)現(xiàn)了右側(cè)推薦的一堆相關(guān)的提供行業(yè)資訊的網(wǎng)站怜校,雷鋒網(wǎng),36氪注竿,pingwest茄茁,知乎,果殼等巩割,這就是典型的超出用戶預(yù)期裙顽。
做好該模塊的難度較大,因?yàn)閿?shù)據(jù)的選擇范圍太廣宣谈,但最少需要做到以下幾點(diǎn):
1愈犹、最基本的是要基礎(chǔ)領(lǐng)域相關(guān),這個(gè)普通的用戶都可以感知到闻丑,技術(shù)難度也不大漩怎。
2、推薦的粒度要細(xì)嗦嗡,不要太粗放勋锤。比如“科比”這個(gè)query,他的首要標(biāo)簽是NBA球星酸钦,其次才是籃球標(biāo)簽怪得,所以推薦的時(shí)候要優(yōu)先推薦相關(guān)的NBA球星咱枉,如果一上來(lái)就推薦籃球相關(guān)的技術(shù)、相關(guān)籃球術(shù)語(yǔ)等徒恋,那么粒度就有些太過(guò)于粗放蚕断,點(diǎn)擊自然就不會(huì)太高。
3入挣、做好基礎(chǔ)質(zhì)量亿乳,尤其是圖片質(zhì)量。圖片是吸引用戶點(diǎn)擊的最主要因素径筏,所以圖片起碼要做到清晰相關(guān)葛假,目前各大搜索引擎做的都不是太好,相對(duì)而言百度要好一些滋恬。要做好這一點(diǎn)需要重點(diǎn)在數(shù)據(jù)源上下功夫聊训。
但正如前面所說(shuō),做好這個(gè)模塊的難度很大恢氯,并且人工評(píng)判主觀性太強(qiáng)带斑,比較合理的策略是在做好基礎(chǔ)相關(guān)(各大引擎目前做的都還不錯(cuò))的情況下,不斷調(diào)整策略勋拟,根據(jù)點(diǎn)擊率的變化來(lái)評(píng)判一個(gè)策略的好壞勋磕。策略可以是針對(duì)所有query,也可以是針對(duì)某一類query敢靡,如“影視”挂滓、“人物”、“小說(shuō)”等啸胧。

當(dāng)然赶站,最終判定某個(gè)模塊是否優(yōu)秀,或者策略升級(jí)是否有效吓揪,最終還是要用數(shù)據(jù)說(shuō)話亲怠。比如點(diǎn)擊率是否提升,從該模塊帶過(guò)去的搜索量占總搜索量的比例是否提高等等柠辞。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末团秽,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子叭首,更是在濱河造成了極大的恐慌习勤,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,311評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件焙格,死亡現(xiàn)場(chǎng)離奇詭異图毕,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)眷唉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,339評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門予颤,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)囤官,“玉大人,你說(shuō)我怎么就攤上這事蛤虐〉骋” “怎么了?”我有些...
    開封第一講書人閱讀 152,671評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵驳庭,是天一觀的道長(zhǎng)刑顺。 經(jīng)常有香客問(wèn)我,道長(zhǎng)饲常,這世上最難降的妖魔是什么蹲堂? 我笑而不...
    開封第一講書人閱讀 55,252評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮贝淤,結(jié)果婚禮上柒竞,老公的妹妹穿的比我還像新娘。我一直安慰自己霹娄,他們只是感情好能犯,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,253評(píng)論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著犬耻,像睡著了一般。 火紅的嫁衣襯著肌膚如雪执泰。 梳的紋絲不亂的頭發(fā)上枕磁,一...
    開封第一講書人閱讀 49,031評(píng)論 1 285
  • 那天,我揣著相機(jī)與錄音术吝,去河邊找鬼计济。 笑死,一個(gè)胖子當(dāng)著我的面吹牛排苍,可吹牛的內(nèi)容都是我干的沦寂。 我是一名探鬼主播,決...
    沈念sama閱讀 38,340評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼淘衙,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼传藏!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起彤守,我...
    開封第一講書人閱讀 36,973評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤毯侦,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后具垫,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體侈离,經(jīng)...
    沈念sama閱讀 43,466評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,937評(píng)論 2 323
  • 正文 我和宋清朗相戀三年筝蚕,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了卦碾。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片铺坞。...
    茶點(diǎn)故事閱讀 38,039評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖洲胖,靈堂內(nèi)的尸體忽然破棺而出康震,到底是詐尸還是另有隱情,我是刑警寧澤宾濒,帶...
    沈念sama閱讀 33,701評(píng)論 4 323
  • 正文 年R本政府宣布腿短,位于F島的核電站,受9級(jí)特大地震影響绘梦,放射性物質(zhì)發(fā)生泄漏橘忱。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,254評(píng)論 3 307
  • 文/蒙蒙 一卸奉、第九天 我趴在偏房一處隱蔽的房頂上張望钝诚。 院中可真熱鬧,春花似錦榄棵、人聲如沸凝颇。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,259評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)拧略。三九已至,卻和暖如春瘪弓,著一層夾襖步出監(jiān)牢的瞬間垫蛆,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工腺怯, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留袱饭,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,497評(píng)論 2 354
  • 正文 我出身青樓呛占,卻偏偏與公主長(zhǎng)得像虑乖,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子晾虑,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,786評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容