PM搜索總結(一)——如何通過query分析煤傍、session分析挖掘用戶搜索需求把握行為習慣

搜索產品和推薦產品一樣,是策略主導的產品類型嘱蛋,與功能型產品相比蚯姆,前者更加注重背后邏輯策略的設計五续,但在用戶的需求和行為的把握方面,搜索產品龄恋,或者說任何產品疙驾,面臨的要求挑戰(zhàn)都是相同的。了解你的目標用戶郭毕,通過功能或者策滿足用戶需求它碎,追求更好的用戶體驗,是產品設計的重要目標之一显押。

跟其他pm一樣扳肛,需求挖掘是策略產品經理的基本功,定性定量的用戶行為分析是需求挖掘的重要方法煮落,也是數(shù)據(jù)分析的重要方法之一敞峭,這里分析的用戶行為指的是用戶使用搜索產品的最終訴求在于找到自己想要的商品或者信息。為滿足此需求蝉仇,用戶會在搜索產品留下一系列的行為軌跡信息旋讹。我們都應該聽過“方案》數(shù)據(jù)》算法”的說法,很多例子都證明轿衔,方案層的優(yōu)化往往比一味的提高算法準確率對更加有效沉迹,我們要做的用戶分析、需求挖掘是一切方案的基礎害驹。

搜索產品在進行用戶行為分析中常用的兩種分析方法:“query分析”鞭呕,“session分析”。

一.query分析

概念:query即查詢的意思宛官,query分析指的是通過對用戶查詢詞的拆解與分析葫松,了解用戶意圖與需求。

query分析通常會從case的定性分析入手底洗,然后結合數(shù)據(jù)進行定量分析腋么,最終實現(xiàn)了解用戶目的。case抽樣中亥揖,采用隨機抽樣即可珊擂,筆者在進行一次完整分析時通常抽取數(shù)量500+或1000+。

第一步:數(shù)據(jù)分析過程中费变,在完成數(shù)據(jù)采集及清洗過后摧扇,將數(shù)據(jù)分類整理是重要的第一步。

1.query類型劃分:

query按照不同維度可以有多種分類方法挚歧,以電商產品為例扛稽。

按照query組成結構分類:

在分析組成結構的時候要注意分詞粒度,對于電商產品滑负,可以以索引基本單元劃分庇绽,即term級锡搜。

例如“zara兒童包包”,可以分為zara/兒童/包包:三個term的類型分別為品牌瞧掺,性別,類目凡傅,這個query的類型就是品牌+性別+類目辟狈。

按照query的精準程度分類:

“zara兒童包包”與“包”對比,前者的精準程度明顯大于后者夏跷,根據(jù)query精準程度的不同哼转,可以劃分為“泛搜索詞”與“精準搜索詞”,劃分粒度根據(jù)需求決定槽华。

按照query是否含有不明意圖修飾詞劃分:

例如“最好看的包包”壹蔓,“最好看的”就是非明確意圖的修飾詞,一般這種類型的query在電商行業(yè)比重較小猫态。

按query是否錯誤劃分:

同音字佣蓉、錯別字、輸入法錯誤導致的query錯誤亲雪,也是一種類型勇凭。

2.query類型劃分的意義:

?2.1通過抽樣調查的結果,統(tǒng)計各個類型query所占比例义辕,了解你的搜索產品用戶需求的分布虾标,是策略設計的前提,同時也要注意灌砖,產品設計中考慮投入產出比璧函,并不是所有的問題都需要解決,所有的點都需要優(yōu)化基显,哪些問題影響面廣蘸吓,優(yōu)化覆蓋率高,各個類型的query比例是優(yōu)先級的依據(jù)续镇。明確高頻詞(頭部)美澳、低頻詞(長尾)組成,按照基本的二八原則摸航,可以指導很多策略的確定制跟。這里需要注意以上幾個分類并不是獨立的,不同分類維度不同酱虎,結果存在耦合雨膨。

?2.2query組成結構代表用戶的關注點,通常電商產品用戶一般關注品牌读串、類目聊记、性別撒妈、有明確意圖的修飾詞,類似:顏色排监、款式等狰右,不同垂直領域會有分布差別,了解用戶關注點舆床,才能有的放矢的匹配用戶需求棋蚌。

?2.3query精準程度、需求明確程度通常反應代表用戶的購買意圖挨队,搜索“zara兒童包包”的用戶往往比搜索“zara”的用戶購買意愿更加強烈谷暮。

?2.4包含無明確意圖的修飾詞往往代表用戶是專業(yè)內新手,無法明確表達自己的需求盛垦,當此類query過多的時候湿弦,需要考慮更多的資訊類內容進行新手的教育。

?2.5query錯誤的時候腾夯,需要糾錯颊埃、改寫策略。

第二步俯在,query分類后續(xù)分析竟秫。

通過query分析,我們通常能得到搜索產品的需求分布與比例跷乐,但query類型劃分并不是query分析的終點肥败,而是分類查找問題的開始。

概念:

召回:搜索查詢返回物品的過程愕提。

召回率:返回物品的數(shù)量/數(shù)據(jù)庫內應該被召回的物品的總量馒稍。

準確率:召回物品中準確的物品數(shù)量/召回物品的總量。

F1-sorce:是統(tǒng)計學中用來衡量二分類模型精確度的一種指標浅侨,它同時兼顧了分類模型的準確率和召回率纽谒。F1-sorce是模型準確率和召回率的一種加權平均,F(xiàn)1-sorce=2*p*r/(p+r)如输,最大值是1鼓黔,最小值是0

召回率、準確率以及F1-sorce是評估策略的重要指標不见。

示例一個簡單的query抽樣分析:


抽樣分類后仍然需要結合定量的數(shù)據(jù)統(tǒng)計澳化,查看抽樣case暴露出來的問題總量。

可以思考以下問題

1.哪類query召回數(shù)量少稳吮?

是否資源過少無法滿足用戶需求缎谷?是否需要通過招商配合豐富商品?

2.哪類query的召回率低灶似?

低的原因:商品信息填寫不全導致無法命中列林?部分信息未建索引導致無法命中瑞你?其他技術問題?

3.哪類query準確率低希痴?

低的原因:商品信息填寫不準確導致誤召回者甲?商家seo作弊?技術bug润梯?

4.哪類query平均瀏覽結果數(shù)量少过牙?

少的原因:排序不合理?商品數(shù)量過多降低瀏覽欲望纺铭?

5.哪類query點擊/購買數(shù)量少?

少的原因:缺乏優(yōu)質/新穎商品刀疙?未召回優(yōu)質商品舶赔?排序不合理無法迅速查找目標商品?價格太貴谦秧?

……

搜索結果頁的產品展示設計問題竟纳、信息整合問題、ui設計問題都可以此逐一分析疚鲤。

具體問題解決環(huán)節(jié)要從占比大锥累、程度重的解決。

二. session分析

query分析側重從用戶在搜索過程中留下的查詢詞入手集歇,session分析則側重用戶從進入搜索到推出搜索的整個過程分析用戶行為桶略。

概念:

session:即會話,是指在制定的時間段內在網站上發(fā)生的一系列互動诲宇,搜索的sesion分析指的是從點擊搜索輸入框/icon至離開搜索的一些列行為际歼。

session分析:是一種專業(yè)的數(shù)據(jù)分析,把用戶單點行為串聯(lián)成一個整體姑蓝,在此基礎上進行分析鹅心,解決用戶分析中的“線”型難題。

(以上定義參考神策-張喬的文章《數(shù)據(jù)分析方法論:你真的懂session(會話)分析嗎纺荧?》)

session切割時間:session切割一向是比較模糊的難題旭愧,有很多論文論述session切割標準與方法,筆者在做搜索session分析時通常采用“離開搜索30分鐘未返回”標準切割宙暇。

搜索中用戶單點行為包括:

?輸入查詢詞

?點擊查詢

?瀏覽結果

?點擊結果

?返回結果瀑布流

?更換搜索詞

?收藏商品

?加入購物車

?購買/下單商品

……

一個session中通常包含多個單點行為输枯,同時每個單點行為通常帶有其他信息。

舉例筆者分析通過session分析查找用戶搜索后無點擊行為的例子客给。

通過數(shù)據(jù)分析用押,發(fā)現(xiàn)搜索后無點擊行為占比比較高彩匕,分析前先做調查垦页,搜索后無點擊原因包含常規(guī)的原因,如用戶對商品不滿意,用戶對召回結果不滿意等原因哄辣,除此之外,用戶搜索心理對點擊的影響卻很難憑空猜測澎语,通過session分析的方法蜗顽,查找其原因,尤其是用戶自身原因血崭。

第一步:采集數(shù)據(jù)與人工整理卧惜。

數(shù)據(jù)采集可以采用第三方數(shù)據(jù)平臺,例如神策夹纫,在埋點詳細的情況下咽瓷,也可直接找研發(fā),好處是可以根據(jù)自己需要靈活提取詳細數(shù)據(jù)舰讹。

本次選取包含從輸入某查詢詞點擊查詢至改寫查詢詞或者離開搜索頁過程中茅姜,無點擊結果行為的100個搜索session。


第二步:將用戶搜索意圖根據(jù)需求程度大致分類月匣。

電商行業(yè)區(qū)別于o2o行業(yè)钻洒,用戶在沒有購買轉化意愿的時候也會常常使用產品,其目的是多樣的锄开,且每一種目的比例都很可觀素标。結合線下訪談與平臺特性大致劃分以下三類。

1.了解認識:出于了解行業(yè)動向了解萍悴,“換季了头遭,新出了什么衣服”,“聽說了兩個牌子退腥,搜搜看什么風格”任岸,或者無意義瀏覽,類似線下的無目標逛街狡刘,打發(fā)時間享潜,標準的“瀏覽型”用戶。

2.關注偏好:用戶對某些品牌或者商品有特定愛好嗅蔬,會定期查詢了解相關動態(tài)剑按。

3.準確意圖:有具體的商品目標,通常一定要找到該目標商品澜术,可能加入購物車或者購買艺蝴,也可能最終決定放棄。這一類是典型的“購買型”用戶鸟废。

出于不同搜索目的的用戶在搜索后無點擊行為的原因是不同的猜敢,例如:出于了解認識的用戶,搜索后無點擊行為,但是如果發(fā)生瀏覽行為仍然說明本次搜索滿足了用戶需求缩擂。而出于準確意圖的用戶鼠冕,搜索后無點擊則說明搜索或者商品本身是存在需要解決的重大問題。

第三步胯盯,以上分類粒度是無法滿足定位具體原因目的的懈费,需要將用戶搜索行為按照一定的標準歸入大類,并繼續(xù)劃分次級類型博脑,并分析每種類型背后的原因憎乙。

如何將搜索行為歸納到以上類型,并繼續(xù)劃分次級類型叉趣,以下行為標準可以參考:

1.查詢次數(shù):一次完整的搜索session通常由多次查詢組成泞边。

2.query類型:參照上面query分析里的分類,確定意圖疗杉。

3.查詢改寫的類型:?

用戶將查詢提交給搜索引擎繁堡,然后對搜索結果進行瀏覽,如果發(fā)現(xiàn)搜索結果不能完全解決用戶的信息需求乡数,則會根據(jù)搜索結果的啟發(fā),改寫查詢闻牡,以便更精確地描述自己的信息需求净赴,之后重新構造新的查詢請求,如此形成用戶和搜索引擎交互的閉合回路罩润。后續(xù)的查詢改寫是用戶逐步澄清搜索需求的一個過程玖翅。

抽象化改寫:將原來的查詢進行語義抽象,比如由“zara兒童包包”經過抽象改寫為“zara包包”割以,后者在語義概念層次上要更加寬泛金度,包含了兒童包包這個概念,之所以要做這種類型的改寫严沥,往往是因為原先查詢找到的東西太少了猜极,通過概念泛化增加搜索的召回率,以此方法找到更多內容消玄。

具體化改寫:具體化改寫與抽象化改寫相反跟伏,從寬泛的語義概念下行收窄,改寫后的查詢更加具體翩瓜,這么做可以更加精準的的定位查找內容受扳。

同義化改寫:此類型改寫則保持改寫前后的查詢含義不變,比如將“兒童”改寫為“小孩”兔跌,兩者代表的含義是相同的勘高,用戶如此改寫往往是對原先查詢的搜索結果不滿意,所以換了一種同一說法來繼續(xù)搜索。

多類型改寫:用戶在目標明確且查找意愿非常強烈而返回結果不能讓其滿意的情況下华望,用戶會進行反復的查詢改寫蕊蝗,導致一次搜索session包含多次改寫,改寫類型也不相同立美。

其他關聯(lián)類型:即使用戶的查詢語義并無上述邏輯匿又,通常也不代表前后查詢毫無關聯(lián),尤其是在電商行業(yè)建蹄,依然可以根據(jù)查詢詞是否存在“品牌”“類目”“顏色”“款式”等內在相同點來判斷用戶意圖的相關性和連續(xù)性碌更。這里還有一類隱藏較深的關聯(lián)關系,例如“Sandro”與“maje”兩個品牌類型查詢詞洞慎,看似無關痛单,了解品牌的同學可能會知道這兩個品牌都是著名的少女風格時尚品牌,因此這次的查詢改寫仍然是有關聯(lián)的劲腿。

4.瀏覽行為與點擊行為:瀏覽的深度和是否發(fā)生點擊行為往往代表用戶是否找到滿意的商品旭绒。

5.切換排序方式:搜索的結果頁提供多種排序方式,默認-按照熱度-按照價格-按照銷量-按照時間焦人,用戶在切換排序方式的時候反應影響查找商品決策的因素挥吵。

6.篩選行為:通過篩選,縮小查詢范圍花椭。

7.加入購物車行為與購買行為:發(fā)生加入購物車或者購買行為代表用戶找到目標商品忽匈,目標信息與第一次查詢的偏移程度也可作為用戶行為分析的內容。

用戶搜索意圖是由整個session綜合分析得到矿辽,任何單一的行為都不能完整的代表用戶意圖丹允。

最終可形成初步結果:


以上述表格中session為例進行分析。

session1:用戶第一次查詢詞“zara兒童包包”袋倔,召回結果數(shù)=瀏覽數(shù)量雕蔽,點擊次數(shù)為0,無加入購物車以及購買行為宾娜,第二次查詢改寫為“zara包包”批狐,為抽象化改寫,這次召回商品數(shù)量為5000碳默,瀏覽數(shù)量1000贾陷,遠多于第一次,本次發(fā)生點擊行為嘱根,但點擊商品位置排名較后髓废。

說明用戶有明確的商品目標,第一次“zara兒童包包”召回結果數(shù)過少该抒,未包含用戶目標商品慌洪,進行抽象化改寫后,擴大搜索范圍,找到目標商品冈爹,發(fā)生點擊涌攻,猜測可能存在目標商品無法召回問題,需分析召回問題频伤,點擊位置說明排序存在問題恳谎,有優(yōu)化空間。

session2:用戶第一次查詢詞“chanel”憋肖,瀏覽深度大于平時瀏覽平均深度因痛,切換過“按價格排序”,第二次改寫查詢詞為“gucci”岸更,瀏覽深度大于平時瀏覽平均深度鸵膏,無其他行為,兩次搜索都無點擊行為怎炊。

分析“chanel”與“gucci”并無風格類似等內在聯(lián)系谭企,但都為大家耳熟能詳?shù)臒衢T奢侈品品牌,同時用戶瀏覽深度較大评肆,可判斷是出于了解認識目的债查,“線上逛街”,并無明顯的優(yōu)化點瓜挽,可考慮增加更多資訊信息攀操,以及信息組織形式,滿足瀏覽型用戶“逛”的需求秸抚,用戶切換過“按價格排序”,可能屬于價格敏感性用戶歹垫,可考慮增加優(yōu)惠信息剥汤,輔助激發(fā)購物欲望。

這里面的“行為原因”就是用戶出于不同目的引發(fā)的無點擊行為原因排惨,據(jù)本次分析吭敢,包括“了解認識_正常瀏覽”“準確意圖_懶,首次查詢輸入信息不全”等多種原因暮芭。

第四步鹿驼,從問題角度匯總整理。


這樣就能完成一次session分析查找無點擊行為總結辕宏。

最終根據(jù)整理的問題畜晰,按照優(yōu)先級依次解決。




蕭飯飯瑞筐,搜索推薦產品經理凄鼻,WX:xiao-xiao1991,歡迎大家一同探討,共同進步~

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末块蚌,一起剝皮案震驚了整個濱河市闰非,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌峭范,老刑警劉巖财松,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異纱控,居然都是意外死亡辆毡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進店門其徙,熙熙樓的掌柜王于貴愁眉苦臉地迎上來胚迫,“玉大人,你說我怎么就攤上這事唾那》枚停” “怎么了?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵闹获,是天一觀的道長期犬。 經常有香客問我,道長避诽,這世上最難降的妖魔是什么龟虎? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮沙庐,結果婚禮上鲤妥,老公的妹妹穿的比我還像新娘。我一直安慰自己拱雏,他們只是感情好棉安,可當我...
    茶點故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著铸抑,像睡著了一般贡耽。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上鹊汛,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天蒲赂,我揣著相機與錄音,去河邊找鬼刁憋。 笑死滥嘴,一個胖子當著我的面吹牛,可吹牛的內容都是我干的至耻。 我是一名探鬼主播氏涩,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼届囚,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了是尖?” 一聲冷哼從身側響起意系,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎饺汹,沒想到半個月后蛔添,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡兜辞,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年迎瞧,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片逸吵。...
    茶點故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡凶硅,死狀恐怖,靈堂內的尸體忽然破棺而出扫皱,到底是詐尸還是另有隱情足绅,我是刑警寧澤,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布韩脑,位于F島的核電站氢妈,受9級特大地震影響,放射性物質發(fā)生泄漏段多。R本人自食惡果不足惜首量,卻給世界環(huán)境...
    茶點故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望进苍。 院中可真熱鬧加缘,春花似錦、人聲如沸觉啊。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽柄延。三九已至,卻和暖如春缀程,著一層夾襖步出監(jiān)牢的瞬間搜吧,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工杨凑, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留滤奈,地道東北人。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓撩满,卻偏偏與公主長得像蜒程,于是被迫代替她去往敵國和親绅你。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內容