背景說明:本文以百度地圖為例,試分析其同一城市的公交線路推薦策略的思路框架。公交路線中所包括的交通方式包括公交車圆到、地鐵坏平、機場巴士、輪渡渠概、步行茶凳、騎行。
一播揪、產(chǎn)品目標
1. 整體目標
針對于同城的公交線路制定推薦策略贮喧,使用戶的滿意度達到最佳。這里的“最佳”是指猪狈,最優(yōu)先為用戶推薦同城中從A點到B點的成本最小的公交線路箱沦。不同用戶在不同場景下對于“最小成本”的需求是不同的,譬如上班的時候需要是時間最快且準時雇庙,晚上回家的時候可能需要的是少步行谓形,等等。因此疆前,我們需要實現(xiàn)的即是基于不同的用戶和場景寒跳,為其推薦成本最小的路線、讓用戶的滿意度最佳竹椒。
2. 衡量體系
基于產(chǎn)品目標童太,需要制定一系列的指標體系來告訴我們用戶是否滿意了、我們是否達到了預期的產(chǎn)品目標胸完,并且根據(jù)數(shù)據(jù)指標所反饋出的情況作為下一步迭代的依據(jù)书释。
此處的數(shù)據(jù)指標包括:
1)用戶點擊推薦線路的次數(shù)——即假設從A點到B點的推薦線路共有10條,那么用戶共點了幾條推薦線路的數(shù)據(jù)舶吗。若用戶滿意度越高征冷,則點的次數(shù)越少(或不點擊);
2)用戶點擊的推薦路線的排序——用戶點擊的推薦線路的排名位置誓琼,點擊的線路排名越靠前越好检激。
二、排序策略的原理概述
根據(jù)用戶的出發(fā)地腹侣、目的地叔收、公交線路圖、路況傲隶、運營時間等饺律,我們可以得出從A地到B地的路線的客觀集合《逯辏基于不同的需求复濒,我們需要從這些線路的集合中篩選出符合用戶需求的線路進行排序脖卖。
基于歷史數(shù)據(jù)和用戶調研,可了解到用戶在考慮路線的優(yōu)劣時巧颈,主要考慮總時長畦木、準時率、價格砸泛、步行距離十籍、換乘次數(shù)、交通方式偏好這幾個維度的因素唇礁,我們可以稱這幾個維度為“路線特征”勾栗。因此,我們將考慮不同用戶在不同場景下盏筐,對于路線特征的權重偏好围俘,從而通過算法加權得到一個路線的“推薦得分”,并以“推薦得分”作為唯一的排序依據(jù)机断。
以下附上選擇總時長/準時率/價格/步行距離/換成次數(shù)/交通方式偏好楷拳,作為主要路線特征衡量因素的分析過程。通過典型用戶/場景的例子加以說明吏奸。
1. 總時長:用戶趕去機場乘飛機欢揖,希望以最快的時間到達/ 不喜歡在交通工具上花太多時間,希望以最有效率的時間到達和朋友聚會的咖啡廳
2. 準時率:預定了8:00的會奋蔚,希望路上不要有延誤的風險/ 早上9:30要到公司打開她混,一般在固定時間出門,希望在預期的時間內到達(備注:這里所說的準時率泊碑,主要是考慮堵車風險)
3. 價格:王大媽每天都要乘公交出去買菜坤按,路上時間長點沒關系、但希望票價不要太貴/ 建筑工人小趙白天在市區(qū)干活馒过、晚上回城郊住宿臭脓,路途較遠嫌地鐵貴,希望乘坐比較便宜的公交
4. 少步行:天氣惡劣的時候腹忽,希望盡量減少戶外步行的時間/ 在體力上不想太勞累来累,不希望走太多路/ 拿了比較多的行李,不想走太多路窘奏、不方便/ 帶著病人去醫(yī)院看病嘹锁,不希望走太多路
5. 換乘次數(shù):帶老人坐公交、腿腳不太利索着裹,希望少換乘领猾、避免太折騰/ 和客戶約了9:00減免,換乘多的話,對時間的預估會不準/ 小張上班路上喜歡看劇摔竿,換乘多了對時間不好預估面粮,而且會經(jīng)常中斷她看劇
6. 交通方式偏好:小李不會騎單車,不希望看到采用單車的路線方案/ 孟大媽覺得坐地鐵總覺得太悶拯坟,喜歡坐在公交車上看窗臺外的風景/ 公交經(jīng)常不準時但金,白領cathy喜歡高效韭山、準時的出行方式
三郁季、輸入
根據(jù)前文所說,此處的輸入即為路線特征權重的影響因素钱磅。
我們將影響因素主要分為了“用戶特征”和“場景特征”類梦裂,以下舉例說明這些因素如何影響排序。
CASE 1
用戶特征-歷史行為記錄-收藏路線:譬如盖淡,小王總是喜歡收藏少換乘的路線年柠,那么積累到數(shù)據(jù),我們可以為小王打一個“偏向于少換乘”的標簽褪迟,并作為推薦路線的依據(jù)冗恨。
CASE 2
場景特征-出發(fā)的時間段特征-白天/夜間:譬如,用戶晚上11:30選擇公共交通味赃,處于安全性的考慮掀抹,晚上會少推薦需要步行比較長/在小巷道中步行的路線。
四心俗、計算邏輯
每條線路都將計算一個“推薦分值”傲武,將會以“推薦分值”作為唯一依據(jù)進行路線排序。
推薦分值計算邏輯:
1. 基礎分值
基礎分值在-10~10分之間城榛,需要對各路線中的各特征的表現(xiàn)做出評分揪利。基礎分值是不考慮具體用戶特征和場景特征的一個普適性評分狠持,評分的依據(jù)為歷史數(shù)據(jù)疟位。
CASE:以總時長為例,從歷史數(shù)據(jù)中我們可以看到一段10km的路在某個城市中的耗費總時長分布喘垂,假設歷史數(shù)據(jù)反饋甜刻,80%的用戶都選擇了時長在30~50分鐘的線路。若當前一個10km的路線推薦時間在1.5h王污,那么該路線“總時長”維度的基礎分值應為負數(shù)罢吃。
2. 權重
權重的依據(jù)包括用戶特征、場景特征昭齐、歷史數(shù)據(jù)尿招、PM的調研/判斷,以下舉例說明計算邏輯。
CASE 1
用戶特征-用戶歷史行為:根據(jù)用戶以往的行為記錄就谜,該用戶偏向于點擊/收藏換乘較少的路線怪蔑,那么“換乘次數(shù)”的系數(shù)就應當在整體計算中加大;
CASE 2
場景特征-目的地特征:譬如用戶輸入的目的地為動車站丧荐,根據(jù)大量用戶的歷史數(shù)據(jù)來看缆瓣。當用戶輸入了“高鐵站”,其背后的訴求是“準時”和“用時少”虹统,那么此時總時長和準時率的系數(shù)就應當增大弓坞;
3. 閾值
線路特征中的總時長、準時率车荔、換乘次數(shù)渡冻、步行距離、價格忧便、交通方式偏好都應當有一個閾值族吻。若觸發(fā)了閾值,那么這條路線便不用推薦(閾值代表了用戶無法忍受的一個值)珠增。
譬如超歌,從A點到B點共10km,對于小李來說蒂教,他最多可以接受55min路程巍举。若超出了55min這個閾值,在有其他一定數(shù)量路線推薦的基礎上悴品,那么這條超過閾值的路線就不推薦了禀综。如果沒有其他足夠數(shù)量的路線推薦,那么這條超過閾值的路線就排序位于最后苔严。
那么定枷,如何來確定閾值呢?
1)對于一個用戶的冷啟動階段届氢,則以歷史數(shù)據(jù)作為標準欠窒。即普羅大眾的閾值標準。舉例來說退子,從A點到B點岖妄,歷史數(shù)據(jù)表明80%的用戶都僅接受3次及以內的換乘,如果有超過4次的換乘則不用再推薦寂祥。
2)當用戶使用APP一定時間之后荐虐,則根據(jù)該用戶的特征和歷史數(shù)據(jù)來進行綜合判斷。譬如丸凭,用戶手動選擇了“不坐地鐵”福扬,那么帶有地鐵推薦的線路則會被認為是超過了這個閾值腕铸,不予推薦。若用戶總是選擇步行少的路線铛碑,那么可以調低該用戶對于步行的閾值狠裹,因為他對“步行”的忍耐限度比一般用戶要低。
五汽烦、輸出
輸出的結果為每條推薦線路的“推薦分值”涛菠,按照推薦分值的高低從上到下依次排列。
衡量指標為用戶點擊推薦線路的次數(shù)和點擊的推薦路線的排序撇吞,并可以以此作為效果評估的標準和迭代依據(jù)俗冻。