對(duì)于線上和線下的零售行業(yè),銷量預(yù)測(cè)都是一項(xiàng)至關(guān)重要的任務(wù),它可以幫助企業(yè)更好的預(yù)備庫(kù)存以及在各個(gè)倉(cāng)庫(kù)之間分配商品缝左。特別是在大型購(gòu)物節(jié)期間友鼻,強(qiáng)勁的促銷活動(dòng)將極大地促進(jìn)消費(fèi)嫁盲。然而裂垦,可供參考的歷史數(shù)據(jù)卻非常稀缺恢恼。如何同時(shí)對(duì)城市的不同區(qū)域和不同時(shí)間段的銷量進(jìn)行預(yù)測(cè)扼褪,是一個(gè)非常具有挑戰(zhàn)的問題舱污。
在2020年12月收錄的AAAI 2021(CCF-A類)上什往,京東城市被收錄了一篇名為《Robust Spatio-Temporal Purchase Prediction via Deep Meta Learning》的論文。該論文研究了如何通過(guò)深度元學(xué)習(xí)慌闭,結(jié)合城市中的各項(xiàng)信息以及歷史的銷量數(shù)據(jù)别威,對(duì)未來(lái),特別是大型購(gòu)物節(jié)期間驴剔,城市中各個(gè)區(qū)域不同時(shí)間段的銷量進(jìn)行預(yù)測(cè)省古。
1.背景
購(gòu)物中心和商店的空間分布、人口的分布屬性以及不同的日期類型(例如丧失,工作日豺妓,周末或購(gòu)物節(jié))等因素,將會(huì)導(dǎo)致不同的購(gòu)物方式布讹,如圖1所示琳拭。由于來(lái)自某個(gè)特定區(qū)域以及特定時(shí)間范圍內(nèi)的數(shù)據(jù)過(guò)于稀缺,我們無(wú)法僅使用某個(gè)范圍的數(shù)據(jù)去訓(xùn)練一個(gè)高精度的預(yù)測(cè)模型描验。同時(shí)白嘁,城市中不同區(qū)域的人口密度和分布特征高度異質(zhì),并且隨著時(shí)間的推移區(qū)域特征也會(huì)發(fā)生變化膘流,對(duì)這樣復(fù)雜的時(shí)空購(gòu)買模式進(jìn)行建模是一個(gè)非常困難的任務(wù)絮缅。為了準(zhǔn)確地捕獲區(qū)域的空間特性,它需要考慮一組綜合的空間特征呼股,例如興趣點(diǎn)(POI)分布耕魄,區(qū)域的人口統(tǒng)計(jì)特征等。如何通過(guò)跨時(shí)空建模學(xué)習(xí)提升單個(gè)區(qū)域在特定時(shí)間段的預(yù)測(cè)精度是我們的主要任務(wù)彭谁。
作者將該預(yù)測(cè)任務(wù)分為主要三個(gè)部分:1)利用時(shí)空元學(xué)習(xí)推理吸奴,對(duì)不同的時(shí)空區(qū)域生成對(duì)應(yīng)的時(shí)空表示。2)學(xué)習(xí)不同時(shí)空區(qū)域間的共享信息缠局,同時(shí)結(jié)合區(qū)域特定的時(shí)空表示则奥,得到更加可靠的預(yù)測(cè)銷量。3)通過(guò)時(shí)空交替訓(xùn)練使得模型在空間以及時(shí)間層面都能夠得到更加完善的學(xué)習(xí)甩鳄。
2.時(shí)空表示生成
我們開發(fā)了一個(gè)攤銷網(wǎng)絡(luò)(如圖2 Amortization Network 所示)逞度,以對(duì)目標(biāo)區(qū)域和日期類型的時(shí)空表示的近似后驗(yàn)分布進(jìn)行建模,該模型需要同時(shí)考慮銷量特征和相關(guān)空間特征的影響妙啃。
從圖3(a)中我們可以看到档泽,以北京為例俊戳,不同城區(qū)的銷量分布有著明顯的區(qū)別。
要完全捕獲不同區(qū)域預(yù)測(cè)任務(wù)的購(gòu)買數(shù)據(jù)的時(shí)間特性馆匿,還需要考慮歷史銷量數(shù)據(jù)之間的線性和非線性時(shí)間相關(guān)性抑胎,例如采購(gòu)訂單和購(gòu)物車記錄中所隱藏的周期模式。
圖3(b)中我們能夠看到明顯的以周為周期的銷量模式變化渐北。為了對(duì)這種復(fù)雜而動(dòng)態(tài)的時(shí)間序列模式進(jìn)行建模阿逃,我們使用了線性變換模塊來(lái)獲得銷量的大致基數(shù),并使用一個(gè)特殊的跳躍LSTM層來(lái)捕獲銷量變化的非線性時(shí)間模式赃蛛。接著恃锉,通過(guò)特征融合模塊將提取的時(shí)間特征與靜態(tài)特征相結(jié)合,以進(jìn)一步支持構(gòu)建更具有代表性的銷量時(shí)空表示呕臂。
3.時(shí)空銷量預(yù)測(cè)
通過(guò)上一步破托,我們已經(jīng)得到了特定時(shí)空區(qū)域的銷量表示。接下來(lái)我們將介紹一種利用共享統(tǒng)計(jì)結(jié)構(gòu)的生成模型歧蒋,來(lái)學(xué)習(xí)不同時(shí)空預(yù)測(cè)任務(wù)間所共享信息土砂。對(duì)于任務(wù)特定的預(yù)測(cè),它大大提高了學(xué)習(xí)效率和預(yù)測(cè)準(zhǔn)確性谜洽。該生成模型的結(jié)構(gòu)可以參考上節(jié)所屬的攤銷網(wǎng)絡(luò)結(jié)構(gòu)的解碼器(圖2 Generative Model 所示)萝映。
它使用兩個(gè)不同的輸入來(lái)生成最終的銷量。第一個(gè)輸入側(cè)重于通過(guò)對(duì)最近一段時(shí)間的輸入銷量阐虚,利用特征提取和融合技術(shù)來(lái)挖掘當(dāng)前的購(gòu)買表示序臂,該特征描述了近期的銷量模式的變化。第二個(gè)輸入是從攤銷網(wǎng)絡(luò)中采樣的特定于某個(gè)時(shí)空預(yù)測(cè)任務(wù)的時(shí)空特征表示敌呈。它捕獲了目標(biāo)任務(wù)的宏觀時(shí)空模式贸宏。最后,生成模型使用完全連接的網(wǎng)絡(luò)將兩個(gè)輸入合并磕洪,對(duì)目標(biāo)時(shí)刻的銷量訂單進(jìn)行預(yù)測(cè)。
4.時(shí)空交替訓(xùn)練
不同的時(shí)空任務(wù)僅與來(lái)自特定區(qū)域和時(shí)間范圍的有限數(shù)據(jù)相關(guān)聯(lián)诫龙,無(wú)法完全描述特定區(qū)域的購(gòu)買行為析显。受多視圖學(xué)習(xí)的啟發(fā),我們構(gòu)建了兩種視圖(空間視圖和時(shí)間視圖)來(lái)描述數(shù)據(jù)的不同觀點(diǎn)签赃。兩個(gè)視圖相互補(bǔ)充谷异,以增強(qiáng)學(xué)習(xí)到的信息并獲得更準(zhǔn)確的時(shí)空數(shù)據(jù)表示〗趿模空間觀點(diǎn)傾向于學(xué)習(xí)不同地區(qū)的購(gòu)買模式歹嘹,而時(shí)間觀點(diǎn)傾向于挖掘不同時(shí)間段類型的時(shí)間變化模式。
訓(xùn)練期間在不同視圖之間進(jìn)行切換可以在不同區(qū)域或日期類型之間學(xué)習(xí)到不同的時(shí)空信息孔庭。同時(shí)尺上,在交替訓(xùn)練期間還能夠整合不同時(shí)空任務(wù)共享的生成模型材蛛,并提高了預(yù)測(cè)準(zhǔn)確性。完整的訓(xùn)練過(guò)程如算法1所示怎抛。
5.實(shí)驗(yàn)
我們使用來(lái)自京東的海量高質(zhì)量在線銷量數(shù)據(jù)集來(lái)評(píng)估我們的模型卑吭。JD數(shù)據(jù)集包含時(shí)間跨度從2015年至2019年的采購(gòu)訂單,購(gòu)物車數(shù)據(jù)(作為動(dòng)態(tài)時(shí)間序列特征)和包括北京18個(gè)行政區(qū)塊的區(qū)域特征(例如POI和人口統(tǒng)計(jì)資料數(shù)據(jù))作為靜態(tài)特征马绝。
為了驗(yàn)證模型的有效性以及魯棒性豆赏,作者對(duì)不同時(shí)間區(qū)間(周內(nèi),周末富稻,購(gòu)物節(jié)等)的銷量進(jìn)行預(yù)測(cè)評(píng)估掷邦。同時(shí)還對(duì)模型中的不同組件進(jìn)行消融分析,對(duì)不同組件的有效性進(jìn)行評(píng)估椭赋,結(jié)果如表1所示抚岗。
表1中我們可以看到,對(duì)于平日較為平緩和購(gòu)物節(jié)的爆發(fā)性預(yù)測(cè)設(shè)置中纹份,STMP均優(yōu)于所有基線方法苟跪。在MSE方面,STMP均比最佳基準(zhǔn)提高了至少30%蔓涧。在爆發(fā)性銷量預(yù)測(cè)場(chǎng)景中件已,STMP仍比基準(zhǔn)降低約30%至60%。這些結(jié)果表明元暴,當(dāng)實(shí)際購(gòu)買模式與平時(shí)截然不同時(shí)篷扩,我們的方法是有效且可靠的。
為了進(jìn)一步研究STMP各個(gè)模型組成部分的影響茉盏,我們還在表1中比較了STMP及其變體的性能鉴未。可以觀察到鸠姨,STMP-VI在總體和周末情景中表現(xiàn)良好铜秆,這些情景具有相對(duì)穩(wěn)定的購(gòu)買模式,但在購(gòu)物節(jié)上的表現(xiàn)要比STMP差讶迁。這是因?yàn)镾TMP-VI使用點(diǎn)估計(jì)而不是特定于任務(wù)的時(shí)空表示的分布描述连茧,當(dāng)數(shù)據(jù)有限或模式高度不確定時(shí),這會(huì)出現(xiàn)問題巍糯。此外啸驯,與STMP或其他變體相比,STMP-SKIP的準(zhǔn)確性較差祟峦,但仍優(yōu)于其他基準(zhǔn)罚斗。這證明需要考慮購(gòu)買時(shí)間序列中的多個(gè)周期性模式。這也反映在圖4(b)中宅楞,我們可以在購(gòu)買時(shí)間序列數(shù)據(jù)中看到清晰的周期性模式针姿。這些證明對(duì)數(shù)據(jù)中的多個(gè)周期性屬性進(jìn)行建模在提高模型性能方面起著重要作用袱吆。
為了探究模型在不同區(qū)域以及時(shí)間段的效果,作者挑選了四個(gè)具有代表性的區(qū)域(覆蓋不同銷量范圍搓幌,詳細(xì)地理位置請(qǐng)參見圖4(a))將STMP與基線方法在整個(gè)2019年的銷量數(shù)據(jù)上做可視化杆故,如圖4所示。在大多數(shù)地區(qū)溉愁,基線無(wú)法很好地預(yù)測(cè)購(gòu)物節(jié)期間購(gòu)買時(shí)間序列的突發(fā)性处铛,例如中旬促銷和11.11的購(gòu)買高峰。他們傾向于給出保守的結(jié)果拐揭,并且只專注于提高整體準(zhǔn)確性撤蟆。但是,STMP利用不同區(qū)域和日期類型的時(shí)空表示來(lái)支持多任務(wù)少拍學(xué)習(xí)堂污,以促進(jìn)對(duì)特定區(qū)域和日期類型的更好預(yù)測(cè)家肯。可以觀察到盟猖,只有STMP能夠準(zhǔn)確地預(yù)測(cè)爆發(fā)式的銷量(所有圖6中的峰值)讨衣。
同時(shí)作者對(duì)于購(gòu)物節(jié)歷史數(shù)據(jù)的可參考情況進(jìn)行了進(jìn)一步的探究,在購(gòu)物節(jié)銷量數(shù)據(jù)非常稀缺的情況下式镐,每增加一次購(gòu)物節(jié)可見數(shù)據(jù)反镇,精度會(huì)有一定的提升。然而即使在購(gòu)物節(jié)可參考數(shù)據(jù)只有一次(持續(xù)大約一周)的情況下娘汞,STMP也具有較高的準(zhǔn)確率歹茶,這表明了模型的魯棒性。
最后你弦,作者對(duì)時(shí)空交替訓(xùn)練方式在三個(gè)大型購(gòu)物節(jié)上也做了比較惊豺。在時(shí)間訓(xùn)練中,合并操作將來(lái)自同一天類型的實(shí)例成批集成禽作,而不考慮空間知識(shí)尸昧。同時(shí),在空間訓(xùn)練中旷偿,模型將來(lái)自同一區(qū)域的一批實(shí)例集成在一起彻磁,而無(wú)需考慮時(shí)間信息。從表2中我們可以看到狸捅,即使不完整的T訓(xùn)練和S訓(xùn)練也比表1列出的基線提供更高的準(zhǔn)確性。但是累提,與完整的時(shí)空交替訓(xùn)練相比尘喝,缺乏時(shí)空上的聯(lián)合元知識(shí)仍然會(huì)導(dǎo)致較低的準(zhǔn)確性。這表明不同的訓(xùn)練模式會(huì)跨地區(qū)和時(shí)間類型學(xué)習(xí)不同的轉(zhuǎn)換斋陪。從時(shí)空方面的補(bǔ)充訓(xùn)練可以有效地提高預(yù)測(cè)的準(zhǔn)確性朽褪。