?引言
本文是 TalkingData 首席數(shù)據(jù)科學(xué)家張夏天翻譯自 Highly Scalable Blog?的一篇文章劳淆,介紹了零售業(yè)中的數(shù)據(jù)挖掘問(wèn)題。
本文內(nèi)容包括零售業(yè)中的多個(gè)常見問(wèn)題默赂,如響應(yīng)建模沛鸵、推薦系統(tǒng)、需求預(yù)測(cè)缆八、價(jià)格差異曲掰、促銷活動(dòng)規(guī)劃、類目管理耀里、財(cái)務(wù)影響等蜈缤。
其中涉及的資源分配優(yōu)化問(wèn)題、個(gè)性化推薦冯挎、定向廣告等業(yè)務(wù)問(wèn)題底哥,上下兩篇完整閱讀大約需要兩個(gè)半小時(shí)。
本次發(fā)布下篇房官,上篇請(qǐng)查看——
《萬(wàn)字長(zhǎng)文趾徽,細(xì)數(shù)零售業(yè)中的那些數(shù)據(jù)挖掘問(wèn)題(上)》
問(wèn)題 4: 價(jià)格差異
問(wèn)題定義
零售商向客戶提供一組產(chǎn)品時(shí),針對(duì)每個(gè)用戶都制定不同的價(jià)格來(lái)最大化整體的收入翰守。另外孵奶,該問(wèn)題可以重新定義為提供定向折扣從而在基線價(jià)格上改變價(jià)格。
應(yīng)用
價(jià)格差異被廣泛的應(yīng)用在零售業(yè)并且存在非常多種顯性和隱性的形式:
優(yōu)惠券蜡峰,店鋪級(jí)價(jià)格分區(qū)了袁,和折扣都是價(jià)格差異的例子。
價(jià)格區(qū)分與通過(guò)數(shù)量折扣來(lái)提升銷售是相關(guān)的湿颅。
動(dòng)態(tài)定價(jià)能用價(jià)格差異的原則和模型來(lái)增量的調(diào)整價(jià)格载绿。
盡管我們?cè)趩?wèn)題的定義中暗示了是細(xì)粒度的個(gè)體定價(jià)方式,但是這是非常極端的情況更多常見的方法是對(duì)大的客戶分群設(shè)置不同的價(jià)格油航。
解決方案
價(jià)格區(qū)分是最基礎(chǔ)的經(jīng)濟(jì)和營(yíng)銷問(wèn)題 [SM11]崭庸,因此
此處 G 是利潤(rùn),Q 是銷售數(shù)量谊囚,P 是單位價(jià)格怕享,V 是可變的單位成本(大致相當(dāng)于零售商拿到的批發(fā)價(jià)格),而是固定成本如管理成本镰踏。公式(4.1)中的價(jià)格和銷量是互相依賴的函筋,因?yàn)殡S著價(jià)格的提高需求會(huì)下降,反之亦然奠伪。價(jià)格和銷量的關(guān)系通匙つ牛可以用一個(gè)線性函數(shù)來(lái)逼近灌诅,這一函數(shù)具有一個(gè)一般被稱為需求彈性的系數(shù):
換言之, 需求彈性是需求量的百分比變化與價(jià)格的百分比變化的比率含末。公式(4.1)和(4.2)可以可視化如下:
需求曲線是一條由需求彈性和零售商利潤(rùn)定義的斜線猜拾,數(shù)值上等價(jià)于(Po-V) · Q0,此處 P0 是由零售商設(shè)定的單位產(chǎn)品價(jià)格佣盒。一方面挎袜,當(dāng)價(jià)格接近可變成本時(shí)利潤(rùn)趨近于 0,雖然銷售量很高肥惭。
另一方面盯仪,高價(jià)格將導(dǎo)致銷售量下降,結(jié)果利潤(rùn)也會(huì)變得很小蜜葱。這基本上意味著價(jià)格服從于一個(gè)數(shù)值優(yōu)化問(wèn)題全景,并且零售商可以用統(tǒng)計(jì)技術(shù)來(lái)估計(jì)需求彈性并找到使得公式(4.1)最大化的最優(yōu)價(jià)格。
這一方法牵囤,即所謂計(jì)量?jī)r(jià)格優(yōu)化的實(shí)用性是比較有限的 [SM11] 因?yàn)橛止剑?.1)表達(dá)的模型過(guò)于簡(jiǎn)化了市場(chǎng)行為并丟棄了在競(jìng)爭(zhēng)市場(chǎng)中一些重要的影響價(jià)格-數(shù)量關(guān)系的因素爸黄。例如,價(jià)格大幅度下降可能會(huì)引發(fā)競(jìng)爭(zhēng)對(duì)手降低整個(gè)行業(yè)價(jià)格的對(duì)稱反應(yīng)揭鳞,所以所有的市場(chǎng)參與者最終都會(huì)處于一個(gè)銷售量和利潤(rùn)都較低的狀況炕贵。
盡管計(jì)量?jī)r(jià)格優(yōu)化有很多局限性,但公式(4.1-4.2)揭示了價(jià)格差異的本質(zhì)野崇。對(duì)于任意一個(gè)價(jià)格, 無(wú)論它有多優(yōu)化称开,這一價(jià)格都是一種折衷。因?yàn)橐恍┛蛻魰?huì)因?yàn)檫@一價(jià)格太貴而放棄購(gòu)買乓梨,盡管他們可能愿意以更低的在 P0 和 V 之間的價(jià)格(依然對(duì)兩種利潤(rùn)是正向貢獻(xiàn))購(gòu)買該產(chǎn)品鳖轰。
此外,一些客戶可以容忍高于 P0 的價(jià)格扶镀,盡管他們產(chǎn)生的銷售量會(huì)相對(duì)較小蕴侣。在這兩種情況下,零售商無(wú)法獲取位于需求曲線和可變成本線圍成的三角區(qū)域之中的額外利潤(rùn)狈惫。
價(jià)格差異是一種自然的方法來(lái)克服單一常規(guī)價(jià)格的限制睛蛛,通過(guò)根據(jù)客戶的付款意愿將客戶分群并向不同的客戶群體提供不同的價(jià)格鹦马‰侍福考慮一個(gè)這種策略的特殊情況,在前一圖表的常規(guī)價(jià)格外補(bǔ)充了一個(gè)較高的溢價(jià)(注意與單一價(jià)格策略相比利潤(rùn)區(qū)域如何增加):
這一考慮帶來(lái)了零售商如何把相同的產(chǎn)品以不同的價(jià)格賣給不同的客戶這一挑戰(zhàn)性問(wèn)題荸频。一般而言菱肖,這需要在具有不同付費(fèi)意愿的客戶之間設(shè)置區(qū)隔以使得高付費(fèi)意愿的客戶不能以為低付費(fèi)意愿客群設(shè)定的價(jià)格來(lái)付費(fèi)。零售商可以使用如下幾種區(qū)隔機(jī)制:
店鋪區(qū)域:連鎖零售商店一般都位于不同的社區(qū)內(nèi)旭从,這些社區(qū)具有不同的平均家庭收入稳强、平均家庭規(guī)模场仲、最近競(jìng)爭(zhēng)商店距離等人口屬性和競(jìng)爭(zhēng)性因素。這就自然對(duì)客戶的價(jià)格敏感性以及尋找替代供應(yīng)商的能力或者意愿做了區(qū)分退疫。這使得零售商可以在店鋪的級(jí)別上在不同區(qū)域設(shè)置不同的價(jià)格渠缕。
包裝大小:諸如軟飲料或化妝品之類的快速消費(fèi)品(FMCG)具有較高的周轉(zhuǎn)率褒繁,消費(fèi)者自然可以選擇是頻繁購(gòu)買少量產(chǎn)品或者儲(chǔ)存大量的產(chǎn)品亦鳞。這種權(quán)衡也受到諸如家庭規(guī)模等人口因素的影響。這一機(jī)制通過(guò)購(gòu)買大型或小型包裝的意愿來(lái)創(chuàng)建區(qū)隔棒坏,并為不同包裝尺寸設(shè)置不同的單位邊際價(jià)格燕差。買一送一(BOGO)優(yōu)惠也與此機(jī)制有關(guān)。
促銷活動(dòng):客戶可以根據(jù)他們是否愿意等待較低價(jià)格還是以正常價(jià)格立即購(gòu)買來(lái)區(qū)分坝冕。此種客戶分群方式被廣泛應(yīng)用于服飾領(lǐng)域徒探,在該領(lǐng)域季節(jié)性促銷是主要的營(yíng)銷機(jī)制之一。
優(yōu)惠券:許多客戶不會(huì)愿意以常規(guī)價(jià)格來(lái)購(gòu)買某一產(chǎn)品喂窟,但是當(dāng)有折扣價(jià)時(shí)卻會(huì)考慮購(gòu)買测暗。因此零售商可以從折扣中獲得額外的客戶,盡管他們貢獻(xiàn)的毛利率相較于那些以正常價(jià)格購(gòu)買的產(chǎn)品的客戶較低谎替。另一方面偷溺,向太過(guò)廣泛的受眾提供折扣可能是有害的,因?yàn)槟切┰敢庖哉r(jià)格購(gòu)買的客戶也會(huì)使用折扣(當(dāng)沒(méi)有折扣的時(shí)候)钱贯。前面章節(jié)中討論過(guò)的響應(yīng)建模技術(shù)有助于解決這一問(wèn)題挫掏。然而有一種 19 世紀(jì)就存在的傳統(tǒng)解決方案——優(yōu)惠券。優(yōu)惠券代表需要付出一定努力才能賺取或兌換的價(jià)格折扣(例如秩命,客戶必須在報(bào)紙上找到它尉共,剪下來(lái)并在商店出示),這就通過(guò)花費(fèi)時(shí)間和精力獲得折扣的意愿區(qū)分了客戶弃锐。
銷售渠道:不同的銷售渠道自然代表不同的區(qū)隔袄友,因?yàn)榭蛻魧?duì)購(gòu)買渠道的選擇與他們的支付意愿密切相關(guān)。例如霹菊,與在雜貨店購(gòu)買相同葡萄酒的顧客相比剧蚣,酒類商店顧客的價(jià)格敏感性一直較低 [CU13]。
盡管這些技術(shù)已經(jīng)應(yīng)用很久了旋廷,但是要建立一個(gè)完整的折扣優(yōu)化模型是非常挑戰(zhàn)的鸠按。并且,據(jù)我們所知饶碘,所有現(xiàn)有的模型都有這樣或者那樣的局限性目尖。在本節(jié)剩下的部分我們考慮兩個(gè)價(jià)格差異模型,這兩個(gè)模型是根據(jù)美國(guó)超市(特別是 Safeway 在芝加哥子公司的數(shù)據(jù))的數(shù)據(jù)設(shè)計(jì)并在這些數(shù)據(jù)上做過(guò)驗(yàn)證的扎运。
基于數(shù)量和地點(diǎn)的差異
文獻(xiàn) [KJ05] 提出了這一模型瑟曲,該模型的目標(biāo)是聯(lián)合優(yōu)化基于包裝大小的數(shù)量折扣和店鋪級(jí)別的區(qū)域價(jià)格饮戳。這一模型與我們?cè)谛枨箢A(yù)測(cè)章節(jié)中討論的模型非常相似,只是該模型引入了更多的包裝大小和折扣參數(shù)洞拨。
讓我們考慮這樣一種情況扯罐,一個(gè)零售商運(yùn)營(yíng)多個(gè)店鋪,銷售的某種產(chǎn)品也有幾種品牌烦衣,產(chǎn)品的規(guī)格也有幾種篮赢,例如可口可樂(lè)和百事可樂(lè)分別有 2 聽裝、4 聽裝和 6 聽裝琉挖。目標(biāo)是優(yōu)化每種包裝的單位產(chǎn)品價(jià)格启泣,這里假設(shè)單位產(chǎn)品價(jià)格是可以根據(jù)產(chǎn)品規(guī)格和店鋪來(lái)調(diào)整。我們從標(biāo)準(zhǔn)的多元邏輯特模型(multinomial logit - MNL)開始示辈,這一模型在前一節(jié)需求預(yù)測(cè)中討論過(guò)寥茫。
它表示顧客在時(shí)間 t 在商店 s 購(gòu)買產(chǎn)品 j 的概率,J 是產(chǎn)品的數(shù)量(所有品牌的所有規(guī)格加上)矾麻。時(shí)間以相對(duì)較長(zhǎng)的時(shí)間間隔(如周)進(jìn)行測(cè)量纱耻。參數(shù)變量 x 可以使用以下回歸模型進(jìn)行估計(jì):
此處 zj 是產(chǎn)品規(guī)格,Pjts 是價(jià)格险耀,djts 是折扣力度(單位美元)弄喘,ruts 整合了諸如最近競(jìng)爭(zhēng)商店等競(jìng)爭(zhēng)性因素,而 fjts 則整合了環(huán)境變化因素如天氣甩牺。因此蘑志, 回歸參數(shù) αk 基本上對(duì)應(yīng)著客戶對(duì)品牌、規(guī)格的偏好贬派、對(duì)價(jià)格的敏感性急但、對(duì)折扣的響應(yīng)度、對(duì)競(jìng)爭(zhēng)者的偏好搞乏、對(duì)變化因素的敏感性波桩,以及折扣對(duì)價(jià)格敏感性的影響等等。
文獻(xiàn) [KJ05] 認(rèn)為促銷案例中的價(jià)格敏感性回歸模型應(yīng)該比以上僅用一個(gè)回歸量來(lái)表達(dá)價(jià)格敏感性更復(fù)雜请敦,因?yàn)榭蛻魰?huì)有囤積產(chǎn)品的情況镐躲,這就使得過(guò)去的促銷會(huì)提高其對(duì)當(dāng)前產(chǎn)品價(jià)格的敏感性。這一方面可以通過(guò)將相應(yīng)的回歸器分解為兩個(gè)部分來(lái)建模侍筛,如下所示:
以上公式中 α3 是平均敏感度而第二項(xiàng)則表示記憶效應(yīng)萤皂。其中 W 是表示歷史深度,即過(guò)去的周數(shù)勾笆,p0 表示常規(guī)價(jià)格敌蚜,而 p 是實(shí)際的折后價(jià)格桥滨。類似的窝爪,也有觀點(diǎn)認(rèn)為對(duì)促銷的敏感性也與最近的促銷有關(guān):
此處 wj 是最近的促銷活動(dòng)過(guò)去的周數(shù)弛车。促銷敏感性對(duì) wj 依賴基于以下假設(shè),兩次促銷之間的周期越長(zhǎng)蒲每,則對(duì)促銷的響應(yīng)度越高纷跛。
公式(4.3)允許我們預(yù)測(cè)銷售量,所以價(jià)格優(yōu)化問(wèn)題能夠根據(jù)公式(4.1)分時(shí)間周期來(lái)定義:
以上公式中 cjt 表示批發(fā)價(jià)格邀杏,而 Qjt 表示預(yù)測(cè)的銷售量贫奠。此處的優(yōu)化約束條件是為了避免由市場(chǎng)競(jìng)爭(zhēng)或者客戶行為等主要因素的變化引起的劇烈的價(jià)格變化和偏移。
文獻(xiàn) [KJ05] 提出了這一特殊的約束條件望蜡,這一約束要求優(yōu)化后的產(chǎn)品份額加權(quán)平均價(jià)格(表示產(chǎn)品的市場(chǎng)份額)不會(huì)超過(guò)優(yōu)化前的份額加權(quán)平局價(jià)格(表示原始價(jià)格)唤崭。這一優(yōu)化問(wèn)題(4.4)可以在店鋪水平上得到求解,這意味著在規(guī)格和地點(diǎn)上都可以做差異化脖律,或者僅在連鎖店級(jí)別上來(lái)差異化數(shù)量折扣谢肾。
個(gè)性化折扣和優(yōu)惠券
盡管上面的模型在店鋪層面做價(jià)格差異也隱含了客戶層次上的價(jià)格差異,但是這一模型不是為單個(gè)客戶的折扣優(yōu)化來(lái)設(shè)計(jì)的小泉。接下來(lái)我們考慮文獻(xiàn) [JT13] 提出的另一種模型芦疏,這一模型是為了專門優(yōu)化個(gè)性化折扣和優(yōu)惠券的。這一模型的主要優(yōu)勢(shì)是它不僅是優(yōu)化折扣的粒度微姊,同時(shí)也嘗試為指定用戶提供折扣的最優(yōu)時(shí)間和折扣的最優(yōu)有效期酸茴。這些時(shí)間屬性上的優(yōu)化思想來(lái)自于以下假設(shè):一個(gè)客戶購(gòu)買的概率不是隨時(shí)間恒定的,而是會(huì)隨著時(shí)間變化的兢交,因此對(duì)每一個(gè)用戶而言都存在最優(yōu)的折扣時(shí)間窗口薪捍。
這一模型的主要缺陷是其只能對(duì)特定品牌如廠商促銷來(lái)進(jìn)行優(yōu)化,而不能用于品類管理配喳。你為了對(duì)折扣的時(shí)間屬性建模飘诗,假設(shè)對(duì)產(chǎn)品的折扣力度為 d,我們將客戶 u 在時(shí)間 t 購(gòu)買產(chǎn)品的概率分解為購(gòu)買產(chǎn)品的概率和客戶在在時(shí)刻 t 購(gòu)買的概率乘積:
對(duì)給定產(chǎn)品的購(gòu)買概率密度函數(shù)能夠用公式(4.3)中用過(guò)的 MNL 的模型來(lái)估計(jì)界逛。在時(shí)刻時(shí)購(gòu)買的概率密度函數(shù)在文獻(xiàn) [JT13] 中由厄蘭分布來(lái)建模:
此處參數(shù)變量 yu 可以用回歸模型來(lái)估計(jì)昆稿,該回歸模型與公式(4.3)中用來(lái)估計(jì)參數(shù)變量的類似,會(huì)用一個(gè)回歸量來(lái)描述折扣力度息拜,因此之后可以對(duì)其進(jìn)行優(yōu)化溉潭。
上面定義的購(gòu)買概率使得我們能夠?qū)o定客戶的銷售量 Qu 作為折扣力度(以美元為單位)、折扣起始時(shí)間少欺、和折扣周期的函數(shù)來(lái)建模:
以上推導(dǎo)可以使得我們導(dǎo)出如下毛利率優(yōu)化問(wèn)題:
這里 m 是在正常價(jià)格下的毛利率喳瓣。以上公式中的第一項(xiàng)對(duì)應(yīng)著收入,收入由三個(gè)方面組成(促銷前的收入赞别、促銷期間的收入和促銷后的收入)畏陕;第二項(xiàng)對(duì)應(yīng)著營(yíng)銷活動(dòng)的成本。下圖描述了這一優(yōu)化問(wèn)題:
頂部的第一個(gè)圖顯示了客戶 u 購(gòu)買的概率密度函數(shù)曲線仿滔,此圖中對(duì)于給定產(chǎn)品在正常價(jià)格時(shí)的銷量對(duì)應(yīng)著 S0 區(qū)域惠毁。一個(gè)固定的永久折扣增加的銷量對(duì)應(yīng)的區(qū)域?yàn)?S1犹芹,因此總收入和促銷成本(如中間的圖所示)是與 S0 和 S1 成正比的。
時(shí)間優(yōu)化的促折銷使得收入與 S0+S2 成正比鞠绰, 其成本與 S02+S2(如底部的圖所示)腰埂。固定折扣促銷和時(shí)間優(yōu)化的促銷之間的這種差異表明在概率密度函數(shù)具有某些數(shù)量性質(zhì)時(shí)存在利用時(shí)間優(yōu)化來(lái)改善毛利率的潛力。
問(wèn)題 5:促銷活動(dòng)規(guī)劃
問(wèn)題定義
零售商向客戶提供一組產(chǎn)品時(shí)蜈膨,針對(duì)每個(gè)用戶都制定不同的價(jià)格來(lái)最大化整體的收入屿笼。另外,該問(wèn)題可以重新定義為提供定向折扣從而在基線價(jià)格上改變價(jià)格翁巍。
零售商準(zhǔn)備一次促銷活動(dòng)驴一,即對(duì)某個(gè)或者一組特定商品進(jìn)行有時(shí)限的折扣。對(duì)促銷活動(dòng)的規(guī)劃需要估計(jì)到下列有關(guān)的值:
哪些產(chǎn)品的庫(kù)存需要避免在活動(dòng)結(jié)束前缺貨灶壶?
什么樣的價(jià)格會(huì)最大化收入蛔趴??jī)r(jià)格可以考慮是一個(gè)恒定值或者是一個(gè)從活動(dòng)開始到結(jié)束不同時(shí)間段的函數(shù)。
我們將考慮庫(kù)存水平是預(yù)先確定的例朱,零售商試圖計(jì)算最優(yōu)價(jià)格這種情況孝情。這是時(shí)尚零售商在處理季節(jié)性清倉(cāng)和款式翻新 [JH14, CA12] 中遇到的典型問(wèn)題。這一問(wèn)題可以以不同的方式來(lái)定義洒嗤,如將需求預(yù)測(cè)和價(jià)格優(yōu)化作為獨(dú)立的問(wèn)題來(lái)處理箫荡,也可以同時(shí)優(yōu)化庫(kù)存水平和價(jià)格,總之其目的是最大化收入渔隶。
應(yīng)用
促銷活動(dòng)的規(guī)劃在零售中有如下的應(yīng)用:
清倉(cāng)和季節(jié)性促銷是時(shí)尚零售業(yè)中的主要應(yīng)用羔挡。
某些商業(yè)模式如快閃零售(也被稱為彈出零售)只有促銷活動(dòng)一種銷售方式。
快消品和易腐品的零售商可以使用促銷活動(dòng)策劃來(lái)調(diào)整銷售節(jié)奏與產(chǎn)品保質(zhì)期同步 间唉。
解決方案
動(dòng)態(tài)需求預(yù)測(cè)和價(jià)格優(yōu)化是經(jīng)濟(jì)學(xué)中所研究的基礎(chǔ)問(wèn)題绞灼,被稱為收入管理。收入管理的理論在書籍如 [TA05] 中有很好的闡釋和系統(tǒng)化的介紹呈野。在服務(wù)業(yè)中的預(yù)定服務(wù)低矮,如機(jī)票、體育場(chǎng)座位被冒、酒店房間军掂、租車等等場(chǎng)景中可以找到收入管理自動(dòng)化的最先進(jìn)和最有效率的例子。要理解這些技術(shù)可以如何在零售領(lǐng)域中使用昨悼,我們來(lái)考察由 RueLaLa(一個(gè)時(shí)尚零售商)提出來(lái)的方法論蝗锥。
我們假設(shè)一個(gè)零售商計(jì)劃對(duì) N 個(gè)產(chǎn)品或者產(chǎn)品組(產(chǎn)品組中的產(chǎn)品價(jià)格相同,如不同口味的酸奶率触,或者不同花色的 T 恤)進(jìn)行打折终议。設(shè) P 為價(jià)格集合,該集合包含每個(gè)產(chǎn)品可以設(shè)定的價(jià)格。在實(shí)踐中穴张,P 通常是根據(jù)業(yè)務(wù)規(guī)則組成的比較小集合细燎。例如,價(jià)格下限可以根據(jù)零售商的盈利水平定義為 29.90, 價(jià)格調(diào)整幅度根據(jù)心理價(jià)格可以設(shè)定為 5 美元陆馁,則 P=$29.9,$34.9合愈,$39.9叮贩,$44.9,$49.9佛析。
假設(shè)促銷活動(dòng)中的所有產(chǎn)品或者產(chǎn)品組都有某些共同點(diǎn)益老,例如同屬于相同的類目“女鞋”或者“平安夜食品”,因此對(duì)一個(gè)產(chǎn)品的需求潛在的依賴于其他可替代產(chǎn)品的價(jià)格寸莫。
通過(guò)引入變量 S捺萌,其等于所有參與促銷活動(dòng)的競(jìng)爭(zhēng)產(chǎn)品(產(chǎn)品組)的價(jià)格之和,而對(duì)某一產(chǎn)品估計(jì)的期望需求則為數(shù)學(xué)期望 E{Q | i膘茎,pj桃纯,S},此處 Q 是表示需求量的隨機(jī)變量披坏,i=1态坦,2,……棒拂,N 是產(chǎn)品的索引伞梯,而 j =1,2帚屉,……谜诫,|P| 是單個(gè)產(chǎn)品或產(chǎn)品組的價(jià)格。既然 Q 與產(chǎn)品價(jià)格 S 和都相關(guān)攻旦,這就隱含地包含了產(chǎn)品價(jià)格與可替代產(chǎn)品的評(píng)價(jià)價(jià)格的比值對(duì)需求和其彈性都是有影響的喻旷。
現(xiàn)在我們可以在假設(shè) S 為固定的并對(duì)所有可能的 S 求解這一優(yōu)化問(wèn)題 [JH14]:
當(dāng)產(chǎn)品 i 的價(jià)格為 pj 時(shí),二值變量 δi,j∈0牢屋,1 為 1掰邢,否則為 0。上述優(yōu)化問(wèn)題中的目標(biāo)函數(shù)可以自然地表達(dá)為促銷活動(dòng)的收入伟阔。第一項(xiàng)約束保證每個(gè)產(chǎn)品的價(jià)格都在 P 之中(原文可能有問(wèn)題)辣之,而第二項(xiàng)約束保證所有產(chǎn)品的價(jià)格之和為 S。其他關(guān)于庫(kù)存水平的約束也可以加入到優(yōu)化問(wèn)題中來(lái)皱炉。
以上的優(yōu)化問(wèn)題需對(duì)需求 E{Q | i怀估,pj,S} 做估計(jì),這可以用前面章節(jié)中做需求預(yù)測(cè)和價(jià)格分群的技術(shù)來(lái)解決多搀。然而歧蕉,需要非常注意到缺貨(而且是可取的)是促銷活動(dòng)中非常典型的情況,因此對(duì)很多產(chǎn)品的需求預(yù)測(cè)建模所要用到的歷史數(shù)據(jù)都是被截?cái)嗟摹?/p>
正如 [JH14] 中所建議的那樣康铭,可以通過(guò)使用在此前促銷期間沒(méi)有缺貨的產(chǎn)品的數(shù)據(jù)為不同產(chǎn)品類別構(gòu)建畫像來(lái)解決此問(wèn)題惯退,并使用這些畫像來(lái)調(diào)整相應(yīng)類別的需求曲線。
問(wèn)題 6: 類目管理
問(wèn)題定義
零售商根據(jù)類目銷售產(chǎn)品从藤。一個(gè)類目表示一組相對(duì)內(nèi)聚的產(chǎn)品催跪,這些產(chǎn)品有很多共同點(diǎn)(如"甜點(diǎn)"、“女式牛仔”等)夷野,所以客戶有可能在他們的首選產(chǎn)品因某些原因缺貨時(shí)愿意用另一產(chǎn)品來(lái)替代冲秽。
產(chǎn)品缺貨的主要原因有永久性的品種減少(如因?yàn)橛邢薜呢浖芸臻g)和暫時(shí)的性的售罄痛黎。類目管理的目標(biāo)是利用替代效用用優(yōu)化方法計(jì)算出一個(gè)產(chǎn)品子集,這一子集在滿足物理約束如可用的貨架空間的情況下可以最大化毛利率。
應(yīng)用
品類管理是一項(xiàng)相對(duì)專業(yè)化的工作瑰钮,但是當(dāng)目標(biāo)是優(yōu)化一個(gè)產(chǎn)品類目的整體收益而不是一個(gè)單一產(chǎn)品的收益時(shí)着绊,它也會(huì)涉及到在促銷優(yōu)化問(wèn)題中存在的替代效應(yīng)問(wèn)題钞瀑。零售商一般情況下對(duì)類目的整體收益的關(guān)心程度遠(yuǎn)勝于對(duì)單個(gè)產(chǎn)品的優(yōu)化熄守,因此在本節(jié)中討論的方法可以被用在很多不同的應(yīng)用中以實(shí)現(xiàn)最優(yōu)解決方案。本節(jié)研究的模型可以直接應(yīng)用于以下類目管理方式:
倉(cāng)庫(kù)的產(chǎn)品庫(kù)存水平優(yōu)化灌曙。一個(gè)特別重要的應(yīng)用是對(duì)易腐產(chǎn)品的庫(kù)存管理黄鳍,這需要考慮到保質(zhì)期和過(guò)去產(chǎn)品造成的潛在損失。
優(yōu)化貨架的布局來(lái)調(diào)整相關(guān)產(chǎn)品的份額平匈。
類目規(guī)劃(在類目中加入或者移除哪些產(chǎn)品)
解決方案
從計(jì)量經(jīng)濟(jì)學(xué)的角度來(lái)看框沟,類目管理問(wèn)題是由收益遞減規(guī)律引起的≡鎏浚或者更具體地說(shuō)忍燥,收入和成本與類目的規(guī)模關(guān)系是不同的,總的趨勢(shì)是消費(fèi)者購(gòu)買能力在某個(gè)時(shí)候達(dá)到飽和隙姿,同時(shí)由于店鋪面積和其他運(yùn)營(yíng)成本的增加梅垄,成本持續(xù)增長(zhǎng):
這一趨勢(shì)引出了類目?jī)?yōu)化問(wèn)題。這是一個(gè)非常具有挑戰(zhàn)性的問(wèn)題输玷,因?yàn)樗枰獙?duì)整個(gè)類目中所有產(chǎn)品之間的相互依賴關(guān)系建模队丝。然而,盡管面臨這些挑戰(zhàn)欲鹏,在 [KOK07] 中已經(jīng)提出了一種切實(shí)可行的類目?jī)?yōu)化模型机久,并在荷蘭的連鎖超市 Albert Heijn 中應(yīng)用。在研究這一方法之前赔嚎,我們先引入下列符號(hào):
N={1膘盖,2胧弛,……,J} - 零售商給用戶提供的一個(gè)類目下面的最大產(chǎn)品集合侠畔,即所有品類结缚。
fi∈{0,1软棺,2红竭,……} - 產(chǎn)品 j 的庫(kù)存水平。零售商通過(guò)選擇 f 為 0(產(chǎn)品不出現(xiàn)在品類中)或者非 0 來(lái)優(yōu)化品類喘落。
F0 - 統(tǒng)一庫(kù)存單位度量下的庫(kù)存總?cè)萘恳鹣堋_@里有個(gè)假設(shè)是所有產(chǎn)品的庫(kù)存水平之和不能超過(guò) F0。庫(kù)存總?cè)萘靠梢杂蓚}(cāng)庫(kù)或者店鋪的可用貨架空間所約束揖盘。
Nh ? N - 店鋪 h 的品類眉厨,是總品類的子集锌奴。
dj 表示產(chǎn)品 j 的原始需求率(當(dāng)所有 N 品類都展示給客戶時(shí)有多少顧客會(huì)選擇該產(chǎn)品)
Dj - 觀察到的產(chǎn)品的需求率(每天因?yàn)樵家庠富蛘咛娲?yīng)而實(shí)際選擇產(chǎn)品 j 的數(shù)量)兽狭。對(duì)給定產(chǎn)品觀察到的需求與原始需求和其他產(chǎn)品的可獲得性(替代效應(yīng))有關(guān)系,其可以被視為函數(shù):
Dj({f1鹿蜀,……箕慧,fJ},{d1茴恰,……颠焦,dJ})
使用上述符號(hào),品類優(yōu)化問(wèn)題可以形式化如下:
其中毛利率 Gj 是給定產(chǎn)品和其對(duì)應(yīng)的觀測(cè)需求的函數(shù)往枣。這一函數(shù)很大程度上與零售商的商業(yè)模式有關(guān)伐庭,所以我們下面介紹一些通用的函數(shù)模板,基于這些模板可以根據(jù)實(shí)際的使用情況來(lái)定制毛利率函數(shù):
公式(6.2)將觀測(cè)需求乘以毛利率 m分冈,這是對(duì)毛利潤(rùn)最簡(jiǎn)單的建模方式圾另。該公式隱含假設(shè)了補(bǔ)貨及時(shí)而沒(méi)有缺貨的情況。雜貨這樣的快消品正是屬于這種情況雕沉,但是在其他領(lǐng)域如服飾則必須如公式(6.3)那樣考慮缺貨的情況集乔。銷售易腐貨物的零售商還要考慮貨損,公式(6.4)通過(guò)引入單位損失變量 L 來(lái)對(duì)此進(jìn)行建模坡椒。
為討論方便扰路,后面我們假設(shè)所有產(chǎn)品的補(bǔ)貨都是及時(shí)的,所以缺貨是不可能或者是可忽略的倔叼。因此我們可以將 j∈{0汗唱,1} 作為二值變量來(lái)表示產(chǎn)品是否在類目中。更復(fù)雜的處理缺貨的模型可以在 [KOK07] 中找到丈攒。
要解決(6.1)中的優(yōu)化問(wèn)題渡嚣,我們需要定義觀測(cè)需求函數(shù)。在無(wú)缺貨假設(shè)下,需求函數(shù)可按照下面公式來(lái)建模:
其中 αk-j 是產(chǎn)品 k 被產(chǎn)品 j 替換的概率识椰。上述公式是比較自明的:第一項(xiàng)是原始需求绝葡,而第二項(xiàng)是所有被從類目中移除的產(chǎn)品的累計(jì)替代需求。
公式(6.5)需要估計(jì)替代概率 αk-j 和原始需求率 dj腹鹉。為了做這些估計(jì)藏畅,我們假設(shè)下列變量是已知的(我們已經(jīng)在本文的前面章節(jié)討論過(guò)需求預(yù)測(cè)):
Qjh,j∈Nh – 每個(gè)客戶在店鋪對(duì)產(chǎn)品的需求功咒。假設(shè) Kh 是一天內(nèi)進(jìn)過(guò)店鋪 h 的客戶數(shù)量愉阎, 則 Dj = Kh * Qjh。
Q0jh力奋,j∈Nh - 每個(gè)客戶在店鋪 h 具有全品類產(chǎn)品時(shí)的需求(假設(shè)商店的品類是全的)榜旦。因?yàn)槠奉慅R全所以不存在替代效應(yīng),因此 Q0jh 就是原始需求景殷。
估計(jì)替代率 αk-j 是比較困難的事情因?yàn)楫a(chǎn)品集合 J 中有多達(dá)不同 J2的替代率溅呢。不過(guò),[KOK07] 找到了下述客戶行為的簡(jiǎn)化模型猿挚,在實(shí)踐中這一模型有足夠的精度并僅需要用一個(gè)而不是 J2 個(gè)變量:如果產(chǎn)品 k 買不到咐旧,客戶會(huì)選擇其第二選擇產(chǎn)品來(lái)替代的概率為 δ,這一概率對(duì)一個(gè)類目下的所有產(chǎn)品都是一樣的绩蜻,則客戶不買任何東西的概率為(1- δ)铣墨。這一模型引出了如下替代率的簡(jiǎn)單公式:
為了估計(jì) δ, 我們將給定店鋪的總需求定義為Qjh(可由歷史數(shù)據(jù)來(lái)估計(jì))之和,
另一方面办绝,該值也可以根據(jù)公式(6.5)估計(jì)如下:
現(xiàn)在 δ 可以通過(guò)最小化總需求的實(shí)際值和預(yù)測(cè)值之間的差異來(lái)估計(jì):
求解優(yōu)化問(wèn)題(6.1)的下一步是計(jì)算公式(6.5)中使用的原始需求率伊约。我們首先注意到店鋪?h?對(duì)?N?中所有產(chǎn)品的總需求可以按如下方式計(jì)算:
其中?Vh?是每天到訪店鋪?h?的客戶總數(shù)。在公式(6.10)中孕蝉,所有?Q0jh?之和乘以?Vh?表示在給定全品類時(shí)的的總需求屡律。然而的值時(shí)針對(duì)擁有全品類的店鋪估計(jì)得的,其值時(shí)與給定店鋪相關(guān)(如地點(diǎn)昔驱,店鋪面積等等)而沒(méi)有被建模的疹尾。這可以通過(guò)公式(6.7)估計(jì)的類目需求和從公式(6.8)預(yù)測(cè)的需求比值來(lái)補(bǔ)償調(diào)整。
在一個(gè)品類有限的店鋪骤肛,總需求是以下兩個(gè)部分的和:對(duì)給定店鋪品類中存在的商品的需求和對(duì)中其他產(chǎn)品的需求纳本。兩部分的比率可以由表示如下:
自然的,Th * rh 表示對(duì)品類中存在的產(chǎn)品的需求分額腋颠,而(1- Th * rh)則表示對(duì)不在品類中的產(chǎn)品的需求份額繁成。最后,我們對(duì)單一產(chǎn)品的需求可以當(dāng)作是總需求的一部份來(lái)計(jì)算:
所有公式(6.12)和(6.9)中的系數(shù)都可以根據(jù)數(shù)據(jù)來(lái)估計(jì)淑玫,因此我們可以把所有公式展開到原始優(yōu)化問(wèn)題(6.1)中巾腕,則這個(gè)問(wèn)題可以使用 [KOK07] 提出的數(shù)值方法來(lái)求解面睛。
公式(6.1)將為每個(gè)產(chǎn)品都產(chǎn)生一個(gè)假定的最有庫(kù)存水平 fj。這些庫(kù)存水平值可以用來(lái)調(diào)整庫(kù)存和優(yōu)化貨架布局尊搬。值得注意的是該模型使得零售商可以做假設(shè)分析來(lái)評(píng)估對(duì)品類和庫(kù)存水平的改變會(huì)如何影響毛利率叁鉴。
例如,零售商可以畫出毛利率根據(jù)給定產(chǎn)品或者產(chǎn)品組的庫(kù)存水平變化的函數(shù)曲線佛寿。這些曲線對(duì)易腐產(chǎn)品尤其具有描述性幌墓,因?yàn)槊适峭购瘮?shù),當(dāng)庫(kù)存水平為 0 時(shí)函數(shù)值為 0冀泻,而當(dāng)庫(kù)存水平過(guò)高時(shí)毛利率因?yàn)楫a(chǎn)品過(guò)期造成的損失也會(huì)為 0常侣,毛利率的最優(yōu)值是在兩種極端情況之間。
問(wèn)題 7:財(cái)務(wù)影響
如果缺乏上述被討論的優(yōu)化方法的財(cái)務(wù)表現(xiàn)方面的數(shù)據(jù)弹渔,我們對(duì)這些方法和對(duì)應(yīng)的數(shù)據(jù)問(wèn)題的概述將是不完整的胳施。盡管這些數(shù)據(jù)是不難獲取的,但對(duì)此我們?nèi)匀恍枰?jǐn)慎對(duì)待肢专,因?yàn)樨?cái)務(wù)表現(xiàn)與零售商的商業(yè)模型機(jī)密相關(guān)舞肆,并且事實(shí)上我們無(wú)法隔離其他環(huán)境因素如市場(chǎng)增長(zhǎng)或者競(jìng)爭(zhēng)對(duì)手的行動(dòng)對(duì)優(yōu)化問(wèn)題的影響。
除此之外鸟召,這些數(shù)字可能因很多因素而有很大的差異胆绊,所以本文中我們的目標(biāo)只是提供一些基準(zhǔn)氨鹏,使得讀者可以對(duì)優(yōu)化的潛在幅度有所了解欧募。以下列表收集了一些關(guān)于這些優(yōu)化方法對(duì)財(cái)務(wù)影響的實(shí)例:
響應(yīng)模型廣泛用于整個(gè)營(yíng)銷過(guò)程,從零售到推廣活動(dòng) [EP13]仆抵。經(jīng)常有報(bào)道稱跟继,與隨機(jī)投放相比,響應(yīng)模型可以將推廣活動(dòng)的收益率提高 20-30%镣丑,而提升模型可以帶來(lái) 15% 左右的實(shí)質(zhì)性提升或在其他方法都不起作用的困難的情況下實(shí)現(xiàn)盈利 [PS08]舔糖。
在 RueLaLa 的實(shí)踐中對(duì) [JH14] 中提出的營(yíng)銷活動(dòng)優(yōu)化進(jìn)行了全面評(píng)估,得出的一般結(jié)論是莺匠,綜合優(yōu)化模型比之前使用的啟發(fā)式算法能提高約 10% 的收入金吗。 [CA12] 中提出的并經(jīng) Zara 驗(yàn)證過(guò)的事件優(yōu)化模型聲稱可提供 5.8% 的收入增長(zhǎng)。
類目管理框架已在 Albert Heijn 進(jìn)行了驗(yàn)證趣竣,以優(yōu)化 37 個(gè)商店中 25 個(gè)子類別的分類摇庙。發(fā)現(xiàn)在這 25×37 = 1295 個(gè)情況中,使用傳統(tǒng)方法有 701 個(gè)不理想遥缕,在使用了新的類目管理方法進(jìn)行優(yōu)化后可以提高約 6.2% 的毛利率卫袒。
最后,值得注意的是单匣,大多數(shù)這里討論的優(yōu)化方法不會(huì)顯著的影響零售商的成本夕凝,因此收入的提升大概率的直接帶來(lái)凈利潤(rùn)的提升宝穗。
結(jié)論
在前面的章節(jié)中我們概述了一些零售相關(guān)的計(jì)量經(jīng)濟(jì)學(xué)問(wèn)題,給出了其應(yīng)用和用例码秉,并且闡述了可以應(yīng)用到這些問(wèn)題上的數(shù)據(jù)分析方法和優(yōu)化模型逮矛。在最后的一節(jié)中,我們將把上述這些模型聯(lián)系起來(lái)以提供一個(gè)全景式的總結(jié)转砖。
由點(diǎn)到面
本文的主要目的是描繪完全依賴于數(shù)據(jù)挖掘和數(shù)值優(yōu)化的決策自動(dòng)化框架橱鹏。因此,將這個(gè)框架可視化為一個(gè)消費(fèi)數(shù)據(jù)并產(chǎn)生可執(zhí)行動(dòng)作和決策的管道是合理的堪藐。
首先莉兰,我們可以將數(shù)據(jù)探索和知識(shí)發(fā)現(xiàn)流程放入一個(gè)單獨(dú)的層級(jí)中,該層級(jí)主要使用無(wú)監(jiān)督學(xué)習(xí)算法礁竞,并且主要依靠人為因素來(lái)評(píng)估數(shù)據(jù)挖掘結(jié)果糖荒,例如客戶群或者是購(gòu)買產(chǎn)品的頻繁項(xiàng)集。
雖然這些過(guò)程在實(shí)踐中非常重要模捂,但它們很難集成到自動(dòng)優(yōu)化過(guò)程中來(lái)捶朵,因?yàn)槟J降陌l(fā)掘通常依賴于手工流程而且通常相比于增量式優(yōu)化它對(duì)戰(zhàn)略決策更有用。不過(guò)這一層的輸出可以配置到下游的過(guò)程中狂男,例如综看,新發(fā)現(xiàn)的客戶群可用于定義新的傾向模型或引入并優(yōu)化專屬折扣。
接下來(lái)的兩層分別與建模和優(yōu)化有關(guān)岖食。廣義而言红碑,建模層的基本目標(biāo)是提供一個(gè)全面的消費(fèi)者模型,定量描述他或她的價(jià)格敏感性泡垃,對(duì)活動(dòng)和折扣的響應(yīng)傾向析珊,用一種產(chǎn)品替代另一種產(chǎn)品的意愿,對(duì)推薦的接受度蔑穴,等等忠寻。
但是在實(shí)踐中建立這樣一個(gè)全面的模型是非常困難的,所以我們使用多種專用模型來(lái)處理不同的問(wèn)題存和。然而奕剃,需要指出的是,這種想象中的消費(fèi)者模型涉及到所有類型的優(yōu)化問(wèn)題捐腿,因此獲取有關(guān)客戶行為各個(gè)方面的全面數(shù)據(jù)至關(guān)重要纵朋。
優(yōu)化層的主要挑戰(zhàn)是多目標(biāo)的聯(lián)合優(yōu)化。聯(lián)合優(yōu)化對(duì)計(jì)算來(lái)說(shuō)是一個(gè)嚴(yán)重的挑戰(zhàn)叙量,而且最重要的是聯(lián)合優(yōu)化受到底層預(yù)測(cè)模型能力的限制倡蝙,所以幾乎所有的優(yōu)化技術(shù)都只能處理一個(gè)或兩個(gè)目標(biāo)。
我們把這些層都放到下圖中绞佩。組件之間存在許多可能的依賴關(guān)系和相互作用寺鸥,因此我們僅展示了一個(gè)與響應(yīng)建模相關(guān)的樣例程流猪钮,以免圖變得過(guò)于混亂。
定價(jià)的重要性
在這些不同的問(wèn)題和目標(biāo)中胆建,我們需要非常重視定價(jià)決策以及所有于定價(jià)有著直接或間接關(guān)系的的優(yōu)化問(wèn)題烤低。讓我們用一個(gè)經(jīng)典例子來(lái)說(shuō)明定價(jià)決策的重要性。會(huì)議一下企業(yè)利潤(rùn)的基本公式:
G = Q · (P - V)- C
其中 Q 是銷售量笆载,P 是價(jià)格扑馁,V 是可變成本,而 C 表示固定成本凉驻。假設(shè)一個(gè)服裝零售商每月以 40 美元的單價(jià)銷售 10 萬(wàn)件服裝腻要,假設(shè)每件服裝的批發(fā)價(jià)是 25 美元而固定成本為一個(gè)月 50 萬(wàn)美元。我們可以計(jì)算銷售量涝登、價(jià)格雄家、可變成本和固定成本在變化百分之一的情況下是如何影響利潤(rùn)的:
在這個(gè)例子中,我們可以看到定價(jià)對(duì)利潤(rùn)的影響比其他變量大得多胀滚。盡管這是一個(gè)過(guò)于簡(jiǎn)單和任意的例子趟济,這一模式在眾多不同行業(yè)的不同企業(yè)中存在。這使我們得到如下結(jié)論:零售商應(yīng)特別關(guān)注與定價(jià)(折扣咽笼、個(gè)性化價(jià)格顷编、動(dòng)態(tài)定價(jià)等)有關(guān)的優(yōu)化方法以及支持這些方法的數(shù)據(jù)挖掘流程。
我們也注意到全渠道零售可以給自動(dòng)定價(jià)優(yōu)化帶來(lái)新的機(jī)會(huì)剑刑。既然價(jià)格差異是最有力的定價(jià)技術(shù)之一媳纬,則定價(jià)優(yōu)化的理想環(huán)境是為每一個(gè)客戶提供顯示或隱式(折扣)的個(gè)性化價(jià)格,而且所有的價(jià)格是可以動(dòng)態(tài)調(diào)整的叛甫。數(shù)字渠道恰好提供了這些條件层宫,其中每個(gè)客戶都有自己獨(dú)立和動(dòng)態(tài)的對(duì)零售商的視圖杨伙。
隱含維度的重要性
如我們已經(jīng)提到的其监,許多零售業(yè)中的優(yōu)化問(wèn)題與用戶的行為模型是內(nèi)在相關(guān)的。在個(gè)人客戶層面建立這種模型的能力是數(shù)據(jù)挖掘技術(shù)帶來(lái)的最重要的好處之一限匣,也是一對(duì)一營(yíng)銷的關(guān)鍵推動(dòng)力抖苦。
客戶建模的最復(fù)雜的例子可以在推薦系統(tǒng)中找到,這些系統(tǒng)通常使用隱式維度的概念來(lái)捕捉客戶和產(chǎn)品的心理特征米死。這一概念非常的重要锌历,它可能遠(yuǎn)遠(yuǎn)超出推薦系統(tǒng)的范圍,但據(jù)我們所知峦筒,它并沒(méi)有如期望的那樣在其他應(yīng)用中被廣泛應(yīng)用究西。這使我們得出這樣一個(gè)結(jié)論,即整體的優(yōu)化系統(tǒng)可以將推薦領(lǐng)域的最先進(jìn)的技術(shù)應(yīng)用到那些不常見的應(yīng)用中而受益物喷。
展望
在零售業(yè)中實(shí)現(xiàn)完全的自動(dòng)化決策是極具雄心的卤材。甚至可以說(shuō)遮斥,在實(shí)踐中想要衡量這些優(yōu)化方法的表現(xiàn)幾乎是不可能的,因?yàn)橛^察到的收益提升可能與市場(chǎng)趨勢(shì)扇丛,競(jìng)爭(zhēng)對(duì)手的行動(dòng)术吗,顧客品味的變化以及其他因素相關(guān)。
這個(gè)問(wèn)題在經(jīng)濟(jì)學(xué)教科書中被稱為內(nèi)生性問(wèn)題帆精,這對(duì)于數(shù)據(jù)驅(qū)動(dòng)優(yōu)化技術(shù)的研發(fā)者和用戶來(lái)說(shuō)都是一個(gè)巨大的挑戰(zhàn)较屿,而且即使看起來(lái)成功的案例也會(huì)受到該問(wèn)題的挑戰(zhàn)而顯得其結(jié)果沒(méi)那么可靠。
盡管如此卓练,在過(guò)去的十年中隘蝎,主要的零售商一直在尋求將數(shù)據(jù)挖掘與數(shù)值優(yōu)化技術(shù)結(jié)合在一起的技術(shù)的整體解決方案。這種先進(jìn)的系統(tǒng)將是企業(yè)數(shù)據(jù)管理演進(jìn)的下一個(gè)階段襟企,它將遵循對(duì)數(shù)據(jù)倉(cāng)庫(kù)的共識(shí)并大量采用數(shù)據(jù)學(xué)科學(xué)方法末贾。
— 全文終 —