引言
本文介紹了一些銷量預測相關的誤差指標. 它們可以被分為兩類: 絕對誤差和絕對百分比誤差. 前2節(jié)介紹銷量預測問題及相關概念. 第3節(jié)我們介紹3種絕對誤差, 并比較它們對異常值的敏感性. 由于絕對誤差不適合比較多個商品或多個時段的預測結果, 在第4節(jié)我們介紹3種百分比誤差. 在這一節(jié), 我們重點強調(diào)了它們的優(yōu)點和缺陷. 第5節(jié)是誤差指標比較結果的匯總. 在第6節(jié)中, 我們用一個例子充分說明了百分比誤差容易引發(fā)的問題, 并提醒讀者在實際中必須確認預測目標與誤差的一致性. 在第7節(jié), 我們給出一些結論和實際使用中的建議.
1. 銷量預測
銷量預測問題是供應鏈管理中的一個基本問題. 銷量預測可用來指導商品采購, 新品立項, 銷售計劃, 庫存平衡和資源調(diào)度等業(yè)務. 因此, 預測"效果"的好壞 將直接影響這些業(yè)務的質(zhì)量(注: 不同業(yè)務可能要求不同的預測"效果"). 我們一般用預測銷量和真實銷量之間的誤差來評估銷量預測結果或模型的好壞. 直觀地講, 預測銷量與真實銷量越"接近"則誤差越小, 反之則誤差越大.
為方便描述, 我們考慮如下簡化的銷量預測問題.
銷量預測 預測一個商品未來1到n天的銷量. 用和分別代表商品第天的實際銷量和預測銷量, 其中. 因此我們需要估計實際銷量與預測銷量之間的誤差.
2. 基本概念
首先考慮第天的實際銷量和預測銷量. 定義兩種誤差:
絕對誤差(Absolute Error): .
絕對百分比誤差(Absolute Percentage Error): .
我們通過一個簡單的例子來比較兩種誤差.
例. 假設 .
- 絕對誤差: 優(yōu)點是能直接反映誤差的大小; 缺點是依賴標度(Scale-dependent), 即, 它依賴觀測值的標度(單位), 因此不適合比較不同商品或不同時段之間的誤差.
- 絕對百分比誤差: 優(yōu)點是不依賴標度(Scale-free); 缺點是要求, 而這個條件在實際中往往不滿足. 此外, 即使?jié)M足條件, 當比較小時, 容易造成非常大(從而嚴重影響總體誤差).
3. 絕對誤差
下面考慮實際銷量與預測銷量之間的誤差指標. 我們先介紹三種絕對誤差指標.
-
平均絕對誤差(Mean Absolute Error - MAE)
幾何平均絕對誤差(Geometric Mean Absolute Error - GMAE)
- 根均方誤差(Root Mean Square Error - RMSE)
誤差比較
- 可以證明: . 這個關系也體現(xiàn)了它們對異常值的敏感程度(從左到右, 從高到低).
- GMAE對異常值不太敏感, 其誤差值比較穩(wěn)定, 因而適合用來比較預測模型的優(yōu)劣. 但它要求(否則GMAE=0). 此外, 由于需要開n次根, 其計算相對MAE耗時較大.
- RMSE和MAE對異常值比較敏感. 換句話說, 單個時段的絕對誤差可能會較大地影響整體誤差, 從而導致誤差值會隨著預測值的變化呈現(xiàn)較大的波動. 因此, 在使用中我們需要先剔除異常值.
- 由于絕對誤差依賴標度, 它們不適合用來比較不同商品或不同時期預測結果的誤差水平.
4. 絕對百分比誤差
為了克服絕對誤差依賴標度的缺點, 一個自然的想法是考慮百分比誤差. 在實際使用中, 人們常常盲目地使用直觀易懂的誤差指標(例如下文提到的MAPE), 并忽略了百分比誤差自身的一些缺陷, 從而導致誤差的降低并不能帶來期望中預測效果的提升. 本節(jié)我們重點強調(diào)絕對百分比誤差的缺陷以及使用時需要注意的事項.
4.1 平均絕對百分比誤差(Mean Absolute Percentage Error - MAPE)
-
優(yōu)點
直觀, 容易計算
-
缺點
- 它要求, 否則, 從而導致.
- MAPE沒有上界, 因此對異常值敏感. 當某個非常大時, 會導致MAPE的值也顯著變大.
- 如果使用MAPE作為誤差評價指標, 的不對稱性會導致預測銷量低于實際銷量(解釋如下).
-
的不對稱性
給定實際銷量, 當預測銷量從0變化到時, 分別考慮"低估"和"高估"時的上界.
- 低估: , 此時, 即上界為100;
- 高估: , 此時, 即上界為無窮大.
由于高估會帶來較大懲罰, 為了最小化MAPE值, 算法會傾向低估, 從而導致預測的銷量偏低.
4.2 對稱的MAPE (Symmetric Mean Absolute Percentage Error - SMAPE)
為了彌補的不對稱性, M3-競賽[1]和IJCAI-17[2]數(shù)據(jù)挖掘競賽采用了所謂"對稱的"MAPE作為誤差評價指標. 定義如下:
-
優(yōu)點
- 始終可計算(當時, 定義).
- SMAPE有界, 即: .
- 形式上滿足對稱性, 即低估和高估時上界都是200.
-
缺點
- 的意義不直觀, 缺乏解釋性.
- 在實際的銷量預測中, 由于銷量的上界通常是有限的(通過經(jīng)驗可以預估), 因而即使出現(xiàn)"高估"的情形, 預測銷量一般不會超過實際銷量的常數(shù)倍(例如不超過10倍). 從這個角度來看, 高估時誤差的上界一般低于低估時對應的上界. 換句話說, 低估帶來的懲罰比高估大. 因此如果使用SMAPE作為誤差指標, 其預測銷量一般會高于實際銷量.
4.3 反正切絕對百分比誤差(Mean Arctangent Absolute Percentage Error - MAAPE)
Sungil Kim和Heeyoung Kim[3]提出了一個有意思的誤差指標MAAPE. 與MAPE相比, 它把理解成直角三角形中的切角(見下圖).
因此. MAAPE即為的均值:
-
優(yōu)點
- 始終可計算.
- MAAPE有界, 即: .
- 有較好的可解釋性.
-
缺點
- 如果用MAAPE作為誤差指標, 其預測銷量一般會低于實際銷量. (可以驗證: 低估時的上界為, 而高估時對應的上界為.)
5. 誤差指標匯比較結果匯總
絕對誤差
誤差指標 | 中文 | 優(yōu)點 | 缺點 | 說明 |
---|---|---|---|---|
MAE | (算術)平均絕對誤差 | 直觀 | 對異常值敏感 | 需要確認預測的目標與誤差指標是否一致 |
GMAE | 幾何平均絕對誤差 | 對異常值不敏感 | 1. ; 2. 計算相對耗時 | 需要確認預測的目標與誤差指標是否一致 |
RMSE | 根均方誤差 | - | 對異常值非常敏感 | 需要確認基本假設(例如誤差是正態(tài)分布) |
絕對百分比誤差
誤差指標 | 中文 | 優(yōu)點 | 缺點 | 說明 |
---|---|---|---|---|
MAPE | 平均百分比絕對誤差 | 直觀/容易計算 | 1. 對異常值敏感; 2. ; 3. 預測值偏小 | 不推薦使用 |
SMAPE | 對稱的平均絕對百分比誤差 | 1. 始終可計算; 2.形式上對稱 | 1. 實際中預測值偏大; 2. 解釋性差 | 需要確認預測的目標與誤差指標是否一致 |
MAAPE | 平均反正切絕對百分比誤差 | 1. 始終可計算; 2. 有一定的解釋性 | 預測值偏小 | 需要確認預測的目標與誤差指標是否一致 |
說明
- 在實際中我們不能盲目地使用已知的誤差指標, 也不存在"萬金油"的誤差指標. 我們采用(設計)的誤差指標必須與業(yè)務目標一致. 即, 誤差指標的提升會帶來業(yè)務目標的提升.
- 使用百分比誤差時, 必須注意誤差指標會引發(fā)預測銷量比實際銷量偏小或者偏大的風險.
6. 示例
我們用一個簡單的例子來說明百分比誤差引起的預測值偏大或偏小的問題.
例. 假設, 實際銷量為1-100的均勻分布, 即, 其中(若, 令). 我們的預測模型為 (為1-100之間的整數(shù)).
下面考慮三種誤差指標MAPE, SMAPE和MAAPE. 它們對應的最優(yōu)預測結果如下圖所示.
誤差指標 | 最優(yōu)k值 | 誤差值 | 結論 |
---|---|---|---|
MAPE | 8 | 85.99 | 嚴重偏低(銷量的均值為50.5) |
SMAPE | 56 | 56.33 | 偏高 |
MAAPE | 41 | 0.5272 | 偏低 |
警告 MAPE是業(yè)界使用最多的誤差指標, 其預測模型產(chǎn)生的預測結果會明顯偏低, 因此我們在使用中一定要確認預測目標與誤差指標的一致性!
7. 總結
- RMSE經(jīng)常作為預測模型的誤差指標(損失函數(shù)), 其理論依據(jù)是建立在誤差滿足正態(tài)分布的假設下. 首先我們要驗證用于擬合的樣本是否滿足該條件. 其次, RMSE對異常值敏感, 為了獲得穩(wěn)定的效果, 我們一般需要對數(shù)據(jù)做一些平滑處理.
- 百分比誤差MAPE(以及類似的變種)是被濫用的誤差指標. 如果你正在使用, 請確保業(yè)務方了解該誤差指標帶來的風險.
- 沒有萬金油的誤差指標, 應該根據(jù)自己實際的業(yè)務目標來確定銷量預測的誤差指標. 一個基本原則是確定誤差指標的提升能帶來業(yè)務的提升.
- 盡量不要使用單一的目標來衡量預測效果.
- 盡量不要使用單一的預測結果去支持多種業(yè)務.
參考文獻
-
S. Makridakis and M. Hibon. The m3-competition: Results, conclusions and implications.
International Journal of Forecasting, 16:451-476, 2000. ? -
IJCAI' 17 Competition. https://tianchi.aliyun.com/competition/information.htm?spm=5176.100067.5678.2.2f6f5933auxKS4&raceId=231591&_lang=zh_CN ?
-
Sungil Kim and Heeyoung Kim. A new metric of absolute percentage error for intermit-
tent demand forecasts. International Journal of Forecasting, 32:669-679, 2016. ?