1.1.2 機會約束模型
嚴格的值約束
? 記優(yōu)化問題(1-2)的最優(yōu)解為垒棋。若某一場景中需求
的取值為
,那么顯然
可能與
差別很大掸茅。一個很自然的想法是:能否給優(yōu)化問題(1-2)添加一個約束
椅邓。考慮到
是一個分片線性函數(shù)昧狮,那么該約束等價為
其中表示需求
的所有可能的取值構(gòu)成的集合景馁。
寬松的概率約束
上述約束過強,若足夠大逗鸣,那么很有可能沒有
能夠滿足上述約束合住,即優(yōu)化問題不可行。進而我們可以考慮添加這樣一個約束:
的概率小于閾值
撒璧。這就是一個chance constraint透葛,表示如下
亦即
我們來看看的形式
于是乎chance constraint (1-7)等價于
相對于約束(1-5)來說殿如,約束(1-8)寬松了很多贡珊。
1.1.3 多階段模型(multistage models)
? 我們對報童問題進行拓展最爬,考慮一個多階段問題涉馁。假定公司需要在一個時間長度為的經(jīng)營活動中做決策。在第
個時間段爱致,需求是一個隨機變量烤送,記為
,其中
糠悯。在開始階段帮坚,即
時,我們已知當(dāng)前存貨量為
互艾。在每個階段试和,即
時,公司觀測到當(dāng)前存貨量為
纫普,然后公司決定購入一些貨物阅悍,使得存貨量更新為
,顯然
昨稼;庫存量更新之后节视,公司觀測到需求量
(
是
的一個實例),于是在
時段開始時假栓,庫存量
寻行。注意
可能為正也可能為負,為負數(shù)時表示拖欠或者交付延誤匾荆。
時段公司的代價如下
其中表示購買成本拌蜘,
表示延誤成本杆烁,
表示庫存成本。一般來說简卧,
连躏,
。
? 目標(biāo)是所有時間段的代價和的期望最小贞滨,可寫為如下優(yōu)化問題
? 若入热,那么優(yōu)化問題(1-9)與優(yōu)化問題(1-2)是等價的。
時晓铆,情況就復(fù)雜很多了勺良。記
表示截止到時間
時的歷史需求構(gòu)成的隨機過程,記
表示
的一個實例骄噪。在
時間段開始時尚困,我們不知道
,但是我們很有可能知道
在
情況下的條件概率分布链蕊。假定我們知道該條件分布事甜。
? 最后一個時間段,即滔韵,我們觀測到了
,然后我們求解下述優(yōu)化問題:
亦即求解如下問題
? 顯然優(yōu)化問題(1-10)或者(1-11)的目標(biāo)函數(shù)最優(yōu)解時一個關(guān)于以及
的函數(shù)逻谦,我們將其記為
? 在時,我們求解如下優(yōu)化問題
注意到陪蜻,優(yōu)化問題(1-12)可以寫為
? 顯然優(yōu)化問題(1-12)或者(1-13)的目標(biāo)函數(shù)最優(yōu)解時一個關(guān)于以及
的函數(shù)邦马,我們將其記為
? 類似地對于,我們求解如下優(yōu)化問題
? 最后在時宴卖,求解如下問題
? 我們再來回顧下優(yōu)化問題(1-10)-(1-14)滋将。從開始,我們需要回溯求出函數(shù)
症昏。一般來說随闽,很難或者幾乎不可能求出上述函數(shù)。如果假定
是"階段獨立"(stagewise independent)的肝谭,那么情況會變得簡單很多掘宪。所謂的"階段獨立"是指,
與
獨立分苇。那么優(yōu)化問題(1-10)-(1-14)中的條件期望就直接轉(zhuǎn)換了期望添诉。目標(biāo)函數(shù)最優(yōu)值也就可以寫為
。此時医寿,我們可以對
以及
進行離散化栏赴,對于每一個
我們求解相應(yīng)的
。但是該方法面臨著維數(shù)災(zāi)難靖秩,如果
以及
可取值較多须眷,那么該方法幾乎不可行竖瘾。后面章節(jié)我們會談到,動態(tài)規(guī)劃利用了函數(shù)的凸性來降低維數(shù)帶來的災(zāi)難花颗。
? 假定我們已經(jīng)求解出來了優(yōu)化問題(1-10)-(1-14)捕传。記最優(yōu)解為。對于
扩劝,
是
以及
的函數(shù)庸论。而
僅僅與
有關(guān)。在"階段獨立"的假設(shè)下棒呛,
僅僅是關(guān)于
的函數(shù)聂示。考慮到
自身是由
與
決定簇秒。所以鱼喉,我們考慮將決策視為關(guān)于
的函數(shù),即
趋观。這樣的一組決策扛禽,我們稱為實行策略,或者簡稱策略皱坛,policy编曼。策略是指基于當(dāng)前階段可獲得的信息來做出何種決策的規(guī)則。
? 我們可以將優(yōu)化問題(1-9)理解為在所有可能的策略中麸恍,尋找代價期望最少的策略灵巧。動態(tài)規(guī)劃問題求解出來的解即為最優(yōu)策略。在"階段獨立"的情況下抹沪,我們假定是下列無約束優(yōu)化問題的解。
我們可以證明上述目標(biāo)函數(shù)關(guān)于是凸函數(shù)瓤球,并且當(dāng)
逼近于無窮大時融欧,函數(shù)值為正無窮大。因而卦羡,上述優(yōu)化問題一定存在最優(yōu)解噪馏。再考慮函數(shù)的凸性,可知
時最優(yōu)策略绿饵。當(dāng)沒有"階段獨立"的假設(shè)時欠肾,結(jié)論依然成立,不過此時
與
有關(guān)拟赊。
? 我們證明優(yōu)化問題(1-15)的目標(biāo)函數(shù)時一個凸函數(shù)刺桃,無論"階段獨立"是否成立。
- 首先我們證明一個保凸運算:一個凸函數(shù)在一個隨機變量上的期望仍然是凸函數(shù)吸祟。若設(shè)函數(shù)
是實數(shù)范圍內(nèi)的一個凸函數(shù)瑟慈,
是一個隨機變量桃移, 那么函數(shù)
=
仍然是一個凸函數(shù)。
? 記葛碧,
是任意兩個數(shù)借杰,
,
.
? 證畢。
- 然后我們證明
是關(guān)于
的凸函數(shù)崎弃。首先
時苗胀,
記,那么依據(jù)章節(jié)1.1.1中的分析粘都,該函數(shù)是一個關(guān)于
的凸函數(shù)。給定
刷袍,記
關(guān)于
最優(yōu)解為
翩隧,那么
注意函數(shù)是關(guān)于
的凸函數(shù)。關(guān)于它的證明略呻纹,可依據(jù)二次函數(shù)畫圖理解堆生。那么
是關(guān)于
的凸函數(shù)。
我們再來觀察雷酪,如式(1-13)所示淑仆,目標(biāo)函數(shù)中與
相關(guān)的部分可以寫為關(guān)于
的凸函數(shù)(注意包含了一個仿射變換,以及一個求期望運算哥力,都是保凸的)蔗怠。該凸函數(shù)再約束
下求最優(yōu)值,那么所得目標(biāo)函數(shù)是一個關(guān)于
的函數(shù)吩跋,同上寞射,該函數(shù)關(guān)于
凸。進而
是關(guān)于
的凸函數(shù)锌钮。
以此類推桥温,可證明是關(guān)于
的凸函數(shù)。
那么依據(jù)仿射變換跟期望運算的保凸性梁丘,可知優(yōu)化問題(1-15)的目標(biāo)函數(shù)時一個凸函數(shù)侵浸,無論"階段獨立"是否成立。