#.是什么:
動態(tài)規(guī)劃--把多階段過程轉(zhuǎn)化為一系列單階段問題,逐個求解通殃,是求解決策過程(decisionprocess)最優(yōu)化的數(shù)學(xué)方法度液。
#.為什么:
應(yīng)用領(lǐng)域:
--經(jīng)濟管理、生產(chǎn)調(diào)度画舌、工程技術(shù)和最優(yōu)控制等方面得到了廣泛的應(yīng)用堕担。例如最短路線、庫存管理骗炉、資源分配照宝、設(shè)備更新、排序句葵、裝載等問題,用動態(tài)規(guī)劃方法比用其它方法求解更為方便兢仰。
--動態(tài)規(guī)劃主要用于求解以時間劃分階段的動態(tài)過程的優(yōu)化問題乍丈,但是一些與時間無關(guān)的靜態(tài)規(guī)劃(如線性規(guī)劃、非線性規(guī)劃)把将,只要人為地引進時間因素轻专,把它視為多階段決策過程,也可以用動態(tài)規(guī)劃方法方便地求解察蹲。
根據(jù)過程的時間變量是離散的還是連續(xù)的请垛,分為離散時間決策過程(discrete-timedecision process)和連續(xù)時間決策過程(continuous-time decision process);
根據(jù)過程的演變是確定的還是隨機的洽议,分為確定性決策過程(deterministicdecision process)和隨機性決策過程(stochastic decision process)宗收,其中應(yīng)用最廣的是確定性多階段決策過程。
#怎么做:
步驟
動態(tài)規(guī)劃模型通常包含以下要素:(以題目展示)
1.階段:階段(step)是根據(jù)時間順序或空間順序特征對整個過程的自然劃分亚兄。階段變量一般用k=1,2,L,n表示混稽。在例1中由A出發(fā)為k=1,由B(i=1,2)i出發(fā)為k=2审胚,依此下去從F(i=1,2)i出發(fā)為k=6匈勋,共n=6個階段。
2.狀態(tài):狀態(tài)(state)表示每個階段開始時過程所處的自然狀況膳叨。它應(yīng)能描述過程的特征并且無后效性洽洁,即當某階段的狀態(tài)變量給定時,這個階段以后過程的演變與該階段以前各階段的狀態(tài)無關(guān)菲嘴。通常還要求狀態(tài)是直接或間接可以觀測的饿自。
-狀態(tài)變量:描述狀態(tài)的變量碎浇,xk表示第k階段的狀態(tài)變量,它可以是一個數(shù)或一個向量璃俗。(小寫x)
-允許狀態(tài)集合:變量允許取值的范圍奴璃,Xk表示第k階段的允許狀態(tài)集合。(大寫X)
在例1可取B1,B2城豁,或?qū)i定義為i(i=1,2)苟穆,則=1或2,而X2={1,2}唱星。
n個階段的決策過程有n+1個狀態(tài)變量雳旅,表示演變的結(jié)果。在例1中取G间聊,或定義為1攒盈,即=1
3.決策:當一個階段的狀態(tài)確定后,可以作出各種選擇從而演變到下一階段的某個狀態(tài),這種選擇手段稱為決策(decision)拂玻,在最優(yōu)控制問題中也稱為控制(control)谋竖。
-決策變量:描述決策的變量,
-允許決策集合:變量允許取值的范圍
4.策略:
5.狀態(tài)轉(zhuǎn)移方程
6.指標函數(shù)和最優(yōu)值函數(shù)
指標函數(shù)
最優(yōu)值函數(shù)
7.最優(yōu)策略和最優(yōu)軌線
8.遞歸方程:
動態(tài)規(guī)劃遞歸方程是動態(tài)規(guī)劃的最優(yōu)性原理的基礎(chǔ),即:最優(yōu)策略的子策略飘言,構(gòu)成最優(yōu)子策略衣形。
--用狀態(tài)轉(zhuǎn)移方程(1)和遞歸方程(2)求解動態(tài)規(guī)劃的過程谆吴,是由k=n+1逆推至k=1,故這種解法稱為逆序解法苛预。
--對某些動態(tài)規(guī)劃問題句狼,采用順序解法。這時碟渺,狀態(tài)轉(zhuǎn)移方程和遞歸方程分別為:
用lingo求解例1最短路線問題: