數字通訊

[拼音]:buquedingxing juece

[英文]:decision under uncertainty

在無法估計系統行動方案所處狀態概率的情況下進行的決策。不確定型決策的基本方法是先用效用值表示各種可能的後果,構造一張支付表,再用一定的評價準則來評定各個方案的優劣,從而選出最優方案。若有n種行動方案(a1,a2,...,an)可供選擇,可能出現m 個狀態(θ1,θ2,θm),方案ɑi在狀態θj所出現的後果用效用值表示,記作Cij=C(ai,θj),即可得出構造矩陣表,又稱支付表(見表)。根據支付表可用不同準則評價方案的優劣,從而選出最優行動方案(或稱最優策略)。常用的準則有拉普拉斯準則、瓦爾德準則、赫維茲準則、混合準則和薩沃格準則。

拉普拉斯準則

這個準則假定所有狀態都是以相等概率出現:P(θ1)=P(θ2)=...=P(θm)=1/m,P(θj)為θj狀態下的概率。用期望效用值ū(ai)作為評價方案ɑi的準則:

滿足

的方案a壟為最優方案。

瓦爾德準則

又稱悲觀準則或max-min準則。用這一準則決策時對客觀情況的估計持悲觀態度,在支付表中對每一方案ɑi總是估計會出現最壞結果,從中找出一個較好的方案。其評價準則為

滿足

的方案a壟為最優方案。

赫維茲準則

又稱樂觀準則或max-max準則。用這一準則決策時對客觀情況的估計總是抱樂觀態度,在支付表中對每一方案ɑi總是估計會出現最好結果,其評價準則為

使ū(ɑi)最大的方案a壟為最優方案。

混合準則

又稱 α樂觀準則。在支付表中對每一方案 ɑi既非全部悲觀,也非全部樂觀,而是各取一部分。為此引入係數α ,滿足0≤α≤1,因此

使ū(ɑi)最大的方案a壟為最優方案。

薩沃格準則

又稱遺憾準則。在支付表中先按列計算其最大值,同列中未達到最大值者與最大值的差值稱為遺憾值,記為Rij。這些Rij構成遺憾值矩陣,對遺憾值矩陣每一行取最大值,記為

,i=1,2,n。在所有

中取最大者

,a*就是最優方案。

在同一個支付矩陣表的情況下,由於所採用的準則不同,所選出的最優方案常常不同。因此需要根據決策者所遇到問題的實際情況決定採用什麼準則,有時也可採用多種準則互相參照。

參考書目

A.P.Sage,Methodology for Large Scale Systems,McGraw-Hill,New York,1977.