北京控制工程研究所

[拼音]:feihezuo duice

[英文]:noncooperative games

對策論中局中人在選擇各自策略時不結成任何聯盟的對策問題。非合作對策按局中人數可分為二人對策和多人對策,按局中人的支付(或得失)之和可分為零和對策和非零和對策。

二人零和對策

對策論中理論最簡單又最完善的部分是二人零和對策,它是其他各部分理論的基礎。許多遊戲都可看作是二人零和對策的例子。在一個二人對策問題中(例如兩人進行對抗性競賽),參加者分別為局中人甲和乙,他們各自有自己的策略,即在對抗競賽中所採取的行動方案。設甲有m個策略,乙有п個策略。當甲選取第i個策略而乙選取第j個策略時便形成一種局勢。此時甲、乙雙方會有贏得或損失。甲、乙雙方得失之和為零,即一方所得等於另一方所失。若甲所得為ɑij=f(i,j)(i=1,…,m;j=1,п),乙所得為-ɑij,則ɑij為甲取第i個策略、乙取第j個策略時甲的支付(或贏得)。甲的支付可列成如下的矩陣表:

並可用矩陣方法進行處理。因此這類對策也稱為二人零和矩陣對策。對策論的基本問題是局中人採取何種策略才能使自己贏得最多(或損失最少)。

局中人甲也可以概率α1選取第一個策略,…,以概率 αi選取第i個策略,…,最後以概率αm選取第m個策略。這樣得到一個概率向量α=(α1,…,αi,…,αm),其中αi≥0,i=1,m,

α稱為甲的一個混合策略,而原來的 m種策略稱為甲的純策略。同樣可引進局中人乙的混合策略β=(β1,…,βj,…,βn)。若用X1、X2分別代表甲、乙的混合策略全體的集,並分別稱X1,X2為甲、乙的策略空間(以下在不產生誤解的情況下稱混合策略為策略)。當甲取策略α而乙取策略β時,甲的期望支付(贏得)是

,記作K1(α,β),並稱為甲的支付函式。顯然乙的支付函式為-K1(α,β),其中α∈X1,β∈X2。

對二人零和對策,若有策略對(╋,娕)便形成一種局勢。若對甲的一切策略α ∈X1,總有K1(╋,娕)≥K1(α,娕),則╋稱為甲的一個優策略。同樣,若對乙的一切策略β∈X2,也總有-K1(╋,娕)≥-K1(╋,β)或K1(╋,娕)≥或K1(╋,β),則娕稱為乙的優策略,而(╋,娕)稱為對策的優策略對,或稱為鞍點,這是二人零和對策的解。顯然在鞍點(╋,娕)對一切α∈X1,β∈X2,均滿足

K1(α,娕)≤K1(╋,β)

此式稱為諾伊曼鞍點定理或最小最大定理,它等價於方程

計算鞍點有多種方法,如利用線性規劃中的單純形法等。

多人非合作對策

與二人零和對策理論相似,多人非合作對策中討論最多的是正規型的。若把幾個參與者順次記為局中人1,2,…,n,並設局中人i的策略全體的集為xi(i=1,n),則稱xi為局中人i的策略空間。當每個局中人各自選擇一個策略xi∈xi(i=1,n),便形成一種局勢(x1,xn)。此時局中人i的支付可用函式Ki(x1,…,xn)表示。它是定義在乘積空間

上的實值函式、若

(常數),則稱此對策為常和對策;特別當c=0時,稱此 n人對策為 n人零和對策,若n=2,即為上述的二人零和對策。在非合作對策中,局中人在選擇各自策略時,根據對策的規則,不應結成任何聯盟;否則,就會變成“合作對策”。對一個非合作的多人對策,若有策略組(憫1,…,憫n),對局中人i的一切策略xi∈Xi,總有Ki(憫1,憫i-1,憫i,憫i+1,憫n)≥Ki(憫1,憫n)則憫i對局中人i來說是宜取策略。若對i=1,…,n,均有宜取策略憫i,則稱(憫1,憫n)為多人非合作對策的一個平衡點。J.納什證明,在一定條件下有平衡點存在。n=2時,平衡點就是二人零和對策中的鞍點。多人非合作對策平衡點的計算尚無有效的方法。