三體問題

[拼音]:suiji bijin

[外文]:stochastic approximation

在有隨機誤差干擾的情況下,用逐步逼近的方式估計某一特定值的數理統計方法。1951年,H.羅賓斯和S.門羅首先研究了此問題的一種形式:設因素x的值可由試驗者控制,x的“響應”的指標值為Y,當取x之值x進行試驗時,響應Y可表為Y=h(x)+ε,式中h(x)為一未知函式,ε為隨機誤差。設目標值為A,要找這樣的x

,使h(x

)=A。分別以Y-A和h(x)-A代替Y和h(x)。不妨設A=0,問題就在於找方程h(x)=0的根x

。例如若x為施藥量,Y為衡量藥物反應的某種生理指標,則問題在於找出施藥量x

,以使該生理指標控制於適當的值A。

若隨機誤差 ε=0,且h(x)為已知函式,則數值分析中提供了許多近似解法。例如可用牛頓迭代法求解:從一適當選擇的初始值x0出發,用迭代公式xi+1=xj+αjyj,式中yj=h(xj);

但當h(x)未知且有隨機誤差干擾時,αj和yj無法算出。羅賓斯等將上述演算法稍作修改,引進迭代程式xi+1=xj-bjYj,式中Yj為當x=xj時Y的響應值,bj為適當選定的常數。假定 h(x)為x的遞增函式且增長速度不快於線性,而各次量測相互獨立,則理論研究證明了,只要取bj>0滿足

則由此演算法決定的序列{xj}以概率1收斂到x

(見概率論中的收斂)。上述演算法叫羅賓斯-門羅程式,這是隨機逼近的開創性的工作。

在有的問題中,要找的不是h(x)的零點,而是其極值點慜,它滿足h′(慜)=0。但試驗觀測到的不是h′(x)+ε而只是h(x)+ε,故上述演算法不能用於逼近慜。J.基弗和J.沃爾弗維茨依據用差商逼近h′(x)的想法在 1952年提出了一個演算法(基弗-沃爾弗維茨程式)以解決估計慜的問題。

1951年以來,隨機逼近的研究已取得了很大的進展。在理論上,討論了量測誤差不獨立的情形和帶約束條件的情形,以及h(x)具有更一般性質的情形。也考慮了時間連續時的演算法和修正係數bj的選擇,並對演算法的漸近性質作了深入的研究。在方法上,也從純概率發展到結合使用微分方程等工具。隨機逼近在優化問題、適應控制、調節及跟蹤系統等方面都有應用。

參考書目

M.T.Wasan,Stochastic ApproxiMation,cambridge Univ. Press,cambridge,1969.

H.Robbins and S.Monro,A Stochastic Approximation Method,Ann. Math. Statist.,Vol.22(1),1951.