三體問題

[拼音]：suiji bijin

[外文]：stochastic approximation

在有隨機誤差干擾的情況下，用逐步逼近的方式估計某一特定值的數理統計方法。1951年，H.羅賓斯和S.門羅首先研究了此問題的一種形式:設因素x的值可由試驗者控制，x的“響應”的指標值為Y，當取x之值x進行試驗時，響應Y可表為Y=h(x)+ε，式中h(x)為一未知函式，ε為隨機誤差。設目標值為A，要找這樣的x

，使h(x

)=A。分別以Y-A和h(x)-A代替Y和h(x)。不妨設A=0，問題就在於找方程h(x)=0的根x

。例如若x為施藥量，Y為衡量藥物反應的某種生理指標，則問題在於找出施藥量x

，以使該生理指標控制於適當的值A。

若隨機誤差 ε=0，且h(x)為已知函式，則數值分析中提供了許多近似解法。例如可用牛頓迭代法求解：從一適當選擇的初始值x0出發，用迭代公式xi+1=xj+αjyj，式中yj=h(xj)；

但當h(x)未知且有隨機誤差干擾時，αj和yj無法算出。羅賓斯等將上述演算法稍作修改，引進迭代程式xi+1=xj-bjYj，式中Yj為當x＝xj時Y的響應值，bj為適當選定的常數。假定 h(x)為x的遞增函式且增長速度不快於線性，而各次量測相互獨立，則理論研究證明了，只要取bj>0滿足

則由此演算法決定的序列{xj}以概率1收斂到x

(見概率論中的收斂)。上述演算法叫羅賓斯-門羅程式，這是隨機逼近的開創性的工作。

在有的問題中，要找的不是h(x)的零點，而是其極值點慜，它滿足h′(慜)=0。但試驗觀測到的不是h′(x)+ε而只是h(x)+ε，故上述演算法不能用於逼近慜。J.基弗和J.沃爾弗維茨依據用差商逼近h′(x)的想法在 1952年提出了一個演算法（基弗-沃爾弗維茨程式）以解決估計慜的問題。

1951年以來，隨機逼近的研究已取得了很大的進展。在理論上，討論了量測誤差不獨立的情形和帶約束條件的情形，以及h(x)具有更一般性質的情形。也考慮了時間連續時的演算法和修正係數bj的選擇，並對演算法的漸近性質作了深入的研究。在方法上，也從純概率發展到結合使用微分方程等工具。隨機逼近在優化問題、適應控制、調節及跟蹤系統等方面都有應用。

參考書目

M.T.Wasan，Stochastic ApproxiMation，cambridge Univ. Press，cambridge，1969.

H.Robbins and S.Monro，A Stochastic Approximation Method，Ann. Math. Statist.，Vol.22(1)，1951.