雲南省

[拼音]:shuju de tongji chuli fangfa

[英文]:statistical methods in data analysis

由於測量的偶然誤差以及被研究的物理現象本身的隨機性質,實驗觀測資料是由帶有偶然性的一些隨機資料組成的。實驗資料處理的任務是,由測得的有限個隨機資料(觀測值隨機變數的一個樣本),推斷被測定物理量的數值,或物理量之間的函式關係或被研究的物理現象的其他規律性。資料處理必須應用以隨機量為研究物件的統計數學方法,主要是概率論、數理統計學和隨機過程理論的數學方法。在粒子物理實驗中,由於物理現象本身固有的隨機性質很突出,物理現象的規律性往往被所測資料表面上的偶然性所掩蓋,所以選擇適當的統計方法進行資料處理就更為重要。資料處理中最常用的統計方法有參量估計、假設檢驗、擬合以及蒙特-卡羅模擬等。

參量估計

被測定的物理量常常是觀測值所服從的統計分佈中的參量。例如,穩定粒子的壽命是其生存時間觀測值所服從的指數分佈中的參量,共振態的質量和壽命是其衰變產物系統不變質量所服從的布賴特-維格納(Breit-Wigner)分佈中的參量。由觀測資料推斷物理量的數值,需要應用數理統計學中的參量估計方法。

最大似然法是估計分佈參量值的一個最常用的方法。若觀測值x服從概率密度函式為p(x;θ)的一個統計分佈,分佈參量θ為待測定的物理量,進行N次獨立測量得到一組觀測值x1、x2、…、xN,似然函式

是在參量取某特定值 θ的條件下出現該組觀測資料的概率,最大似然法選擇使似然函式取最大值的參量值

作為特定參量θ的估計值:

估計值的誤差用一定置信水平下的置信區間表示(見實驗資料的誤差處理)。置信區間可根據估計值的分佈性質用區間估計的方法定出,利用參量估計的置信分佈方法,可以得到被估物理量的一個完整的概率推斷,即該物理量的置信分佈。通常的測量誤差處理是參量估計的一個特殊情況:觀測值服從正態分佈,被測物理量的真值是觀測值正態分佈的期待值,其最大似然估計值是觀測值的算術平均值,平均值左右一倍標準誤差區間的置信水平為68.3%。

在被測物理量θ是一個隨機變數,並且已知它的概率分佈p(θ)(驗前分佈)的情況下,利用貝葉斯公式可以從觀測值x1、x2、…、xN得出關於被測物理量數值的一個更精密的推斷,即該物理量的驗後分布,參量θ的驗後分布的概率密度為

任意區間[θ1,θ2]的置信水平為

擬合

擬合是尋求被觀測物理量之間的函式關係的統計數學方法,又叫做觀測資料的平滑,設y和x都是被觀測的物理量,並且y是x的函式,函式關係由理論公式y=f(x;

c

)表示,式中

c

=(с1,с2,…,сm)為m個待定的參量,擬合的任務是由測得的N對觀測值

、…、

推斷理論公式中的未知參量

c

最常用的擬合方法是最小二乘法,在各觀測值彼此獨立且x 的測量誤差可以忽略的情況下,最小二乘法選擇使各觀測點殘差(y 的觀測值與理論值之差)的“加權平方和最小”的參量值╦ 作為引數的估計值,即

其中σ崿為觀測值y壟的方差。

最小二乘法可用於解決物理實驗中各種經驗公式的實驗曲線的建立問題(如粒子物理實驗中粒子徑跡的重建)。

假設檢驗

參量估計和擬合方法用於由實驗資料估計觀測值統計分佈中或被觀測量間函式關係中的待定參量。但是,觀測值所服從的統計分佈或被觀測量間函式關係的理論公式常常只是一種統計假設;這種假設是否能應用於實懸a href='http://www.baiven.com/baike/222/323577.html' target='_blank' >櫚木嚀邇榭觶欠褳鄄飩峁邢災拿埽枰黴鄄饈縈枰約煅欏J笛櫓行枰煅櫚耐臣萍偕杌箍梢允槍賾詮鄄庵低臣品植疾瘟渴檔哪持侄涎裕偕杓煅櫸椒ǔS糜諗卸鮮笛樘跫ɡ繅瞧髦副輳┦欠裾#欠翊嬖諉饗緣南低澄蟛睿蛘呤笛榻峁惺欠癜毆鄄庵檔耐臣品植薊蟣還鄄飭考浜叵檔睦礪奐偕柚興揮鋅悸塹降男孿窒蟆<偕杓煅櫸椒ɑ箍捎糜詿恿街擲礪奐偕柚刑粞∫桓鱟羈贍艿募偕瑁鞝硬煌W擁幕旌鮮校薟獾玫氖縈行У靨粞〕瞿持中枰牧W印Ⅻ/p>

假設檢驗的一般方法,是選擇一個觀測資料的函式λ(

x

),叫做檢驗統計量,λ的數值表現了理論假設同實測資料的差異,而且在理論假設成立的條件下λ 的統計分佈已知,則如果由測得資料算出的λ 值落入了表明與理論假設差異很大的某個區域之內(即在理論假設成立的條件下由λ的統計分佈算得λ值落入該區域內的概率──顯著水平──很小),就表明觀測資料同理論假設存在顯著的矛盾。

在實際問題中,應當根據具體情況選擇適當的檢驗統計量。

一個廣泛使用的檢驗統計量是皮爾孫 (Pearson)ⅹ2量,其定義為

式中ni為落入區間i中觀測值的個數,Ei為區間i中觀測值個數的理論預期值。顯然,ⅹ2值的大小表現了實驗資料與理論值差異的大小;同時,如果理論假設是正確的,則ⅹ2量漸近地服從一個已知的ⅹ2分佈,可以利用ⅹ2分佈對差異的大小作出定量的概率估計。

在觀測值統計分佈中的參量θ只有兩個可能值 θ0和θ1的情況下,對於由觀測值

x

判斷參量是否為特定值θ0的參量檢驗問題,似然比是一個很有用的檢驗統計量,似然比的定義為

蒙特-卡羅模擬

見蒙特-卡羅法。

參考書目

李惕碚著:《實驗的數學處理》,科學出版社,北京,1980。

A.G.Frodesen,et al.,ProBability and Statistics in particle Physics, Universitetsforlaget, Bergen,1979.