興山縣

[拼音]:shuli tongjixue

[英文]:mathematical statistics

數學的一個分支學科。研究怎樣去有效地收集、整理和分析帶有隨機性的資料,以對所考察的問題作出推斷或預測,直至為採取一定的決策和行動提供依據和建議。數理統計學可用於種種專門領域(物理、化學、工程、生物、經濟、社會等),但只涉及其中有關帶隨機性的資料的分析問題,而不是以任何一種專門的知識領域為研究物件。但是,在用數理統計方法分析帶隨機性的資料時,從統計模型的選擇、實驗方案的制定、統計方法的正確作用以至所得結論的恰當解釋,都離不開所論問題的專門知識。

在英語中,統計學(statistics)一詞系由state(國家)衍化而來,意指由國家收集的有關國情的資料。在中國的《二十四史》和其他典籍中,可看到不少關於錢糧戶口、水災地震等數字記載,這類記載可以看成是統計學的濫觴,但還不是現代意義下的數理統計學,因為它只是有關事實的記錄和整理,而沒有在一定理論的指導下,作出超越資料範圍之外的推斷。例如,在概率論和近代數學發展起來以前,沒有也不可能根據已有的人口資料,去建立一定的模型以預測人口發展的趨勢,或者根據已有的地震資料,去建立一個模型以預測今後若干年內的地震。在概率論發展以前,社會調查多是採取普查的形式,不需要處理因抽樣的隨機性所產生的問題。常把這種收集、記錄和整理資料的工作稱為描述性統計。

數理統計學是伴隨著概率論的發展而發展起來的,當人們認識到,必須把資料看成是來自具有一定概率分佈的總體,所研究的物件是這個總體而不能侷限於資料本身之日,也就是數理統計學誕生之時。這一點始自何時,在專家中沒有一致的意見。從現有資料看,在19世紀中葉以前已出現了若干重要的工作,特別是C.F.高斯和 A.-M.勒讓德關於觀測資料誤差分析和最小二乘法的研究。到19世紀末期,經過包括K.皮爾森在內的一些學者的努力,這門學科已開始形成。但數理統計學發展成一門成熟的學科,則是20世紀上半葉的事,它在很大程度上要歸功於K.皮爾森、R.A.費希爾等學者的工作。特別是費希爾的貢獻,對這門學科的建立起了決定性的作用。1946年H.克拉默發表的《統計學數學方法》,是第一部嚴謹且比較系統的數理統計著作,可以把它作為數理統計學進入成熟階段的標誌。

數理統計學一詞有一種狹義的理解,即僅指有關統計方法的數學理論。在美英等國多是這樣理解的。統計方法的數學理論研究中用到很多近代數學的知識,主要的如分析學與函式論、矩陣代數、組合數學,也用到泛函分析、拓撲學和抽象代數的知識。但與數理統計學關係最密切的是概率論。在很大程度上可以說:概率論是數理統計的基礎,數理統計是概率論的一種應用。但是,它們是兩個並列的數學分支學科,並無從屬關係。

統計工作諸環節

用數理統計方法去解決一個實際問題時,一般有如下幾個步驟:建立數學模型,收集整理資料,進行統計推斷、預測和決策。這些環節不能截然分開,也不一定按上述次序,有時是互相交錯的。例如,在建立模型時往往要參考所掌握的資料,在整理資料時,要考慮到擬作的統計推斷的形式,等等。

模型的選擇和建立

在數理統計學中,模型是指關於所研究問題的總體的某種假定,一般是給總體分佈規定一定的型別。有的假定不直接涉及總體分佈形式,如在迴歸分析中,常假定迴歸函式為線性的,稱為線性迴歸模型。這一假定與總體分佈所屬型別無關。建立模型要依據概率論的知識、所研究的問題的專業知識、以往的經驗以及從總體中抽取的樣本(資料)。例如,依概率論的中心極限定理,在分析測量誤差時,有理由選擇正態分佈作為模型;在電子元件的老化作用可以忽略不計的時段內,有理由假定其壽命服從指數分佈;等等。在有些實際問題中,並無足夠的理論根據去選擇一種特定的模型,而需要利用資料。例如,把資料描在各種概率紙上,看它們在哪一種概率紙上與直線最接近,就選那種分佈為模型。根據理論選定的模型,也要用資料去檢驗它是否符合實際,其中涉及很多理論問題。

資料的收集

有三種方式:全面觀測,抽樣觀測和安排特定的實驗。

全面觀測又稱普查,即對所研究的總體的每個個體都加以觀測,測定所需要的指標值,如人口普查。如果不計普查過程中可能發生的重複、遺漏、誤記等人為性錯誤,則普查結果沒有隨機性可言。而且,普查既然對總體的所有個體都作了觀測,就不存在由所得資料去對總體作出統計性的推斷的問題。因此,全面觀測不屬於數理統計學的研究範圍。但是,全面觀測所得的資料的加工整理也用到數理統計學的方法和概念。

抽樣觀測又稱抽查,是指從一些有形的個體組成的總體中抽取一部分,測定其有關的指標值。例如,在全國人口中抽取十分之一作調查。為使抽出的這一部分個體在總體中有儘可能大的代表性,對抽樣方法要作適當安排。這方面的研究內容構成數理統計的一個分支學科,叫抽樣調查。一個最簡單且最常見的要求是;總體中的每一個體要有同等的機會被抽出。在抽樣觀測中,隨機性一般表現在:樣本中包含哪些個體,是出自機會,而不是在抽樣前預定的。有一種所謂“判斷性抽樣”,或稱“典型抽樣”,是根據抽樣者的判斷抽取他認為合適的若干個體作調查。在這種情況下,隨機性的影響無法考慮,因而不屬於數理統計學的研究範圍。

安排特定實驗以收集資料,可以理解為通過實驗去“造出”總體中的個體(的指標)。例如,在同樣的條件下重複測定一個物理常數,會得出不盡相同的數值。所有可能的測定值構成一個總體,它並非有形地存在著,而是每做一個實驗,就“造出”其中一個個體。在一定的生產條件下,所能生產出的某種工業產品的質量指標構成的總體,也屬於這種性質,即:每生產出一件產品並測出其質量指標時,就“造出”其中一個個體。由此可見,通過實驗收集資料與抽樣觀測不同之處,在於前者是從一個無形且無限的總體中抽樣,而在後者,總體是有形且一般是有限的。

實驗需要有計劃地安排。如為試製一種工業品,有幾種原材料和裝置可選用,生產的各種工藝因素溫度、壓力、反應時間等,又可各有若干個可選用的水平。因此,全部可能的搭配數很多,一般為人力物力時間所限,只能挑選一部分去做實驗。所挑的一部分要有代表性,並使所得資料便於進行分析。這裡面所包含的數學問題,構成數理統計學的一個分支學科實驗設計法的內容。

資料整理

目的是把包含在資料中的有用資訊提取出來。一種形式是制定適當的圖表,以反映隱含在資料中的粗略的規律性或一般趨勢。另一種形式是計算若干特徵數字,以刻畫樣本某些方面的性質。如樣本均值和樣本方差分別反映了樣本內各數值的平均水平及差異程度。這種特徵數字在數理統計學中稱為統計量,它的研究有重要的理論和實際意義,所得到的成果可用於指導資料的整理和統計推斷方法的選擇。

統計推斷

指根據總體模型以及由總體中抽出的樣本,作出有關總體分佈的某種論斷。資料的收集和整理是進行統計推斷的必要準備,但它沒有越出所觀察的事物的範圍,是屬於前述的描述性統計的範疇,而不是統計推斷。後者的特徵是:推斷的內容必須涉及總體。例如,從整批1萬件產品中隨機抽取200件作檢查。算出這200件的廢品率為2%。這確切描述了抽出的這200件產品的質量情況。若由此跨出一步,以2%這個數作為整批產品的廢品率p 的估計,則構成一個統計推斷。

統計預測

統計預測的物件,是隨機變數在未來某個時刻所取的值,或設想在某種條件下對該變數進行觀測時將取的值。例如,預測一種產品在未來三年內的市場銷售量,武漢市明年的長江最高水位,某個10歲男孩在兩年後的身高,等等。統計推斷與統計預測在兩個方面有相似之處:一是都要依據一定的統計模型和觀測資料,二是都要越出已觀察的事物的範圍。不同之處在於:統計推斷的物件是總體分佈的某一方面,如分佈中所包含的一個引數的值,它雖是未知的,但並無隨機性;統計預測的物件則不僅未知,且是隨機的。例如,估計由全體12歲男孩的身高構成的總體的均值,是統計推斷問題;若要問一個指定的10歲男孩兩年後將長到多高,則是一個統計預測問題。預測和推斷也不能截然分開,在許多情況下,為了進行預測,必須先做統計推斷。例如,當用線性迴歸方程作預測時,有必要先估計迴歸方程中的係數,而這屬於統計推斷問題。

統計決策

不少實際問題的解決,最後要落實到一定的行動。統計決策就是依據所做的統計推斷或預測,並考慮到行動的後果(以經濟損失的形式表示),而制定的一種行動方案。目的是使損失儘可能小,或反過來說,使收益儘可能大。例如,一個商店要決定今年內某種產品的進貨數量,商店的統計學家根據抽樣調查,預測該產品本店今年銷售量為1000件。假定每積壓一件產品損失20元,而少銷售一件產品則損失10元,要據此作出關於進貨數量的決策。一般,在作決策時要考慮其他方面的因素,而不完全是統計決策。但只要在決策所依據的條件中有受到偶然性影響的成分,則數理統計方法總是有用的。從廣義的意義說,統計推斷(或預測)也可視為一種行動。這帶來一種新觀點,就是把損失的概念引伸於評價所作統計推斷的優劣。這種看法豐富了統計推斷理論的內容,使得有可能用統一的觀點去研究種種形式不同的統計推斷。這正是A.瓦爾德在1950年提出統計決策理論的出發點。

分支學科

數理統計學內容龐雜,分支學科很多,難於作出一個周密而無懈可擊的分類。大體可以劃分為如下幾類。

第一類分支學科包括前面已提到的抽樣調查和實驗設計。它們討論在觀測和實驗資料的收集中有關的理論和方法問題,但並非與統計推斷無關。因為收集資料是為了爾後作統計推斷之用,在制定收集資料的方案時要以此為準繩。

第二類分支學科為數甚多,其任務都是討論統計推斷的原理和方法。各分支的形成是基於:

(1)特定的統計推斷形式。例如,主要的統計推斷形式有引數估計和假設檢驗兩種,它們各自構成數理統計學中的基礎性的重要分支。

(2)特定的統計觀點。例如貝葉斯統計與統計決策理論,它們都是從一種基本觀點出發去處理全部統計推斷問題。

(3)特定的理論模型或樣本結構。例如非引數統計、多元統計分析、迴歸分析、相關分析、序貫分析、時間序列分析和隨機過程統計。其中,非引數統計之所以形成一個分支,是因為所討論的問題有一個公共特性:其總體分佈族包羅的內容很廣泛,不能用有限個實引數去刻畫;多元統計分析的特點則在於所討論的統計總體必是多維的;等等。這種分支學科不是以某一種特定的統計推斷形式為研究物件,而要涉及各種統計推斷形式,它們既研究統計理論,也研究統計方法。這種統計方法是共性的,即可用於來自各種不同的專業領域中的實際問題,而不是以一種特定的應用領域為物件。

第三類是一些針對特殊的應用問題而發展起來的分支學科,如產品抽樣檢驗、可靠性統計、統計質量管理等,它們都不涉及或很少涉及任何一種專門學科的知識,以此才被認為是一個統計分支。在這種分支學科中,一般都需要同時考慮資料的收集和統計推斷兩方面的問題。例如,產品抽樣檢驗的任務是制定從一批產品中作隨機抽樣的方案,並依據由此獲得的樣本去決定是否接受該批產品,這裡面有抽樣方案的統計問題,也有使用資料作統計假設檢驗的問題。

還有一些分支學科,它們的任務是討論統計方法在某一特定學科中的應用,例如生物統計、計量經濟學、氣象統計、地質統計等,這些分支因為涉及大量有關學科的專門知識,不好認為是數理統計學的一個分支,可以看作是一種邊緣學科分支。

對上面所提的分支學科名單及其分類,也還存在某些問題。例如有的意見認為第三類中的產品抽樣檢驗等不應列為數理統計的分支學科,只是數理統計方法的一種應用。另外,在上面提到的一些分支之間,存在著內容重複交叉以至在一定意義下有包含關係的情況。例如,時間序列分析可以認為是更一般的隨機過程統計的一部分,迴歸分析、相關分析中的許多內容可歸入多元統計分析內;假設檢驗中的非引數檢驗部分是非引數統計的主要內容。

應用

數理統計方法在工農業生產、自然科學和技術科學以及社會經濟領域中都有廣泛的應用,然而按其性質來說,基本上是一個輔助性的工具,它的恰當應用依賴於所論問題的專門知識、經驗,以至良好的組織工作。

數理統計方法在農業中應用的一個主要方面,是對田間試驗進行適當的設計和統計分析。實驗設計的基本思想和方法,就是從田間試驗開始發展起來的。象種子品種、施肥的種類和數量以及耕作方法的選定,都需要通過試驗。農業試驗由於週期長且環境因素變異性大,特別需要對試驗方案作精心的設計,並使用有效的統計分析方法。數理統計方法在農業中應用的另一方面是數量遺傳學的方法。例如,培育高產品種的研究中的資料分析使用了多種統計方法,如在遺傳力的計算上,用了很複雜的迴歸和方差分量分析的方法。

數理統計方法在工業中的應用,有兩個主要方面。一是在工業生產中,常有試製新產品和改進老產品、改革工藝流程、使用代用原材料和尋求適當的配方等問題。影響產品質量的因素一般很多,在進行試驗時要用到各種多因素設計方法,及與之相應的統計分析方法,以判定哪些因素是重要的,哪些是次要的,並決定一組最優的生產條件。正交設計(見實驗設計法)、迴歸設計與迴歸分析、方差分析、多元分析等統計方法,是處理這類問題的有用工具。另一方面是,現代工業生產多有大批量和要求高可靠的特點,為保證產品質量,需要在連續的生產過程中進行工序控制,制定成批產品的抽樣驗收方案,對大批生產的元件進行壽命試驗,以估計元件的可靠性及包含大量各種元件的系統的可靠性。為解決這些問題發展了一些統計方法,如種種形式的質量控制圖,抽樣檢驗,可靠性統計分析,等等,它們構成統計質量管理的內容。這些方法是20世紀二三十年代開始發展起來的,幾十年來的經驗證明,它們起了相當大的作用。

醫學是較早使用數理統計方法的領域之一。在防治一種疾病時,需要找出導致這種疾病的種種因素。統計方法在發現和驗證這種因素上,是一個重要工具。例如,長時期來人們懷疑肺癌的發生與吸菸有關係,這一點得到大量統計資料的證實。另一方面的應用是,通過臨床試驗,用統計分析確定一種藥物對治療其種疾病是否有用,用處多大,以及比較幾種藥物或治療方法的效力;對比試驗、列聯表、迴歸分析等是這方面的常用工具。統計方法在醫學中應用之廣,可以由在關於醫藥的廣告中也常引用統計數字這樣一個現象看出。

數理統計方法在自然科學和技術科學中的應用,有以下幾個方面:在基礎理論研究中,常常從一種觀點出發,根據初步觀察結果而提出一種學說或假說。它們是否正確,或在多大程度上正確,要訴諸大規模的實驗驗證,這裡面就有實驗的設計和資料的統計分析問題。有時,是通過統計分析發現某種規律性,然後在理論上去尋求解釋。一個著名的例子是門德爾的遺傳定律,門德爾通過豌豆試驗發現了這個定律,以後由很多人通過進一步的試驗,並用數理統計學中的“擬合優度檢驗法”(見假設檢驗)檢驗過。為這個定律尋求理論上的解釋,是導致“基因學說”建立的一個重要原因。在應用性的研究中,常常因為對所研究的現象的規律性認識不充分,而不能不主要依靠對實驗和觀察資料的分析,去提出解決問題的辦法。例如,統計方法用於地震、氣象和水文方面的預報,都有一定的效果。在地質勘探中,人們在一個地區的若干個點(點的選擇也有統計上的考慮)進行觀察,對其結果用種種統計方法,如趨勢面分析、對應分析(見多元統計分析)等去進行處理,去建立某種經驗性質的規律,以用於指導找礦。數理統計方法在上述各領域中的作用很大,以致出版了一些闡述統計方法在這些領域中應用的專著。一般地說,無論是自然科學和技術科學,都離不開實驗觀察,都有處理資料的問題,因此也就有統計方法用武之地。例如,通過分析實驗資料而建立經驗公式,是技術科學中常用的一種方法。

數理統計方法對社會、經濟領域也有重要的意義,從某些數理統計學較發達的國家看,統計方法在這些領域中的應用,比它在自然科學和技術領域中的應用更早且更廣泛。

統計方法在社會領域中應用的一個重要方面是抽樣調查,在人力物力時間不允許進行全面調查時,使用抽樣調查可以做到節省、快速,並獲得滿意的結果。有時,經過精心設計和組織的抽樣調查,其效果甚至比全面調查更好。因為,全面調查由於工作量太大,常不免產生一些人為性的錯誤。另一方面,對社會現象的研究有向定量化發展的趨勢。例如人口學,確定一個合適的人口發展動態模型,需要掌握大量的資料資料,並使用包括統計方法在內的一些科學分析方法。在經濟科學中,定量化的趨勢比其他社會科學部門更早且程度更深,如早在20世紀二三十年代,時間序列分析方法就曾用於市場預測,現在已建立了一門邊緣性質的學科──數量經濟學,從簡單的迴歸分析方法到艱深的隨機過程統計方法,都在其中找到了應用。

發展簡史

數理統計學的發展大致可分三個時期來敘述。

20世紀以前

這個時期又可以分成兩段,大致上可以把高斯和勒讓德關於最小二乘法用於觀測資料的誤差分析的工作作為分界線,前段屬萌芽時期,總的說還沒有超出描述性統計的範圍。不過,這個時期在概率論方面有較多的發展,為以後數理統計學的建立作了準備。某些現在還很常用的統計方法,如直方圖方法,符號檢驗法等,在這個時期就有人使用過。T.貝葉斯在1763年發表的《論有關機遇問題的求解》對後世統計思想起了很大的影響。這時期的後一段可算作是數理統計學的幼年階段。其中,高斯等關於最小二乘法的工作,在20世紀初以來經過Α.Α.馬爾可夫和其他學者的發展,成為數理統計學中的一個重要方法。但是,這個時期的最重要的發展,首先在於確立了這樣一種觀點,即資料是來自服從一定概率分佈的總體,而統計問題就是用資料去推斷這個分佈中的未知方面。這種觀點強調了推斷的地位,而使統計學擺脫了單純描述的性質。但這種觀點也並非一下子就徹底建立起來的,由於高斯等的工作揭示了正態分佈的重要性(人們常稱正態分佈為高斯分佈),在相當一個時期內,學者們普遍持有這樣一種觀點,即在實際問題中遇見的幾乎所有的連續變數,都可以滿意地用正態分佈去刻畫。這正是“正態”一詞的由來與含義。這樣,連續變數的統計基本上就被看成是正態分佈的統計。這種觀點對20世紀統計的發展起了很大的影響,其積極的一面是關於正態分佈的統計得到了深入的發展,而這在應用上有很大的重要性。但也有消極的後果,如延緩了非引數統計的發展並使它沒有取得應有的地位。19世紀末期以來,一些學者,特別是K.皮爾森,開始認識到這種觀點的侷限性。皮爾森引進了一個現在以他的名字命名的分佈族,它包含了正態分佈及現在已知的一些重要的偏態分佈。皮爾森認為,他所引進的分佈族可以概括實用上常見的分佈。統計學以後的發展並沒有沿著他所設想的路線,但他的工作仍有很大的意義。特別是,他引進了一種方法──矩估計法,用來估計他所引進的分佈族中的引數(見點估計),這個方法一直是一種重要的引數估計方法。

另外,德國的大地測量學者F.赫爾梅特1875年在研究正態總體的樣本方差時,發現了在統計上十分重要的ⅹ2分佈。F.高爾頓等關於迴歸分析的先驅性的工作,以及時間序列分析方面的一些工作,也是這個時期數理統計學發展史中的重要事件。

20世紀初到第二次世界大戰結束

是數理統計學蓬勃發展達到成熟的時期。許多重要的基本觀點和方法,以及數理統計學的主要分支學科,都是在這個時期建立和發展起來的。這個時期的成就,包含了至今仍在廣泛使用的大多數統計方法,並佔據了教科書中的主要篇幅。在其發展中,以英國統計學家、生物學家R.A.費希爾為代表的英國學派起了主導的作用。

K.皮爾森在1900年提出了檢驗擬合優度的ⅹ2統計量,並證明其極限分佈(在原假設成立時)是ⅹ2分佈。這個結果是大樣本統計的先驅性工作,20世紀20年代費希爾又作了重要發展。

緊接著的一項重要進展,是皮爾森的學生,英國醫生W.S.戈塞特(又譯哥色特,筆名“學生”)1908年匯出了t分佈──正態總體下t統計量的精確分佈,開了小樣本理論的先河。在此以前,皮爾森成功地匯出了一些統計量的標準差,但對統計量的抽樣分佈問題沒有多少建樹。不過,戈塞特這項成就中也有皮爾森的功勞,因為它是在 t統計量的分佈屬於皮爾森分佈族的假定下匯出的。

比皮爾森略晚的費希爾(1890~1962),對現代數理統計的形成和發展作出了最大的貢獻。他是一些有重要理論和應用價值的統計分支和方法的開創者,其重要成就有:系統地發展了正態總體下種種統計量的抽樣分佈(20年代),這標誌著相關、迴歸分析和多元分析等分支的初步建立;建立了以最大似然估計為中心的點估計理論(1912~1925);與F.耶茨合作創立了實驗設計,並發展了與這種設計相適應的資料分析方法──方差分析法(20~30年代),這在實用上很重要。費希爾在統計學上另一項有影響的工作,是他引進的“信任推斷法”(見區間估計),這種方法不是基於傳統的概率思想,但對某些困難的統計問題,特別是著名的貝倫斯-費希爾問題,提供了簡單可行的解法。

在數理統計學的另一個主要分支──假設檢驗的發展中,費希爾也起過重要的作用,但假設檢驗理論的系統化和深入的研究,則應歸功於原籍羅馬尼亞的美國學者J.奈曼與K.皮爾森的兒子、英國學者E.S.皮爾森。他們在1928~1938年期間發表了一系列文章,建立了假設檢驗的一種嚴格的數學理論。其要旨是把假設檢驗問題作為一個數學最優化問題來處理。在一定意義上,他們的工作是爾後瓦爾德建立的統計決策理論的先驅。奈曼對數理統計作出的另一項很重要的貢獻,是他在1934~1937年間建立的置信區間估計理論。它基於概率的頻率解釋,並與奈曼-皮爾森的假設檢驗理論有密切聯絡。

多元統計分析是數理統計學中有重要應用價值的分支。1928年以前,費希爾已經在狹義的多元分析(多元正態總體的統計分析)方面作過一些工作。1928年J.維夏特匯出了著名的“維夏特分佈”。此後,狹義多元分析發展很快,作出重要貢獻的學者中,包括中國著名的數理統計學家許寶。他在1940年前後的幾年中,對這一領域以及線性模型的統計推斷理論,都作出了奠基性的工作。此外,G.U.尤爾在1925~1930年間關於時間序列分析的工作中,引進了自迴歸和序列相關等重要概念,奠定了這個分支現代發展的基礎。瓦爾德在第二次世界大戰期間發展了序貫概率比檢驗的方法,不僅在實用上有重要意義,也為戰後序貫分析的發展開了先聲。

綜合起來,以上這些成就構成了數理統計學一幅成熟而豐富多采的圖景,確立了這門學科在人類文化史中的地位。前面提到的克拉默在1946年發表的著作,對這些成就的主要部分作了扼要的總結,宣告了統計學發展史上這一重要時期的結束。

戰後時期

這一時期中,數理統計學在應用和理論兩方面繼續獲得很大的發展。在應用上,由於經濟和軍事技術的快速發展以及電子計算機的出現,使數理統計學的應用達到了前所未有的規模。有些需要大量計算的統計方法,在戰前限於條件而無法使用,這個障礙今日已不復存在。在戰前,即使在統計學較發達的國家裡,統計方法的使用多少還侷限在一些“點”上,如今在一些國家中則逐步達到了“面”的規模。最顯著的例子是在大批生產工業產品時使用統計質量管理的方法,它對日本在戰後的經濟恢復和發展起了不小的作用。

與戰前不同,戰後統計理論是沿著縱深的方向和使用更復雜的數學工具的方向發展的。在許多情況下,是把在戰前已有發端的理論引向深入與完善,顯著的表現是在大樣本理論方面。例如,最大似然估計和非引數統計的大樣本理論,在戰前只有初步的結果,現已達到完善的地步。

瓦爾德在1950年創立了統計決策理論,它從人與大自然進行博弈的觀點出發,企圖把形形色色的統計問題歸併在一個統一的模式之下,這種理論對戰後數理統計各分支的發展產生了程度不等的影響。它大大地改變了引數估計這個分支的面貌,而對假設檢驗的影響則要小一些。但是,對於用這種觀點去看待統計問題是否恰當,統計學界還存在分歧。

在戰後數理統計的發展中,一個引人注目的現象是貝葉斯學派的崛起。如前所述,這個學派的思想可溯源於貝葉斯1763年的工作。但在戰前,雖有一些學者,例如H.傑弗里斯,在其著作中鼓吹這一學派的思想,並對流行的、基於概率的頻率解釋的統計理論有所批評,但未能產生多大的影響。20世紀50年代以來,這個學派日益獲得了勢頭,原因在於:傳統的統計學發展趨於成熟並得到大量應用後,其固有的弱點開始顯露並逐漸為人們所認識。貝葉斯統計在理論上的進展以及它在應用上的方便和效益,使其觀點為更多的人所瞭解並對一些人產生吸引力。傳統學派與貝葉斯學派之間的爭論(見貝葉斯統計),其最後結局如何,要取決於它們在應用中的表現,這會影響到未來統計學的面貌。就目前情況而言,傳統學派雖然失去了一些陣地,但在統計學中大體上仍處於支配地位。

電子計算機的廣泛應用,也對戰後數理統計學的發展產生不小的影響。有了計算機,過去一些停留在理論上的方法得以付諸實用,而這又反過來促進人們提出和解決一些理論上的問題。如在涉及數十個自變數的大型迴歸問題中,有變數選擇的問題。沒有計算機,這種問題只能停留在紙面上,而現在這種問題所涉及的計算已不難實現,人們就提出了很多選擇標準並進行了理論上的探討,這豐富了迴歸分析這個分支的內容。通過計算機模擬,可以在實際應用中避開一些難於解決的、複雜的抽樣分佈推導問題。另外,計算機在短時間內處理大量資料的能力,使人們有可能從各個角度對資料進行透徹的分析,從其中提出更多的資訊,而不必總是依賴一定的數學模型。有的學者把這方面的工作稱為“資料分析”,並認為是數理統計發展中的一個生長點。從另一面看,這在一定程度上降低了模型(即理論)的作用。有的學者已表現出忽視模型的傾向,它可能加劇在數理統計學的發展中理論與應用分家的趨勢。總的說,電子計算機的廣泛應用為數理統計學提供了巨大的機會,也提出了一些很有意義的研究課題。

參考書目

M. Kendall and A. Stauart,The Advanced Theory of Statistics, 4th ed., Vol.1, 4th ed., Vol.2,3rd ed., Vol.3, Charles Griffin, London, 1977, 1979, 1976.

陳希孺著,《數理統計引論》,科學出版社,北京,1981。