什麼是方差

  方差是衡量源資料和期望值相差的度量值。以下是有小編為大家整理的,希望能幫到你。

  方差的歷史

  “方差”***variance***這一詞語率先由羅納德·費雪***Ronald Fisher***在其論文《The Correlation Between Relatives on the Supposition of Mendelian Inheritance》中提出。

  方差的定義

  方差在統計描述和概率分佈中各有不同的定義,並有不同的公式。

  在統計描述中,方差用來計算每一個變數***觀察值***與總體均數之間的差異。為避免出現離均差總和為零,離均差平方和受樣本含量的影響,統計學採用平均離均差平方和來描述變數的變異程度。總體方差計算公式:

  σ^2=∑***X-μ*** ^2/ N[2]

  σ^2為總體方差,X為變數,μ為總體均值,N為總體例數。

  實際工作中,總體均數難以得到時,應用樣本統計量代替總體引數,經校正後,樣本方差計算公式:

  S^2= ∑***X- *** ^2 / ***n-1***[2]

  S^2為樣本方差,X為變數, 為樣本均值,n為樣本例數。

  在概率分佈中,設X是一個離散型隨機變數,若E{[X-E***X***]^2}存在,則稱E{[X-E***X***]^2}為X的方差,記為D***X***,Var***X***或DX,其中E***X***是X的期望值,X是變數值[1] ,公式中的E是期望值expected value的縮寫,意為“變數值與其期望值之差的平方和”的期望值。[2] 離散型隨機變數方差計算公式:

  D***X***=E{[X-E***X***]^2}=E***X^2*** - [ E***X***]^2

  當D***X***=E{[X-E***X***]^2}稱為變數X的方差,而 稱為標準差***或均方差***。它與X有相同的量綱。標準差是用來衡量一組資料的離散程度的統計量[3] 。

  對於連續型隨機變數X,若其定義域為***a,b***,概率密度函式為f***x***,連續型隨機變數X方差計算公式:

  D***X***= ***x-μ***^2 f***x*** dx[2]

  方差刻畫了隨機變數的取值對於其數學期望的離散程度。***標準差、方差越大,離散程度越大***

  若X的取值比較集中,則方差D***X***較小,若X的取值比較分散,則方差D***X***較大。

  因此,D***X***是刻畫X取值分散程度的一個量,它是衡量取值分散程度的一個尺度。