非引數統計分析在多樣本研究中的應用論文
非引數統計分析在多樣本研究中的應用論文
一、研究背景
當今經濟研究領域,運用傳統的引數統計進行實證分析非常廣泛。然而,在現實生活中,傳統引數統計方法對總體分佈的假定常常難以滿足,比如資料並非來自所假定的分佈,或者資料根本不是來自一個總體,又或者資料因為種種原因被嚴重汙染等。這樣,假定總體分佈的情況下進行推斷的做法就可能產生錯誤的結論,影響決策。為此,人們希望在不假定總體分佈的情況下,儘量從資料本身來獲得所需要的資訊,這就是非引數統計的宗旨。
二、實證分析
以小白鼠為物件研究正常肝核糖核酸(RNA)對癌細胞的生物作用,試驗分別為對照組(生理鹽水),水層RNA組和酚層RNA組,分別用此3種不同處理方法誘導肝癌細胞的果糖二磷酸酯(FDP酶)活力,資料如表1所示.
3種不同處理的誘導結果
處理方法誘導結果
對照組2.792.693.113.471.772.442.832.52
水層RNA組3.833.154.703.972.032.873.655.09
酚層RNA組5.413.474.924.072.183.133.774.26
從上表可以看出,對照組的誘導的平均FDP酶活力最小,水層RNA組次之,酚層RNA組的最大。因此可以初步認為,3種誘導作用的效果有顯著差異。
(二)、正態性檢驗
對樣本做假設檢驗則首先必須知道總體服從的分佈,本文針對3個總體分別進行正態性檢驗,原假設為H0:樣本所來自的總體分佈服從正態分佈,備擇假設為H1:樣本所來自的總體分佈不服從正態分佈。具體檢驗結果如下:
顯然,透過Kolmogorov-Smirnov檢驗可知,在給定的顯著性水平0.05的條件之下,在3個總體所得P值均小於α,故拒絕原假設,可以認為出這3個總體均不服從正態分佈。且從現階段所知的分佈來看,無法斷定其到底屬於何種分佈,故採用非引數方法對該問題進行統計分析。
(三)、尺度引數檢驗
本文中尺度引數的檢驗採取Mood檢驗。原假設X和Y同分布,即H0:b=1,備擇假設H1:b≠1。透過R軟體檢驗結果如下:
Z檢驗統計量的值P值
對照組與水層RNA組-1.39560.1628
對照組與酚層RNA組-1.43490.1513
水層RNA組與酚層RNA組-0.410.6818
表4
結果顯示,對於分佈函式形狀的檢驗,在給定的顯著性水平0.05的條件之下,對照組與水層RNA組、對照組與酚層RNA組和水層RNA組與酚層RNA組的尺度引數檢驗均全部透過,接受原假設。即3個總體的分佈函式(以及密度函式)的形狀完全相同,若有不同僅有可能的是位置引數不同。
(四)、位置引數檢驗
1、Kruskal-Wallis檢驗
由於本文樣本為3個獨立同分布的總體,因此對於位置引數的檢驗採取Kruskal-Wallis檢驗。根據題意有,原假設H0:試驗中3種誘導作用的效果無顯著差異,備擇假設H1:試驗中3種誘導作用的'效果有顯著差異。結果顯示p=0.01895,故在給定的顯著性水平α=0.05條件之下,拒絕原假設。
2、Wilcoxon秩和檢驗
為了進一步檢驗3中誘導作用中產生顯著性差異的是哪一種,本文對其進行兩兩的Wilcoxon秩和檢驗。其中,原假設H0:試驗中某兩種誘導作用的效果無顯著差異,備擇假設H1:試驗中某兩種誘導作用的效果有顯著差異。透過R軟體程式設計檢驗,結果如表5所示。
W秩和檢驗統計量的值P值
對照組與水層RNA組100.02067
對照組與酚層RNA組8.50.01564
水層RNA組與酚層RNA組270.6454
結果顯示,在給定的顯著性水平0.05的條件之下,對照組與水層RNA組、對照組與酚層RNA組的位置引數檢驗沒有透過,因此拒絕原假設,認為對照組與水層RNA組、對照組與酚層RNA組的誘導作用效果有顯著性差異。但是水層RNA組與酚層RNA組的Wilcoxon檢驗結果顯示,在給定的顯著性水平0.05的條件之下,不能拒絕原假設,即沒有證據表明水層RNA組與酚層RNA組的誘導作用效果之間存在顯著性差異。
三、結論
透過本文可以看出,在生物醫學領域,非引數統計具有非常廣泛的應用前景。非引數統計方法不僅可以像引數統計方法一樣用於處理定距、定比資料,更適合處理定類、定序資料。引數方法對資料要求較多,而非引數統計方法則不同,研究的出發點是假定研究總體的理論分佈是未知的,是一個待檢驗的假設,實際應用中這種問題是非常普遍的。非引數統計方法減少了實際應用中對假設條件的依賴,進而使得對多樣本問題的研究更加客觀,不受樣本分佈形式限制的,應用範圍、發生模型錯誤的可能性較小,有較大的穩定性,同時方法簡便易行,直觀性強,易於接受和理解。此外,在本文的實證研究中,所有檢驗均為應用R軟體程式設計運算,因此R軟體具有實現比較非引數統計分析的強大功能。