迴歸分析有哪些基本的步驟
迴歸分析是確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法。迴歸分析也有一定的步驟。以下是由小編整理迴歸分析的內容,希望大家喜歡!
迴歸分析的簡介
①從一組資料出發,確定某些變數之間的定量關係式,即建立數學模型並估計其中的未知引數。估計引數的常用方法是最小二乘法。
②對這些關係式的可信程度進行檢驗。
③在許多自變數共同影響著一個因變數的關係中,判斷哪個***或哪些***自變數的影響是顯著的,哪些自變數的影響是不顯著的,將影響顯著的自變數入模型中,而剔除影響不顯著的變數,通常用逐步迴歸、向前迴歸和向後迴歸等方法。
④利用所求的關係式對某一生產過程進行預測或控制。迴歸分析的應用是非常廣泛的,統計軟體包使各種迴歸方法計算十分方便。
在迴歸分析中,把變數分為兩類。一類是因變數,它們通常是實際問題中所關心的一類指標,通常用Y表示;而影響因變數取值的的另一類變數稱為自變數,用X來表示。
迴歸分析研究的主要問題是:
***1***確定Y與X間的定量關係表示式,這種表示式稱為迴歸方程;
***2***對求得的迴歸方程的可信度進行檢驗;
***3***判斷自變數X對因變數Y有無影響;
***4***利用所求得的迴歸方程進行預測和控制。
迴歸分析的應用
相關分析研究的是現象之間是否相關、相關的方向和密切程度,一般不區別自變數或因變數。而回歸分析則要分析現象之間相關的具體形式,確定其因果關係,並用數學模型來表現其具體關係。比如說,從相關分析中我們可以得知“質量”和“使用者滿意度”變數密切相關,但是這兩個變數之間到底是哪個變數受哪個變數的影響,影響程度如何,則需要通過迴歸分析方法來確定。
一般來說,迴歸分析是通過規定因變數和自變數來確定變數之間的因果關係,建立迴歸模型,並根據實測資料來求解模型的各個引數,然後評價迴歸模型是否能夠很好的擬合實測資料;如果能夠很好的擬合,則可以根據自變數作進一步預測。
例如,如果要研究質量和使用者滿意度之間的因果關係,從實踐意義上講,產品質量會影響使用者的滿意情況,因此設使用者滿意度為因變數,記為Y;質量為自變數,記為X。根據圖8-3的散點圖,可以建立下面的線性關係: Y=A+BX+§
式中:A和B為待定引數,A為迴歸直線的截距;B為迴歸直線的斜率,表示X變化一個單位時,Y的平均變化情況;§為依賴於使用者滿意度的隨機誤差項。
對於經驗迴歸方程: y=0.857+0.836x
迴歸直線在y軸上的截距為0.857、斜率0.836,即質量每提高一分,使用者滿意度平均上升0.836分;或者說質量每提高1分對使用者滿意度的貢獻是0.836分。
迴歸分析的步驟
確定變數
明確預測的具體目標,也就確定了因變數。如預測具體目標是下一年度的銷售量,那麼銷售量Y就是因變數。通過市場調查和查閱資料,尋找與預測目標的相關影響因素,即自變數,並從中選出主要的影響因素。
建立預測模型
依據自變數和因變數的歷史統計資料進行計算,在此基礎上建立迴歸分析方程,即迴歸分析預測模型。
進行相關分析
迴歸分析是對具有因果關係的影響因素***自變數***和預測物件***因變數***所進行的數理統計分析處理。只有當自變數與因變數確實存在某種關係時,建立的迴歸方程才有意義。因此,作為自變數的因素與作為因變數的預測物件是否有關,相關程度如何,以及判斷這種相關程度的把握性多大,就成為進行迴歸分析必須要解決的問題。進行相關分析,一般要求出相關關係,以相關係數的大小來判斷自變數和因變數的相關的程度。
計算預測誤差
迴歸預測模型是否可用於實際預測,取決於對迴歸預測模型的檢驗和對預測誤差的計算。迴歸方程只有通過各種檢驗,且預測誤差較小,才能將回歸方程作為預測模型進行預測。
確定預測值
利用迴歸預測模型計算預測值,並對預測值進行綜合分析,確定最後的預測值。
迴歸分析的相關問題
應用迴歸預測法時應首先確定變數之間是否存在相關關係。如果變數之間不存在相關關係,對這些變數應用迴歸預測法就會得出錯誤的結果。
正確應用迴歸分析預測時應注意: ①用定性分析判斷現象之間的依存關係;
②避免迴歸預測的任意外推;
③應用合適的資料資料;
迴歸分析的步驟