淺析我國區域物流節點城市發展的統計評價
一、 引言
本文綜合以前學者的研究成果,突出不同區域的物流產業發展水平,提出更為簡便可行的指標體系,同時運用因子分析和聚類分析,對這些區域節點城市的物流發展水平進行比較研究,最後針對分析結果提出一些改進建議。
二、 區域物流發展指標體系的構建
1. 評價指標體系的建立。本文選取的指標力圖能夠反映區域物流發展的整體水平,通過對各種物流評價指標體系的比較,按照指標設定的原則,經過反覆篩選,最終從人口規模、經濟實力、工業規模、第三產業規模、物流主導產業規模五個方面確立了現代區域物流評價指標體系,並將這些方面分解為9項二級指標。
2. 資料來源與分析步驟。本研究的資料來源於《中國城市統計年鑑2009》以及各城市統計年鑑,由於在17個區域物流節點城市中,資料符合要求的有11個城市,包括哈爾濱、長春、包頭、呼和浩特、太原、合肥、福州、長沙、昆明、海口、銀川,本文就以這些城市為研究物件。在資料準備階段完成之後,利用SPSS17.0for windows統計軟體從以下幾個方面展開分析。首先檢驗構建的區域物流評估指標系統,然後選擇因子分析法從9個具體指標中提取出n個公共因子,根據得到的因子得分,建立模型計算綜合得分,從而對各節點城市的物流綜合水平進行排序,為確保研究結果的科學性和可靠性,在因子分析的基礎上進一步進行聚類分析, 並利用聚類分析結果對全國區域物流節點城市的發展水平進行總體評價,並給出相應的政策建議。
三、 因子分析
1. 因子分析適用性檢驗。在指標綜合評價中利用因子分析的目的是從眾多的原有指標變數中提取出少量的具有代表性的因子,提取出的因子必須能夠代表不同的評價維度。其應用的前提是要求原指標之間具有較強的相關關係,否則就不能運用因子分析法,我們將原始資料進行標準化處理之後,採用KMO和Bartlett檢驗方法來檢測因子分析法的適用性。
Bartlett球度檢驗表明:Bartlett值=131.602。P接近於0,若顯著性水平為0.01,則拒絕相關矩陣為單位矩陣的原假設,相關矩陣與單位矩陣存在顯著差異,可以進行因子分析。取樣足夠的Kaiser-Meyer-Olkin檢驗是用於比較觀測相關係數值與偏相關數值的一個指標,其值越逼近1,表明對這些變數進行因子分析的效果越好,KMO值大於0.5,因而可以對指標變數進行因子分析。
2. 因子提取。本文采用主成分分析法對指標資料進行因子分析,按照相關係數矩陣特徵值大於1的標準,從原9個統計指標中提取二個主因子來表達其資訊含量。。第二列至第四列描述了因子分析的初始解對原有變數總體的刻畫情況;第二列合計是各成分的特徵值。第一成分特徵值合計=4.883,第二成分特徵值為合計=1.797,這裡只有前兩個因子的特徵值大於1。第三列是各因子變數的方差貢獻率,即該因子刻畫的方差佔原有變數總方差的比例;第四列是因子變數的累計方差貢獻率,表示前m個因子刻畫的總方差佔原有變數總方差的比例。如果提取2個公共因子,那麼它們可描述原變數總方差的90.536%,大於80%,可以認為,這2個公因子基本反映了原變數的絕大部分資訊。
3. 因子旋轉。因子分析的目的不僅是要找出主因子,更重要的是知道每個主因子的具體經濟意義。為便於對主因子進行解釋,一般須對因子載荷矩陣進行旋轉。本研究採用方差極大值法進行正交旋轉之後,得到9個指標的兩個因子負荷。
第一主成分對社會消費品零售總額、國內生產總值、第三產業增加值、年末總人口、工業總產值有絕對值較大的相關係數,第二個因子相關係數絕對數較大的正好是九個原始變數中的另外四個,即貨運總量、公路貨運量、鐵路貨物運量、交通運輸、倉儲及郵政業增加值。根據這些變數的原始含義可以對兩個因子進行命名。第一個因子主要概括了一般的社會人口規模、經濟實力、工業和第三產業的規模,可以命名為社會經濟因子。第二個因子主要概括了物流主導產業的情況,可以稱為物流產業因子。
根據實驗的最終因子載荷矩陣,由此可以寫出如下因子分析的模型:
X1=0.979F1+0.024F2;X2=0.974F1+0.183F2;……;X9=0.324F1+0.879F2
Xi***i=1,2,…,9***代表了9個評價指標,公共因子F1表示社會經濟因子,F2表示物流產業因子。由於因子載荷矩陣是正交旋轉,這兩個因子之間不存在相關,避免了因子綜合評價的多重共線性,故可以代表不同的評價維度。
4. 因子得分。因子分析把原來的9個指標濃縮成相互獨立的2個公因子,一方面達到了降維的目的;另一方面也排除了指標之間的相關性,同時,SPSS根據因子得分函式自動計算各樣本的因子得分,並選取各因子的方差貢獻率為因子得分權重,計算各城市的綜合因子得分,其計算形式為:
F=0.511 09F1+0.394 26F2
每個城市的綜合因子得分反映了各節點城市區域物流綜合實力的強弱,將11個城市的綜合因子得分從高到低排序,如表5所示。
四、 聚類分析
聚類分析是研究“物以類聚”的一種多元統計分析方法。最常用最基本的一種聚類分析方法是層次聚類分析,此外還有動態聚類法、模糊聚類法、有序聚類法等,本研究採用層次聚類法。
層次聚類法的基本思想是,一開始將要歸類的n個變數看成一類,然後按事先規定好的方法計算各類之間的歸類指數***相似係數或距離***,根據指數大小衡量兩類之間的密切程度,將關係最密切的兩類併成一類,其餘不變,即得n-1類;重新計算各類之間的歸類指數,再將關係最密切的兩類併成一類,其餘不變,即得n-2類;如此進行下去,直到最後n個變數都歸成一類。
我們按照層次聚類法的步驟,首先經過運算將原始資料標準化,使具有不同量綱、不同數量級的資料能放在一起比較;然後用11個節點城市的標準化資料求出歐氏距離;最後應用Wald離差平方和法,按照使總的類內離差平方和增加最小的原則,使得類的分法逐漸減小。具體聚類過程見表6。
SPSS完成以上運算步驟後,可將11個城市分成2類~4類,如果按照四類來劃分,其中包頭距離其他城市較遠,單獨聚合為一類;屬於物流發展高水平的地區;長沙、哈爾濱、長春、福州聚合為一類,屬於物流發展中等偏上地區;合肥、呼和浩特、太原、昆明距離較近,聚合為一類,屬於物流發展中等偏下地區;海口、銀川聚合為一類,相對於全國其他九個節點城市來說,是屬於物流發展低水平地區。