統計碩士畢業論文

  統計學是一門實質性的社會科學,既研究社會生活的客觀規律,也研究統計方法。下文是小編為大家整理的關於的範文,歡迎大家閱讀參考!

  篇1

  淺析大資料時代統計學的發展

  摘要:大資料已經承成為助力網際網路+發展的重要手段,成為創客實現夢想星天地的必要途徑,其已經成為我們生活中不可缺少的一部分,大資料正在以一種前所未有的態勢推動著各行各業的發展,其蓬勃發展態勢也標誌大資料時代的襲來。

  關鍵詞:大資料;統計學;發展

  大資料時代以迅雷不及掩耳之勢席捲世界,在全球範圍內掀起了前所未有的資料革命浪潮。相對於政府單位的統計資料來說,大資料主要利用的是多層次、多樣化的資料採集方式,整合了多種資料的開發優勢,並且利用現代科學技術手段和高速處理以及資訊架構資料等資源,兼具極高的使用價值和判斷決策能力。一方面,統計調查資料的多樣化發展趨勢和電子商務產業的不斷髮展,為統計資料的使用方式和生產方式製造了不小的麻煩,不斷地挑戰者政府部門資料管理系統和統計資料的概念。另一方面,資訊科技、網路發展以及空間資訊科技的不斷進步,為統計生產力的升級發展提供了廣闊的視角和空間。資料量急劇增長的電子化、資訊化和產業化資料,都成為了統計資料發展的重要來源。種類不斷增多的“大資料”資源,正在成為政府統計部門利用研究的重要領域。

  一、大資料與統計學的區別

  統計知識在大資料的利用研究中有多樣化的應用形式,主要是對“大資料”進行肢解,對爆炸增長的資料資訊進行搜尋、分類以及整合主要依賴於統計學。因此,大資料的相關研究在一定程度上運用了統計學的知識。但是,大資料的使用尚未被統計學這門學科充分利用,這主要是因為大資料的運用方式,使用模式和統計學之間存在著重要差異。統計學主要利用的是樣本統計資源,樣本主要在根據既定的概率標準從總體中抽樣調查,但是隨機抽樣調查是帶有成本屬性的,例如消耗時間、資本投入的成本等。在樣本數量逐漸增加的情況下,樣本估計的誤差範圍是伴隨著總體樣本數量的增大而逐漸增加的,這是樣本統計學不能忽視的缺點。大資料時代最具代表性的就是海量的資訊資料化以及即時電子商務資訊,大資料在整體上呈現出“總體樣本資料化”的趨勢,這樣的特徵恰好可以補充樣本統計的弊端。大資料環境下的整體樣本統計即使可以囊括全部的樣本容量,但是因為很多情況下資料具有非結構性和半資料化的特徵,而且大量的資料資源呈現的是重視尾部分佈的狀態,方差、標準差等標準化的方法變得毫無意義,整體依靠性和不穩定性經常會超越經典時間內的時間序列的整體假設性,所以概率論的應用範圍呈現狹窄化的發展趨勢。因此,統計學在利用大資料進行樣本統計的過程中,可以對整體上的資料資源進行融合和選擇,這和樣本統計中的資料化處理技術存在異曲同工之妙。

  二、大資料時代統計學教育的發展

  1、全面培養人才素質

  統計學專業的學生需要具備良好與人交往能力。統計學的學生很多都是理科出身的學生,不善於交際。但是在日常的工作中,有資料經驗的科學家應該經常和每個部門的工作人員交流,協同工作。怎麼樣才能讓頗具專業性的資料分析結果讓普通的老百姓也可以讀懂,讓每個部門的工作人員都能無障礙地理解,這是不容易做到的。要訓練自己的交往能力和溝通技能,主動地參加演講活動是不錯的渠道,演講活動鍛鍊了演講者的自信,在整個演講的過程中,能否清晰地表達自己的思想以及給人以信服力是至關重要的。需要培養資料常識,廣其見聞。資料科學家經常面對各種各樣的海量資料,並需要從這些資料中挖掘出有價值的資訊,這就需要資料科學傢俱有強烈的資料敏感性。對資料的敏感程度的訓練不是一蹴而就的,要經過長時間的積累和資料分析工作的磨練,同時也可以根據閱讀資料分析材料積累閱歷,提升對資料資源的敏感程度。

  2、培養應用型人才

  大資料時代培養的資料科學家需要兩方面的基本素質,第一是概念性,也就前面所說的資料科學家需要掌握的基本素養和專業知識;第二是實踐性,也就是本文中我們提及的應用型人才,也就是實際操作中處理資料的能力。在高校開展大資料分析研究生學科,最大的問題是沒有可用的資料,這就需要高效與大資料企業合作,進行研究生的聯合培養,注重學生的實際操作能力,這裡面涉及到我們的應用統計學專業碩士的雙導師培養制度,一名校內導師一名校外導師,校內導師注重學生的概念性,校外導師注重學生的實踐性,學生通過在校外導師單位的實習,從而熟悉並且掌握實際工作中所需要的技能。

  3、促進統計與數學、計算機學科合作

  “大資料”時代需要的海量資料分析資源僅僅憑藉統計學科單一學科的發展是不能滿足發展需求的,大資料的資料結構性特徵已經拋棄了傳統意義上的資料分析模式的非智慧化框架,而且資料分析需要利用新型的資料運算方式以及計算機技能分析,這也是進行資料分析工作的攔路虎。所以,資料科學家的成長僅僅依靠單一的統計學科知識的學習是遠遠不夠的,其需要的是數學、計算機和統計學三門學科融合發展,緊密結合。三門學科之間交叉發展,融會貫通,這樣既可以發揮學科的優勢資源,同時也能彌補其他學科的弊端。

  三、結語

  資料資訊的爆炸式增長使我們在使用統計資料處理資訊時需要更多的資料資源,更有甚者,在很多情況下可以利用全面化的資料,資料資源不再是制約統計分析的唯一因素,大資料前提下的統計學效用和粘合度預測的準確程度不斷提升,而且可以發現諸多在樣本統計基礎上未能顯現的細節。統計學關鍵優勢就是“見微知著”,也是統計學在資料環境下的約束性妥協。在海量資料洶湧襲來的年代,充分發揮統計學的優勢,和大資料資源整合發展,實現“以小見大”和“由繁入簡”的有效結合。

  參考文獻:

  [1]田茂再.大資料時代統計學重構研究中的幾個熱點問題[J].統計研究,2015,05:3-12.

  [2]劉春傑.大資料時代統計學教育面對挑戰的應對[J].凱里學院學報,2015,03:29-32.

  [3]大資料時代統計學的重構與創新――首屆“大資料與應用統計國際會議”述評[J].統計研究,2015,02:3-9.

  篇2

  論統計學中的統計思想

  【摘 要】所謂統計思想,就是在統計實際工作、統計學理論的應用研究中,必須遵循的基本理念和指導思想。統計思想主要包括均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想等思想。文章通過對統計思想的闡釋,提出關於統計思想認識的三點思考。

  【關鍵詞】統計學;統計思想;認識

  1關於統計學

  統計學是一門實質性的社會科學,既研究社會生活的客觀規律,也研究統計方法。統計學是繼承和發展基礎統計的理論成果,堅持統計學的社會科學性質,使統計理論研究更接近統計工作實際,在國家和社會得到廣泛發展。

  2 統計學中的幾種統計思想

  2.1 統計思想的形成

  統計思想不是天然形成的,需要經歷統計觀念、統計意識、統計理念等階段。統計思想是根據人類社會需求的變化而開展各種統計實踐、統計理論研究與概括,才能逐步形成系統的統計思想。

  2.2 比較常用的幾種統計思想

  所謂統計思想,就是統計實際工作、統計學理論及應用研究中必須遵循的基本理念和指導思想。統計思想主要包括:均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想。現分述如下:

  2.2.1 均值思想

  均值是對所要研究物件的簡明而重要的代表。均值概念幾乎涉及所有統計學理論,是統計學的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發展趨勢,避免個別偶然現象的干擾,故也體現了總體觀。

  2.2.2 變異思想

  統計研究同類現象的總體特徵,它的前提則是總體各單位的特徵存在著差異。統計方法就是要認識事物數量方面的差異。統計學反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特徵的抽象和巨集觀度量。

  2.2.3 估計思想

  估計以樣本推測總體,是對同類事物的由此及彼式的認識方法。使用估計方法有一個預設:樣本與總體具有相同的性質。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴謹的必要步驟。

  2.2.4 相關思想

  事物是普遍聯絡的,在變化中,經常出現一些事物相隨共變或相隨共現的情況,總體又是由許多個別事務所組成,這些個別事物是相互關聯的,而我們所研究的事物總體又是在同質性的基礎上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關聯的。

  2.2.5 擬合思想

  擬合是對不同型別事物之間關係之表象的抽象。任何一個單一的關係必須依賴其他關係而存在,所有實際事物的關係都表現得非常複雜,這種方法就是對規律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關係的變化過程在數量上所體現的模式和基於此而預示的可能性”。

  2.2.6 檢驗思想

  統計方法總是歸納性的,其結論永遠帶有一定的或然性,基於區域性特徵和規律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數量特徵的假設是否可信。

  2.3 統計思想的特點

  作為一門應用統計學,它從數理統計學派汲取新的營養,並且越來越廣泛的應用數學方法,聯絡也越來越密切,但在統計思想的體現上與通用學派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現出:1統計思想強調方法性與應用性的統一;2統計思想強調科學性與藝術性的統一;3統計思想強調客觀性與主觀性的統一;4統計思想強調定性分析與定量分析的統一。

  3 對統計思想的一些思考

  3.1 要更正當前存在的一些不正確的思想認識

  英國著名生物學家、統計學家高爾頓曾經說過:“統計學具有處理複雜問題的非凡能力,當科學的探索者在前進的過程中荊棘載途時,唯有統計學可以幫助他們開啟一條通道”。但事實並非這麼簡單,因為我們所面臨的現實問題可能要比想象的複雜得多。此外,有些人認為方法越複雜越科學,在實際的分析研究中,喜歡簡單問題複雜化,似乎這樣才能顯示其科學含量。其實,真正的科學是使複雜的問題簡單化而不是追求複雜化。與此相關聯的是,有些人認為只有推斷統計才是科學,描述統計不是科學,並延伸擴大到只有數理統計是科學、社會經濟統計不是科學這樣的認識。這種認識是極其錯誤的,至少是對社會經濟統計的無知。比利時數學家凱特勒不僅研究概率論,並且注重於把統計學應用於人類事物,試圖把統計學建立成改良社會的一種工具。經濟學和人口統計學中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產。

  3.2要不斷拓展統計思維方式

  統計學是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基於觀測到的資料資訊尤其是不完全甚至劣質的資訊去產生新的知識或去驗證一個假設,即以所掌握的資料資訊為依據,歸納得出具有一般特徵的結論。歸納推理是要在資料資訊的基礎上透過偶然性去發現必然性。演繹推理是對統計認識能力的深化,尤其是在根據必然性去研究和認識偶然性方面,具有很大的作用。

  3.3深化對資料分析的認識

  任何統計研究都離不開資料分析。因為這是得到統計研究結論的必要環節。雖然統計分析的形式隨時代的推移而變化著,但是“從資料中提取一切資訊”或者“歸納和揭示”作為統計分析的目的卻一直沒有改變。對統計資料分析的原因有以下三個方面:一是基於同樣的資料會得出不同、甚至相反的分析結論;二是我們所面對的分析資料有時是缺損的或存在不真實性;三是我們所面對的分析資料有時則又是海量的,讓人無從下手。雖然統計資料分析已經經歷了描述性資料分析DDA、推斷性資料分析IDA和探索性資料分析EDA等階段,分析的方法技術已經有了質的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對資料分析的認識,圍繞“準確解答特定問題並且從資料中獲取一切有效資訊”這一目的,不斷拓展研究思路,繼續開展資料分析方法技術的研究。

  參考文獻

  [1] 陳福貴.統計思想雛議[J]北京統計, 2004,05 .

  [2] 龐有貴.統計工作及統計思想[J]科技情報開發與經濟, 2004,03 .

  [3] 範文正.幾種基本統計思想的現實意義[J]統計與決策, 2007,08 .

  [4] 邢莉.《九章算術》中的統計學思想探究[J]. 統計研究, 2008,03