統計學專業參考論文
統計學本身是大資料時代的一門重要科學,隨著大資料逐漸走進人們的視野和在越來越多的領域當中的應用,統計學也必然會迎來更多的廣泛關注。下文是小編為大家蒐集整理的關於的內容,歡迎大家閱讀參考!
篇1
淺析大資料環境下統計學改革
摘要:進年來,隨著科學技術的不斷創新,資訊科技的不斷髮展,人類文明已經迎來了大資料時代,隨之而來的必將是經濟的不斷攀升,企業執行模式的不斷轉型,人們生活方式的不斷改變,社會整體經濟以及人們生活方式也將朝著多元化、便捷化、科技化、舒適化方向發展,所以,這將是一個極具潛力的新型產業,而與之對應的統計學也將順勢而行,迎來新的改革,基於在大資料環境下統計學理論及方法改革探究,筆者進行簡單闡述與研究。
關鍵詞:大資料:統計學理論:創新應用
顧名思義,統計學幾乎是對所有領域的資料進行統計與研究、分析篩選,因而統計學在如今的大資料時代幾乎涉及到各行各業,其表現方式為,統計出來的資料進行科學的研究與分析,可以有效的幫著企業獲取有效資訊,探索其中數量規律行,進而企業可以更高效、更精準的進行工作。而如今隨著現代資訊科技以及數字科學技術的不斷髮展,統計學也得到了更多的應用,也被人們更加重視,應用最多的為企業管理系統中,統計學中的理論及其分析方式幫助企業進行對資料數量規律性的探以及定性分析,為企業尋找自身的管理經營的基礎進行有效地夯實,奠定企業向更加穩定方向進行發展。而如今計算機軟體的不斷髮展與更新,大資料時代的到來,統計學的應用也會得到更為廣泛的發展,其中有政府和企業利用計算機對相關資料的採集、整理、統計進行綜合的分析。統計學相關的軟體開發商也將軟體設計的更為簡易化、便捷化,使得非統計學專業的人員也可以使用。當今社會經濟高速發展,統計學的應用及其發展趨勢將會迎合時代的到來進行改革改變,促進社會經濟的快速提高。
一、大資料時代的內涵及其意義
一大資料時代的內涵
大資料是指在一定時間內對資訊的捕捉、管理、處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力、流程優化能力的海量、高增長率和多樣化的資訊資產。針對這些資訊資產,利用統計學原理對其進行資料分析、提煉、分解。也可以從另一個方面理解大資料,它涉及各行各業,是多個領域資料的集中區域,涉及到的有自然科學、人文科學、社會經濟學等等相關的混合資料,它們之間相互參雜,互相融合,形成非常龐大的資料系統。目前傳統統計學中的統計方法是分析單個計算機系統的資料儲備,無法分析多臺計算機的資料,在資料統計中產生了侷限性、單一性、不穩定性和客觀性等,但是目前大資料時代的到來,改變了如今這一現象,改變了大資料環境下資料流、磁碟儲存、分佈儲存、多線條等環境。大資料環境主要起到的作用為,將龐大而複雜的資料進行轉換,轉換成為簡單易懂、顯而易見的內容,進而使工作人員對資料進行源頭和機制的追述,從而研究出適合自身並有效的應對策略。因將資料轉換成需要的知識需要相對緩慢的時間,所以工作人員將當前龐大複雜的資料分別存放在不同的儲備空間裡,有些工作人員將目前無法分析的或是不需要的資料進行整體精準的記錄儲存,記錄成一整套的資料發展史,已供日後應用,以備不時之需,為今後科研做出充分準備。
二大資料時代給社會帶來的改革
大資料在一夜之間成為各大網際網路上的討論話題,成為一個包含性非常強的概念,大資料時代也成為人們關注的話題,它的到來已然成為不爭的事實,從本質上來看,它是當今中新型的產業,通過對海量的資料進行統計分析追蹤發現龐大的市場,通過對人們行為喜好進行科學分析,獲取營銷手段。大資料使得廣告投放精準化、醫療衛生體系精密化、社會安全管理有序化等多方面優勢,同時大資料時代的到來隨著帶來了新的新業市場,大資料將為全球帶來440萬個IT崗位和上千萬個非IT崗位,提供了更多的就業崗位。大資料時代到來的變革之大,影響著人們傳統的工作方式,各行各業的人利用研究問題來驅動收據資料,然後再利用收集來的資料進行分析,從而解決問題,從這一行為來講,人們會慢慢適應通過大資料進行統計學的研究分析來解決問題,利用通過統計學理論開發的軟體搜尋、分析一些研究性成果。目前統計學家通過資料的收集、資料的處理以及個人分析能力進行科學探索,如今大資料的到來將會威脅的他們的領域,大資料將我們難以理解的內容翻譯成我們一看便知的統計成果,優化了人們工作的便捷性、舒適性等。
二、大資料時代統計學的發展研究
大資料發展如今,滲透社會的各個角落,分析大資料需要多個領域的結合,它並非單一的科學領域,自成一體,現如今的統計學家不僅需要研究探討計算機對資料的實時決策,更是要將其與統計學理論及其方法相互結合,同時,計算機專家也要不斷學習統計學的一些知識,統計學與大資料相互結合才能順應時代的發展。獲取大資料之後,研究探討大資料時,針對資料分析的高難問題,利用統計學原理對其進行資料分析、提煉、分解時,需創新出新的更便捷更高效的統計處理方法,在壓縮提煉過程中,解決資料混雜的問題,在分解資料中,解決精準問題,使得大資料與統計理論更好的溝通合作,構造全域性統計結果。統計學主要是對海量的資料進行整理分類,結合計算機進行科學分析,探究出資料的數量規律性,從而得出結論,由於目前統計學中的統計學理論和統計方法與時代稍有差距,如今更是大資料時代,而大資料隨機或非隨機的誤差比較大,所以傳統的統計學理論及方法無法滿足如今變革,也無法更好的獲取大資料背景下所帶來的各種機遇。現在的統計學家應該更加努力專研統計學理論以及對資料壓縮、分解的方法,捨棄無法適應當前時代的陳舊理論及方法,必須去學習如何迎合新的事物的到來進行改革改變,只有這樣才能順勢而行。
參考文獻:
[1]毛江偉.《統計學》應用及其發展[J].長江大學學報社會科學版,201312
[2]彭先萌.大資料時代統計學發展研究[J].哈爾濱職業技術學院學報,20156
[3]陳立強董寧娟.淺談統計學的廣泛應用[J].中國市場,201528
篇2
談大資料時代下統計學面臨的挑戰及建議
摘要:傳統的統計學是因資料而生的,也是以研究資料為根本目的,傳統統計學有其獨特的資料收集、整理與分析的方法體系,也確實為我們研究資料帶來了便利,但是不得不思考的是在資料爆炸的資訊時代,尤其是“大資料”概念產生以後,傳統的統計學如果不改變,又將如何應對大資料分析帶來的挑戰,該文將從零售行業的角度分析大資料為傳統統計學帶來的諸多挑戰。
關鍵詞:總體資料;相關性;個性化營銷;定製服務
隨著科技的發展,大資料已經成為資訊時代的一場技術革命。大資料是指傳統資料庫管理工具難以處理的大量的、多樣化的資料。當前普遍認為大資料有3個特點:第一,資料量非常大;第二,資料增長速度非常快;第三,資料型別越來越多樣化[1]。零售業作為傳統的線下實體經營行業,積累了大量的消費者以及管理層的資料,如果依靠傳統的統計學模型對這些資料進行分析,很難得出可以用於企業經營管理的有效資訊,加上年輕一代消費者越來越追求個性化,所以傳統統計學所採用的根據部分樣本推斷總體的分析方法已經無法滿足市場的個性化需求,因此,傳統統計學要想跟上時代發展的步伐,就必須做出與之相適應的改變。
1零售行業裡大資料與傳統統計學的區別
維克多•邁克爾在《大資料時代》一書中提出了大資料思維的3個最顯著的變化:一是樣本等於總體。這與過去基於樣本進行統計分析的思維截然不同;二是不再追求精確性。在大資料中往往存在“噪音”和罕見事件,這樣的資料影響了結果的精確性;三是相關分析比因果分析更重要,在大資料時代我們將注意力更多地放在“是什麼”而不是“為什麼”[2]。大資料的以上特性在零售行業同樣適用,零售行業的大資料與傳統統計學的區別有以下3點。第一,大資料收集總體資料,而傳統統計學多采用抽樣的方式收集部分資料。傳統統計學在做統計分析時首先針對某一個問題提出假設,然後確定需要調查物件的總體,由於資料採集存在一定的難度,所以統計分析採取從總體中隨機抽樣選取一部分資料作為分析的物件,如此的話對隨機抽樣的方法與資料採集的準確性要求是非常高的。而大資料收集的是資料“總體”,在進行分析的時候不會人為進行假設,排除了人的干擾因素,僅僅從資料本身出發進行資料分析。
在零售行業如果能運用大資料思維分析資料,從產生資料的顧客行為本身出發,針對不同顧客做出個性化營銷,而不是人為假設的話,管理層就可以根據資料進行預測,避免了主觀的經驗與直覺的判斷。沃爾瑪作為零售行業的巨頭,運用大資料分析得出的著名的啤酒與尿布理論可以證明這一點。第二,大資料注重個體行為的研究,統計學用樣本資料推斷總體行為。傳統的統計學採用抽樣調查的方式對樣本資料進行分析,用樣本推斷總體,那些在圖表上反映出來的異常資料被排除在外。大資料包容一切資料,其中包括各種結構化、半結構化、非結構化甚至是異構資料。對於零售行業而言,顧客的總體行為表現是沒有意義的,因為每個顧客的需求不同,在不同的時間和地點需要的商品都不同,只有根據每位顧客的不同行為進行個性化服務才能讓線下的零售行業有優勢可言。
美國高檔連鎖百貨Nordstorm最近開始採用線下實體店客流分析服務供應商EuclidAnalytics公司的客流監測解決方案EuclidZero,基於使用者連線Wifi行為來獲取店內顧客手機的Mac實體地址並進行線下追蹤,由此可以通過單個顧客在百貨店裡的行動路線和滯留時間,從而用於改善商品羅列與室內動線以及顧客個性化偏好與推薦服務[3]。第三,大資料注重資料之間的相關性,而傳統統計學更加關注資料分析的結果。從社會發展的角度來看,大資料對資料的關聯性分析更有助於零售行業管理層做出決策。對於傳統零售行業而言,線下的使用者體驗是非常重要的,如果能根據使用者行為資料分析出哪些商品放在一起能促進購買力,那麼零售行業將會有更大的利潤空間,相比之下,統計學進行的結果分析顯得沒有那麼重要。
2大資料在零售行業的優勢
邁克爾•舍恩伯格說:大資料發展的核心動力就是人類測量、記錄和分析資料的渴望。第一,大資料收集的資料是多樣化的、非標準化的,而統計學收集的資料都是標準化、結構化的,統計學無法對非結構化的資料進行分析與測量。但是在零售行業僅僅對標準化的資料進行分析做出的判斷已無法滿足行業的需求,通過對使用者在商品前滯留的時間以及與貨架上商品的互動行為產生的資料進行分析,從而調整貨架的位置才是主流。第二,大資料可以實時、快速監測與收集資料,而統計學收集資料時間長、難度高。大資料收集與處理資料的能力對於零售行業的供應鏈管理十分有效。零售市場可以利用大資料對庫存和員工行為進行監測,從而為管理層做決策提供依據。沃爾瑪為了提高大資料成果在不同部門之間的高效利用,並增加存貨管理和供應鏈管理的投入回報率,其開發了RetialLink工具。供應商使用該工具可以預先知道不同店鋪商品銷售和庫存情況,從而能夠在沃爾瑪發出指令前自行補貨,極大地減少商品斷貨,提高供應鏈的庫存水平[4]。
3傳統統計學面對大資料挑戰要做出改變
大資料的出現給我們的生活帶來了巨大的改變,甚至不同國家的政府都將大資料作為國家的戰略資源。相比之下,傳統統計學面臨著大資料的巨大挑戰,如果能根據自身優勢做出改變,傳統統計學仍然具有存在的價值。第一,改變資料的收集方式。統計學收集資料時前期要做大量的準備工作,需要耗費大量的人力物力成本,所以想要更加高效收集資料,就必須做出改變。由於大資料是基於網際網路收集資料的,所以對於不使用網際網路的地區和群體來說,大資料就顯得很無力,而傳統統計學可以在此基礎上發揮自身優勢,在以往的資料收集方式上進行創新。第二,傳統統計學在資料的分析思維上也要進行改變。傳統統計學不光要打破只能分析標準化資料的魔咒,更要著重分析問題的本質,而不是一味注重結果分析,雖然“是什麼”很重要,但是一直以來探尋事物內在本質才是不斷推動人類社會進步的動力所在,所以統計學也要學會知道“為什麼”。
4結語
資訊科技的發展是無法想象的,我們無法通過今天來預測未來10年資訊行業的發展。只有追上時代的腳步,做出順應時代潮流的改變,才能免遭淘汰,對於傳統統計學也是一樣,停留在原地不動是不明智的,改變才是世界的本質。而所有技術的變革都將反饋給人類的生活,讓人們和社會從中受益。
參考文獻:
[1]城田真琴.大資料的衝擊[M].人民郵電出版社,2013.[2]維克多•邁爾.大資料時代[M].浙江人民出版社,2013.
[3]李寶仁,鄭漢良,王瑩.大資料時代零售業統計的變革[J].經濟與管理,20153:39-43.
[4]趙巍偉.RETIALLINK資料抽取和處理工具的設計與實現[D].上海交通大學,2011.
>