當前位置: 首頁 精選范文 大數(shù)據時代的概述范文

    大數(shù)據時代的概述精選(五篇)

    發(fā)布時間:2024-03-05 14:39:02

    序言:作為思想的載體和知識的探索者,寫作是一種獨特的藝術,我們?yōu)槟鷾蕚淞瞬煌L格的5篇大數(shù)據時代的概述,期待它們能激發(fā)您的靈感。

    大數(shù)據時代的概述

    篇1

    關鍵詞:學習分析;數(shù)據挖掘;大數(shù)據

    隨著信息化技術的飛速發(fā)展,傳統(tǒng)的教育方式也發(fā)生了翻天覆地的變化。MOOCs、云課堂等大量的在線教育模式的出現(xiàn),使得教育信息化程度不斷深入。各類在線學習系統(tǒng)已經獲取和存儲了海量的學生信息以及與學習過程相關的數(shù)據。如何獲取、挖掘、理解、處理和利用在教育領域中產生的海量數(shù)據已成當務之急,學習分析應時而生。

    一、學習分析的定義

    2011年,在第一屆學習分析與知識國際會議上,將學習分析定義為測量、收集、分析和報告關于學習者及其學習情景的數(shù)據,以期了解和優(yōu)化學習和學習發(fā)生的情境。美國新媒體聯(lián)盟(New Media Consortium)對學習分析也有類似的定義,認為學習分析是利用松散耦合的數(shù)據收集工具和分析技術,研究分析學習者學習參與、學習表現(xiàn)和學習過程的相關數(shù)據,進而對課程、教學和評價進行實時修正。

    可以這樣理解,學習分析所研究的數(shù)據是整個教育活動所產生的海量數(shù)據和學習分析過程中所產生的中間數(shù)據。這些數(shù)據包括集中式學習環(huán)境下,學生上傳下載的學習資料、登錄次數(shù)、每次學習時間、考試成績等學習活動日志,以及分布式學習環(huán)境下,學生們通過郵件、短信、社交網絡開展的學習討論等。

    隨著可穿戴設備的不斷推廣和普及,可穿戴設備所捕獲到的心率等各項身體活動數(shù)據,也將成為研究的數(shù)據來源。在此基礎上,評估或預測學生的學習活動,并從中發(fā)現(xiàn)潛在的問題,為教育活動相關者提供決策支持,并進一步優(yōu)化學習過程,設計更適合的學習情境。

    例如,學習分析可以及時發(fā)現(xiàn)學生存在的問題,缺少前驅知識、某個知識技能掌握不達要求等等。這時,教師們就可以針對不同情況合理干預學生的學習活動,修改教學內容、改善教學方式等。當時,這只是一方面,學習分析所能做的遠不止于此。

    二、學習分析的研究內容及應用

    學習分析在對學習者知識、學習者行為以及學習者本身建模的基礎上發(fā)現(xiàn)潛在問題,通過解決問題優(yōu)化教學資源和教學策略,預測未來學習趨勢和結果等。能從學習分析中受益的包括教育系統(tǒng)相關的各個參與者,如學生、教師、研究人員、教育管理者和政策制定者等。

    研究者通過學習者在線學習過程中,應答的正確率、回答問題時間、重復修改次數(shù)等抽取學習者與在線系統(tǒng)之間所產生的交互數(shù)據,以此來建立學習者知識模型。從模型中可以清楚地了解學習者所學習的知識和技能的掌握情況。這樣,系統(tǒng)就可以在學習者需要時推送合適的學習內容。

    學習行為建模是從在線交互數(shù)據中提取知識的學習順序、每個知識點的點擊次數(shù)、完成學習所花費的時間、線上和線下考試成績、學習行為的變化情況等建立學習行為與學習結果之間的對應關系,以此來研究什么樣的學習行為可以取得更好的學習成績,哪些學習存在學習失敗的可能性。

    對學習者本身建模,是為了構建個人學習特性,例如學習的風格、偏好、目標,完成情況等,這樣做的目的是對有同樣學習特性的人進行分組和聚類。通過研究該模型,可以有針對性的提供個性化的學習環(huán)境,從而提高學習效率。

    學習分析可以應用于優(yōu)化教學資源和教學策略。它可以幫助教師實時監(jiān)控網絡教學情況,評估課程設計的效果,從而為教師在教學實踐中做出合理決策。通過對大量的相關數(shù)據的采集和分析,能夠發(fā)現(xiàn)隱藏在每個學習者背后的學習偏好和學習模式,為學習者提供真正適合個人的個性化學習環(huán)境和學習建議,有效提高學習效果。

    云計算、數(shù)據挖掘、社會網絡分析、物聯(lián)網等技術使學習分析成為可能。但學習分析目前仍處于發(fā)展初期,還面臨著多方面的挑戰(zhàn)。數(shù)據來源多樣、分布存儲等使得數(shù)據預處理過程復雜繁瑣,如何從海量數(shù)據中獲取適合開展學習分析的有效數(shù)據占了大部分工作量。另外,學生隱私和檔案的道德問題也是我們要格外關注的重點。隨著學習分析的不斷深入研究,它也將得到更加廣泛的應用,為每一個學生提供更適合自己的個性化教育資源,不斷深化教育信息化的發(fā)展。

    參考文獻:

    [1]SIEMENS G, LONG P. Penetrating the fog: Analytics in learning and education[J]. Educause Review, 2011, 46(5): 30-32.

    篇2

    個人健康大數(shù)據,是大數(shù)據時代里醫(yī)療大數(shù)據的內容之一,指個人從出生到死亡的全生命周期過程中,因免疫、體檢、門診、住院等健康活動所產生的大數(shù)據。按照歸整的部門分為醫(yī)療衛(wèi)生領域、金融保險領域、公安領域等。留存于醫(yī)療衛(wèi)生領域的大數(shù)據,被理解為醫(yī)療大數(shù)據。

    國家對于醫(yī)療大數(shù)據也早已做了頂層設計,2014年衛(wèi)計委了“46312”工程,對國家衛(wèi)生、計生資源整合做了頂層設計規(guī)劃,其中的“3”就是指三大數(shù)據庫,分別為電子健康檔案數(shù)據庫、電子病歷數(shù)據庫和全員人口個案數(shù)據庫。

    醫(yī)改試點城市上海,已經在信息化、大數(shù)據支持上推進醫(yī)改。具體來說,就是用大數(shù)據建立分析標準、評價體系、管理機制,以及基于大數(shù)據的決策和公立醫(yī)院運行模式。對于曾經的評價方式,上海市醫(yī)改辦副主任許速稱,“現(xiàn)在醫(yī)院的評價體系是收入、門診量、住院病人,但這會使醫(yī)院的規(guī)模越做越大、收入越來越高、病人和財政的負擔越來越重。公立醫(yī)院產出評價體系和管理機制,應以衛(wèi)生信息化為基礎,建立以公益性和效率為核心的機制。”

    他表示,“公立醫(yī)院的產出應主要是病種,并通過大數(shù)據研究病種和寄主的關系,病種和資源的關系,資源和醫(yī)務人員的效率、符合的關系,建立標準是上海醫(yī)改的核心。”

    具體來說,就是基于客觀數(shù)據,按照疾病診斷和技術應用設定病種組合指數(shù),測算公立醫(yī)院平均病種組合指數(shù),形成公立醫(yī)院醫(yī)療服務產出評價的度量衡。分析病種與效率、技術、費用、資源的關系,科學評價公立醫(yī)院服務效率、技術水平、費用控制、資源配置的合理性。以此來落實政府政策和政府管理。

    此外,利用大數(shù)據分析疾病的病理和病因還將發(fā)現(xiàn)其他機會,如肺癌和胃腸道癌在中國的發(fā)病率較高,這些樣本和分析對于正在尋找研發(fā)目標的制藥企業(yè)也極具價值。

    在大數(shù)據的驅動下,未來醫(yī)療資源優(yōu)化配置的路徑也將發(fā)生變化,在方正證券研究所的一項報告指出,醫(yī)療衛(wèi)生領域三大數(shù)據庫分為健康檔案庫、人口庫、電子病歷庫,其中醫(yī)院內部所產生的醫(yī)療數(shù)據價值最高,尤以基于電子病歷的臨床數(shù)據更甚。醫(yī)療衛(wèi)生信息化產品搶占數(shù)據入口,應重點關注三類產品:基于電子病歷的臨床信息系統(tǒng)(抓取底層數(shù)據)、院內“集成/開放”平臺(標準化數(shù)據),區(qū)域集成平臺(共享數(shù)據)。

    2015年1月28日,國家衛(wèi)計委下發(fā)《關于印發(fā)進一步改善醫(yī)療服務行動計劃的通知》,北京協(xié)和醫(yī)學院公共衛(wèi)生學院院長劉遠立團隊在2015年底作為第三方機構,對醫(yī)院、醫(yī)患雙方的工作效果進行了評估。數(shù)據標準化開始在監(jiān)管層面應用。

    根據劉遠立團隊的研究,臨床質量測量中最重要的是結果指標。“影響臨床療效的因素很復雜,加上醫(yī)院與患者個體差異,如果不進行標準化,即使有大量的電子病歷,也可能是蘋果和桔子相比較。”

    篇3

    [摘 要] 大數(shù)據時代的來臨,給教育帶來了全新的變革,開啟了教育的新篇章。數(shù)據挖掘技術分析了當前教育存在的問題,針對問題提出了大數(shù)據技術在教育資源、教育管理、評比系統(tǒng)及因材施教等方面的應用,尤其針對Visual FoxPro數(shù)據庫設計這門課,設計了學生反饋信息獲取和教學資源共享網站,更好地實現(xiàn)個性化教育,從而構建可行的教學模型。

    [關鍵詞] 大數(shù)據技術;數(shù)據挖掘技術;教育資源;教育管理

    doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 05. 133

    [中圖分類號] G434;TP311.13 [文獻標識碼] A [文章編號] 1673 - 0194(2017)05- 0244- 03

    0 引 言

    教育是國之根本,教育的發(fā)展預示著國家未來的發(fā)展。國家的強大離不開人才的培育,人才的培育需要一個良好的教育體制,教育體制的好壞決定了未來人才的輸送。教育改革需要應用現(xiàn)代信息技術的各種手段,為其提供高效、便捷的溝通平臺,從而實現(xiàn)信息的實時交流。對此,本文提出將大數(shù)據技術作為教育改革的第一手段,針對當前的教育問題制定可行性計劃,有效地將數(shù)據收集、數(shù)據分析、數(shù)據處理、數(shù)據應用完美的結合到教育的改革中,從而使教育的發(fā)展腳步向前邁進一大步。

    1 教育存在的問題

    教育,教化育人,以現(xiàn)有的經驗、學識推敲于人,為其解釋各種現(xiàn)象、問題或行為,其根本是以相對成熟或理性的思維來認知新的事物,并將其見解育之他人,實現(xiàn)信息傳承的過程。在這個傳承的過程中,隨著時代與科技的發(fā)展,教育的體制與核心也在不斷地變化,其中的很多問題也越來越明顯。

    (1)教育資源繁多,選擇教育方案困難。

    (2)教育制度不夠透明,阻礙教育的發(fā)展。

    (3)傳統(tǒng)的教育管理方法無法滿足現(xiàn)代教育發(fā)展的需求。

    (4)學生信息反饋不及時,無法做出最準確的解決方案。

    2 大數(shù)據與數(shù)據挖掘

    2.1 大數(shù)據

    大數(shù)據,即big data或massive data,是指規(guī)模大到無法在有限的時間內用常規(guī)軟件工具對其內容進行收集、管理和處理的數(shù)據集合。例如,一個學生考了99分,這只是一個“數(shù)字”,如果把考99背后的因素考慮進去,如家庭教育模式、自己努力程度、智商水平等,把他們和99分聯(lián)系在一起,就成了數(shù)據。大數(shù)據的特點可以簡單的概括為“4V”,即更大的容量(Volume)、更高的多樣性(Variety)、更快的生成速度(Velocity)和價值(Value)。

    (1)更大的容量。面對種類多樣、更加復雜的數(shù)據,一個新的問題――數(shù)據的存儲擺在了人們的眼前。大數(shù)據通常可以達到PB級的數(shù)據規(guī)模,因此,對于教育中每天產生的海量信息,大數(shù)據提供的數(shù)據存儲都能夠輕松的解決,這也為教育提供了最堅實的基礎保障。

    (2)更高的多樣性。數(shù)據的來源有很多的渠道,如社交媒體、網絡搜索、網絡文章等,內容包括所有的辦公格式、辦公文檔、圖片、XML、HTML、音頻、視頻等。信息來源渠道的多樣性及信息格式的多樣性,使得大數(shù)據收集的信息擁有更高的多樣性。

    (3)更快的生成速度。即數(shù)據被創(chuàng)建和移動的速度快、時效性要求高,這是大數(shù)據區(qū)別于傳統(tǒng)數(shù)據挖掘最顯著的特征。在高速網絡時代的今天,憑借著各種性能優(yōu)越的硬件及高速的網絡,不斷生成各種各樣的數(shù)據,而且這種高速度也成為了必然趨勢。谷歌公司一天之內要處理幾十PB的數(shù)據,F(xiàn)acebook產生約10億張新的照片、300TB以上日志,淘寶交易進行數(shù)千萬次、產生20TB以上的數(shù)據等。

    (4)價值。每一條數(shù)據都有著其本身的價值。在當今高速的數(shù)據流通下,數(shù)據的價值密度也不斷降低。所以,對于如何提高數(shù)據價值這個問題,我們還需要好好思考一下。

    2.2 數(shù)據挖掘

    數(shù)據挖掘(Data Mining)就是從大量不完整的、隨機的、模糊的數(shù)據中抽出潛在的、有價值的數(shù)據的過程,是一類深層次的數(shù)據分析方式。數(shù)據挖掘的過程主要是信息收集、數(shù)據集成、數(shù)據規(guī)約、數(shù)據清理、數(shù)據變換、挖掘過程、模式評估、知識表示等,通過這一系列的過程給用戶提供所需信息。數(shù)據挖掘能夠對信息實現(xiàn)準確處理,幫助大數(shù)據這一個數(shù)據集合實現(xiàn)精準的應用,實現(xiàn)數(shù)據的價值,為大數(shù)據在教育中的應用,提供最有利的幫助。

    3 大數(shù)據在教育中的作用

    3.1 大數(shù)據下教育資源的選擇

    大數(shù)據不僅有著極強的數(shù)據收集、處理能力,而且可以為我們提供快捷、簡單、準確的選擇。面對海量的教育書籍、課堂筆記等,大數(shù)據能夠輕松的收錄、存儲,并且根據我們的需要,通過數(shù)據處理技術,準確高效的提供有價值的信息,能夠做到在大范圍中尋找最優(yōu)的結果。通過數(shù)據收集和處理為學生的學習減少很多不必要的選擇,從而提高學習效率。例如,現(xiàn)在越來越火的“題庫”類用,就是大數(shù)據的一個細化分支,通過對學生的查詢信息的收集處理,可以顯示學生目前的學習狀況以及存在的知識點薄弱現(xiàn)象,能夠幫助學生和家長以及老師開展教育工作。相對于“題庫”類應用,以視頻為載體的應用傳播更為廣泛,這些都是基于大數(shù)據技術的細化分支。

    3.2 數(shù)據分析處理在教育評比系統(tǒng)中的應用

    教育信息化不斷發(fā)展,利用信息技術助力教育質量綜合評比,能夠使評比內容更加全面、數(shù)據收集范圍更加廣泛、數(shù)據形式更加趨于多樣化、評比結構更加公開透明。因此,一個優(yōu)秀的評價系統(tǒng)能夠更好地推動教育的發(fā)展。20世紀90年代,歐美等發(fā)達國家與地區(qū)為確保教育質量積累了大量的數(shù)據經驗,并建立了完善的高等教育人才培養(yǎng)評比系統(tǒng)。我國自20世紀90年代也開始著手于教育系統(tǒng)的建設,例如上海大學從1998年開始不斷完善自己的教育系統(tǒng),將教育系統(tǒng)與大數(shù)據的分析結合,經過十幾年的不斷完善,建成了一個完整的教育評比系統(tǒng)。

    3.3 大數(shù)據在教育管理中的應用

    教育一直都在強調要培養(yǎng)學生多方面能力,可是事實卻是以“分”為首,很多初高中學生幾乎沒有課余生活,活在題海里。這樣的事實是什么造成的呢?很多人說是應試教育必然的結果,其實不然。教育改革從本質上是好的,可是監(jiān)管的不利、評比體系的不健全,使得更多的學生、家長、老師以及學校背離改革的初衷,更加看重考試分數(shù)。所以,一個健全的教育管理體系是多么的重要。我們可以通過采用大數(shù)據對信息收集方式多樣性這一特點,更全面收集、掌握教育的發(fā)展狀況。例如,可以通過學校監(jiān)控視頻收集學生和老師的學習授課情況,利用大數(shù)據的分析能力進行實時反饋。大數(shù)據與教育管理系統(tǒng)的結合,雖然不能快速的解決教育中的問題,但是其所提供的信息反饋能夠更好地監(jiān)督教育改革的步伐。

    3.4 全面了解學生,實現(xiàn)因材施教

    我們要想真正地做到因材施教,可以通過對教學信息的獲取、存儲、管理和分析,從而構建學生的學習模型,分析學生已有的學習方法和學習狀態(tài),并對其將來的學習進行一定的規(guī)劃和引導。目前,教育中的大數(shù)據應用主要有教育數(shù)據挖掘和學習分析兩大類,兩個方向雖然同源,可是應用方向、研究對象、研究方法完全不同。教育數(shù)據挖掘是將來自教育的原始數(shù)據轉換為有用信息的過程,是大數(shù)據應用于學習分析最基本的應用手段,并且通過數(shù)據挖掘自身的信息挖掘技術能夠提高分析效率、擴大分析范圍。學習分析是利用松散耦合的數(shù)據收集工具和分析技術,研究分析學習者學習參與、學習表現(xiàn)和學習過程的相關數(shù)據,進而對課程、教學和評價進行實時修正。我國學者顧小清認為,學習分析是圍繞與學習者學習信息相關的數(shù)據,運用不同的分析方法和數(shù)據模型來解釋這些數(shù)據,根據解釋的結果來探究學習者的學習過程和情景,發(fā)現(xiàn)學習規(guī)律;或者根據數(shù)據闡釋學習者的學習表現(xiàn),為其提供相應的反饋從而促進更加有效的學習。為了達到對教育的進一步變革,我們需要建立一個數(shù)據模型,該模型以大數(shù)據為基礎的數(shù)據分析與應用系統(tǒng),主要存儲學生和老師的日常學習與工作計劃及其短期與長期目標,進而對學生和老師的需求進行全面的分析規(guī)劃,實施可行的教育方案,真正的實現(xiàn)因材施教的最高教育目標。

    筆者針對“Visual FoxPro數(shù)據庫設計”這門課,設計了學生反饋信息獲取和教學資源共享網站,通過采集學生反饋的信息,讓老師更全面地了解學生的學習狀況,更好地制定教學計劃。網站還提供了教學資源共享平臺,師生都可以文章等有關學習的各種資料,如圖1所示,實現(xiàn)資源的可選擇,使學生不再被動學習,可以主動選擇學習內容,并在交流平臺發(fā)表自己的一些看法等,如圖2所示。通過網站信息的獲取,進行數(shù)據分析,構建可行的教學模型,從而真正實現(xiàn)因材施教。

    4 結 語

    隨著大數(shù)據時代的到來,以大數(shù)據為依托進行教育的改革能夠更快速的推進教育的發(fā)展,從而為學生、教師、家長提供一個更優(yōu)質的學習、教育、O督體系。大數(shù)據的應用可以使我們現(xiàn)在種類繁多的教育資源變得井井有條,各類資源更加清晰明了;教師制定教育規(guī)劃時能夠多一份準確的學生反饋信息分析,從而制訂更加精準的教學計劃;學生們可以脫離“題海”,轉向準確、高質量的最優(yōu)題區(qū),不再做沒頭的蒼蠅,找不到方向。在未來,大數(shù)據的應用會更加廣泛,我們的教育一定會得到充分的發(fā)展,未來的教育我們也許不再需要沉重的書包、繁重的作業(yè),需要的也許僅僅是自己對自己優(yōu)勢的發(fā)揮。

    主要參考文獻

    [1]鄭立海.大數(shù)據時代的教育管理模式變革芻議[J].中國電化教育,2015(7):32-36.

    [2]陸Z.大數(shù)據及其在教育中的應用[J].上海教育科研,2013(9):5-8. [3]高巨山,郭健.數(shù)據挖掘技術在教育信息化中的應用研究[J].中國教育信息化,2007(9S):75-76.

    [4]何蘊毅.大數(shù)據背景下教育變革的思考與實踐[J].教育信息技術,2014(12):13-15.

    篇4

    關鍵詞:統(tǒng)計學;教育改革;大數(shù)據

    一、引言

    最早提出大數(shù)據時代到來的機構是全球知名的麥肯錫咨詢公司,該公司在一份研究報告中指出:“數(shù)據已經滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產因素,人們對于海量數(shù)據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來”。

    大數(shù)據是隨著互聯(lián)網技術的廣泛應用帶來的數(shù)據量和數(shù)據類型激增而衍生出來的一種現(xiàn)象,但大數(shù)據一詞不僅指規(guī)模大、種類多的數(shù)據集,還包括對這種數(shù)據集進行采集、處理與分析以提取有價值信息和直接創(chuàng)造價值的技術構架和技術過程。大數(shù)據的第一個特征是數(shù)據量巨大。截止到2012年,數(shù)據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。第二個特征是數(shù)據類型繁多、異構性突出,包括網絡日志、音頻、視頻、圖片、地理位置信息等等。第三個特征是數(shù)據價值密度較低,數(shù)據中存在大量重復性和無價值性信息或噪聲。如何通過強大的計算技術和統(tǒng)計分析等方法迅速完成數(shù)據的價值提純,是大數(shù)據時代亟待解決的難題。第四個特征是處理速度快、時效性要求高。這是大數(shù)據區(qū)分于傳統(tǒng)數(shù)據挖掘最顯著的特征。

    目前,不同的學科領域對大數(shù)據概念有著不盡相同的解釋,但各種解釋中大致可以從兩個方面去理解。首先,大數(shù)據概念體現(xiàn)在數(shù)據量的巨大、種類的眾多及產生速度的飛快,同時產生的數(shù)據集極有可能包含著各種半結構化和非結構化數(shù)據;其次,大數(shù)據概念還體現(xiàn)在對數(shù)據進行處理的手段和流程方面,由于數(shù)據量的龐大和類型復雜,利用常規(guī)的統(tǒng)計軟件已經無法對當今的數(shù)據進行及時有效的存儲、分析及處理。因此,所謂的大數(shù)據并不是單純指數(shù)據流量的巨大,還指其結構的復雜和種類的多樣,在數(shù)據處理和分析上需要采用高端計算平臺或高級統(tǒng)計軟件,以及海量數(shù)據中存在著可挖掘的潛在的大量價值信息與知識。

    近年來,隨著高速計算機的應用、信息技術的快速發(fā)展,特別是云計算技術的發(fā)展,使大數(shù)據的存儲和分析技術得到迅速發(fā)展,目前的核心技術有MapReduce、GFS、BigTable、Hadoop,以及數(shù)據可視化等。在數(shù)據搜集上,可方便地通過在線互聯(lián)網數(shù)據庫獲取二手數(shù)據或一手實時數(shù)據。在數(shù)據分析上,傳統(tǒng)統(tǒng)計學方法采取的是基于統(tǒng)計模型的樣本數(shù)據分析,而大數(shù)據分析技術則是通過高端計算平臺,對大數(shù)據中的信息進行挖掘。

    統(tǒng)計學作為對數(shù)據進行處理和分析的科學,必然受到大數(shù)據的影響。在大數(shù)據時代,統(tǒng)計學教育必須與時俱進,跟上時展步伐。近年來,有不少文獻討論了大數(shù)據環(huán)境下我國統(tǒng)計學教育的改革問題(例如[1]-[5]),本文在分析大數(shù)據時代特征的前提下,進一步討論我國統(tǒng)計學教育的現(xiàn)狀與挑戰(zhàn)、統(tǒng)計學教育改革的內容、方法、借鑒和適應時代要求的變革問題。

    二、統(tǒng)計學教育的現(xiàn)狀與挑戰(zhàn)

    2013年,教育部對我國統(tǒng)計學專業(yè)設置進行一次新的調整,將原來的既可授予理學學位,也可授予經濟學學位的統(tǒng)計學專業(yè)劃分為統(tǒng)計學、應用統(tǒng)計學和經濟統(tǒng)計學三個本科專業(yè)[6]。根據教育部高等學校統(tǒng)計類專業(yè)教學指導委員會2013年11月公布的數(shù)據,當時全國有194所高校開設了統(tǒng)計學專業(yè),156所高校開設了應用統(tǒng)計學專業(yè),164所高校開設了經濟統(tǒng)計學專業(yè)[6]。目前,全國開設這三個統(tǒng)計學專業(yè)的高校個數(shù)和在校學生人數(shù)與2013年相比都有不少的增加。

    面對大數(shù)據時代,我們目前的統(tǒng)計學教育無論在培養(yǎng)目標和教學內容上,還是在教育方式和人才培養(yǎng)模式上,都存在著亟待解決的挑戰(zhàn)性問題。例如,在專業(yè)培養(yǎng)目標和人才培養(yǎng)過程中,我們比較重視課程層面上的評價,比較輕視專業(yè)層面上的整體評價,缺乏對學生綜合能力的反饋機制。

    關于教學內容,目前三個統(tǒng)計學專業(yè)在統(tǒng)計理論和應用統(tǒng)計兩個方面有不同的側重。統(tǒng)計理論主要包括:抽樣理論、實驗設計、估汁理論、假設險驗、決策理論、貝葉斯統(tǒng)計、半參數(shù)和非參數(shù)統(tǒng)計、序貫分析、多元統(tǒng)計分析、時間序列分析、小樣本理論和大樣本理論等。在數(shù)據分析中,現(xiàn)今的統(tǒng)計方法基本以結構化數(shù)據為主要處理對象,而對非結構化和半結構化數(shù)據的分析和工具涉及較少。因此,現(xiàn)今統(tǒng)計學課程及內容已不能滿足從事非結構型和半結構型的大數(shù)據研究和商業(yè)應用對人才培養(yǎng)的需要,必須進行必要的改革。

    對于教育方式,鑒于大數(shù)據時代要求,統(tǒng)計分析人員需要具備較高的數(shù)學和現(xiàn)代統(tǒng)計學基礎,具有較高的軟件操作能力,掌握一定的大數(shù)據收集、整理、分析、處理和挖掘數(shù)據的技能。日本學者城田真琴認為:“數(shù)據科學家要有計算機科學專業(yè)背景,數(shù)學、統(tǒng)計方面的素養(yǎng)和使用數(shù)據挖掘軟件的技能,善于利用數(shù)據可視化的手法展現(xiàn)晦澀難懂的信息,而且具備相應的專業(yè)知識、眼界和視野,具有適應社會發(fā)展和創(chuàng)造價值的能力”。現(xiàn)今的統(tǒng)計學教育方式還不能很好適應大數(shù)據時代數(shù)據科學人才培養(yǎng)需要,必須進行必要及時的調整和變革。

    對人才培養(yǎng)模式,大數(shù)據時代不僅要求培養(yǎng)具有數(shù)據處理和分析所需的基本素質與技能,更重視培養(yǎng)從海量數(shù)據中發(fā)現(xiàn)和挖掘價值信息、把握市場機遇、創(chuàng)造利潤的潛在能力。面對大數(shù)據時代的諸多挑戰(zhàn),現(xiàn)代統(tǒng)計技術、數(shù)據挖掘方法、計算機信息技術、軟件工具和理念的日新月異,培養(yǎng)統(tǒng)計人才的教育模式也需要相應變化,統(tǒng)計學教育只有與時俱進,主動做出全面的調整和變革才能適應新時代知識進步和激烈人才市場競爭的需要,積極迎接大數(shù)據時代的挑戰(zhàn)。

    大數(shù)據時代對統(tǒng)計學教師有更高的要求,統(tǒng)計學教師需要與時俱進,跟上時代步伐。隨著互聯(lián)網、物聯(lián)網、云計算等信息技術的發(fā)展,對數(shù)據的分析和處理的技術也隨之要求更高,統(tǒng)計學教師固有的知識體系已不能滿足培養(yǎng)現(xiàn)代統(tǒng)計人才的需要,必須進一步深化和更新原有的統(tǒng)計學理論知識,而且還需要學習掌握計算機技術、互聯(lián)網、數(shù)據庫和信息科學等有關知識和技術,同時還要熟悉處理非結構型和半結構型數(shù)據的知識和技能,以適應現(xiàn)代統(tǒng)計學教育對教師的知識結構和基本素質的要求。

    大數(shù)據時代對統(tǒng)計專業(yè)的學生也提出了更高的要求,他們不僅需要掌握現(xiàn)代統(tǒng)計理論、統(tǒng)計方法和專業(yè)統(tǒng)計軟件,還要學會如何分析、處理來自互聯(lián)網或各種實際問題中的海量數(shù)據,如何利用統(tǒng)計軟件和互聯(lián)網技術進行數(shù)據操作,如何借助軟件技術和統(tǒng)計準則判斷數(shù)據質量,如何進行模型選擇和評價模型方法的有效性,如何準確清晰地呈現(xiàn)統(tǒng)計分析結果和結論,等等。

    2014年11月,美國統(tǒng)計學會了統(tǒng)計學本科專業(yè)指導性教學綱要 [7],該教學綱要對統(tǒng)計學專業(yè)提出四個方面的要求:(1)具有扎實的數(shù)學和統(tǒng)計學基礎、強大的統(tǒng)計計算和編程能力,熟練使用統(tǒng)計軟件和數(shù)據庫;(2)分析來自現(xiàn)實問題的真實數(shù)據,真實數(shù)據是統(tǒng)計專業(yè)教育的重要組成部分;(3)掌握多樣化的統(tǒng)計模型方法;(4)具有通過語言、圖表和動畫等方式解釋數(shù)據分析結果的能力。美國是統(tǒng)計學教育和人才培養(yǎng)最先進的國家之一,該指導性教學綱要代表著美國統(tǒng)計學專業(yè)培養(yǎng)人才的基本要求和發(fā)展方向,對我國統(tǒng)計教育的改革具有重要的參考價值。以該指導性教學綱要為參考依據,對照我國目前的統(tǒng)計學本科專業(yè)教育,無論是在培養(yǎng)目標和課程設置方面,還是在教學內容和教學方法方面,都存在著亟待解決的挑戰(zhàn)性問題。

    三、統(tǒng)計學教育的改革

    大數(shù)據時代的統(tǒng)計學教育不僅是各種統(tǒng)計方法、數(shù)據挖掘方法和信息技術手段的延續(xù)或發(fā)展,更主要的是這些方法的集成應用和在實際數(shù)據分析中的真實體驗。過去,企業(yè)數(shù)據庫價格昂貴,在統(tǒng)計學教育的教學案例或實驗課教學中,很少采用真實和海量的數(shù)據庫資源,基本都是采用過時或虛擬的數(shù)據。今天,像百度大數(shù)據引擎這樣的數(shù)據庫的逐步對外開放,將有助于開展“線上大數(shù)據統(tǒng)計實驗”教學。為了適應大數(shù)據時代要求,有必要利用網絡資源以及各種數(shù)據處理軟件,搭建線上大數(shù)據分析實驗教學平臺,全面開展大數(shù)據統(tǒng)計實驗教學的改革。實際上,借助大數(shù)據分析平臺,本科階段的統(tǒng)計學教育就可以融人聯(lián)機分析和數(shù)據的可視化教學。其次,要時刻關注大數(shù)據分析理論的進展,及時將新理論新方法融入課堂教學內容。

    需要指出的是,在大數(shù)據時代,經典統(tǒng)計理論和方法并沒有過時,但需要進行改進和進一步發(fā)展。這是因為,網上采集的巨型數(shù)據集往往存在大量的重復性和無價值數(shù)據信息,使得大數(shù)據價值密度降低。在對這些數(shù)據進行分析處理之前往往需要通過去噪、分層、截斷、聚類等方法的預處理,將其變成便于進行分析處理的小數(shù)據,繼而借助于經典統(tǒng)計方法進行分析和處理。因而在大數(shù)據時代仍然需要采用傳統(tǒng)統(tǒng)計學的小樣本理論和方法。所以,即便是在大數(shù)據時代,經典統(tǒng)計方法仍然是進行統(tǒng)計分析的基石,其核心地位不可動搖。所以,在大數(shù)據時代仍然要強化統(tǒng)計學的基本理論和方法,尤其是在長期發(fā)展和實踐應用中經過驗證的、成熟有效的經典和現(xiàn)代統(tǒng)計方法,在大數(shù)據時代仍然沒有過時,但需要結合大數(shù)據分析的需要對經典統(tǒng)計方法進行必要的發(fā)展和改進。

    大數(shù)據科學需要統(tǒng)計學與數(shù)學、計算機等學科的結合。亞馬遜大數(shù)據科學家John Rauser 認為:“數(shù)據科學家是統(tǒng)計學家和計算機工程師的結合體”。為了滿足大數(shù)據時代的要求,統(tǒng)計學專業(yè)的課程設置需要進行必要的調整。應根據新時代人才培養(yǎng)的要求,增設與大數(shù)據前沿領域發(fā)展相關的課程,如計算機網絡和大數(shù)據相關的軟件應用,同時要加大實驗課和社會實踐課的比重,引導學生理解和掌握大數(shù)據概念、理論、技術和方法,培養(yǎng)其運用大數(shù)據的相關分析工具解決實際問題的能力。對于理論課程,除基本統(tǒng)計理論外,還應開設一些較為現(xiàn)代和深入的課程,如現(xiàn)代貝葉斯方法、神經網絡、數(shù)據挖掘、應用隨機過程論等。另外,還應開設與大數(shù)據分析相關的關聯(lián)規(guī)則、決策樹、機器學習、支持向量機等課程。

    為了培養(yǎng)與時代適應的統(tǒng)計學人才,統(tǒng)計學專業(yè)教師應不斷更新自身的知識結構和價值觀念,改變認識數(shù)據、收集數(shù)據和分析數(shù)據的思維,主動學習和補充互聯(lián)網、現(xiàn)代數(shù)據分析技術、數(shù)據庫和數(shù)據挖掘技術,使自己的知識體系不斷更新和提升,跟上時展的步伐。

    在大數(shù)據時代,要注意培養(yǎng)學生適應社會的能力。統(tǒng)計專業(yè)人才培養(yǎng)模式應以提高本專業(yè)學生數(shù)據分析方面的能力,開闊他們的視野,培養(yǎng)其適應社會的能力。應積極引導學生進入實訓場所動手操作和鍛煉,嘗試以企事業(yè)單位的財政、金融、保險、統(tǒng)計、咨詢和信息公司等部門為主構建專業(yè)性教育實踐基地。鼓勵學生到大數(shù)據相關的機構部門、產業(yè)園區(qū)和企業(yè)中去調查研究和實踐。此外,統(tǒng)計專業(yè)應積極同其他專業(yè)進行合作,聯(lián)合培養(yǎng)適應新時代要求的數(shù)據分析人才。鑒于大數(shù)據對數(shù)據分析人員在計算機技術、行業(yè)認知、業(yè)務知識、數(shù)據分析工具和方法的要求提高,統(tǒng)計學科應主動與計算機、經濟學、管理學等相關學科合作,培養(yǎng)學生的計算機能力、專業(yè)素質和業(yè)務修養(yǎng)。

    “它山之石可以攻玉”,關于統(tǒng)計學專業(yè)的課程設置,可以參考和借鑒美國統(tǒng)計學會公布的統(tǒng)計學本科專業(yè)指導性教學綱要。根據該教學綱要,統(tǒng)計專業(yè)的課程設置應該涵蓋五個模塊[7]:(1)統(tǒng)計方法與統(tǒng)計理論。建立統(tǒng)計模型并對模型的輸出結果進行評價,熟悉統(tǒng)計推斷,能夠從數(shù)據分析中得出恰當?shù)慕Y論。(2)數(shù)據操作和統(tǒng)計計算。熟練使用一款專業(yè)統(tǒng)計軟件進行探索性數(shù)據分析,發(fā)現(xiàn)和清洗數(shù)據中的錯誤記錄,具有編程能力和算法思維,可以進行各種數(shù)據操作,還應掌握統(tǒng)計計算技術,能夠進行模擬研究。(3)數(shù)學基礎。熟練掌握微積分、線性代數(shù)、矩陣論、概率論和數(shù)理統(tǒng)計的基礎知識。(4)實踐訓練和表達能力。具有良好的表達和交流能力,善于通過圖示和動畫等聽眾易于理解的方式展示分析結論,并且具有團隊合作精神和項目領導能力。(5)特定領域的知識。掌握特定應用領域的知識,并用統(tǒng)計學特有的思維方法來分析和解決特定領域的實際問題。

    大數(shù)據時代是以數(shù)據為中心的時代,統(tǒng)計學專業(yè)的教育改革必須適應這個時代的要求。統(tǒng)計數(shù)據分析中軟件應用能力至關重要。在眾多統(tǒng)計軟件中推薦使用R和SAS軟件,因為R是免費開源軟件,其統(tǒng)計建模、統(tǒng)計計算和可視化功能強大,更新迅速,是最新統(tǒng)計方法的主要平臺,非常有利于培養(yǎng)學生的編程能力和知識更新能力,而SAS軟件被很多公司用于數(shù)據管理和數(shù)據分析,在實際應用領域具有長期而深遠的影響,是數(shù)據分析不可或缺的專業(yè)統(tǒng)計軟件。當然,教學中也可以嘗試使用其他專業(yè)統(tǒng)計軟件,例如經濟統(tǒng)計專業(yè)學生也可使用SPSS軟件,但最好會使用SAS或R軟件。在加強軟件使用和編程能力的基礎上,應加強學生統(tǒng)計計算和統(tǒng)計模擬能力的培養(yǎng)。在大數(shù)據時代,強調統(tǒng)計計算的重要性是大勢所趨。統(tǒng)計模擬技術是伴隨著高速計算機和信息技術的快速發(fā)展而廣泛應用的現(xiàn)代技術,可用來解決傳統(tǒng)學科領域中無法解決的問題。例如,在計算技術飛速發(fā)展的今天,貝葉斯統(tǒng)計方法過去曾經面臨的計算瓶頸正在逐漸消失,基于馬爾科夫鏈蒙特卡洛(MCMC)技術的統(tǒng)計模擬方法在數(shù)據分析中的強大威力正在日益顯現(xiàn)[8]。

    參考文獻:

    [1] 劉春杰,大數(shù)據時代對當代統(tǒng)計學教育的挑戰(zhàn),統(tǒng)計與決策,2015年,第8期。

    [2] 孟生旺,袁衛(wèi),大數(shù)據時代的統(tǒng)計教育,統(tǒng)計研究,2015年,第32卷4期。

    [3] 葛虹,韓偉,大數(shù)據時代統(tǒng)計教育變革的SWOT分析與發(fā)展策略,統(tǒng)計與決策,2015年,第4期。

    [4] 張海波,黃世祥,統(tǒng)計學專業(yè)學生大數(shù)據分析能力的培養(yǎng)方式選擇,統(tǒng)計與決策,2014年,第24期。

    [5] 李衛(wèi)東,大數(shù)據對統(tǒng)計學科發(fā)展的影響,統(tǒng)計與決策,2014年,第13.期。

    [6] 教育部高等學校統(tǒng)計類專業(yè)教學指導委員會.統(tǒng)計學專業(yè)教學單位.http:///category/信息公開/教學單位,2013-11-15.

    篇5

    關鍵詞:大數(shù)據時代 大數(shù)據理解

    1大數(shù)據時代概念的提出

    當前,大數(shù)據這一詞匯在各行各業(yè)中出現(xiàn)的頻率越來越高,各種媒體中也經常對這大數(shù)據這一概念進行推廣,大數(shù)據時代逐漸成為了一個社會熱詞,昭示著大數(shù)據時代的來臨。

    在學界中,大數(shù)據的理論思考與實踐探索一直在如火如荼的濟寧這,并與經濟市場,政府機關形成了良好的合作與互相支持的模式。大數(shù)據時代的來臨與當前互聯(lián)網時代的建設基礎和發(fā)展迅速的信息技術具有重要聯(lián)系,早在上個世紀末就有了關于大數(shù)據時代的理論雛形,對整合所有數(shù)據并對數(shù)據進行加工,分析,處理提出設想。這一設想的提出與同一時期的“商業(yè)智能”的具有密切的聯(lián)系,所謂商業(yè)智能也是指建立數(shù)據倉庫的基礎上挖掘數(shù)據的深度含義,分析數(shù)據從而挖掘出數(shù)據之間的內部聯(lián)系性,從而獲取文化公司所需要的信息,為文化公司的發(fā)展提供決策思路和數(shù)據支持。

    直到世紀,信息技術的發(fā)展導致各種數(shù)據統(tǒng)計工作的便捷與高效性,人們逐漸發(fā)現(xiàn)了進行大規(guī)模數(shù)據分析和研究對文化公司在發(fā)展過程中所能起到的作用,互聯(lián)網的覆蓋范圍越來越廣,在各行業(yè)各的應用程度愈來愈高,智能手機的普及都為大數(shù)據時代的來臨打下了堅實的基礎,隨后大數(shù)據的概念在信息技術行業(yè)中越來越得到認可與重視,大數(shù)據的相關理論基礎研究與前景展望也越來越多,為大數(shù)據時代構建了理論結構與應用前景。

    2012年的達沃斯世界經濟論壇中將大數(shù)據作為主題之一進行討論,可以說變相確定了大數(shù)據在未來社會發(fā)展進程中的地位,探究了以信息技術為依托的大數(shù)據處理分析如何對人類社會的發(fā)展作為貢獻。國內對大數(shù)據在未來發(fā)展中將占據的地位和起到的作用也做出了充分的認可,各大企業(yè)與高校對大數(shù)據的概念與應用已經開始進行研究與實踐。

    2大數(shù)據一詞的概念與理解

    對大數(shù)據時代的理解離不開對大數(shù)據的概念的理解。什么是大數(shù)據?就當下而言,雖然大數(shù)據一詞的出現(xiàn)的頻率極高,許多媒體,部門,論壇都在使用這一詞語,但是對大數(shù)據一詞的核心含義的理解卻并不一定充分。當前學界內對數(shù)據一詞的定義尚且沒有一個統(tǒng)一的較為得到廣泛認可的定義。對大數(shù)據一詞的定義可以分為幾種,例如維基百科上說大數(shù)據就是指數(shù)量、規(guī)模龐大的數(shù)據資料,無法利用常見的軟件工具對其進行高效率收集,處理與分析。還有的的說法認為大數(shù)據就是單純指數(shù)據量足夠大,遠超常規(guī)水平的數(shù)據集合。還有的說法主要是認為大數(shù)據進行處理的方式才是大數(shù)據一詞的實質,即大數(shù)據是通過特殊處理模式能提高企業(yè)對市場形勢的掌控程度,為決策提供指導的數(shù)據分析處理方法。

    因此來看,大數(shù)據的特征應該包含著兩方面,一是大數(shù)據處理在技術層面具有先進性,二是大數(shù)據在社會性方面具有廣泛性。如上文所述,大數(shù)據一詞的出現(xiàn)是信息技術進步的結果。大數(shù)據最先出現(xiàn)其是存在與IT界的術語,大數(shù)據是一個多項技術合并在一起的概念,是一個具有系統(tǒng)性的體系,包括對數(shù)據依托信息技術實現(xiàn)大規(guī)模儲存與聯(lián)網分享的云技術,對數(shù)據進行分析處理的分布式處理技術,指紋識別,虹膜識別等對數(shù)據進行保密管理的感知技術等等,都應該包括與大數(shù)據體系之中。與此同時,大數(shù)據還具有社會性。大數(shù)據這一概念的出現(xiàn)離不開信息爆炸化的時代特征,大量的信息充斥于社會的每一個角落并呈現(xiàn)著井噴式的增長,每一個人都是數(shù)據的創(chuàng)造者與傳遞著,國際化進程的加快使人類社會前所未有的緊密聯(lián)系在一起,在這種時代背景下醞釀出來的大數(shù)據概念無法避免的具有人類社會發(fā)展的特征。

    在大數(shù)據時代,人們的思維模式必須向大數(shù)據化的方向靠攏,傳統(tǒng)的思維模式已經不適合時代的發(fā)展。信息技術的進步使我們的思維模式也可以在依托大數(shù)據提供的信息作出更準確的決策和判斷。在大數(shù)據模式下,高效率的數(shù)據收集與處理是我們可以脫離傳統(tǒng)的抽樣調查得出結論的辦法,不用再考慮數(shù)據模型是否具有科學性和代表性,也不用考慮抽樣結果是否具有偶然性,因為我們已經可以立足于全面性的數(shù)據來對問題進行思考與判斷,同時,對數(shù)據的判斷要提高效率,應為判斷的本身也是一個大數(shù)據的過程,提高判斷的效率再借以數(shù)據統(tǒng)計來提高其準確性。在大數(shù)據時代,人們面對數(shù)據不需要刨根問底的研究數(shù)據出現(xiàn)的原因,而是應該要考慮數(shù)據之間的關聯(lián)性,研究數(shù)據之間的聯(lián)系,思考關聯(lián)出現(xiàn)的原因而不是單純研究因果關系。

    大數(shù)據時代對于社會的改變在于,它變革的是人們處理數(shù)據的方式與模式,改變的是人認知世界,認知事物的方法,在數(shù)據化的信息處理中提供發(fā)現(xiàn)問題,解決問題,創(chuàng)造價值的方法。大數(shù)據作為一個新生事物能開創(chuàng)出一個新的時代,不得不說大數(shù)據在我們當下的社會發(fā)展進程中是極有價值的。雖然大數(shù)據的定義及體系,實踐應用方面還存在許多不足,缺少經驗方面的積累,但是筆者相信隨著時間的推移大數(shù)據體系的形成必將越來越完備。我們當下所需要做的就是把握住大數(shù)據時代的時代脈搏,必須明確大數(shù)據時代的要求:首先,大數(shù)據時代必須充分利用信息技術來提高數(shù)據的收集與儲存,利用新的數(shù)據處理模式發(fā)現(xiàn)數(shù)據之間的關聯(lián)新,為決策提高科學性的指導與數(shù)據支持。然后,大數(shù)據是技術屬性與社會屬性的有機統(tǒng)一,所以在大數(shù)據時代中兩方面工作都要雙管齊下,提高技術水平的同時還要注重社會實踐應用,達到改變市場運作模式,各組織的結構的目的。最后,大數(shù)據不是一個高高在上的概念性名詞,而是應該作為一種新的思維方式適用于社會的各個方面,包括政府行政,企業(yè)運營和人民生活等等,是新的時代智慧與時代氣息,而不是單純的一種技術或處理數(shù)據的手段。

    必須要明確大數(shù)據時代真正的思想內涵,才能是我國在新時代的發(fā)展過程中不落人后,占據著有力地位,提高國家的信息化程度與綜合實力,對本論文的命題“大數(shù)據時代”對企業(yè)人力資源管理工作的影響能做出正確的分析探究。

    參考文獻:

    主站蜘蛛池模板: 国产主播一区二区| 久久久综合亚洲色一区二区三区| 无码日韩人妻AV一区免费l| 免费视频一区二区| 国模精品一区二区三区视频 | 国产一区二区三区日韩精品| 无码av免费一区二区三区| 乱中年女人伦av一区二区| 色多多免费视频观看区一区| 亚洲综合色一区二区三区小说| 国产日韩一区二区三免费高清| 国产一区二区不卡在线播放| 视频一区在线免费观看| 精品一区二区高清在线观看| 国产在线一区二区三区av| 蜜芽亚洲av无码一区二区三区 | 亚洲AV成人精品日韩一区18p| 国产精品一区二区久久乐下载| 欧美日韩国产免费一区二区三区| 乱码人妻一区二区三区| 色婷婷香蕉在线一区二区| 一色一伦一区二区三区| 国模精品视频一区二区三区| 日韩在线一区高清在线| 日本免费精品一区二区三区| 国产一区美女视频| 国产一区二区精品久久凹凸| 精品乱人伦一区二区三区| 一区二区三区视频在线观看| 亚洲综合一区二区| 天堂一区二区三区精品| 色噜噜一区二区三区| 日韩制服国产精品一区| 老熟女五十路乱子交尾中出一区| 亚洲国产成人久久一区二区三区| 精品人妻无码一区二区三区蜜桃一| 国产精品免费视频一区| 成人免费av一区二区三区| 一区二区三区在线免费看| 色综合视频一区中文字幕 | 在线免费观看一区二区三区|