2023年5月29日,習近平總書記在中共中央政治局第五次集體學習時就加快建設教育強國發(fā)表重要講話,強調我們要建設的教育強國“以教育理念、體系、制度、內容、方法、治理現代化為基本路徑”,并指出“教育數字化是我國開辟教育發(fā)展新賽道和塑造教育發(fā)展新優(yōu)勢的重要突破口”。建設教育強國,是以中國式現代化全面推進中華民族偉大復興的基礎工程,要加快推進教育數字化轉型,以大數據賦能教育治理現代化,助力教育強國建設。
一、深刻認識數據驅動教育決策的重要意義
2015年,習近平總書記在致國際教育信息化大會的賀信中指出,當今世界,科技進步日新月異,互聯(lián)網、云計算、大數據等現代信息技術深刻改變著人類的思維、生產、生活、學習方式,深刻展示了世界發(fā)展的前景。
全球大數據規(guī)模增長快速,根據國際權威機構Statista的統(tǒng)計和預測,2020 年全球數據產生量達到 64.2ZB,而到2025年,這一數字將達到181ZB,全球數據量呈現指數級增長。[1] 數據已經演變成為一種不可或缺的生產要素,其開發(fā)利用可以促進創(chuàng)新驅動、提高效率、優(yōu)化結構、增強競爭力,成為促進經濟、科技和社會發(fā)展的關鍵驅動力。
與先前的數據信息有所不同,大數據基本特點可以用3V或4V來概括:Volume(數據規(guī)模龐大),大數據的體積遠遠超過常規(guī)數據,通常以TB、PB甚至EB為單位;Variety(數據類型多樣),大數據不僅包含傳統(tǒng)的結構化數據,還包括各種形式的非結構化和半結構化數據;Value(數據價值巨大),大數據中蘊含著對決策和創(chuàng)新有重要意義的信息和價值;Velocity(數據更新頻繁),大數據以高速率生成、流動和積累。[2]
大數據正日益成為提升政府治理能力的重要手段。早在2015年國務院印發(fā)《促進大數據發(fā)展行動綱要》,確定了未來5—10年我國大數據發(fā)展的國家頂層設計和總體部署,并將“打造精準治理、多方協(xié)作的社會治理新模式”作為第一條總體目標,強調將大數據作為提升政府治理能力的重要手段,通過高效采集、有效整合、深化應用政府數據和社會數據,提升政府決策和風險防范水平?!吨腥A人民共和國國民經濟和社會發(fā)展第十四個五年規(guī)劃和2035年遠景目標綱要》也專章提出要提高數字政府建設水平,將數字技術廣泛應用于政府管理服務,推動政府治理流程再造和模式優(yōu)化,不斷提高決策科學性和服務效率。
世界教育發(fā)達國家紛紛將大數據運用于教育決策確立為提升教育核心競爭力的重大戰(zhàn)略,一方面通過制定教育數字化戰(zhàn)略,明確大數據在支撐教育治理方面的發(fā)展目標、任務和措施,加強頂層設計和協(xié)調推進;另一方面通過建設教育大數據平臺,整合教育數據資源,實現數據的采集、存儲、處理、分析、展示、共享、應用等全流程管理,為教育決策提供數據支撐和數據服務。例如美國國家教育統(tǒng)計中心、英國高等教育統(tǒng)計局和日本國立教育政策研究所等機構平臺,在規(guī)范管理與開放共享國家教育數據、輔助科學教育決策等方面發(fā)揮了重要作用。[3]
大數據環(huán)境下,整體現象的理解和把握需要通過對數據內部相互關系和非線性效應的深入研究,而非僅僅關注單個數據元素的行為。凱文·凱利在其著作《失控》中多次強調復雜系統(tǒng)理論的“涌現(emergence)”概念,用于描述在大量個體集聚時,個體之間的相互作用引發(fā)了整體新屬性或模式的現象。典型的例子包括蟻群和蜂群等,其中整體行為和性質不僅僅是個體行為的簡單疊加,而是由系統(tǒng)內部相互作用和非線性效應所塑造,與單個組成部分的行為迥然不同。[4] 不過,當數據規(guī)模達到一定程度時,自發(fā)產生的模式和規(guī)律并非直觀可見,需要通過大數據分析和挖掘技術,這些模式和規(guī)律方得以揭示。例如,“涌現”的教育治理趨勢、教師教學模式、學習者行為模式等現象,均可在大數據的深入挖掘中得以發(fā)現。
大數據服務支撐教育決策可以概括為四方面功能價值。
一是循數決策:數據驅動決策的范式已經取代了傳統(tǒng)的反應式處理方式,使教育決策者能夠以數據為基礎進行決策、管理和創(chuàng)新。海量的教育數據將治理變量轉變?yōu)榭山y(tǒng)計、可度量、可計算的對象,促使教育決策者主動挖掘數據價值,深入理解教育系統(tǒng)的運行情況,從而制定更為科學和有效的教育政策和措施。
二是智能決策:將大數據與人工智能技術相結合,可協(xié)助教育決策者更有效地處理和分析龐大的數據集,超越個體處理數據的極限。借助數學模型、仿真技術和數據融合等方法,能揭示出原本難以察覺的非線性關聯(lián),幫助決策者發(fā)現教育治理中潛在的變量和相關關系,消除因個人知識儲備的局限性和數據信息的滯后而造成的決策研究與教育實踐不匹配,[5] 從而超越傳統(tǒng)的憑經驗進行決策的范式,提高決策的科學性和準確性。
三是簡化決策:大數據處理的核心目標在于超越錯綜復雜的教育過程和現象,通過有效處理大規(guī)模的教育數據,挖掘數據背后的潛在內涵,并將其轉化為可解釋的信息,從而將龐大而復雜的數據集簡化為直觀易懂的規(guī)律模式,使決策者更全面地理解教育系統(tǒng)的運行情況,并迅速把握關鍵趨勢和問題。
四是協(xié)同治理:在大數據時代,教育決策已不再是單極化的過程,而是演變?yōu)橐粋€涉及多方利益相關者的協(xié)同治理過程。在教育決策領域,需要構建多元主體協(xié)同合作的制度體系,以明確各方的權利和義務范圍,形成權責一致的合作局面。[6] 大數據的流動和共享使得家長、社會組織以及公眾能夠積極參與到教育決策過程中,形成開放和協(xié)同的治理模式。
二、教育大數據應用的現狀與問題
黨的二十大首次將“推進教育數字化”寫進黨代會報告,作為國家教育數字化戰(zhàn)略行動的重要組成部分,教育部加快推進大數據支撐教育治理轉型升級,連續(xù)多年將提升數據支撐服務教育決策能力寫入教育部年度工作要點,2021年提出形成教育系統(tǒng)數據資源目錄和數據溯源圖譜,制定教育基礎數據標準規(guī)范,實現有序共享。[7] 2022年強調要提升數據治理、政務服務和協(xié)同監(jiān)管能力,并強化數據挖掘和分析,構建基于數據的教育治理新模式。[8] 教育部部長懷進鵬在世界數字教育大會上提出,要推動教育治理高效化、精準化,通過人工智能、大數據等技術應用,實現業(yè)務協(xié)同、流程優(yōu)化、結構重塑、精準管理,從而更好提升教育管理效率和教育決策科學化水平。
目前,教育大數據正逐步賦能政府決策全要素、全過程、全領域,使其從單一決策向綜合決策轉化,從孤立數據源向多元數據源轉化,從靜態(tài)數據分析向動態(tài)數據分析轉化,從封閉數據管理向開放數據共享轉化,其運用于教育決策的集中體現之一是構建各類教育決策服務系統(tǒng)。通過整合數據挖掘、機器學習等先進技術,教育決策服務系統(tǒng)能夠從大規(guī)模數據中識別模式、趨勢,為決策者提供科學、客觀的支持,從而推動教育治理水平的提升。
教育決策服務系統(tǒng)已有一些實踐探索。在教育部領導和支持下,“雙一流”建設動態(tài)監(jiān)測系統(tǒng)以及長三角教育現代化監(jiān)測評估系統(tǒng)等在一流大學建設、區(qū)域教育現代化推進等方面發(fā)揮了積極作用。“雙一流”建設動態(tài)監(jiān)測系統(tǒng)為國家“雙一流”建設提供了政策制定依據。長三角教育現代化監(jiān)測評估系統(tǒng)依據長三角三省一市統(tǒng)一的教育現代化指標體系,整合包括教育統(tǒng)計數據、教育行政填報數據、超過百萬份問卷調查數據和第三方權威數據等多源數據,建立數字化、智能化的監(jiān)測評估系統(tǒng),實現對大數據的挖掘和分析,服務長三角一市三省科學決策、精準施策,引導各級各類學校高質量發(fā)展。
當前教育大數據應用于教育決策仍面臨著不少問題和挑戰(zhàn)。
一是教育數據的開放性存在一系列困難。由于教育系統(tǒng)的復雜性,決策制定過程對大量數據的需求迫切。然而,數據安全與開放之間存在矛盾,開放數據存在信息不完整或缺失的問題,所公開的數據往往呈現出模糊和粗糙的特征,從而影響了大數據在教育決策中的應用效果。此外,數據滯后或更新不及時使得研究者難以及時獲取到最新的教育數據,直接影響并制約了大數據在教育決策中運用的準確性和有效性。
二是“數據孤島”問題在教育系統(tǒng)中較為明顯。各部門獨立開發(fā)數據系統(tǒng)導致數據分散存儲在各自獨立的數據庫中,部門間數據有效流動存在障礙,無法實現數據的集中管理和共享,呈現分散性、格式標準不一致以及權限和安全等問題,難以發(fā)揮其多維度的價值。
三是大數據高效處理面臨著巨大的挑戰(zhàn)。隨著數據規(guī)模的爆炸式增長、數據來源和類型的復雜多樣以及數據生成更新的高速性,已超過傳統(tǒng)數據處理軟硬件架構的承載能力。因此,滿足規(guī)模龐大、格式多樣、高速生成的大數據高效處理要求,成為大數據應用于教育決策的重要挑戰(zhàn)。
三、把握大數據支持教育決策的本質與核心
(一)思維模式的變革
思維模式的變革是大數據應用于教育決策的前提,為更全面、更靈活地理解和利用大數據奠定基礎。大數據研究專家舍恩伯格指出,在大數據時代,人們對待數據的思維方式將經歷三個關鍵變化:數據處理對象從樣本數據擴展到全部數據;由于涉及全部數據,人們不得不接受數據的混雜性,從而放棄對精確性的過度追求;逐漸放棄對因果關系的追求,而更關注相關關系的識別。[9]
提升教育治理現代化水平,應使決策過程從依靠經驗向基于證據的循證思維轉變,強化政策研究和決策的多主體協(xié)同意識、證據意識與大數據思維方式。傳統(tǒng)思維與大數據思維在多個方面存在顯著差異,包括數據來源和范圍、數據處理方式、決策速度和實時性,以及面向未知和創(chuàng)新的適應性等方面。
在數據來源和范圍方面,傳統(tǒng)思維主要依賴于有限的內外部數據,基于已有的經驗和知識;而大數據思維則注重整合和利用多源、多類型、多領域的數據,包括結構化和非結構化數據。
在數據處理方式方面,傳統(tǒng)思維使用有限、已知的數據樣本進行分析和決策,注重確定性和精確性,采用統(tǒng)計學和規(guī)則推理方法;而大數據思維關注海量、多樣化、高速產生的數據,強調從中提取有價值的信息和模式,借助數據挖掘、機器學習等技術進行分析和決策。
在決策速度和實時性方面,傳統(tǒng)思維主要基于歷史數據和固定模型進行分析,需要較長時間來收集、整理和分析數據;而大數據思維則通過對實時數據的快速處理和分析,使決策能夠更及時地基于當前情況和趨勢進行調整和優(yōu)化。
在面向未知和創(chuàng)新方面,傳統(tǒng)思維通過已有的模型和規(guī)則解決已知問題,對未知情況和新挑戰(zhàn)的適應性可能不足;而大數據思維注重從數據中發(fā)現新的模式、趨勢和關聯(lián),能夠更好地適應未知情況和創(chuàng)新需求,提供新的解決方案。
(二)數據收集和整合
在大數據及人工智能時代,教育數據的收集和整合呈現出顯著演變,體現在以下幾個方面。
一是多源數據。教育數據的采集范圍不再受限于傳統(tǒng)的學生信息系統(tǒng)和學校管理系統(tǒng),而涵蓋了學習管理系統(tǒng)、在線教育平臺、社交媒體數據、傳感器數據等多源數據。
二是實時數據采集。隨著傳感器技術的不斷發(fā)展和普及,教育數據的采集變得更加實時和準確,通過智能設備和傳感器,能夠實時獲取學生的學習行為、心理狀態(tài)、生理指標等數據。
三是自動化數據收集。人工智能技術的應用使教育數據的收集過程更加自動化和高效,自動化工具還能夠對大規(guī)模的學習數據進行快速處理和分析。
四是數據云存儲。云計算技術的興起為教育數據的存儲和管理提供了更加靈活和可擴展的解決方案。
五是跨系統(tǒng)數據整合。教育數據的整合不再受限于單一的數據系統(tǒng),而是實現了跨系統(tǒng)的整合,通過提升數據標準化和互操作性,不同系統(tǒng)中的數據能夠進行無縫集成和流動,實現多維度數據的整合分析。
(三)研究范式轉換
大數據的興起正引領科學研究的范式演變。有研究者認為,人類科學研究經歷了實驗科學、理論科學和計算科學三個范式的演變,目前正逐步進入“數據密集型科學”的第四研究范式。[10]
實驗科學階段以控制變量和觀察結果驗證假設為主,典型如鉆木取火和伽利略的實驗。理論科學階段側重于通過構建模型和推理解釋現象,代表性例子有牛頓的三大定律和麥克斯韋的電磁學。計算科學階段則以計算來模擬系統(tǒng)行為,包括電子計算機的發(fā)展、核試驗模擬和天氣預報等。
當前的“數據密集型科學”范式依賴于大數據技術和分析方法,旨在挖掘數據中的模式、關聯(lián)和趨勢。這一范式特別適用于那些基本原理不完備、缺乏原始先驗知識,但可以大量獲取真實數據的問題領域,通過對豐富的實際數據進行深入挖掘,為解決復雜問題提供了一種全新的、更貼近應用場景的研究途徑。在大數據的背景下,計算教育學、算法教育學等基于數據密集型研究范式的學科應運而生,傳統(tǒng)的教育管理與決策正在從以管理流程為主的線性范式逐漸向以數據為中心的扁平化范式轉變,教育管理與決策中各參與方的角色和相關信息流向更趨于多元與交互,為推動教育管理由“粗放式”向“精準化”轉變提供了機遇,也為實現我國教育治理現代化提供了重要契機。[11]
四、教育大數據運用于教育決策的未來走向
(一)認識大數據本身的局限
應當注意的是,大數據本身還存在多方面局限,包括不完整性、難以獲取性、不具代表性、飄移、算法干擾、臟數據以及敏感性等特性。[12]
大數據的不完整性表現為數據集中可能存在缺失、遺漏或不完備的信息,導致數據的整體性和完整性受到一定程度的影響。教育作為一門“人”的學科,數據永遠只能觸及教育的部分層面。在教育領域,通過局部信息難以實現整體認知,如無意識中發(fā)生的、頓悟的、休閑的、隱性的學習和教育活動都難以被記錄和保存。[13]
此外,大數據的難以獲取性涉及某些數據無法輕松獲取或收集,可能由于技術、法規(guī)或其他限制而造成數據采集的困難。大數據的不具代表性意味著數據集中的樣本可能無法充分反映整體群體的特征,存在一定的偏差。飄移問題指的是數據分布在時間或空間上的變化,使得在不同時期或不同地點采集的數據難以直接比較和推廣。算法干擾指由于復雜的算法運算導致數據結果的扭曲,使得分析者可能誤讀或誤解數據。臟數據表明數據集中存在錯誤、異常或不一致的數據,可能源于錄入錯誤、傳感器故障等因素。敏感性問題強調了大數據可能包含個人隱私和敏感信息,需要在使用和共享時嚴格考慮數據隱私和安全問題。
(二)避免過度依賴大數據
聯(lián)合國教科文組織《一起重新構想我們的未來:為教育打造新的社會契約》中提到,數字工具的廣泛應用為研究人員提供了前所未有的能力,使其能夠有效組織、綜合和處理比以往任何時候都更為龐大的教育數據集。然而,這種發(fā)展帶來了兩方面的影響,一是人們可能形成一種假設,即如果沒有大量的數據,就無法識別任何模式,沒有模式則沒有價值;二是人們更傾向于將數據,尤其是適合數字技術的可量化數據,視為最重要的知識形式。[14]
因此,正如使用任何工具一樣,研究人員有責任明確數字研究工具的潛在能力及其局限性,要在大數據運用于決策研究中形成重塑目的導向,從而超越數據的局限與假定。獲取更多的數據并不總是意味著更好或更精確的研究結果,其效果取決于研究的目的。特別是將大數據運用于教育決策,要以研究目的為中心,而非以工具為中心。研究人員應該對數字分析軟件所呈現的客觀性假設保持審慎,避免沉迷于其表面的客觀性而忽視了背后的潛在局限性。
(三)呼喚“社會學的想象力”
在大數據時代,迫切需要發(fā)揮“社會學的想象力”。僅僅依賴數據并不能自動導致教育決策的生成,連通大數據與教育決策之間關鍵的中介環(huán)節(jié)是“想象力”,即在專業(yè)經驗和思考的支持下形成的假設。
米爾斯強調,在抽象經驗主義的實踐中,對數據進行標準化的統(tǒng)計分析,僅僅是對已知數據的簡單操控,無法產生“具有歷史穿透力的社會科學”,真正需要的是一種特殊的心智品質,這種品質可以幫助人們運用信息,清晰地概括周邊世界的發(fā)展和自身可能面臨的挑戰(zhàn),通過運用這種想象力,原本心智活動范圍狹隘的個體往往會感到仿佛在一座原本熟悉的房子里幡然醒悟。[15] 因此,正如教育部提出的“方法重于技術、組織制度創(chuàng)新重于技術創(chuàng)新”的工作理念,數字化管理要避免“技術論”主導數字化。[16] 大數據支撐教育決策的功能發(fā)揮,亟待理論的先行引領。
(四)推動教育大數據支撐服務教育強國建設
新時代新征程,要深入貫徹落實黨的二十大對教育、科技、人才工作的統(tǒng)籌部署,全面把握建設教育強國的要求,發(fā)揮我國制度優(yōu)勢,有效整合教育內外相關數據信息,充分利用先進技術和智能化手段,以教育數字化轉型加速推進大國教育治理的智能化,支撐服務教育強國建設。
一是加強教育大數據標準化建設。建立覆蓋教育管理信息化工作各要素的工作制度,明確信息系統(tǒng)、教育數據、管理服務等方面的管理要求,規(guī)范數據采集、存儲傳輸、使用處理等全生命周期的數據活動,建立完備的數據標準體系,進一步完善技術、服務和質量標準。
二是聚焦決策應用場景,提升服務應用能級。充分利用深度學習、預訓練內容生成式AI等前沿技術和解決方案拓展動態(tài)監(jiān)測、統(tǒng)計分析、趨勢研判、效果評估、預警預報、風險防控等應用場景,為政府部門提供更全面、更精準、更實時的決策支撐。
三是建立教育大數據共享融合機制。堅持以共享為原則、不共享為例外,推動教育數據廣泛共享,建立數據共享審核制度,明確各類數據共享屬性和范圍,規(guī)范數據共享工作流程,依托國家智慧教育公共服務平臺,建設教育數據共享開放模塊功能,實現數據動態(tài)匯聚和實時更新,穩(wěn)步推進跨部門數據共享及社會公開,促進數據的開發(fā)利用。
四是提升教育決策主體的數據素養(yǎng)。通過加強教育管理者、教師和學生的數據教育和培訓,提升其數據意識、數據能力、數據責任、隱私和保密意識,使其能夠有效獲取、分析、利用和保護數據。
五是加強大數據在教育決策中的應用。將大數據支撐教育決策作為強國建設的一項戰(zhàn)略性舉措,健全大數據支撐、輔助教育決策的相關機制。教育行政部門和各級教育決策機構要借助于各種應用場景,善于科學運用大數據進行研判,從而全面提升教育決策科學化水平。
注釋:
[1] Volume of data/information created,captured,copied,and consumed worldwide from 2010 to 2020,with forecasts from 2021 to 2025. [EB/OL]. https://www.statista.com/statistics/871513/worldwide-data-created/
[2] Laney,D.(2001). 3D Data Management:Controlling Data Volume,Velocity,and Variety. META Group.
[3] 劉博文,吳永和,肖玉敏,等. 構筑大數據時代教育數據的新生態(tài)——國內外國家級教育數據機構的現狀與反思[J]. 開放教育研究,2019,25(03):103-112.
[4] Kevin Kelly. Out of Control:The New Biology of Machines,Social Systems,and the Economic World[M]. New Jersey:Addison-Wesley,1994.
[5] 王加祥. 基于大數據的教育宏觀決策信息化智庫構建研究[J]. 智庫理論與實踐,2021,6(05):86-94.
[6] 梁鵬,李大衛(wèi). 大數據推動教育治理的愿景、技術風險與應對[J]. 教育科學探索,2023,41(02):74-80.
[7] 中華人民共和國教育部. 教育部2021年工作要點[EB/OL]. http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/202102/t20210203_512419.html.
[8] 中華人民共和國教育部. 教育部2022年工作要點[EB/OL]. http://www.moe.gov.cn/jyb_sjzl/moe_164/202202/t20220208_597666.html.
[9] 邁耶-舍恩伯格. 大數據時代[M]. 杭州:浙江人民出版社. 2012.
[10] Jim Gray on eScience:A Transformed Scientific Method.[EB/OL]. https://languagelog.ldc.upenn.edu/myl/JimGrayOnE-Science.pdf
[11] 劉三女牙,楊宗凱,李卿. 計算教育學:內涵與進路[J]. 教育研究,2020,41(03):152-159.
[12] 薩爾加尼克. 計算社會學:數據時代的社會研究[M]. 北京:中信出版集團. 2019.
[13] 譚維智.計算社會科學時代需要什么教育學——兼與《計算教育學:內涵與進路》作者商榷[J]. 教育研究,2020,41(11):46-60.
[14] 聯(lián)合國教科文組織. 一起重新構想我們的未來[M]. 北京:教育科學出版社. 2022.
[15] C.賴特·米爾斯. 社會學的想象力[M]. 北京:北京師范大學出版社. 2017.
[16] 許韜,李宇航,代東旭. 高等教育數字化的理論檢視、現實挑戰(zhàn)與進階路徑[J]. 中國高等教育,2023(23).
(桑標 作者系上海市教育科學研究院院長、教授,教育部“教育大數據與教育決策”實驗室主任)
《人民教育》2024年第2期
工信部備案號:京ICP備05071141號
互聯(lián)網新聞信息服務許可證 10120170024
中國教育報刊社主辦 中國教育新聞網版權所有,未經書面授權禁止下載使用
Copyright@2000-2022 bet39696.cc All Rights Reserved.