學(xué)習(xí)者走出學(xué)習(xí)資源迷航的探討
時(shí)間:2023-04-28 15:36:33
導(dǎo)語:學(xué)習(xí)者走出學(xué)習(xí)資源迷航的探討一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:以MOOCs為代表的在線課程為學(xué)習(xí)者提供了多模態(tài)海量的學(xué)習(xí)資源,但學(xué)習(xí)者在選擇資源時(shí)也經(jīng)常面臨信息過載、資源內(nèi)容與學(xué)習(xí)需求不匹配等問題,造成學(xué)習(xí)資源迷航的困境。如何高效精準(zhǔn)地向?qū)W習(xí)者推薦合適的學(xué)習(xí)資源與自適應(yīng)的學(xué)習(xí)路徑,已成為當(dāng)前教育信息化亟待解決的問題。基于學(xué)習(xí)者畫像的個性化學(xué)習(xí)資源推薦模型,從個性化資源推薦的現(xiàn)實(shí)需求出發(fā),以現(xiàn)代教育理論和數(shù)字技術(shù)為支撐,探究個性化學(xué)習(xí)資源推薦過程中,學(xué)習(xí)者的狀態(tài)與學(xué)習(xí)需求等個性化特征診斷、學(xué)習(xí)資源自身屬性特征參數(shù)挖掘與表征、學(xué)習(xí)資源與學(xué)習(xí)需求精準(zhǔn)匹配等問題,旨在向?qū)W習(xí)個體和學(xué)習(xí)群體推薦個性化學(xué)習(xí)資源。將基于學(xué)習(xí)者畫像的個性化學(xué)習(xí)資源推薦模型應(yīng)用于教學(xué)實(shí)踐,結(jié)果表明,與基于協(xié)同過濾推薦、DINA認(rèn)知診斷推薦相比,該學(xué)習(xí)資源推薦模型具有更高的精準(zhǔn)度和更優(yōu)的可解釋性,能夠?yàn)椴煌瑢W(xué)習(xí)需求的學(xué)習(xí)者推薦適切的學(xué)習(xí)資源;同時(shí)該模型也在一定程度上緩解了冷啟動與數(shù)據(jù)稀疏性等問題。
關(guān)鍵詞:在線開放課程;學(xué)習(xí)者畫像;學(xué)習(xí)資源;深度學(xué)習(xí);推薦模型;數(shù)字化
一、研究背景
隨著教育信息化進(jìn)程的不斷推進(jìn),國家不斷從頂層架構(gòu)層面出臺系列政策文件,支持個性化的自適性服務(wù),如《教育信息化十年發(fā)展規(guī)劃(2011—2020年)》提出“努力為每一名學(xué)生和學(xué)習(xí)者提供個性化學(xué)習(xí)、終身學(xué)習(xí)的信息化環(huán)境和服務(wù)”;[1]《教育信息化2.0行動計(jì)劃》提出要“探索在信息化條件下實(shí)現(xiàn)差異化教學(xué)、個性化學(xué)習(xí)、精細(xì)化管理、智能化服務(wù)的典型途徑”;[2]《中國教育現(xiàn)代化2035》提出要“利用現(xiàn)代化技術(shù)加快推動人才培養(yǎng)模式改革,實(shí)現(xiàn)規(guī)模化教育與個性化培養(yǎng)的有機(jī)結(jié)合”。[3]提供個性化的教育服務(wù)是我國現(xiàn)階段教育現(xiàn)代化的重要任務(wù)之一。近年來,隨著新一代信息技術(shù)與教育行業(yè)的深度融合發(fā)展,以慕課為代表的在線開放課程為學(xué)習(xí)者提供了海量的學(xué)習(xí)資源。然而,學(xué)習(xí)者在海量學(xué)習(xí)資源中也常常面臨信息過載、資源內(nèi)容與學(xué)習(xí)需求不匹配等問題,造成資源迷航的困境。因此,如何高效精準(zhǔn)地向?qū)W習(xí)者推薦合適的學(xué)習(xí)資源與自適應(yīng)的學(xué)習(xí)路徑,已成為當(dāng)前教育信息化亟待解決的問題。本研究以教育大數(shù)據(jù)、數(shù)據(jù)挖掘等技術(shù)為支撐,從學(xué)習(xí)者基本信息、知識掌握情況、學(xué)習(xí)行為等維度,構(gòu)建學(xué)習(xí)者畫像并對其知識掌握情況進(jìn)行診斷,同時(shí)結(jié)合學(xué)習(xí)者的個性化特征和學(xué)習(xí)行為特點(diǎn)向其推薦適切的學(xué)習(xí)資源,促進(jìn)其學(xué)習(xí)效率和學(xué)習(xí)成效雙提升。
二、個性化學(xué)習(xí)資源推薦研究現(xiàn)狀
(一)概念界定
“個性化推薦”概念最早由Resnick和Varian提出,認(rèn)為個性化推薦是根據(jù)用戶的個性化需求,利用計(jì)算機(jī)系統(tǒng)向其推薦相關(guān)信息。[4]姜強(qiáng)等認(rèn)為個性化學(xué)習(xí)資源推薦是基于對學(xué)習(xí)者認(rèn)知風(fēng)格等個性化特征和知識掌握情況等綜合分析后,將學(xué)習(xí)資源進(jìn)行重組排序,從而使學(xué)習(xí)資源更適合學(xué)習(xí)者的認(rèn)知能力與學(xué)習(xí)風(fēng)格,幫助學(xué)習(xí)者進(jìn)行知識構(gòu)建。[5]趙晉認(rèn)為個性化學(xué)習(xí)資源推薦是在明確學(xué)習(xí)者學(xué)習(xí)需求和偏好的前提下,根據(jù)用戶對資源的評價(jià)信息,對學(xué)習(xí)資源進(jìn)行多維度優(yōu)先級排序,再向?qū)W習(xí)者進(jìn)行推薦。[6]趙蔚等認(rèn)為個性化學(xué)習(xí)資源推薦是根據(jù)學(xué)習(xí)者特性、需求向其呈現(xiàn)適切的學(xué)習(xí)資源與學(xué)習(xí)路徑,從而促進(jìn)其學(xué)習(xí)目標(biāo)達(dá)成。[7]盡管國內(nèi)外學(xué)者對個性化學(xué)習(xí)資源推薦的內(nèi)涵進(jìn)行了多種描述,但其核心要義是一致的,即個性化學(xué)習(xí)資源推薦主要包括三個核心內(nèi)容:學(xué)習(xí)者特征、推薦對象和推薦算法。學(xué)習(xí)者特征是根據(jù)學(xué)習(xí)者的基本信息、學(xué)習(xí)行為挖掘出其學(xué)習(xí)風(fēng)格、偏好和學(xué)習(xí)需求并進(jìn)行參數(shù)化表示;推薦對象包含MOOCs視頻、文本等學(xué)習(xí)資源和學(xué)習(xí)路徑,同時(shí)需要將其進(jìn)行參數(shù)化表示;推薦算法是指根據(jù)學(xué)習(xí)者的個性化需求特征和推薦對象之間的關(guān)系,向?qū)W習(xí)者推送適切的學(xué)習(xí)資源,以提高其學(xué)習(xí)成效。因此,推薦算法是銜接兩者的重要橋梁。
(二)推薦算法及模型構(gòu)建
1.推薦算法
常用個性化學(xué)習(xí)資源推薦算法包括內(nèi)容推薦、[8]協(xié)同過濾推薦、[9]混合推薦三種,[10]其中協(xié)同過濾推薦算法應(yīng)用最為廣泛。協(xié)同過濾推薦算法是通過分析與目標(biāo)用戶相似的用戶進(jìn)行推薦,即找到與目標(biāo)用戶相似的用戶群組,將相似用戶偏好的學(xué)習(xí)資源、學(xué)習(xí)路徑等推薦給目標(biāo)用戶。EduRank利用協(xié)同過濾推薦算法篩選出與目標(biāo)學(xué)生相似度最高的學(xué)生,然后將相似學(xué)生的學(xué)習(xí)內(nèi)容、練習(xí)試題、學(xué)習(xí)路徑等推薦給目標(biāo)學(xué)習(xí)者。[11]姜強(qiáng)等將具有相同或相近知識結(jié)構(gòu)水平、學(xué)習(xí)偏好的學(xué)習(xí)者進(jìn)行分類,并進(jìn)行學(xué)習(xí)者特征與學(xué)習(xí)對象媒體類型、理解等級、難度級別的匹配計(jì)算,從而生成精準(zhǔn)個性化學(xué)習(xí)路徑,為差異化教學(xué)提供了新思路。[12]趙寧對協(xié)同過濾推薦算法進(jìn)行了優(yōu)化,充分利用學(xué)習(xí)者的用戶屬性信息,計(jì)算學(xué)習(xí)者之間的相似性并形成最佳的鄰居集合,進(jìn)而向目標(biāo)用戶推薦與其興趣愛好相近的鄰居所評價(jià)過的學(xué)習(xí)資源。[13]近年來,隨著云計(jì)算和大數(shù)據(jù)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的推薦算法逐漸興起。基于深度學(xué)習(xí)的推薦算法主要是通過對數(shù)據(jù)樣本進(jìn)行訓(xùn)練、提取特征屬性來提升預(yù)測或分類的準(zhǔn)確性。蘭明祥利用深度神經(jīng)網(wǎng)絡(luò)技術(shù)設(shè)計(jì)了基于相似度排序的資源過濾算法,從而向?qū)W習(xí)者進(jìn)行個性化推薦。[14]文孟飛等利用深度學(xué)習(xí)和支持向量機(jī)(SupportVectorMachine,SVM)相結(jié)合的方式進(jìn)行視頻學(xué)習(xí)資源的個性化推薦,從而大大提高了視頻資源的獲取率和利用率。[15]任蓓蓓等人通過深度學(xué)習(xí)挖掘用戶特征、時(shí)間關(guān)系、資源參數(shù)之間的關(guān)系,大大提高了學(xué)習(xí)者與資源間的匹配度,從而實(shí)現(xiàn)了數(shù)字圖書館資源的個性化推薦。[16]
2.模型或系統(tǒng)構(gòu)建
目前個性化學(xué)習(xí)資源推薦模型主要有基于協(xié)同過濾算法的傳統(tǒng)模型、矩陣分解模型、邏輯回歸模型、特征交叉模型和深度神經(jīng)網(wǎng)絡(luò)推薦模型等。JieLu等人開發(fā)了在線學(xué)習(xí)資料個性化推薦系統(tǒng),通過學(xué)習(xí)者歷史瀏覽數(shù)據(jù),挖掘其偏好模型并引入內(nèi)容過濾,優(yōu)化了推薦效果。[17]王曉東等將學(xué)習(xí)者的學(xué)習(xí)水平和學(xué)習(xí)風(fēng)格等特征融入推薦過程,構(gòu)建了學(xué)習(xí)者和學(xué)習(xí)資源知識相融合的學(xué)習(xí)資源推薦模型,其個性化與精準(zhǔn)度超過了傳統(tǒng)的協(xié)同過濾算法。[18]李浩等針對移動學(xué)習(xí)時(shí)間碎片化、學(xué)習(xí)環(huán)境動態(tài)性等特點(diǎn),設(shè)計(jì)了基于學(xué)習(xí)者時(shí)空特征的移動學(xué)習(xí)資源推薦模型,有效解決了由于學(xué)習(xí)用戶數(shù)據(jù)量過大而導(dǎo)致的用戶相似度計(jì)算過慢的問題,提高了移動學(xué)習(xí)情境下學(xué)習(xí)資源推薦的精準(zhǔn)度。[19]王奕利用概率矩陣分解模型,從用戶圖書借閱歷史記錄中學(xué)習(xí)低維的近似矩陣,從而實(shí)現(xiàn)個性化的圖書推薦。[20]常詩卉在內(nèi)容推薦和協(xié)同過濾推薦策略的基礎(chǔ)上,融合邏輯回歸精排序模型,并添加交叉特征,以此提升推薦結(jié)果的個性化程度。[21]字云飛等提出了一種基于多用戶—項(xiàng)目結(jié)合的深度神經(jīng)網(wǎng)絡(luò)個性化推薦模型,該模型利用深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)、抽取數(shù)據(jù)特征,再融合協(xié)同過濾中的廣泛個性化產(chǎn)生候選集,然后通過二次模型學(xué)習(xí)產(chǎn)生排序集,實(shí)現(xiàn)精準(zhǔn)、實(shí)時(shí)、個性化推薦。[22]近年來,基于認(rèn)知診斷模型(CognitiveDiagnosisModlels,CDMs)的個性化學(xué)習(xí)資源推薦備受關(guān)注。認(rèn)知診斷模型是基于項(xiàng)目反應(yīng)理論(ItemResponseTheory,IRT)框架并融入認(rèn)知變量,對學(xué)習(xí)者的認(rèn)知過程、知識加工技能或知識結(jié)構(gòu)等方面進(jìn)行診斷與評價(jià)。當(dāng)前常用的認(rèn)知診斷模型主要有規(guī)則空間模型(RulesSpaceModel)、決定型輸入、噪聲與門模型(DeterministicInputs,NoisyandGateModel,DINA)、融合模型(FusionModel,F(xiàn)M)、多維項(xiàng)目反應(yīng)理論模型(MultidimentionalItemResponseTheory,MIRT)等。[23]其中,DINA模型最為經(jīng)典,應(yīng)用也最為廣泛。DINA模型利用學(xué)習(xí)者的答題歷史記錄,引入試題—知識點(diǎn)關(guān)聯(lián)矩陣(QuestionKnowledgematrix,簡稱Q矩陣),將學(xué)生的認(rèn)知狀態(tài)建模為一個多維的知識點(diǎn)掌握向量,建模得到的認(rèn)知狀態(tài)具有極高的可解釋性。趙宇丹提出基于DINA模型的教師認(rèn)知診斷模型,通過引入潛變量和滑動矩陣,使DINA模型能夠?qū)崿F(xiàn)多級評分,從而為學(xué)習(xí)者提供個性化學(xué)習(xí)資源。[24]李全等基于學(xué)生知識點(diǎn)掌握信息,利用DINA認(rèn)知診斷模型對學(xué)生、試題和知識點(diǎn)三者信息進(jìn)行聯(lián)合概率矩陣分解,最后根據(jù)難度范圍進(jìn)行試題推薦。[25]另外,基于圖模型的個性化推薦是近期業(yè)界和學(xué)界的研究熱點(diǎn)。[26][27]綜上,基于協(xié)同過濾推薦算法的推薦能夠有效降低模型構(gòu)建的復(fù)雜性,但存在忽略學(xué)習(xí)個體的知識點(diǎn)掌握情況和知識點(diǎn)之間存在的關(guān)系,且存在矩陣稀疏和冷啟動等問題。基于深度學(xué)習(xí)的推薦能夠有效降低學(xué)習(xí)資源推薦過程中對模型的依賴性,但存在對推薦結(jié)果的解釋性不強(qiáng)等問題。基于DINA認(rèn)知診斷的推薦能夠以多維向量準(zhǔn)確反映學(xué)習(xí)者的知識掌握情況,具有較好的可解釋性,但由于只關(guān)注個體學(xué)習(xí)狀態(tài)診斷,忽視相似學(xué)習(xí)者的共性特征,對數(shù)據(jù)隱含的信息挖掘不夠等,容易造成建模模型過大和誤差偏大等問題。為克服上述不足,借鑒協(xié)同過濾推薦算法和DINA認(rèn)知診斷推薦模型,本研究構(gòu)建了基于學(xué)習(xí)者畫像的個性化學(xué)習(xí)資源推薦模型,該模型基于學(xué)習(xí)者畫像動態(tài)獲取學(xué)習(xí)需求,根據(jù)學(xué)習(xí)者個性化參數(shù)、學(xué)習(xí)資源參數(shù)等信息匹配,計(jì)算出適合學(xué)習(xí)者當(dāng)前學(xué)習(xí)需求和偏好的資源推送給學(xué)習(xí)者,大大提高了推薦結(jié)果的準(zhǔn)確性與可解釋性。
三、基于學(xué)習(xí)者畫像的個性化學(xué)習(xí)資源推薦模型構(gòu)建
在學(xué)習(xí)者畫像個性化學(xué)習(xí)資源推薦模型中,學(xué)習(xí)者畫像是個性化推薦模型的基礎(chǔ),通過畫像診斷出學(xué)習(xí)者的認(rèn)知水平和未掌握的知識點(diǎn);通過畫像挖掘提取出學(xué)習(xí)者學(xué)習(xí)風(fēng)格與偏好。學(xué)習(xí)資源匹配計(jì)算模塊是個性學(xué)習(xí)資源推薦模型的核心,通過多個參數(shù)(未掌握的知識點(diǎn)、“知識點(diǎn)—學(xué)習(xí)資源”關(guān)系、學(xué)習(xí)風(fēng)格與偏好等)精準(zhǔn)匹配,計(jì)算并篩選出適合學(xué)習(xí)者當(dāng)前認(rèn)知水平與學(xué)習(xí)偏好的各類學(xué)習(xí)資源。學(xué)習(xí)資源推薦模塊根據(jù)相應(yīng)的策略向?qū)W習(xí)者個體、學(xué)習(xí)群體推薦適切的學(xué)習(xí)資源(見圖1)。
一)學(xué)習(xí)者畫像構(gòu)建
學(xué)習(xí)者畫像概念源于商業(yè)領(lǐng)域的“用戶畫像”。用戶畫像最初由庫珀(AlanCooper)提出,是對用戶的基本屬性、偏好特征、行為特點(diǎn)等用戶數(shù)據(jù)進(jìn)行語義化的標(biāo)簽表示,其對用戶全貌進(jìn)行刻畫、細(xì)化用戶特征,能夠?yàn)槠髽I(yè)實(shí)現(xiàn)精準(zhǔn)化服務(wù)提供管理決策參考。[28]用戶畫像技術(shù)最初在醫(yī)療、商業(yè)等領(lǐng)域有著廣泛的應(yīng)用,改進(jìn)了產(chǎn)品服務(wù)質(zhì)量與提升用戶體驗(yàn)。近年來,隨著學(xué)習(xí)分析、人工智能等技術(shù)在教育領(lǐng)域的深度應(yīng)用,用戶畫像概念與技術(shù)也被引入教育領(lǐng)域。學(xué)習(xí)者畫像的本質(zhì)在于收集學(xué)習(xí)者基本屬性數(shù)據(jù)、學(xué)習(xí)過程全樣本數(shù)據(jù),并對這些數(shù)據(jù)進(jìn)行處理分析,從而生成數(shù)字化標(biāo)簽和知識體系。學(xué)習(xí)者畫像構(gòu)建流程通常包含明確畫像目標(biāo)、數(shù)據(jù)采集與處理、構(gòu)建標(biāo)簽體系、生成學(xué)習(xí)者畫像庫、畫像服務(wù)輸出五個階段(見圖2)。當(dāng)然,針對不同的畫像目標(biāo),畫像建模的維度也不盡相同。本研究構(gòu)建學(xué)習(xí)者畫像的目標(biāo)是對學(xué)習(xí)者學(xué)習(xí)狀態(tài)進(jìn)行精準(zhǔn)識別、對學(xué)習(xí)者的認(rèn)知水平進(jìn)行精準(zhǔn)診斷,以便后期對學(xué)習(xí)者進(jìn)行個性化學(xué)習(xí)資源推薦。本研究主要從學(xué)習(xí)者基本屬性、知識掌握情況、學(xué)習(xí)行為三個維度構(gòu)建學(xué)習(xí)者畫像,由于本研究團(tuán)隊(duì)在《基于學(xué)習(xí)者畫像的在線開放課程學(xué)習(xí)預(yù)警研究》一文中,曾對學(xué)習(xí)者畫像的構(gòu)建流程做過詳細(xì)表述,[29]因此,這里主要介紹學(xué)習(xí)者畫像標(biāo)簽體系的構(gòu)建流程(見圖3)。
1.原始數(shù)據(jù)采集
全面持續(xù)采集學(xué)習(xí)者全樣本數(shù)據(jù)是學(xué)習(xí)者畫像構(gòu)建的基礎(chǔ)。原始數(shù)據(jù)采集主要是采集學(xué)習(xí)者基本信息、歷史學(xué)業(yè)數(shù)據(jù)、學(xué)習(xí)過程數(shù)據(jù)和學(xué)習(xí)結(jié)果數(shù)據(jù)等。考慮到線下實(shí)體課堂中師生教學(xué)互動等行為數(shù)據(jù)的采集存在諸多條件限制,本研究暫且僅對線上課堂數(shù)據(jù)進(jìn)行全面采集。其中,基本信息數(shù)據(jù)包括學(xué)習(xí)者的人口屬性、部分學(xué)習(xí)風(fēng)格等數(shù)據(jù),主要通過在線開放課程用戶注冊、調(diào)查問卷等進(jìn)行采集;歷史學(xué)業(yè)數(shù)據(jù)主要通過學(xué)校學(xué)業(yè)綜合成績管理信息系統(tǒng)進(jìn)行采集;學(xué)習(xí)過程數(shù)據(jù)包括在線開放課程學(xué)習(xí)過程中教與學(xué)行為數(shù)據(jù)、教學(xué)管理數(shù)據(jù)等,即師生或生生互動數(shù)據(jù)、論壇交流、探究過程等數(shù)據(jù);學(xué)習(xí)結(jié)果數(shù)據(jù)包括學(xué)習(xí)者在線做練習(xí)、在線即時(shí)測評和期末終結(jié)性考核評價(jià)等數(shù)據(jù)。
2.事實(shí)標(biāo)簽處理
事實(shí)標(biāo)簽處理是對原始數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。這里的事實(shí)標(biāo)簽主要指靜態(tài)事實(shí)標(biāo)簽,包括學(xué)習(xí)者基本信息、學(xué)習(xí)風(fēng)格類型等,具有穩(wěn)定性。比如,學(xué)習(xí)風(fēng)格反映學(xué)習(xí)者如何感知學(xué)習(xí)環(huán)境并做出交互行為,可以使用Felder-Silverman量表從信息感知(感悟型、直覺型)、信息輸入(視覺型、言語型)、信息加工(活躍型、沉思型)和內(nèi)容理解(序列型、綜合型)四個方面對學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進(jìn)行量化與統(tǒng)計(jì),[30]也可以通過對學(xué)習(xí)者查閱學(xué)習(xí)資源類型、學(xué)習(xí)時(shí)長、瀏覽資源次數(shù)、論壇發(fā)帖或回帖數(shù)量、做練習(xí)次數(shù)與時(shí)長、測評成績與時(shí)長等方面的學(xué)習(xí)行為數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。
3.模型標(biāo)簽處理
模型標(biāo)簽處理是在靜態(tài)事實(shí)標(biāo)簽處理的基礎(chǔ)上進(jìn)行建模分析。可以從學(xué)習(xí)者的課堂出勤、互動、資源利用、探究過程等方面,對學(xué)習(xí)者的學(xué)習(xí)投入度、參與度進(jìn)行標(biāo)簽化處理;可以從學(xué)習(xí)行為軌跡、課堂互動、作業(yè)按時(shí)完成等方面,對學(xué)習(xí)者的學(xué)習(xí)拖延與輟課風(fēng)險(xiǎn)進(jìn)行標(biāo)簽化處理;可以通過練習(xí)效果與完成時(shí)間、即時(shí)測評成績等方面,對學(xué)習(xí)者知識掌握情況進(jìn)行標(biāo)簽化處理。值得注意的是,人口屬性、學(xué)習(xí)偏好等標(biāo)簽指標(biāo)基本保持穩(wěn)定,不需要做過多的處理。
4.預(yù)測標(biāo)簽處理
預(yù)測標(biāo)簽處理是從模型標(biāo)簽庫中根據(jù)具體需要抽取某些標(biāo)簽對學(xué)習(xí)者某一方面情況進(jìn)行預(yù)測,如抽取學(xué)習(xí)投入度、參與度、學(xué)習(xí)滿意度等模型標(biāo)簽并進(jìn)行分析,可以對學(xué)習(xí)者的輟課情況進(jìn)行預(yù)測;抽取知識點(diǎn)掌握風(fēng)險(xiǎn)評估、學(xué)習(xí)滿意度、學(xué)習(xí)偏好等標(biāo)簽分析,可以預(yù)測學(xué)習(xí)者的掌握情況和學(xué)習(xí)新需求;抽取學(xué)習(xí)行為風(fēng)險(xiǎn)評估、學(xué)習(xí)投入度等標(biāo)簽可以預(yù)測學(xué)習(xí)者的學(xué)習(xí)拖延概率;抽取學(xué)習(xí)投入度、參與度、學(xué)習(xí)偏好等標(biāo)簽對學(xué)習(xí)者進(jìn)行群體聚類分析,可以預(yù)測不同學(xué)習(xí)群體的學(xué)習(xí)新需求等。通過上述標(biāo)簽體系構(gòu)建流程,本研究最終根據(jù)畫像目標(biāo)構(gòu)建出學(xué)習(xí)群體畫像和學(xué)習(xí)個體畫像。
(二)基于學(xué)習(xí)者畫像確定未掌握的知識點(diǎn)
學(xué)習(xí)者畫像中全程記錄了學(xué)習(xí)者的學(xué)習(xí)過程和學(xué)習(xí)結(jié)果,特別是對學(xué)習(xí)者做練習(xí)、測評、資源學(xué)習(xí)、探究互動等學(xué)習(xí)行為和學(xué)習(xí)結(jié)果做了詳細(xì)記錄并進(jìn)行了深度剖析。通過抽取學(xué)習(xí)者參與度、投入度、知識掌握等標(biāo)簽生成畫像,挖掘?qū)W習(xí)者做練習(xí)、即時(shí)測驗(yàn)和終結(jié)性測驗(yàn)等數(shù)據(jù),診斷出學(xué)習(xí)者知識點(diǎn)的掌握水平。學(xué)習(xí)者對某個知識點(diǎn)的掌握水平可以分為基本認(rèn)知(L1)、夯實(shí)基礎(chǔ)(L2)和拓展應(yīng)用(L3)三個級別。其中總分設(shè)定為1,基本認(rèn)知水平表示學(xué)習(xí)者對該知識點(diǎn)有了基本的理解,其評分為(0-0.6)之間;夯實(shí)基礎(chǔ)水平表示學(xué)習(xí)者對該知識點(diǎn)有了較好的掌握,其評分為[0.6-0.8)之間;拓展應(yīng)用水平表示學(xué)習(xí)者已經(jīng)很好地掌握了該知識點(diǎn),并且可以將知識進(jìn)行遷移應(yīng)用,其評分為[0.8-1)之間。根據(jù)學(xué)習(xí)者對某個知識點(diǎn)掌握水平(L1、L2、L3),下游推薦學(xué)習(xí)資源時(shí)對應(yīng)匹配資源的內(nèi)容類型(R1:概念理解,R2:知識鞏固,R3:綜合應(yīng)用)。通過學(xué)習(xí)者畫像可以將學(xué)習(xí)者未掌握的所有知識點(diǎn)篩選出來,形成待學(xué)習(xí)知識點(diǎn)列表。
(三)學(xué)習(xí)資源匹配計(jì)算
在學(xué)習(xí)資源與學(xué)習(xí)需求匹配計(jì)算前,首先需要構(gòu)建課程知識體系,然后標(biāo)注“知識點(diǎn)—學(xué)習(xí)資源”間的關(guān)聯(lián)關(guān)系。知識點(diǎn)是課程知識體系中最基本的單元,也是教與學(xué)過程中傳遞教學(xué)信息的最小單元。每個知識點(diǎn)都有相關(guān)屬性,且知識點(diǎn)之間也存在一定的關(guān)聯(lián)。以數(shù)據(jù)結(jié)構(gòu)課程為例,該課程學(xué)習(xí)內(nèi)容邏輯性較強(qiáng),且偏重實(shí)踐應(yīng)用,同時(shí)還需面向社會人群提供學(xué)習(xí)服務(wù),所以首先應(yīng)確定數(shù)據(jù)結(jié)構(gòu)課程知識構(gòu)建的目標(biāo)和知識點(diǎn)范圍,并對知識點(diǎn)進(jìn)行分類;然后根據(jù)知識管理理論和數(shù)學(xué)領(lǐng)域知識層次結(jié)構(gòu)思想,采用自上向下的設(shè)計(jì)方法,在課程開發(fā)專家指導(dǎo)下反復(fù)論證構(gòu)建出樹狀層級結(jié)構(gòu)課程知識體系。通常情況下,知識點(diǎn)與學(xué)習(xí)資源之間是一對多的關(guān)系。由于數(shù)據(jù)結(jié)構(gòu)課程知識點(diǎn)以及學(xué)習(xí)資源比較豐富且類型多樣,本研究采用人工標(biāo)注+機(jī)器學(xué)習(xí)標(biāo)注相結(jié)合的方式,對知識點(diǎn)與學(xué)習(xí)資源之間的關(guān)系進(jìn)行標(biāo)注。同時(shí),學(xué)習(xí)資源本身也包含了難度水平、關(guān)聯(lián)程度(與知識點(diǎn)關(guān)聯(lián)度、與其他學(xué)習(xí)資源關(guān)聯(lián)程度)、媒介類型(文本、圖片、音視頻)和內(nèi)容類型(概念理解、知識鞏固、綜合應(yīng)用)等信息。通過標(biāo)注,在知識點(diǎn)與學(xué)習(xí)資源兩者之間建立基于語義的深層映射關(guān)系,為后續(xù)根據(jù)學(xué)習(xí)者某個知識點(diǎn)的掌握程度進(jìn)行個性化學(xué)習(xí)資源推薦做好鋪墊。將學(xué)習(xí)者的知識掌握水平、學(xué)習(xí)風(fēng)格、知識點(diǎn)—學(xué)習(xí)資源關(guān)聯(lián)關(guān)系三個變量因素輸入到學(xué)習(xí)資源匹配計(jì)算模塊中,與課程資源池中的學(xué)習(xí)資源進(jìn)行匹配計(jì)算,進(jìn)而將篩選出來的學(xué)習(xí)資源推薦給學(xué)習(xí)者。
(四)個性化學(xué)習(xí)資源推薦
1.學(xué)習(xí)個體個性化學(xué)習(xí)資源推薦
具體推薦流程如下:步驟一是診斷個體知識點(diǎn)掌握水平,確定未掌握知識點(diǎn)。基于學(xué)習(xí)者畫像從學(xué)習(xí)者做練習(xí)、即時(shí)測評、學(xué)習(xí)行為軌跡等數(shù)據(jù)中精確診斷出學(xué)習(xí)者對知識點(diǎn)的掌握水平,明確每個知識點(diǎn)的綜合評分(0-1之間,每個知識點(diǎn)總分設(shè)為1,綜合評分越接近1表示該知識點(diǎn)掌握越好);然后根據(jù)知識點(diǎn)類型及難易程度,設(shè)定知識點(diǎn)達(dá)標(biāo)閾值,當(dāng)學(xué)習(xí)者某知識點(diǎn)綜合評分小于該閾值時(shí),則認(rèn)為學(xué)習(xí)者未掌握該知識點(diǎn),應(yīng)將其加入待學(xué)習(xí)知識列表中(如K1、K2、K3……)。步驟二是基于畫像從學(xué)習(xí)者信息感知、信息輸入、信息加工和內(nèi)容理解等方面,綜合挖掘提取學(xué)習(xí)者的學(xué)習(xí)風(fēng)格與偏好。步驟三是需要將步驟一和步驟二的結(jié)果和“知識點(diǎn)—學(xué)習(xí)資源關(guān)系”作為三個參數(shù)輸入到學(xué)習(xí)資源匹配模塊中,與學(xué)習(xí)資源池中的資源進(jìn)行匹配計(jì)算。具體計(jì)算過程如下:首先,根據(jù)待學(xué)習(xí)知識點(diǎn)與學(xué)習(xí)資源之間的關(guān)聯(lián)程度,從學(xué)習(xí)資源池中篩選出各類學(xué)習(xí)資料S1。其次,根據(jù)學(xué)習(xí)者對知識點(diǎn)的掌握水平(L1:基本認(rèn)知,L2:夯實(shí)基礎(chǔ),L3:拓展應(yīng)用),從學(xué)習(xí)資源S1中篩選出同水平層次的學(xué)習(xí)資源S2,如學(xué)習(xí)者的掌握水平為L2(夯實(shí)基礎(chǔ)級別),則篩選出S2資源的難度級別為R2(知識鞏固級別的各類學(xué)習(xí)資源)。最后,根據(jù)學(xué)習(xí)者的學(xué)習(xí)風(fēng)格與偏好等信息,從S2中篩選出適合其學(xué)習(xí)偏好的學(xué)習(xí)資源S3,并將S3加入待推薦學(xué)習(xí)資源列表中。按照上述步驟將與所有未掌握知識點(diǎn)關(guān)聯(lián)度高且與學(xué)習(xí)者學(xué)習(xí)風(fēng)格相近的學(xué)習(xí)資源更新到待推薦學(xué)習(xí)資源列表中。步驟四是將待推薦學(xué)習(xí)資源列表中的資源向?qū)W習(xí)者推薦,學(xué)習(xí)者根據(jù)學(xué)習(xí)資源進(jìn)行補(bǔ)救性學(xué)習(xí)后進(jìn)行學(xué)習(xí)成效測評;學(xué)習(xí)平臺對學(xué)習(xí)過程和學(xué)習(xí)結(jié)果進(jìn)行記錄,及時(shí)更新畫像并進(jìn)入下一輪診斷與推薦。此外,如果學(xué)習(xí)者對某個知識點(diǎn)考核的綜合評分高于設(shè)定知識點(diǎn)達(dá)標(biāo)閾值,則認(rèn)為學(xué)習(xí)者對該知識點(diǎn)掌握較好,此時(shí)學(xué)習(xí)資源匹配計(jì)算模塊就會根據(jù)學(xué)習(xí)者的學(xué)習(xí)偏好從課程學(xué)習(xí)資源池中篩選出難度級別為R3(綜合應(yīng)用)類型的學(xué)習(xí)資源推薦給該學(xué)習(xí)者。
2.學(xué)習(xí)群體個性化學(xué)習(xí)資源推薦
在課程學(xué)習(xí)初期,學(xué)習(xí)者的學(xué)習(xí)行為數(shù)據(jù)和結(jié)果數(shù)據(jù)比較少的時(shí)候,學(xué)習(xí)者畫像不能夠全面清晰地描述學(xué)習(xí)者學(xué)習(xí)全貌,此時(shí)需要根據(jù)學(xué)習(xí)者的課程注冊信息、調(diào)查問卷信息以及少部分學(xué)習(xí)行為數(shù)據(jù)來挖掘其學(xué)習(xí)偏好,并根據(jù)學(xué)習(xí)偏好將學(xué)習(xí)者分為合作學(xué)習(xí)型、自主探究性和被動接受型三類群體。合作學(xué)習(xí)型群體具有較強(qiáng)的學(xué)習(xí)能力和較強(qiáng)的團(tuán)隊(duì)協(xié)作能力,但其學(xué)習(xí)目標(biāo)性較差,對教師引導(dǎo)或?qū)W習(xí)同伴引導(dǎo)的依賴性較高,針對此類學(xué)習(xí)群體,可以從學(xué)習(xí)資源池中向其推薦具有任務(wù)導(dǎo)向和明確分工的學(xué)習(xí)資源;自主探究型群體具有較強(qiáng)的自學(xué)能力和自我管控能力,學(xué)習(xí)效率高,針對此類學(xué)習(xí)者可以從學(xué)習(xí)資源池中向其推薦知識鞏固型、稍微有點(diǎn)難度的學(xué)習(xí)資源,并引導(dǎo)其在規(guī)定時(shí)間內(nèi)獨(dú)立完成知識學(xué)習(xí)和內(nèi)化;被動接受型群體自主學(xué)習(xí)能力差、缺乏學(xué)習(xí)動機(jī)與毅力、學(xué)習(xí)進(jìn)程易中斷,針對此類群體可以向其推薦趣味性強(qiáng)的慕課視頻資源、游戲闖關(guān)式的練習(xí)題與測試題等學(xué)習(xí)資源,這樣可以“誘導(dǎo)”學(xué)習(xí)者持續(xù)學(xué)習(xí),盡可能地達(dá)成學(xué)習(xí)目標(biāo)。如果學(xué)習(xí)平臺有學(xué)習(xí)者豐富的學(xué)習(xí)行為和學(xué)習(xí)結(jié)果數(shù)據(jù),就可以根據(jù)學(xué)習(xí)者知識掌握情況進(jìn)行群組劃分,將知識點(diǎn)綜合評分在0.6以下的學(xué)習(xí)者劃分為基本認(rèn)知群體;將在[0.6-0.8)區(qū)間的學(xué)習(xí)者劃分為夯實(shí)基礎(chǔ)群體;將在[0.8-1)區(qū)間的學(xué)習(xí)者劃分為拓展遷移群體。向基本認(rèn)知群體推薦趣味性強(qiáng)、概念理解型學(xué)習(xí)資源;向夯實(shí)基礎(chǔ)群體推薦具有一定探究能力、闖關(guān)式學(xué)習(xí)資源和活動任務(wù);向拓展遷移群體推薦具有一定挑戰(zhàn)難度、綜合型的學(xué)習(xí)資源和活動任務(wù),這樣才能促進(jìn)不同學(xué)習(xí)群體達(dá)成學(xué)習(xí)目標(biāo)。
四、基于學(xué)習(xí)者畫像的個性化學(xué)習(xí)資源推薦模型的實(shí)踐應(yīng)用
(一)研究對象
本研究以國內(nèi)某院校數(shù)據(jù)結(jié)構(gòu)課程學(xué)習(xí)為研究對象。該課程是軟件技術(shù)、移動應(yīng)用開發(fā)等專業(yè)的核心基礎(chǔ)課程,課程目標(biāo)是培養(yǎng)學(xué)生數(shù)據(jù)抽象能力和程序設(shè)計(jì)能力。課程開設(shè)周期為1~14周,每周4學(xué)時(shí),總共64學(xué)時(shí)。課程學(xué)習(xí)者為在校軟件技術(shù)專業(yè)的127名大二學(xué)生,這些學(xué)生在大一時(shí)已提前學(xué)習(xí)了部分專業(yè)基礎(chǔ)課程,能夠適應(yīng)在線開放課程混合教學(xué)模式且具備一定的探究學(xué)習(xí)能力。數(shù)據(jù)結(jié)構(gòu)課程學(xué)習(xí)內(nèi)容偏向邏輯思維訓(xùn)練和實(shí)踐操作技能培養(yǎng),學(xué)習(xí)者在學(xué)習(xí)過程中容易出現(xiàn)一些學(xué)習(xí)瓶頸,如能及時(shí)給予教學(xué)干預(yù)和推送適切的學(xué)習(xí)資源,則可以較好地幫助學(xué)習(xí)者克服學(xué)習(xí)障礙達(dá)成學(xué)習(xí)目標(biāo)。本研究基于學(xué)習(xí)者畫像構(gòu)建了個性化學(xué)習(xí)資源推薦模型,為驗(yàn)證其實(shí)踐效果,將127名學(xué)習(xí)者劃分成實(shí)驗(yàn)組、對照組1、對照組2三個組別,分別應(yīng)用本模型、基于協(xié)同過濾算法的推薦模型和DINA認(rèn)知診斷的推薦模型,并向?qū)嶒?yàn)組推送各類學(xué)習(xí)資源數(shù)為891條,向?qū)φ战M1推送各類學(xué)習(xí)資源數(shù)968條,向?qū)φ战M2推送各類學(xué)習(xí)資源數(shù)924條。
(二)選擇模型對比角度
學(xué)習(xí)資源推薦有別于商品推薦、新聞推薦等,商品推薦、新聞推薦中個人興趣與偏好基本上是穩(wěn)定的,而學(xué)習(xí)資源推薦中學(xué)習(xí)者的需求具有動態(tài)變化性,即隨著學(xué)習(xí)進(jìn)程的推進(jìn),學(xué)習(xí)者的認(rèn)知能力、知識構(gòu)建水平、學(xué)習(xí)能力等方面也會發(fā)生改變。為驗(yàn)證基于學(xué)習(xí)者畫像的個性化學(xué)習(xí)資源推薦模型的有效性和準(zhǔn)確度,本研究從分類準(zhǔn)確率P(L)和平均排序分RS兩個角度對三類模型的推薦效果進(jìn)行實(shí)驗(yàn)論證。一是分類準(zhǔn)確率指推薦學(xué)習(xí)資源正確(被學(xué)習(xí)者接受的資源)的數(shù)目占所有推薦資源總數(shù)的百分比,是衡量推薦模型的主要指標(biāo),其計(jì)算公式為:P(L)=。其中,N為學(xué)習(xí)者人數(shù),Ii為第i個學(xué)習(xí)者收到的推薦資源集合,|Ii|為資源集合Ii中的資源個數(shù)(如|Ii|=15,表示向?qū)W習(xí)者推薦了15個資源),Si為第i個學(xué)習(xí)者接受推薦資源的個數(shù)。比如,如果多個模型推薦的X個資源中都有Y個資源是用戶所需的,則多個模型的推薦準(zhǔn)確率P(L)均為Y/X。在每個模型中學(xué)習(xí)者所需的Y個資源的排序并不是相同的,在相同的準(zhǔn)確率P(L)下,如果能夠使Y個學(xué)習(xí)資源排名靠前,則這個模型更具有優(yōu)勢。二是平均排序分RS指學(xué)習(xí)者所需的推薦資源,在推薦算法所生成的推薦序列中的排名之和與推薦序列中所有資源的排名之和的百分比,是衡量推薦算法排序準(zhǔn)確度的重要指標(biāo),其計(jì)算公式為:RS=∑j∈YRj/∑i∈XRi)。其中,X為推薦模型所推薦資源集合,Ri為推薦資源i在推薦序列集合X中的排名;Y為用戶所需的推薦資源集合,Rj為用戶所需的推薦資源j在X中的排序,平均排序分RS越低,該模型準(zhǔn)確度則越高。
(三)研究結(jié)果
一是分類準(zhǔn)確率P(L)對比。數(shù)據(jù)顯示,隨著學(xué)習(xí)資源推薦數(shù)目逐漸增大,三類推薦模型的整體準(zhǔn)確率均會逐漸降低。DINA認(rèn)知診斷推薦模型在訓(xùn)練集數(shù)據(jù)較少時(shí),對學(xué)習(xí)者的認(rèn)知診斷精度較差,向?qū)W習(xí)者推薦資源的準(zhǔn)確率也較低,但隨著數(shù)據(jù)集的豐富,其準(zhǔn)確率高于基于協(xié)同過濾算法的推薦模型,而基于學(xué)習(xí)者畫像的個性化學(xué)習(xí)資源推薦模型的準(zhǔn)確率明顯高于其他兩種模型。在實(shí)證研究過程中,基于學(xué)習(xí)者畫像的個性化學(xué)習(xí)資源推薦模型向?qū)嶒?yàn)組推送各類學(xué)資源數(shù)為891條,被學(xué)習(xí)者采納條465條,整體平均準(zhǔn)確率P(L)為52.21%,其中操作演示型視頻資源和趣味闖關(guān)練習(xí)資源最受學(xué)習(xí)歡迎,占比分別為22.6%、31.6%。基于協(xié)同過濾算法的推薦模型向?qū)φ战M1推送各類學(xué)習(xí)資源數(shù)為968條,被學(xué)習(xí)者采納294條,平均準(zhǔn)確率P(L)為30.36%,其中操作演示型視頻資源和趣味闖關(guān)練習(xí)資源最受學(xué)習(xí)歡迎,占比分別為21.4%、30.9%。DINA認(rèn)知診斷推薦模型向?qū)φ战M2推送各類學(xué)習(xí)資源數(shù)為924條,被學(xué)習(xí)者采納416條,平均準(zhǔn)確率P(L)為44.98%,其中操作演示型視頻資源和趣味闖關(guān)練習(xí)資源最受學(xué)習(xí)歡迎,占比分別為24.3%、31.9%(見圖4,表1)。整體而言,三類模型推薦的個性化學(xué)習(xí)資源中,被采納最多是趣味闖關(guān)練習(xí)資源和操作演示型視頻資源,這在一定程度上也反映出學(xué)生注重自身操作技能訓(xùn)練和形成綜合解決實(shí)際問題能力。今后教學(xué)者在教學(xué)設(shè)計(jì)、學(xué)習(xí)資源開發(fā)時(shí)應(yīng)偏重開發(fā)實(shí)踐操作型、趣味性強(qiáng)、難易梯度合理的各類學(xué)習(xí)資源。二是平均排序分RS對比。數(shù)據(jù)顯示,隨著I值的逐漸增大,三種推薦模型的平均排序分也會逐漸提高,基于協(xié)同過濾算法的推薦模型其RS值比DINA認(rèn)知診斷模型推薦模型更大,而基于學(xué)習(xí)者畫像的個性化學(xué)習(xí)資源推薦模型的RS值較小(見圖5)。
(四)研究結(jié)論
一是基于學(xué)習(xí)者畫像的個性化學(xué)習(xí)資源推薦模型比基于協(xié)同過濾算法的推薦模型和DINA認(rèn)知診斷推薦模型具有更高的準(zhǔn)確度(即較高的分類準(zhǔn)確度和較低的排序準(zhǔn)確度),既保證了推薦結(jié)果的精準(zhǔn)性與可解釋性,又融合了學(xué)習(xí)者個性特點(diǎn),能夠向?qū)W習(xí)者推薦不同學(xué)習(xí)難度、不同學(xué)習(xí)類型的適切學(xué)習(xí)資源。二是基于學(xué)習(xí)者畫像的個性化學(xué)習(xí)資源推薦模型一定程度上緩解了數(shù)據(jù)稀疏等問題。當(dāng)學(xué)習(xí)者的學(xué)習(xí)行為數(shù)據(jù)較少或剛開始加入課程學(xué)習(xí)時(shí),利用學(xué)習(xí)者畫像采集學(xué)習(xí)者歷史學(xué)業(yè)數(shù)據(jù)、學(xué)習(xí)者個性特征數(shù)據(jù),挖掘出與其學(xué)習(xí)偏好相似的其他學(xué)習(xí)者,將其他相似學(xué)習(xí)者學(xué)習(xí)過的學(xué)習(xí)資源和學(xué)習(xí)路徑推薦給目標(biāo)學(xué)習(xí)者,在一定程度上緩解了冷啟動與數(shù)據(jù)稀疏等問題當(dāng)然,盡管基于學(xué)習(xí)者畫像的個性化學(xué)習(xí)資源推薦模型能夠?qū)W(xué)習(xí)者個體和群體精準(zhǔn)推薦學(xué)習(xí)資源,在實(shí)踐應(yīng)用中也取得了較好的效果,但其在學(xué)習(xí)者畫像及時(shí)動態(tài)更新、知識點(diǎn)與學(xué)習(xí)資源之間語義關(guān)系標(biāo)注的準(zhǔn)確性等方面還有待進(jìn)一步優(yōu)化,另外,該推薦模型只對靜態(tài)事實(shí)標(biāo)簽進(jìn)行了處理,并未涉及動態(tài)學(xué)習(xí)路徑規(guī)劃推薦等,在下一階段的研究中,研究團(tuán)隊(duì)將針對這些不足進(jìn)行深入研究。
參考文獻(xiàn):
[1]中華人民共和國教育部.教育部關(guān)于印發(fā)《教育信息化十年發(fā)展規(guī)劃(2011—2020年)》的通知[EB/OL].
[2]中華人民共和國教育部.教育部關(guān)于印發(fā)《教育信息化2.0行動計(jì)劃》的通知[EB/OL].
[3]中華人民共和國教育部.中共中央、國務(wù)院印發(fā)《中國教育現(xiàn)代化2035》
[5][30]姜強(qiáng),趙蔚,杜欣,等.基于用戶模型的個性化本體學(xué)習(xí)資源推薦研究[J].中國電化教育,2010(5):106-111.
[6]趙晉,周蘇蘇,張建軍.基于在線評論的學(xué)習(xí)資源推薦方法設(shè)計(jì)與實(shí)證[J].數(shù)學(xué)的實(shí)踐與認(rèn)識,2022(9):260-270.
[7]趙蔚,姜強(qiáng),王朋嬌,等.本體驅(qū)動的e-Learning知識資源個性化推薦研究[J].中國電化教育,2015(5):84-89.
[9]梁婷婷,李春青,李海生.基于內(nèi)容過濾PageRank的Top-k學(xué)習(xí)資源匹配推薦[J].計(jì)算機(jī)工程,2017(2):220-226.
[12]姜強(qiáng),趙蔚,李松,等.大數(shù)據(jù)背景下的精準(zhǔn)個性化學(xué)
作者:成亞玲 譚愛平 單位:湖南工業(yè)職業(yè)技術(shù)學(xué)院