基于过程数据的学习预警模型设计与功能实现

分类:论文范文 发表时间:2021-09-10 10:29

  摘要:随着教育大数据的兴起,学习预警技术为教育信息化提供了有力支撑。基于此,文章首先充分利用在线学习过程中产生的海量数据,设置了学习预警的相关指标,并给出了定义与算法,在此基础上将学习预警的维度确定为积极程度、作业成绩和作业质量。随后,文章通过模型权重调参,确定了各维度、指标的权重值,得到预警线阈值,并实证检验了其有效性。最后,文章设计了学习预警模型,搭建了一个基于过程数据的学习预警平台,其投入使用结果显示预警效果良好。基于过程数据的学习预警模型的提出与学习预警平台的应用,大大提升了教学质量,降低了学生的挂科风险,有效实现了预警功能。

  关键词:过程数据;学习预警;学习分析;教学管理;数据可视化

  随着“互联网+”理念的逐步发展,线上学习成为了一种主流的学习方式,各类线上学习平台在教育领域的应用愈加广泛[1],同时也产生了大量的过程数据——过程数据是在教学过程中产生的具有代表性、能反映学生学习情况的数据。而如何充分地利用这些过程数据,对学习中有困难或有挂科风险的学生及时、准确地进行预警,是当前研究的一大热点[2]。考虑到学习预警是预测出有挂科风险学生群体的重要途径[3],本研究针对学习过程中收集的相关数据,设计了一个基于过程数据的学习预警模型,并搭建了相应的网络平台,以实现预警功能。

基于过程数据的学习预警模型设计与功能实现

  一学习预警相关研究

  梳理近年来国内外学习预警的相关研究成果,本研究认为学习预警研究聚焦于以下三方面:

  ①学习预警技术和方法。研究者大多会有效结合机器学习和数据挖掘技术进行学习预警,其中以决策树和多元线性回归等方法较为常用、分类和聚类技术最为典型[4]。例如,Xu等[5]采用比基准法性能更好的、基于过程聚类的潜在因子法预警;吴青等[6]根据学生在Moodle平台上的学习数据,采用决策树、贝叶斯网络、神经网络、支持向量机方法进行预警;胡建红等[7]基于K-Means聚类算法,获取“雨课堂”在线学习平台提供的数据进行预警。

  ②学习预警模型。很多学者从不同角度思考,设计了不同类型的学习预警模型。例如,肖君等[8]从目标(Object)、数据(Data)、分析(Analysis)、服务(Service)四个方面提出“ODAS”开放学习分析概念模型,并构建出学习者画像;武法提等[9]设计了包括学习内容分析、学习行为分析和学习预测分析三个模块的学习效果预测框架;而金义富等[10]设计了一种基于离群数据挖掘技术的课程、课堂、课外“三位一体”预警模型。

  二学习预警模型指标与维度的设置

  1指标的设置设置不同指标是为了从多方面反映学生的学习情况,使学习预警模型考虑的因素更全面,从而使学习预警更有效。学生每次在线上完成作业都会产生大量数据,本研究筛选出能反映学生学习成效并具有典型意义的数据,依此设置了学习预警的相关指标,给出了定义与算法。

  (1)开始时间排名

  (C1)①定义:C1表示学生开始在线做作业的时间先后排名。②计算方法:获取该学生登录平台开始在线做作业的时间,首次做题时间越早,C1越靠前。

  (2)完成用时排名(C2)①定义:C2表示学生完成本次作业的用时长短排名。②计算方法:学生完成本次作业的用时长短计算如公式(1)所示,用时越短,C2越靠前。其中,C2(0)为该学生完成本次作业的用时在班级中的排名,C2’则为排名附加值。考虑到有学生未做完题目而只提交了部分作业的情况,本研究分情况设置C2’值:若该学生全部提交,则设C2’值为0;若该学生未做完所有题目,则获取未做题目的数量和总题目量,然后按公式(2)计算该学生本次作业的完成度——若完成度值处于[0.9,1)区间,则设C2’值为5;若完成度值处于[0.8,0.9)区间,则设C2’值为10……以此类推,若完成度值低于0.6,则设C2’值为25。

  2维度的设置

  现有的学习预警大都不具备多学科的知识结构和研究手段,且未有效借鉴教育学、心理学等领域的理论研究成果[16]。本研究运用文献分析法和案例选取法,查阅大量相关文献并结合实验数据来源,将学习预警的维度确定为:积极程度(含C1、C2两个指标)、作业成绩(含C3、C4两个指标)、作业质量(含C5、C6两个指标)。

  三实验设计与结果分析

  1数据来源

  本研究以江西省N大学软件工程专业8个班的280名学生为研究对象,选取他们在程序设计类实验辅助教学平台上提交12次作业所产生的过程数据为数据源。作业题型有选择题、程序填空题、编程题等,每次作业满分为100分。选择题和程序填空题均由线上学习平台根据参考答案进行评分,编程题则由测试点(代码执行时需通过的测试用例)进行评分。

  2模型权重调参

  能选取最贴合学生真实挂科结果的参数,往往是决定预警效果的关键。学习预警模型各参数权重的确定采用枚举法:先将3个维度、6个指标的权重占比依次进行排列组合,再与上个年度多个班级期末考试的总评成绩进行对比计算,搜索最优参数配置。具体的调参步骤如下:①通过导入操作,将从实验辅助教学平台获得的过程数据上传至预警模型。②不断改变各权重占比,计算当前参数值下学习的总预警值与期末考试总评成绩的均方误差(MSE),如公式(8)所示。其中,yt为期末考试总评成绩,yp为总预警值。实验数据按照训练集与验证集7:3划分,本研究选取5个班级共171名学生的过程数据作为训练集,计算MSE值并排序。③根据排序结果,选出MSE值较小的一组数据。

  四学习预警模型与学习预警平台

  1学习预警模型的设计

  根据各项指标与维度的设定,以及本实验得出的预警线阈值,本研究设计了学习预警模型,如图3所示。学习预警模型包含四个主要模块:①数据收集模块。从在线学习平台上采用数据采集技术(如爬虫)获得学生产生的大量学习过程数据,然后进行数据清洗,解析出有用的数据进行存储。②参数调优模块。根据实验结果确定各维度、指标的权重,并选取合适的预警线阈值。③学习预警模块。根据本研究提出的各指标和各维度算法计算出预警值,据此判断该学生是否存在学习危机——若存在危机,就采取人工介入、发送电子邮件等方式进行预警干预。④可视化模块。对学生的线上学习情况进行多方位展示,使用大量图表将在线学习平台上的学习过程数据予以可视化,以直观地呈现学生的学习状态与学习效果。

  2学习预警平台的功能设计及其实现

  依托学习预警模型,本研究搭建了一个基于过程数据的学习预警平台,现已在江西省N大学投入使用,学习预警效果良好。学习预警平台的主要功能如下:

  ①学生个人预警。考虑到教师和学生本人需掌握个人近期的学习情况,故学习预警平台围绕学生个人预警功能进行了设计。学生个人预警功能包括查看近期学习预警值、情绪分析报告、学习风险报告、作业平均分、各次作业得分变化与班级平均分的对比、各类题型的正答率、编程函数题得分情况、每题代码平均提交次数等,所用图表多采用雷达图、折线图、仪表盘展示。

  ②班级学情分析。教师应了解各班级情况及其差异,以便及时调整教学。班级学情分析功能包括查看班级预警情况、班级每次作业的平均分、得分中位数、高位/低位平均成绩、不同分数段的人数及其占比、每次作业超过/低于平均分的人数、每次作业对该班学生而言的难易度与区分度等,所用图表多采用箱型图、饼图、柱状图展示。

  结语

  本研究参考学生积极程度、作业成绩和作业质量方面的数据进行建模,设计了学习预警模型,并搭建了一个基于过程数据的学习预警平台。学习预警模型是一个通用型模型,其权重参数可以根据不同范围的预警需要进行调整。同时,学习预警模型可与其它线上教学系统进行融合,以发掘出更多的预警维度指标,如从整合型教育数据系统中获取数据,增加学生的社会与人口统计学特征、学生个人特征、学生投入度、学生近期作业是否进步、是否存在代码抄袭现象等维度,结合实验课上机表现,真实反映学生的线上学习情况并及时预警,以有效提高教学质量、降低学生的挂科风险。而学习预警平台将学生在平台上的过程数据做可视化处理,通过清晰、明了的图表,来多角度、直观地反映学生的学习状态,其投入使用结果显示预警效果良好。需要指出的是,现阶段的实验数据量不够大,会在一定程度上影响学习预警模型结果的准确性。基于此,后续研究将考虑引入机器学习算法,获取更多的数据投入训练集,以进一步完善学习预警模型,实现基于多模态、全过程学习数据的学习预警。

  参考文献

  [1]HuYH,LoCL,ShihSP.Developingearlywarningsystemstopredictstudents’onlinelearningperformance[J].ComputersinHumanBehavior,2014,(36):469-478.

  [2]蒋卓轩,张岩,李晓明.基于MOOC数据的学习行为分析与预测[J].计算机研究与发展,2015,(3):614-628.

  [3]王林丽,叶洋,杨现民.基于大数据的在线学习预警模型设计——“教育大数据研究与实践专栏”之学习预警篇[J].现代教育技术,2016,(7):5-11.

  [4][16]朱郑州,李政辉,刘煜,等.学习预警研究综述[J].现代教育技术,2020,(6):39-46.

  杨丰玉陈雨安[通讯作者]聂伟郑巍樊鑫

上一篇:基于模块化教学的商务英语教学探索 下一篇:生态农业中植物保护新技术的应用研究