我国区域教育数据开放的现状、问题与对策

分类:论文范文 发表时间:2021-09-13 10:34

  【摘要】在互联网蓬勃发展和开放数据运动兴起的大背景下,各国政府开始将开放数据列入大数据实施战略,英美等率先建立政府开放平台,力求在各个领域实现数据开放。在此潮流下我国也开始尝试公开各级各类信息,利用开放数据推动行业发展。开放教育数据具有提高政府透明度、促进教育机构正确决策、加强全民参与等现实意义,而政府开放数据是现阶段教育开放数据的主要表现形式。为全面了解我国区域教育数据开放的现状,文章基于文献研究法和案例研究法,从法律和政策视角探讨了我国教育数据开放的依据,调查了14个省级政府开放平台和15个地市级政府开放平台的功能和教育数据开放的实际情况,并结合国外教育数据开放的优秀实践进行了比较。分析了教育数据开放平台在数据开放许可和隐私保护制度、平台功能和服务水平、数据归集、发布和更新、数据价值和质量以及数据利用等方面的问题。最后对我国区域教育数据开放提出了一些参考建议:制定和完善教育数据开放的法律法规;提高建设水平,优化用户体验;完善管理、评价和监督体系;注重数据开放标准和数据质量控制;吸引专业人士和机构参与,鼓励全民应用等。

  【关键词】教育数据;开放数据;信息公开;政府数据;区域数据;开放平台;政府治理;案例研究

  一、问题的提出

  在数字经济时代,“数据即资产”的观念已成为共识,社会对数据价值的重视程度与日俱增,数据已经成为其他各种先进技术得以发挥作用的基础。当前,移动通信、云计算和人工智能等新技术不断融入教育,将会生成更多的过程性数据,包括学生数据、教师数据、教学资源数据、教学媒体数据,以及由此衍生的其他教育数据。基于数据的研究也成为一种教育研究的研究范式(张务农,2018),在教育实践中发挥着越来越大的指导作用。

我国区域教育数据开放的现状、问题与对策

  二、教育数据开放的法律和政策依据

  近年来,各国相继出台了相关法律和政策,为政府数据开放和共享进程列出了“时间表”,规划了“路线图”。2013年,美、英、法、德、日等8国签署了《开放数据宪章》(OpenDataCharter),确定了各国开放数据行动方案。同年,美国政府发布《开放数据政策》(OpenDataPolicy)行政令,要求开放包括教育在内的七大领域数据,并明确了开放时间表(OMBMemorandum,2013)。澳大利亚随后发布了《政府信息共享策略》(NationalGovernmentInformationSharingStrategy),要求将每所学校的简介、规模、人数等基本数据向社会开放。2016年,英国发布了《2016—2018年英国开放政府行动计划》(UKOpenGovernmentNationalActionPlan2016to2018),涵盖教育、金融、交通等多个领域,在原有数据开放基础上进一步提出对公民参与、信息访问、技术与创新和政府账目等方面的承诺。

  早期,我国政府信息开放主要集中在政务信息公开上。2003年广州市颁布了《政府信息公开规定》,明确提出要保障个人和组织的知情权,增加行政透明度,这是我国第一部由地方政府制定的政府信息公开条例(周良金,2007)。2005年办公厅、国务院办公厅联合出台《关于进一步推行政务公开的意见》,加强社会对行政权力的监督。2007年通过了《政府信息公开条例》,规范各级人民政府部门的信息公开过程。2008年《信息公开条例》正式实施,规定了各级政府、行政机关等部门信息公开要求,以及主动公开的形式、时间、条件等。

  遵循在信息公开方面的要求,教育部制定了《教育部政府信息公开指南(试行)》《教育部政府信息公开目录》,对信息公开的内容与范围、公开的方式和程序、公开的监督和保障等进行了统一规定,提高了教育工作的透明度。针对学校,教育部发布了《高等学校信息公开办法》《高等学校信息公开事项清单》《关于推进中小学信息公开工作的意见》等文件,保障公民、法人和其他组织依法获取学校信息,加强和改进学校管理。

  三、教育数据开放的实施情况

  目前,我国教育数据公开和开放仍处于起步阶段,教育信息主要以公报、文件、白皮书等形式在教育部门户网站公开。如教育部发展规划司发布的《教育事业发展统计公报》《教育统计数据》,教育部办公厅发布的《教育部公报》,教育部综合改革司发布的《教育改革相关政策文件》等。《教育统计管理规定》指出,教育部要通过门户网站、统计年鉴、统计信息平台等途径公布统计资料,地方各级人民政府的教育行政部门应当按照有关规定公布教育统计资料,供社会公众查询(教育部,2018)。

  随着地方政府开放平台的建立,教育信息不再只集中于平台发布,开始转向政府和社会共同驱动的数据开放模式。但是,目前无论是教育部还是各省市的教育主管部门均未建成独立的教育数据开放平台,教育领域内几乎所有的开放数据均在各级政府的数据开放平台上发布。复旦大学和信息中心数字研究院联合发布的《地方政府数据开放报告》,是我国首个专注于评估政府数据开放水平的专业报告。2020年报告显示,截至2020年上半年,我国已有省级(17个)、副省级和地市级(113个)政府上线了数据开放平台(复旦大学,等,2020)。除1个省级平台无法打开、2个省级平台无教育数据以外,笔者调查了其余14个省级政府数据开放平台,包括“北京市政务数据资源网”“开放福建”“开放广东”“贵州省政府数据开放平台”“海南省政府数据统一开放平台”等,依次编码为p1~p14。在113个地市级平台中,以简单随机抽样法选取了15个市级政府数据开放平台,包括“临沂公共数据开放网”“佛山市数据开放平台”“广东省政府数据统一开放平台—河源市”“哈尔滨市政府数据开放平台”“烟台市公共数据开放网”等,依次编码为c1~c15。采样时间截至2020年6月,对这29个样本中的教育数据集和API接口进行调查。

  (一)省级教育数据开放情况

  14个省级政府开放平台上共有1,856个教育数据集,占平台数据集总量的3.39%。北京、广东、山东等省级开放平台中的教育数据集较多,其中山东开放了1,018个教育数据集;贵州、江西、陕西、四川等政府开放平台尚处于起步阶段,近一年内刚开始发布教育数据。

  1.数据开放内容

  (1)所属范畴平台通过各种方式引导用户浏览数据,常见的分类维度有主题、领域、行业、部门/机构和场景。超过一半的平台以主题进行分类,并且将教育与文化和科技数据归为一类,命名为“教育科研”“教育科技”“教育文化”等,甚至个别平台直接将科技和文体数据归纳为“教育”类目下,这种分类方式可能与政府主管部门的设置和分工有关,造成该分类名称下数据杂乱,加大了用户获取数据的难度(如表1所示)。

  典型的分类有:p3的“教育科技”主题包含其他领域的技术创新数据集,如农业标准信息、2016年农业主推技术列表等;p14的“教育”场景存在文化、科技、市场、生活等相关数据内容,如“农村电影放映信息”“条码申请管理服务”等。也有一些平台注意到不同领域的数据混合问题,设置了更加具体的分类,如p6将教育、文化和科技领域数据分别划分于不同标签中。还有一些平台提供了多种分类方式,方便用户获取特定数据。p2提供了领域、行业和部门三个分类维度,如需获取教育数据可以在行业分类中选取“教育”子集;p11提供了场景和领域两种分类,用户在查找数据时,相较“教育科技(209个)”主题,“学校教育和终身教育(126个)”场景可更加明确地定位教育数据。也有个别平台未设置教育分类,教育数据只能在其他数据分类中查询,如在p10上教育数据归属于“公共服务”和“社会保障”等主题。

  (2)数据内容平台上的开放数据涉及学前教育、基础教育、高等教育、职业教育、成人教育和特殊教育多个学段或领域,p1、p3、p9和p12的教育数据涵盖所有学段。高等教育数据的覆盖率最广,其次是基础教育、职业教育和学前教育。这些数据集可分为以下主题:①整体教育情况,如教育政策的发布和解读、教育整体情况统计和分阶段统计等;②教学和评估相关信息,如对学生在校情况统计、教师基本情况统计、各阶段考试信息统计、各阶段教育和各类考试等的收费情况统计,以及实验设备和教学用具情况统计等;③其他指标,如对人才称号、资格认定、资助项目和获奖项目等情况的统计,以及科技场馆和基础设施的统计等。大部分平台开放的教育数据集中在前两类。

  2.数据开放技术

  平台的数据获取方式主要是下载数据文件和通过API接口调用两种。大多数平台同时提供两种方式。下载的数据文件也以多种数据格式提供(如表2所示)。“万维网之父”蒂姆·伯纳斯·李(TimBern?ersLee,2009)提出的“数据开放五级标准”是目前开放数据领域普遍使用的评价标准。在这个标准中,一星代表数据可通过Web获得;二星为数据可作为机器可读的结构化数据使用(即不是扫描图像);三星为以非专有格式提供数据,用户不需要专有软件包来分析数据;四星是使用W3C的开放标准(RDF和SPARQL)发布数据;五星为数据以语义网的形式相互关联。以上14个省级平台的数据开放程度为二星级至四星级。除了个别平台的开放数据不可机读之外,近三分之二的平台数据开放程度达到三星级,采用非专属开放格式开放数据,p3、p9和p13还率先使用了RDF格式提供数据集,达到四星级。

  (二)市级教育数据开放情况

  我们进一步评估了15个副省级/地市级政府数据开放平台,涉及932个教育数据集,占平台数据总量的4.83%。开放程度最高的是广东省和山东省,该地区的省市两级政府部门都在积极推进数据开放。

  四、国际比较及现存问题

  随着政府信息公开和数据开放工作的推进,我国的教育数据开放从无到有,有了长足的进展。但从实用的角度看,与先进相比仍有较大差距。在数据开放方面,美国(北美洲)、澳大利亚(大洋洲)和英国(欧洲)的经验较为丰富,连续多年在万维网基金会编制的《开放数据全球报告》(OpenDataBarom?eterGlobalReport)排行榜中名列前茅。为了从国际比较的视角分析我国教育数据开放实践水平,本研究选取了三个一流水平的外国政府数据开放门户:美国华盛顿州政府数据开放门户(p15)、澳大利亚首都政府数据开放门户(p16)和英国伦敦政府数据开放门户(p17),对比中外同级平台教育数据开放情况,从数据开放和隐私保护制度、平台功能和服务水平、数据归集、发布和更新、数据价值和质量以及数据利用情况等几个方面,对比国内外教育数据开放过程中存在的异同,以借鉴国外先进的经验和做法。

  (一)数据开放许可和隐私保护

  《开放数据全球报告》从机器可读、批量获取、免费、开放许可、更新、可持续和可发现七个指标评判数据的开放程度,而“开放许可”是最基本的一项指标。国外三个平台发布的数据集开放许可程度很高,公众可以随时访问和下载数据集。p15还提倡开放公众最需要的数据,它和p16都承担着“中心纽带”的责任,向数据所有者传递公众需求,以便开放更多、更实用的数据集。国内开放平台的开放水平有待提高,虽然有超过一半的省级平台明确了用户获取、利用和传播数据的权利,但授权协议中使用许可不规范,出现“无条件开放”“普遍开放”“完全开放”“登录开放”“主动开放”等容易混淆的概念,不利于提供者标示数据开放的许可程度,也不利于数据使用者区分数据的开放状态。

  (二)平台功能和服务水平

  数据开放的主要目标是希望更多人可以获取和使用数据,以创造更大的价值,而平台功能和服务水平直接影响公众的参与性,甚至对平台发布的数据质量提出质疑。国外三个数据开放平台在功能设计和用户体验上均更加完善。在数据导引方面,p15和p16增加了按字母和最近添加两种排序方式。在数据获取功能上,三个平台发布的教育数据,无须登录注册就可以直接获取,而国内一半以上平台只有注册用户方可获取。在数据请求方面,p15明确规定平台在收到请求后在五个工作日内做出回复,p16提供了“建议数据”功能,将公众对其他数据集的请求情况公布于众,国内大半平台缺少此类功能。在数据交互功能上,p15、p16和p17的数据集页面标明了数据所有者,公众可以直接向数据所有者发送信息,以进一步沟通。

  五、对策及行动建议

  针对目前教育数据开放活动中存在的诸多问题,应该密切关注国外数据开放的优秀实践,结合我国的开放现状和基本条件,编制教育数据的开放蓝图。国外开放政府数据战略的实施路径涵盖法律制度、政府组织体制、基础设施与投入、社会支持体系和评估反馈等不同层面(夏义堃,2017)。因此,推进政府数据开放应建设组织和制度、设计数据开放方案、建立数据开放门户、宣传和推广数据开放、建立协作机制和评估数据开放水平(卫军朝,等,2017)。基于教育数据开放现状,结合本次调查中暴露的问题,我国的教育数据开放应主要从以下几个方面推进:

  (一)制定和完善教育数据开放的法律法规

  在大数据战略和科学治理战略的推动下,我国开始重视政府数据资源的共享和开放,继《政府信息公开条例》发布后,各部委和地方政府也推出了具体政策,如《上海市政务数据资源共享和开放年度工作计划》等。在教育领域,教育部发布了《教育信息化2.0行动计划》《教育部2018年工作要点》等文件,提出要大力整合和共享教育数据。但在操作层面,教育数据开放仍缺少系统的规划和较为完备的制度。

  (二)提高建设水平,优化用户体验

  平台的建设水平直接影响数据开放质量和用户体验。在本次调查中,一些平台暴露出API无效、数据功能不健全等问题,直接影响了用户体验。建设方应在平台的功能设计、人机交互界面设计和技术维护水平等方面予以重视。

  [参考文献]

  复旦大学,等.2020地方政府数据开放报告[EB/OL].[2020-07-23].

  广东省人民政府办公厅.2014.关于印发广东省经济和信息化委员会主要职责内设机构和人员编制规定的通知.粤府办〔2014〕6号,02-21.

  黄璜,孙学智.2018.地方政府数据治理机构的初步研究:现状与模式[J].行政管理(12):31-36.

  黄如花,李白杨.2016.数据素养教育:大数据时代信息素养教育的拓展[J].图书情报知识(1):21-29.

  李青王海兰

上一篇:我国农业科技园区发展演变、问题与发展路径 下一篇:中医临床思维教育新模式研究