黄振亚
- 作品数:9 被引量:150H指数:5
- 供职机构:中国科学技术大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金国家杰出青年科学基金安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学自然科学总论理学更多>>
- 面向在线智慧学习的教育数据挖掘技术研究被引量:52
- 2018年
- 随着教育信息化进程的深入,学生在线学习数据得到不断积累,为数据驱动的教育评估和智能辅助教学提供良好条件.然而,已有的面向在线智慧学习的教育数据挖掘模型很难从海量、稀疏、高噪的数据中准确分析试题特征和学生学业水平,也较少考虑学生及教师的个性化需求.文中针对上述问题开展若干面向在线智慧学习的教育数据挖掘技术研究工作,以教育学习所涉及的试题、学生、教师为对象,以个性化推荐等技术同教育领域知识相结合为手段,以提高学生学业水平为目标.具体介绍用于试题分析和检索的试题文本表征模型、基于认知诊断的个性化学习资源推荐方法、针对教师的教学建议和指导等方法,以及这些技术所依托的应用平台——科大讯飞在线教育系统"智学网".最后简单讨论面向在线智慧学习的教育数据挖掘技术未来可能的研究方向.
- 刘淇陈恩红朱天宇黄振亚吴润泽苏喻胡国平
- 关键词:教育评估推荐系统
- 面向大规模认知诊断的DINA模型快速计算方法研究被引量:22
- 2018年
- 在教育教学的过程中,如何诊断学生的知识水平是一个重要的问题.传统方法大多由教师根据学生的表现和成绩进行人工判断,存在效率低、主观性强的问题,且难以做到针对大量学生的个性化诊断.近年来,认知诊断模型中的DINA模型被广泛应用于诊断学生个性化知识掌握程度.然而传统DINA模型大多基于小样本数据,当面对在线教育带来的大规模数据处理需求时,存在收敛速度慢的问题,难以实际应用.针对DINA模型计算时间过长的问题,本文首先给出了DINA模型的收敛性证明,并提出了三种能够加速DINA求解的算法:(1)增量算法,它将学生数据划分为多个学生块,每次迭代只访问其中一个学生块;(2)最大熵方法,它只访问在极大化模型熵的过程中影响较大的学生数据;(3)基于前两者的混合方法.最后,本文通过真实数据和模拟数据上的实验,分析证明了三种方法均能在保证DINA模型有效性的情况下,达到几倍至几十倍的加速效果,有效地改善了DINA模型的计算效率.
- 王超刘淇陈恩红黄振亚朱天宇苏喻胡国平
- 关键词:DINA模型EM算法
- 结合概率矩阵分解和认知诊断的个性化试题推荐方法
- 面向学生的个性化试题推荐是智能教育领域重要的研究课题,现有的试题推荐工作大多采用协同过滤的方法或基于认知诊断的方法。然而,协同过滤的试题推荐方法往往忽略了学生的学习状态(知识点掌握情况);基于认知诊断的方法只能建模单个学...
- 朱天宇黄振亚刘淇吴润泽吴乐苏喻陈志刚胡国平
- 基于无监督语义哈希的高效相似题检索模型
- 2024年
- 相似题检索旨在从数据库中找到与给定查询试题考查目标相似的试题。随着在线教育的不断发展,试题数据库日益庞大,且由于试题数据的专业属性使标注相关性非常困难,因此需要一种高效且无需标注的相似题检索模型。无监督语义哈希能在无监督信号的前提下将高维数据映射为低维且高效的二值表征。但不能简单地将语义哈希模型应用在相似题检索模型中,因为试题数据具有丰富的语义信息,而二值向量的表征空间有限。为此,提出一个能获取、保留关键信息的相似题检索模型。首先,设计了一个关键信息获取模块获取试题数据的关键信息,并引入去冗余目标损失去除冗余信息;其次,在编码过程中引入随时间变化的激活函数,减少编码信息损失;再次,为了最大化利用汉明空间,在优化过程中引入比特平衡目标和比特无关目标以优化二值表征的分布。在MATH和HISTORY数据集上的实验结果表明,相较于表现最好的文本语义哈希模型DHIM(Deep Hash InfoMax),所提模型在2个数据集的3个召回率设置上分别平均提升约54%和23%;在检索效率方面,所提模型比最优的相似题检索模型QuesCo具有明显的优势。
- 佟威何理扬李锐黄威黄振亚刘淇
- 面向智能教育的自适应学习关键技术与应用被引量:12
- 2021年
- 本文是关于我们获得2020年度吴文俊人工智能科学技术奖主要工作的一个介绍。该成果针对自适应学习中面临的教学资源表示困难、学习状态诊断困难以及学习策略设计困难等关键技术难题,首先构建数据驱动的教学资源无监督表示新框架,提高了教学资源质量评估和内容检索的精度和效率。其次提出基于深度学习的学习者认知诊断新方法,突破了以量表为基础的教育测量理论研究范式。然后设计基于知识匹配的个性化推荐技术以及多目标匹配的自适应推荐技术,满足了智能教育场景的复杂约束与学习者的多样目标需求。最后,本文成果研发了面向基础教育的智能教育系统——智学网,已在全国推广使用,对我国智能教育发展具有积极意义。
- 陈恩红刘淇王士进黄振亚苏喻丁鹏马建辉竺博
- 关键词:自适应学习智能教育个性化推荐
- 一种面向教育评估的智能教育辅助平台被引量:3
- 2015年
- K-12教育是教育领域一个重要的方面.近年来,在线教育模式已成为K-12教育重要的组成部分,被人们广泛接受.然而,现有的在线教育系统和智能教育系统大多为基于教育资源数据库,能够为学生和老师提供优质的线上教育资源,这些针对K-12教育的解决方案鲜有结合线下考试(如期末考试等)资源,并且较少考虑教师和学生的个性化需求.针对以上问题,提出并实现了一种面向教育评估的智能教育辅助平台(intelligent tutoring platform for educational assessment,ITPEA),该平台采用线下考试-线上评估的模式,从试题、学生、教师三个角度进行深入的诊断分析.具体地,该平台收集大规模线下考试数据,结合教育领域模型,首先给出对考试的试题参数分析.其次,针对学生知识点掌握进行分析,给出个性化的学生认知诊断.最后,使用一种除去非教师因素的教师影响力分析法来评估教师,并通过数据挖掘技术,帮助教师找出异常学生.ITPEA的关键技术已经在国内某在线教育系统上运行,取得了良好的效果.
- 黄振亚苏喻吴润泽刘玉苹刘淇陈志刚胡国平
- 关键词:教育评估个性化需求数据挖掘
- 基于认知诊断的个性化试题推荐方法被引量:82
- 2017年
- 面向学生的个性化试题推荐是智能教育领域重要的研究课题,现有的试题推荐工作大多采用协同过滤的方法或基于认知诊断的方法.然而,协同过滤的试题推荐方法往往忽略了学生的学习状态(知识点掌握情况);基于认知诊断的方法只能建模单个学生的学习状态,不能利用相似学生的共性特征.针对以上问题,文中提出一种基于学生知识点掌握程度的协同过滤试题推荐方法.该推荐方法分为3步:第1步结合认知诊断模型,根据学生已有的答题情况和试题知识点的关联对学生的试题掌握水平进行建模;第2步将学生的试题掌握水平用于概率矩阵分解预测学生的答题情况;第3步根据得分预测和试题难度向学生进行相应的试题推荐.该推荐方法同时考虑了被推荐学生学习的个性和群组学生学习的共性,在保证试题推荐解释性的同时提高了试题推荐的可靠性.最后,文中通过大量对比实验证明了该方法在进行学生试题推荐时能够保持精确性和可解释性.
- 朱天宇黄振亚陈恩红刘淇吴润泽吴乐苏喻陈志刚胡国平
- 关键词:协同过滤
- 一种面向教育评估的智能教育辅助平台
- K-12教育是教育领域一个重要的方面.近年来,在线教育模式已成为K-12教育重要的组成部分,被人们广泛接受.然而,现有的在线教育系统和智能教育系统大多为基于教育资源数据库,能够为学生和老师提供优质的线上教育资源,这些针对...
- 黄振亚苏喻吴润泽刘玉苹刘淇陈志刚胡国平
- 融合通用题目表征学习的神经知识追踪方法研究被引量:5
- 2022年
- 知识追踪是一项评估学生学习过程中知识状态演变情况的任务。现有大多数方法都致力于探索不同的知识状态评估方法。然而,答题过程中更为基础的题目表征受到的关注相对较少。因此,该文提出了一种融合通用题目表征学习的神经知识追踪框架。具体地,该文首先设计了一种通用的题目表征方法,通过知识点、难度和题目独有特征来区分题目。然后,采用现有知识追踪方法同时捕捉知识状态演变并学习题目表征。最后,利用知识状态和待回答题目表征的内积来模拟回答过程。在三个真实数据集上的实验结果表明,该文方法可以在知识追踪过程中学习精确有效的题目表征,并且显著提升了基线知识追踪方法的性能,使其能够超过现有最优方法。
- 魏思沈双宏黄振亚刘淇陈恩红苏喻王士进
- 关键词:数据挖掘