国家自然科学基金(31100756)
- 作品数:19 被引量:141H指数:7
- 相关作者:涂冬波蔡艳戴海琦丁树良刘铁川更多>>
- 相关机构:江西师范大学赣南医学院南昌大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金教育部人文社会科学研究基金更多>>
- 相关领域:哲学宗教自动化与计算机技术理学文化科学更多>>
- 基于属性层级关系的rRUM模型优化--模型解释力及判准率的提升视角被引量:1
- 2016年
- 以提高认知诊断模型判准率及对数据的解释力为视角,对当前应用较广泛的r RUM模型进行优化(优化后的模型简记为r RUM-AH),并采用Monte Carlo模拟研究及实证研究相结合的范式,比较分析了传统的r RUM模型和r RUM-AH模型的诊断正确率及诊断结果的解释力.研究结果表明:当属性间存在层级关系时,不论在何种实验设计条件下,优化后的r RUM-AH模型属性诊断正确率远远高于传统的r RUM模型;当属性间存在层级关系时,r RUM模型的模式判准率平均不到80%(而r RUM-AH模型平均高达90%以上),难于满足实际需求,此时实际应用者选用该研究新开发的模型是一个较好的选择.
- 蔡艳涂冬波
- 关键词:认知诊断模型
- 多级评分的认知诊断计算机化适应测验被引量:21
- 2016年
- 本文在0-1评分的CD-CAT基础上,拓展出了适合多级评分CD-CAT(ps CD-CAT)的认知诊断模型及选题策略,为实现多级评分CD-CAT提供了方法支持。Monte Carlo模拟实验结果表明:本文拓展的多级评分CD-CAT具有较理想的属性诊断正确率及测验效率和题库安全性,可以用于多级评分数据的CD-CAT;模拟实验还表明,整体来看PS-PWKL和PS-HKL两种选题策略具有较高属性判准率、题库安全性和高测验效率,且均优于PS-KL选题策略。总之,本研究对于进一步拓展CD-CAT在实践中的应用提供了认知诊断模型与选题策略等。
- 蔡艳苗莹涂冬波
- 基于属性多级化的认知诊断计算机化自适应测验设计与实现被引量:13
- 2015年
- 本研究在传统CD-CAT的基础上进行拓展,开发设计了可以处理属性多级化的CD-CAT(记为p CD-CAT),而且当测验所有属性的水平数Lk=2时则p CD-CAT可简化为CD-CAT,因此传统CD-CAT是本研究设计开发p CD-CAT的一个特例。Monte Carlo模拟实验结果表明:基于属性多级化框架下设计的p CD-CAT具有较好的诊断正确率、题库安全性和较高的测验效率,弥补了传统CD-CAT不足;当属性多级化时,若采用传统CD-CAT方法,则诊断正确率很不理想(属性模式判准不到30%),表明传统CD-CAT在属性多级化测验情景时不适宜,而本文设计的p CD-CAT是一种不错的选择(属性模式判准高达80%以上)。总之,本研究对于进一步拓展CD-CAT在实践中的应用提供了新方法和新技术支持。
- 涂冬波蔡艳
- 基于群体水平评估的认知诊断模型开发与应用被引量:1
- 2014年
- 开发了基于群体水平评估的认知诊断模型——G-AHM,用Monte Carlo模拟探讨模型的性能与表现及其在实践中的具体应用。研究发现:(1)G-AHM具有较高的边际判准率、较好的模式判准率和较强的稳健性,说明新模型基本合理可行。(2)与已有较好的认知诊断模型比较发现:从认知状态、属性掌握概率与属性掌握比例三个方面,G-AHM模型所获得的群体诊断结果都与已有结果基本一致,即可认为G-AHM具有较高的效度。特别地,G-AHM将认知状态与群体对属性的掌握概率信息相结合,可更好的解释及分析被试的认知水平,提供的信息更具参考价值。
- 蔡艳涂冬波丁树良
- 认知诊断测验Q矩阵估计方法比较被引量:2
- 2015年
- 认知诊断以微观认知角度对被试做出准确评估与反馈的优势在心理与教育测量领域展现出巨大发展潜力,但要利用这种优势就必须确保Q矩阵的合理性。研究表明错误界定的Q矩阵会严重影响模型参数估计和被试分类准确性。本文从参数化与否出发介绍6种基于被试作答反应的Q矩阵估计方法的基本思想、实现步骤及应用情况,总结这些方法的特点并展望未来研究方向,为认知诊断研究及应用提供借鉴和基础。
- 刘永涂冬波
- 关键词:Q矩阵
- 基于潜在类别分析的6~15岁儿童平衡秤任务认知规则探索被引量:1
- 2013年
- 本研究使用自编平衡秤测验测试468名6~15岁儿童,通过潜在类别分析对认知规则进行分类。结果发现,被试使用了重量规则、重量规则、重量距离规则、补偿规则、力矩规则、距离优势规则等六种规则;6~9岁儿童主要使用重量规则;10~13岁儿童主要使用补偿规则;14岁以上儿童主要使用力矩规则;13岁到14岁之间是掌握力矩规则的关键时期。与规则评估技术相比,潜在类别分析用于认知规则研究具有明显优势,最后对运用此方法的前提假设与局限进行了讨论。
- 赵玉戴海琦刘铁川
- 关键词:解题策略
- 我国一大型考试等值的铆题参数漂移检验
- 2012年
- 设置铆题来链接不同测验形式是一种常用的等值设计。但受到曝光等因素影响,铆题功能在不同施测时间会发生改变。本研究采用MH检验和logistic回归考察我国一大型考试等值的铆题质量,结果发现,有22个铆题发生参数漂移,铆题的难度参数和区分度参数可能发生漂移;这些铆题中大部分在二次使用时无法通过模型拟合检验;若不删除参数发生漂移的铆题导致较大的系统等值误差,应将铆题参数漂移检验作为等值中的一步必要工作。
- 刘铁川戴海琦赵玉
- 关键词:项目功能差异
- 几种常用非补偿型认知诊断模型的比较与选用:基于属性层级关系的考量被引量:21
- 2013年
- 当前国际上开发了60多种认知诊断计量模型(Fu&Li,2007),各种模型各具特点,实际应用者应根据实际情况选用恰当的模型。本研究以属性层级关系为切入点,采用MonteCarlo模拟的研究方法,比较了属性层级关系正确及有误两种情况下,当前国际上常用的五种认知诊断模型的性能,以充分考察不同认知诊断模型对属性层级关系的依赖程度,及属性层级关系的错误界定对各认知诊断模型诊断正确率的影响,从而为实际运用者在认知诊断模型选用上提供借鉴和参考。
- 涂冬波蔡艳戴海琦
- 关键词:认知诊断模型
- 现代测量理论观点下的测验偏差评价被引量:1
- 2012年
- 测验在当前社会广泛应用的同时,其公平性受到了社会各界的广泛关注。具备公平性的测验应是无偏差的。随着测量理论的快速发展,目前已经出现多类测验偏差评价技术用以维护测验公平,而国内测验研究与实践中所使用的方法却相对滞后。本研究从现代测量学的角度,介绍了评价测量偏差、预测偏差、等值偏差方法的最新进展,并给出了使用建议。这些方法关注测验偏差的不同角度,但紧密相联。我国各行业的测验工作者应充分利用这些理论技术来指导测验的编制、使用,以促进测验的公平性。
- 刘铁川戴海琦赵玉
- 关键词:项目功能差异
- 教育认知诊断测验与认知模型一致性的评估被引量:35
- 2012年
- 构建正确的认知模型是成功进行认知诊断的关键之一,如果认知诊断测验不能完整准确地代表这个认知模型,这个测验的效度就存在问题。属性及其层级可以表示一个认知模型。在认知模型正确基础上,给出了一个计量公式以衡量认知诊断测验能够多大程度上代表认知模型;对于不止包含一个知识状态的等价类及其形成原因进行了分析,对Cui等人的属性层级相合性指标(HCI)提出修改建议,以更好地探查数据与专家给出的认知模型的一致性。
- 丁树良毛萌萌汪文义罗芬CUI Ying