李美娟 作品数:34 被引量:170 H指数:7 供职机构: 北京教育科学研究院 更多>> 发文基金: 国家自然科学基金 教育部人文社会科学研究基金 北京市教育科学“十二五”规划重点课题 更多>> 相关领域: 文化科学 哲学宗教 自动化与计算机技术 语言文字 更多>>
铆测验特征对多维混合题型测验等值的影响 2022年 测验等值是我国考试改革亟待解决的重大技术问题,而铆测验设计是等值技术的核心环节。结合我国学业水平测试特点,采用模拟研究方法,探讨铆测验内容代表性、题目难度分布对多维混合题型测验等值精度的影响。结果表明:铆测验内容代表性对各参数等值结果影响显著,与被等值测验维度相同,即内容代表性最佳的铆测验等值精度更高;铆测验的题目难度分布对各参数等值结果有一定影响,在大部分条件下,当难度参数的分布是被等值测验的50%或20%时,等值精度更高。该研究为我国学业水平测试等值体系建立、铆测验设计开发提供了方法学依据。 王家祺 张咏梅 李美娟 田一关键词:测验等值 学业水平测试 计算心理测量理论在核心素养测评中的应用——以合作问题解决测评为例 被引量:7 2022年 核心素养是在复杂情境中解决问题的能力,涵盖了逻辑思维、分析、综合、推理、演绎、归纳和假设等高阶能力。核心素养测评需要采用新的理念和技术,在计算机动态真实情境中,通过学生的作答过程评价其知识、技能、情感态度价值观等综合表现。在理论层面,计算心理测量理论将自上而下的理论指导与自下而上的数据驱动结合,为核心素养测评提供理论和方法支撑;在应用层面,以合作问题解决测评为例,阐释基于证据为中心指导的测验设计,以及如何从多模态过程数据中提取关键特征,与理论模型建立联系,最终形成评分指标的过程。为核心素养测评探索了方法与路径,是计算心理测量理论走向测评实践的尝试和突破。 李美娟 刘红云 张咏梅关键词:过程数据 学校规模对学生学业成绩影响的实证研究 被引量:4 2015年 本研究以北京市223所小学的19,411名五年级学生为研究对象,采用多层线性模型深入分析学校规模对学生学业成绩的影响,结论如下:(1)学校规模与学校合格率、学校增值分数间存在着正线性关系,学校规模越大,学校合格率越高,学校增值分数越高。(2)就学校规模对于学校合格率的影响情况而言,在不控制学校地域、学校社会经济地位、学生性别、学生户籍类别、学生家庭社会经济地位的条件下,规模>810人的学校合格率显著高于规模≤810人的学校;在控制上述背景变量条件下,各类规模学校间的合格率不存在规律性显著性差异,即不存在学校规模影响学校合格率的质性变化临界线。(3)就学校规模对于学校增值分数的影响情况而言,在不控制和控制上述背景变量条件下,各类规模学校间的学校增值分数均不存在规律性的显著性差异,即不存在学校规模影响学校增值分数的质性变化临界线。 郝懿 李美娟 田一关键词:学业成绩 合格率 网络双评过程中作文评分误差以及评分者效应的分析——以大规模英语考试作文评分为例 被引量:3 2015年 目前大规模考试作文评分大都采用双评评分模式,本研究采用多侧面Rasch模型(MFRM)分析双评模式下大型英语作文评分中的评分者误差来源及主要影响因素。对57名评分者所评价的2 427篇作文分析发现:1评分者的宽严度存在显著的差异;2在作文评分中,约有22.8%的评分者之间的一致性较差,也存在约3.5%的评分者之间一致性过高;3约90%的评分者自身的一致性都较高,但仍有8.8%的评分者自身一致性很差,约2%的评分者出现评分自身一致性过高的情况;4从整体上讲,评分者在不同的评分标准(或维度)上、不同评分等级宽严程度的把握存在差异;评分者和被试,以及评分者、被试和评分标准三者的交互作用不显著;5评分者对男生和女生具有相同的宽严度。 李美娟 刘红云学生发展核心素养应用路径的实证研究——以北京市义务教育阶段学业标准为载体 被引量:14 2018年 "核心素养"是当前全球基础教育理论研究和实践应用领域的焦点。以我国学生发展核心素养框架的研究为基础,以北京市义务教育阶段小学品德与社会、小学语文、中学语文、小学科学、中学物理、中学化学、中学生物、中学地理八个学科学业标准的修订为切入点,采用问卷调查法、编码法等,探索北京市义务教育阶段以学业标准为载体的学生发展核心素养应用路径,并指出未来研究的方向。 张咏梅 胡进 田一 李美娟 王家祺关键词:义务教育阶段 学业标准 实证研究 计算机动态测验中问题解决过程策略的分析:多水平混合IRT模型的拓展与应用 被引量:11 2020年 学生在完成计算机动态测验过程中,会产生大量带有时间标记的过程性数据。本研究基于5个国家(地区)3196名学生在PISA2012一道交通问题解决任务上的139990条数据,将多水平混合IRT(MMix IRT)模型进行拓展,用于探索问题解决过程策略的类别特点。结果表明,该模型不仅可以基于行为序列对不同国家(地区)学生在解决问题时策略使用情况的典型特征进行分析,还可以提供个体水平的能力估计值。拓展的MMixIRT模型可用于分析过程性数据的特征。 李美娟 刘玥 刘红云考生作答数据反馈对Angoff标准设定结果的影响 2016年 以大规模学业成就水平测验为背景,采用组间设计,按类别将专家分为五组,在反馈数据环节随机给予每个专家组未调整的考生真实作答数据和经过上调、下调0.5或1个标准差的调整数据后,采用单因素方差分析与项目反应理论两参数模型考查专家组在标准设定Angoff方法中如何参考使用题目作答数据。结果表明,反馈考生题目作答数据对Angoff标准划定结果有明显影响:反馈未经调整的真实考生题目作答数据影响较大;反馈调整后的高于真实考生题目作答数据影响相对较小,反馈低于真实考生题目作答数据影响相对较大。 张咏梅 田一 郝懿 李美娟减负增效 何以可能——基于对6所学校教学与管理的个案研究 2014年 减轻学生过重的学习负担,是社会关注的热点话题。基于对北京市义务教育教学。质量监控与评价数据分析,发现部分学校教学质量稳步提升,而学习负担却没有增加。之所以有这样的成绩,源于这些学校有先进的育人理念,注重减轻学生学习负担,积累了丰富的教学管理经验,同时,在课堂教学中积极探索以学生为主体的多种教学方式,培养学生浓厚的学习兴趣和良好的学习习惯。 何光峰 李美娟 郝懿关键词:课堂教学 教学管理 义务教育结果公平现状及趋势的实证研究——基于北京市2011—2014年大规模学业质量监测 被引量:6 2016年 促进公平是国家的基本教育政策。义务教育的公平发展由关注教育投入开始逐渐转向关注教育结果,而对于义务教育结果公平的测量和分析,将为促进义务教育公平的政策制定提供实证依据。依托北京市义务教育教学质量分析与评价反馈系统项目,对2011—2014年义务教育阶段五、八年级语文、数学、英语学科各类别学生群体的学业质量情况进行差异分析,并以学生学业成绩的合格率和优秀率差异水平作为教育结果公平指标,同时借鉴经济学的MLD指数、泰尔指数、基尼系数等指标对整体结果公平程度进行分析,以期为义务教育结果公平研究探索一条实证路径,科学、准确地评价教育公平的现状及趋势,为更有针对性地促进义务教育公平发展,开展有效的义务教育改革奠定基础。 田一 李美娟 王家祺关键词:教育公平 学业质量监测 TIMSS数学录像课研究及其借鉴意义 被引量:9 2016年 录像课研究是国际教育评估协会1995年和1999年数学与科学趋势研究(The Trend of International Mathematics and Science Study,TIMSS)项目的组成部分,开创了运用大规模录像课进行课堂教学评价的先河.以数学录像课研究为例,介绍该项目录像课样本的选择、录像课研究的目的、录像课研究编码的开发、录像课编码框架的特点、研究中面临的问题及解决方法,在此基础上分析它对全面评价课堂教学质量,诊断并改进教学问题,构建教学质量监控与评价体系的借鉴意义. 何光峰 李美娟关键词:TIMSS 录像课 课堂教学评价