与传统的纸笔测验(Paper And Pencil Based Test,P&P)相比计算机化自适应测验(Computerized Adaptive Testing,CAT)根据被试的作答反应自适应地选择题目,它不仅缩短了测验长度,还极大地提高了测验的准确性。然而,目前绝大多数CAT不允许被试修改答案,研究者主要担心修改答案会降低CAT的有效性。允许修改答案符合被试一贯的测验习惯,修改之后的分数更能反映被试真实的水平,从而能够进一步促进CAT在实际中的应用。现有的研究主要从三个方面提出了可修改答案CAT的控制方法:一是测验设计;二是改进选题策略;三是建构模型。未来的研究应进一步探讨这些方法之间的比较与结合,以及对可修改答案认知诊断CAT(Cognitive Diagnostic CAT,CD-CAT)的研究。
项目反应理论(IRT)模型依据项目与被试的特征预测被试的作答表现,是常用的心理测量模型。但IRT的有效运用依赖于所选用IRT模型与实际数据资料相符合的程度(即模型?资料拟合度,goodness of fit)。只有当所采用IRT分析模型与实际数据资料拟合较好时,IRT的优点和功能才能真正发挥出来(Orlando&Thissen,2000)。而当所采用IRT模型与资料不拟合或选择了错误的模型,则会导致如参数估计、测验等值及项目功能差异分析等具有较大误差(Kang,Cohen&Sung,2009),给实际工作带来不良影响。因此,在使用IRT分析时,应首先充分考察及检验所选用模型与实际数据是否相匹配/相拟合(McKinley&Mills,1985)。IRT领域中常用模型?资料拟合检验统计量可从项目拟合、测验拟合两个角度进行阐述并比较,这是心理、教育测量领域的重要主题,也是测验分析过程中较易忽视的环节,目前还未见此类公开发表的文章。未来的研究可以在各统计量的实证比较研究以及在认知诊断领域的拓展方面有所发展。