范劲松 作品数:20 被引量:155 H指数:9 供职机构: 复旦大学 更多>> 发文基金: 国家社会科学基金 全国高校外语教学科研项目 教育部人文社会科学研究基金 更多>> 相关领域: 语言文字 更多>>
语言测试效度研究的另一视角考试的因子结构研究 被引量:12 2014年 语言测试效度研究中所需要收集的重要证据是考试所考察的语言能力结构符合相关的语言能力理论模型。本研究以一项校本英语水平考试的效度研究为例,应用结构方程模型中验证性因子分析的方法研究了该考试的效度,并以此展示语言测试效度研究的另外一个视角——通过研究语言考试的因子结构验证考试的效度。本研究的相关结果为该考试的构念效度研究提供了重要证据,同时也为其他语言考试开发机构开展类似的效度研究提供了新的视角和参考。 范劲松 季佩英 俞理明关键词:结构方程模型 验证性因子分析 一部百科全书式的著作:《语言评估指南》评介 2015年 尽管语言测试的历史悠久,但是学界普遍认为现代语言测试的理论与实践始于上世纪60年代(Spolsky 1995)。经过半个多世纪的发展历程,语言测试已经成为应用语言学研究领域的重要学科。在现代社会生活中,语言测试也发挥着越来越重要的作用。 范劲松关键词:语言测试 百科全书 现代社会生活 著作 复旦英语水平考试(FET)效度初探:考试数据分析 被引量:11 2013年 复旦英语水平考试(FET)是一项标准参照的学术英语水平考试,考试对象为复旦大学的在读本科生。本文介绍了FET考试的考察内容与试题结构,并且报告了2011年12月首次FET考试的数据分析情况。对首次FET考试的数据分析结果表明,FET考试的内部一致性信度比较理想;考生在考试各个部分的成绩相关情况也比较理想。方差分析的结果表明,虽然各考生群体的考试成绩之间存在着显著差异,但是差异的实际意义很小;探索性因子分析的结果表明,特征值超过1的因子共有两个,分别为"产出性英语能力"与"接受性英语能力"。数据分析在一定程度上说明了FET考试的效度。在将来的研究中,我们将进一步完善FET考试开发、实施等各个环节的质量控制措施,并且进一步开展FET考试的相关研究。 范劲松 季佩英关键词:数据分析 口语测试中分析性评分量表的构念效度研究 被引量:7 2015年 近些年多层面Rasch模型(MFRM)和结构方程模型(SEM)在语言研究中的应用越来越广泛,但是却很少有研究将这两种分析方法结合起来研究语言考试的效度。本研究采用MFRM和SEM相结合的方法研究了一项口语考试分析性评分量表的构念效度。MFRM和SEM可以从不同的角度为评分量表的构念效度提供证据。MFRM的分析结果表明,评分员的评分信度和评分量表的质量均比较理想;SEM分析的结果表明,高阶能力因子模型与数据的拟合情况理想。本研究的相关结果为评分量表的构念效度提供了重要支撑,同时本研究所采用的MFRM和SEM相结合的方法也为表现型测试评分量表的效度研究提供了重要参考。 范劲松 季佩英关键词:多层面RASCH模型 结构方程模型 口语测试 评分量表 语言测试标准研究:回顾、反思和启迪 被引量:21 2010年 国内大规模语言测试自20世纪80年代以来取得了很大发展。这些考试往往是超大规模的高风险考试,而且对教学产生了重大的反拨作用。因此,这些考试本身的质量如何,考试的使用是否恰当,成为引人关注的问题。如果能够建立一套符合中国国情、适合中国语言测试特点的标准,指导规范考试开发者和使用者在考试各个阶段的行为,必将能够使语言测试更为公平、有效,从而也能使测试对语言教学产生更为积极的反拨作用。自20世纪50年代,尤其是近二十年来,世界各地的语言测试专家和教育工作者携手合作,在制定语言测试标准的研究和实践方面取得了许多重要成果。本文回顾了近二十年来语言测试界在标准制定方面所取得的成果,并且对这些标准进行了反思,以期能够对我们制定适合中国国情的语言测试标准有所启迪。 范劲松 金艳关键词:语言测试 结构方程模型在我国外语界的应用 被引量:3 2017年 本研究采用Ockey&Choi(2015)提出的SEM报道规范和研究合成法对我国12种外语类核心期刊在1999-2015共计17年间发表的52篇SEM文章进行编码和分析,勾勒出我国外语界目前使用SEM的特点与现状。本研究的结果表明,我国外语界研究人员在样本量方面做法普遍较好,但是在数据正态检验、缺失数据处理、参数估计方法、模型拟合指数和模型解释等方面存在不足之处。因此,相关的研究机构、协会或学术期刊应尽快制定我国外语界SEM的使用和报道细则,以进一步规范SEM在外语研究中的应用。 范劲松 任伟关键词:结构方程模型 外语研究 统计分析 Research on Improving Rating Reliability for School-based Oral English Achievement Tests:The Design and Development of a Computer-aided Rating System 2011年 Low rating reliability has long been the primary concern in school-based oral English achievement tests. In this study, a computer-aided rating system (CARS) was developed to improve inter- and intra-rater reliability through the instantiation of rating criteria, task division and random distribution, on-line training, reliability verification and sound wave "reading" and "writing." A rating experiment was conducted among six raters to compare intra- and inter-rater reliability between traditional rating and rating with CARS. At the end of each round of rating, a conference was held. Both quantitative an~ qualitative analyses show that CARS can significantly improve inter- and intra-rater reliability, mainly through helping raters use criteria more accurately and focus more attention on rating. In addition, the research has also shed light upon further study on improving rating reliability. 陆军 范劲松关键词:RATING RELIABILITY Rasch模型下自我评估量表的效度探析 被引量:12 2017年 本研究采用Rasch测量理论中的评分量表模型探析一项自我评估量表的效度。根据解释性效度论据理论,本研究提出量表效度的四个关键性理据,并采用Rasch分析检查这四个效度理据的准确性与合理性。本研究中,我们采用一系列Rasch分析方法,包括信度分析、描述语与模型的拟合度分析、因子分析与试题差异分析等。同时,我们还研究了Rasch模型下被试的自评能力测量值与他们的客观水平测试成绩之间的相关性。研究结果表明,量表的信度良好,基本为单一的能力维度结构,量表的类别设置也比较合理。被试的自评能力值与客观水平测试成绩之间显著相关。本研究的分析结果为四个效度理据提供了重要支撑,本研究所采用的效度研究方法也为量表的效度研究提供了重要参考。 范劲松关键词:RASCH模型 自我评估 国外商务英语能力等级量表研究述评 被引量:14 2017年 近年来,随着我国商务英语教学和测试的迅速发展,建立统一商务英语能力等级量表的重要性和必要性日益显现。本文回顾了国际上较有影响力的五项商务英语能力量表,简要介绍了它们的开发目的、描述语特点以及量表开发方式和效度验证研究,并对各量表的优势与不足进行了反思,以期能够对制定适合我国国情的商务英语能力等级量表有所启发。 王丽 范劲松关键词:商务英语 专门用途英语 中国英语考试行为准则制订:一项探索性研究 近些年以来,世界各地的语言测试组织和机构纷纷制订了自己的语言测试标准或者测试行为准则,以期提高语言测试的质量和专业化水平(参见如AERA/APA/NCME, 1999; ALTE, 1994; EALTA, 2006; ... 范劲松关键词:英语考试 PROFESSIONAL BOARDS 语言测试 EFL 文献传递