评分员对不同体裁作文评分的多面Rasch模型分析被引量：2

The Analysis of Raters' Scoring on Different Writing Genres with Many Facet Rasch Model

下载PDF

导出

摘要主观性测试中,评分员差异是影响测试信度、效度和公平性的重要因素。本文采用多面Rasch模型考察8位评分员对记叙文和议论文两种体裁各60篇作文的评分情况。结果表明,评分员对不同体裁作文的评分存在不一致性:在评分员层面上,评分员的严厉度基本不受体裁的影响,但在评分员的信度与内在一致性方面,议论文评分好于记叙文评分;在评分量表层面上,评分员在评定语言和内容项目上,议论文比记叙文严格,而在条理项目上,议论文比记叙文宽松,并且议论文高分的使用频率比记叙文高。本文还就评分员评分的不一致性的原因进行了探讨,以求为降低评分偏差提供参考。 For the subjective test,the difference of raters is one of the important factors that affect the reliability,validity and fairness of the test. This paper studies eight raters＇ scoring on narration and negotiation both of sixty by using MFRM. It shows there are inconsistencies in the evaluation of different genres： from the level of raters,every rater＇s severity is not affected by the genre of composition,but in terms of the rater ＇s reliability and internal consistency,the scoring results of the argumentative writing is better than that of the narrative; from the level of rating scale,on the evaluation of the language and content item,raters are more stringent for the argumentative than the narrative,but for the consecution,the argumentative is more relaxed than the narrative,and the frequency of using higher scores in the argumentative writing is higher than that of the narrative. This paper also attempts to discuss the reasons for the inconsistencies of raters,so as to provide a reference for reducing the grading bias.

作者王佶旻邓志娜

机构地区北京语言大学汉语考试与教育测量研究所中国教育报刊社

出处《考试研究》 2018年第1期80-89,共10页 Examinations Research

基金国家社科基金重大项目"汉语交际能力标准与测评体系研究(项目号:15ZDB101)" 北京市社科规划项目"首都留学生跨文化适应研究"(项目号:13WYB014)的资助

关键词多面RASCH模型作文体裁评分一致性评分员评分量表 Many Facet Rasch Model, Writing Genres, Consistencies of Scoring, Raters, Rating Scale

分类号 G424.74 [文化科学—课程与教学论]

引文网络
相关文献

参考文献7

1田清源.主观评分中多面Rasch模型的应用[J].心理学探新,2006,26(1):70-73. 被引量：16
2李中权,孙晓敏,张厚粲,张立松.多面Rasch模型在主观题评分培训中的应用[J].中国考试,2008(1):26-31. 被引量：16
3关丹丹,陈睿,张开,赵静宇.两种评分量表的评分效应比较研究[J].教育研究与实验,2011(4):92-96. 被引量：14
4俞韫烨,谢小庆.基于多面Rasch模型的作文网上评卷“趋中评分”判定研究[J].中国考试,2012(1):6-13. 被引量：12
5彭恒利,李蕊.多面Rasch模型在口语主观性试题网上评阅中的应用研究[J].考试研究,2015,11(3):16-26. 被引量：3
6姚琴宜,祁宗海,席仲恩.作文整体评分与分项评分结果的质量比对[J].外语研究,2008,25(5):66-71. 被引量：11
7王佶旻.第二语言口语考试评分方法述评[J].暨南大学华文学院学报,2007(1):24-31. 被引量：11

二级参考文献45

1戴海崎,曹绍游.高考作文阅卷者信度再探[J].教育学术月刊,1988(4):56-58. 被引量：3
2李伟明,严芳.概化理论中的模型选择、数据解释和指标比较——评刘远我等的两篇论文[J].心理学报,2001,33(5):467-470. 被引量：3
3田清源.主观评分中多面Rasch模型的应用[J].心理学探新,2006,26(1):70-73. 被引量：16
4孙晓敏,张厚粲.国家公务员结构化面试中评委偏差的IRT分析[J].心理学报,2006,38(4):614-625. 被引量：36
5杨群,邱江,张庆林.四卡问题解决中的视角效应[J].心理学探新,2007,27(1):30-33. 被引量：14
6Engelhard, G J. The measurement of writing ability with a many facet Rasch Model[J]. Applied Measurement in Education, 1992 (5) .
7Linacre J M. Facets - Rasch measurement computer program.Chicago, Winsteps.com, 2006.
8Saal F E, Downey R G, Lahey M A. Rating the ratings: Assessing the psychometric quality of rating data[J]. Psychological Bulletin, 1980,88(2).
9Linacre J M. What do infit, outfit, mean-square and standardized mean? [J] Rasch Measurement Transactions.2002, 16.
10Engelhard, G J. Examining Rater Error in the Assessment of Written Composition with a Many-Faceted Rasch Model [J]. Journal of Educational Measurement, 1994, 31 (2).

共引文献70

1李英武,张海丽,胡心约.国家公务员遴选策论的多面Rasch模型应用[J].上海行政学院学报,2021,22(6):89-99. 被引量：1
2席仲恩,汪顺玉.英语作文整体评分与分项评分的计量学考量[J].英语研究,2010,8(3):65-70. 被引量：1
3王环宇.对外汉语口语课成绩测试的思考——以首都师范大学国际文化学院为例[J].首都师范大学学报（社会科学版）,2013(S1):101-105. 被引量：1
4李中权,孙晓敏,张厚粲,张立松.多面Rasch模型在主观题评分培训中的应用[J].中国考试,2008(1):26-31. 被引量：16
5关丹丹.主观题评分质量的估计方法评述[J].中国考试,2008(10):52-55. 被引量：8
6李传益.主观考试评分差异研究综述[J].咸宁学院学报,2008,28(5):121-123. 被引量：1
7席仲恩,汪顺玉.经典信度理论和概化理论的计量学透视[J].重庆邮电大学学报（社会科学版）,2009,21(4):120-126. 被引量：1
8薛荣.论交际口语测试及其评分方法[J].外语教学,2009,30(6):62-66. 被引量：16
9张新玲,曾用强,张洁.对大规模读写结合写作任务的效度验证[J].解放军外国语学院学报,2010,33(2):50-54. 被引量：27
10田成泉,郭坤.交际测试理论框架下大学英语口语测试体系研究与应用[J].福建高教研究,2010(2):71-74.

同被引文献4

1孙晓敏,张厚粲.国家公务员结构化面试中评委偏差的IRT分析[J].心理学报,2006,38(4):614-625. 被引量：36
2王蕾.Rasch测量原理及在高考命题评价中的实证研究[J].中国考试,2008(1):32-39. 被引量：18
3俞韫烨,谢小庆.基于多面Rasch模型的作文网上评卷“趋中评分”判定研究[J].中国考试,2012(1):6-13. 被引量：12
4侯晋雄.公开遴选与完善基层公务员培养选拔机制研究[J].重庆理工大学学报（社会科学）,2014,28(8):88-95. 被引量：8

引证文献2

1李英武,张海丽,胡心约.国家公务员遴选策论的多面Rasch模型应用[J].上海行政学院学报,2021,22(6):89-99. 被引量：1
2杜海燕.怀特图在Rasch多面分析中的应用[J].考试周刊,2019,0(5):5-5.

二级引证文献1

1刘拓,朱秋鸿.Likert式计分法应用于卫生健康标准实施效果评估的可行性研究[J].中国卫生标准管理,2022,13(16):1-6. 被引量：21

1李长春.破解选择题的十大策略[J].初中生世界（九年级）,2017,0(7):73-77.
2刘艳.小学语文记叙文教学初探[J].中华少年,2017,0(29):21-22.
3杨雪.论融媒体背景下,如何提升新闻报道的亲和力[J].传播力研究,2017,0(9):71-71. 被引量：1
4吴云天.16层螺旋CT机行颅脑非螺旋扫描成人颅脑的条件选择[J].现代诊断与治疗,2017,28(16):3032-3033.
5孟如莲.如何引导小学生应用赏读法读懂文章[J].基础教育论坛,2017,0(6Z):40-43.
6徐鹏.在线评论对酒店入住量的影响分析[J].纳税,2017,11(16):118-119. 被引量：1
7邓国莉,周龙江,赵义,陈斌,王礼同,彭伟,王苇.初次培训后ASPECT评分一致性和准确性的研究[J].中国卒中杂志,2017,12(12):1104-1110. 被引量：1
8《Ultimate Classical Piano》[J].时代邮刊,2017,0(10):67-67.
9展望.普通话水平测试员应具备的素养[J].贵州教育,2017(20):41-42.
10徐朕,徐晓英.基于双枝节“U”型谐振器的双频段微带带通滤波器[J].固体电子学研究与进展,2017,37(4):261-265.

考试研究

2018年第1期

浏览历史

内容加载中请稍等...

评分员对不同体裁作文评分的多面Rasch模型分析被引量：2

参考文献7

二级参考文献45

共引文献70

同被引文献4

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

评分员对不同体裁作文评分的多面Rasch模型分析 被引量：2

参考文献7

二级参考文献45

共引文献70

同被引文献4

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

评分员对不同体裁作文评分的多面Rasch模型分析被引量：2