基于CTT的锚测验非等组设计中四种等值方法的比较研究被引量：11

Comparison of Four Equating Methods in Common-Item NonEquivalent Group Design Based on The Classical Test Theory

下载PDF

导出

摘要采用锚测验非等组设计的数据收集方案,对4种基于经典测量理论的等值方法进行了比较研究。研究数据取自TIMSS1999数据库,兼用等值标准误和交叉验证方法作为各等值方法比较的检验标准,利用CIPE程序对实验数据进行分析。研究结果表明,针对本研究所设置的等值情境,线性等值优于等百分位等值,其中Tucker线性方法比Levine观察分数线性方法更好一些,Braun-Holland线性方法不宜采用,频数估计等百分位方法等值误差较大,亦不足取。 Four equating methods in common-item non-equivalent group design based on the classical test theory were compared. ＂The research data was selected from the TIMSS1999 database. Both the equating Standard Error and a crossvalidation analysis were used as the evaluation criteria. And the CIPE program was used to compute the data. We came to a conclusion that, in our research situation, the linear equating procedures were superior to the equipercentile method. Of the linear equating methods, the Tucker linear method was better than the Levine Observed Score equating method, and the Braun-Holland linear method was not appropriate. The Frequency Estimation equipercentile method was with large equating error, and should not be used.

作者焦丽亚辛涛

机构地区北京师范大学发展心理研究所

出处《心理发展与教育》 CSSCI 北大核心 2006年第1期97-102,共6页 Psychological Development and Education

基金国家自然科学基金项目(30440081) 北京市重点实验室建设规划项目(jd100270541)资助

关键词测验等值经典测量理论锚测验设计 test equating classical test theory common-item design

分类号 B841.2 [哲学宗教—基础心理学]

引文网络
相关文献

参考文献13

1谢小庆.对15种测验等值方法的比较研究[J].心理学报,2000,32(2):217-223.
2Kolen M J, Comparsion of traditional and item response theory methods for equating tests. Journal of educational measurement, 1981,18:1-11.
3Lord F M. Practical applications of item characteristic curve theory. Journal of educational measurement, 1977,14 : 117 - 138.
4Marco G L, Item characteristic curve solutions to three intractable testing problems. Journal of educational measurement, 1977,14:139- 160.
5Woods E M, Wiley D E. An application of item characteristic curve equating to single form tests. Paper presented at the Annual Meeting of the Psychometric Society, Chapel Hill, NC, 1977.
6Marco G L, Petersen N S, Stewart E E. A test of the adequacy curvilinear score equating models. Paper presented at the 1979 Computer Adaptive Testing Conference, Minneapolis, 1979.
7Slinde J A, Linn R L, Vertically equated tests:Fact or phantom?Journal of educational measurement, 1977,14 : 23 - 32,
8Petersen N S, Linda L C, Martha L S, Journal of educational statistics, 1983, 8 : 137 - 156.
9Kolen M J, Brennan R L. Test equating, scaling, and linking:methods and practices. New York:Springe Press,2004.
10罗照盛 494-501 494-501.经典测量理论等值的误差研究[J].心理科学,2000,23(4).

共引文献14

1刘瑜.对男大学生上肢力量类测验项目的等值研究[J].首都体育学院学报,2005,17(6):37-40. 被引量：3
2周骏,欧东明,徐淑媛,戴海琦,漆书青.等级反应模型下项目特征曲线等值法在大型考试中的应用[J].心理学报,2005,37(6):832-838. 被引量：10
3甘良梅,余嘉元.标准参照测验分数体系的探讨研究[J].心理学探新,2006,26(3):79-83. 被引量：7
4肖玮,苗丹民,朱宁宁,张青华.应用项目反应理论创建图形推理测验题库[J].心理学报,2006,38(6):934-940.
5孙菡,苗丹民,田建全,肖玮,杨业兵.基于项目反应理论的中国应征青年数学推理测验的编制[J].中国行为医学科学,2007,16(6):565-567. 被引量：5
6罗照盛,熊建华,漆书青,戴海琦,丁树良.项目特征曲线等值的抽样误差[J].心理学报,2007,39(4):723-729. 被引量：4
7范晓玲,廖利国.测验等值综述[J].科技信息,2009(34):341-342.
8刘玥,骆方,刘红云.IRT真分数等值和IRT观察分数等值的对比研究[J].心理科学,2010,33(3):676-680. 被引量：1
9谷峰.在基本计算系统中实现切比雪夫多项式的算法[J].数学的实践与认识,2010,40(20):83-88. 被引量：2
10谷峰.学习水平的标准评价模型及应用[J].数学的实践与认识,2010,40(24):15-21. 被引量：6

同被引文献49

1谢小庆.关于ＨＳＫ等值的试验研究[J].世界汉语教学,1998,12(3):88-96. 被引量：5
2余嘉元.经典测量理论和项目反应理论的比较研究报告[J].南京师大学报（社会科学版）,1989(4):93-100. 被引量：7
3戴海崎,刘启辉.锚题题型与等值估计方法对等值的影响[J].心理学报,2002,34(4):367-370. 被引量：17
4丁树良,熊建华,戴海琦.影响项目反应理论等值效果的因素探查[J].中国考试,2005(1):25-26. 被引量：3
5朱正才.大学英语四、六级考试分数等值研究——一个基于铆题和两参数IRT模型的解决方案[J].心理学报,2005,37(2):280-284. 被引量：18
6汪存友,余嘉元.一种新的基于神经网络的IRT项目参数估计模型[J].计算机应用,2006,26(4):992-994. 被引量：9
7陈希镇.铆测验设计下确定IRT等值常数的新方法[J].中国考试,2006(5):39-42. 被引量：6
8飞思科技产品研发中心.神经网络理论与MATLAB7实现[M].北京:电子工业出版社,2000.
9罗照盛,熊建华,漆书青,戴海琦,丁树良.项目特征曲线等值的抽样误差[J].心理学报,2007,39(4):723-729. 被引量：4
10Dong I K, Robert B, Michael K, et al A comparison of IRT equating and beta 4 equating. Journal of Educational Measurement, 2005 : 77 - 99.

引证文献11

1贾志先.神经网络在试卷等值方面的应用探讨[J].计算机与现代化,2009(2):115-117. 被引量：1
2张敏强,黎光明,焦璨.普教“升中”考试中测验等值的应用研究——以广东省佛山市“升中”考试为例[J].心理与行为研究,2009,7(1):27-31. 被引量：4
3黎光明,张敏强.全测验与锚测验题型分值比对等值误差的影响[J].考试研究,2009,5(3):71-78. 被引量：6
4刘玥,骆方,刘红云.IRT真分数等值和IRT观察分数等值的对比研究[J].心理科学,2010,33(3):676-680. 被引量：1
5马洪超.考生样本量对项目反应理论(IRT)等值稳定性的影响[J].考试研究,2011,7(2):62-66. 被引量：5
6贾志先.基于聚类分析的锚测验等值样本选取方法研究[J].控制工程,2012,19(6):1015-1018. 被引量：2
7曹文娟,白俊梅.锚测验难度参数方差特征对测验等值的影响研究[J].考试研究,2013,9(3):79-85. 被引量：1
8贾志先.维吾尔语水平考试试卷等值研究与应用[J].信息系统工程,2017,30(3):128-130. 被引量：1
9张健.互联网托福在线模考成绩如何实现与ETS官方托福成绩连接[J].考试研究,2017,13(4):55-60.
10张健,任杰.基于共同题非等组设计的等值结果评价标准研究综述[J].中国考试,2018(3):32-37. 被引量：4

二级引证文献21

1陈梦琳,吕欣.主观性试题准锚等值方法探究[J].语言规划学研究,2020(1):74-83.
2马洪超.锚题参数特征对IRT真分数等值的影响[J].中国考试,2010(8):9-13. 被引量：2
3黎光明,张敏强.IRT测验等值模型的选择——以广东佛山市中考数学实测数据为例[J].中国考试,2012(2):8-13. 被引量：7
4徐岩,丁朝蓬,王利.新课程实施以来学生评价改革的回顾与思考[J].课程·教材·教法,2012,32(3):12-21. 被引量：31
5黎光明,张敏强.IRT测验等值流程化操作思路的构建[J].中国考试,2012(11):3-10. 被引量：7
6曹文娟,白俊梅.锚测验难度参数方差特征对测验等值的影响研究[J].考试研究,2013,9(3):79-85. 被引量：1
7贾志先.基于谱聚类的网上阅卷质量控制研究[J].智能计算机与应用,2014,4(5):76-79. 被引量：5
8刘玥,刘红云.多维数据IRT真分数等值和IRT观察分数等值研究[J].心理学探新,2015,35(1):56-61. 被引量：2
9冯庆,廖伯琴,洪宁,李洪波.新课程改革下高考物理选做题目等值性研究——以重庆物理高考试题结构为例[J].重庆师范大学学报（自然科学版）,2015,32(2):168-172. 被引量：1
10吴琼,Pui-wa Lei.从项目特征曲线的估算比较参数型及非参数型项目反应理论模型[J].考试研究,2015,11(6):46-55.

1戴步云,罗照盛.题目难度分布和样本容量对两种CTT等值结果的影响[J].心理学探新,2012,32(3):246-251. 被引量：2
2司岩,王新山.西欧远古时期与中古时期思想道德教育方法的比较研究[J].道德与文明,2003(2):51-54. 被引量：4
3刘玥,刘红云.多维数据IRT真分数等值和IRT观察分数等值研究[J].心理学探新,2015,35(1):56-61. 被引量：2
4约瑟夫.M.瑞安,杜承达,谢小庆.基于经典测量理论和项目反应理论的等值与连接——等值设计和经典测量理论等值程序[J].考试研究,2011,7(2):83-95. 被引量：12
5戴海崎,刘启辉.锚题题型与等值估计方法对等值的影响[J].心理学报,2002,34(4):367-370. 被引量：17
6约瑟夫.M.瑞安,杜承达,谢小庆.基于经典测量理论和项目反应理论的等值与连接——项目反应理论等值程序[J].考试研究,2011,7(3):80-94. 被引量：8
7刘玥,刘红云.不同铆测验设计下多维IRT等值方法的比较[J].心理学报,2013,45(4):466-480. 被引量：5
8周林,王锋.黑格尔与胡塞尔的现象学方法的比较[J].兰州学刊,2006(8):7-8. 被引量：1
9王云玺,王彦秋.孔孟、墨认识方法比较略论[J].苏州科技学院学报（社会科学版）,1995,0(1):13-15.
10王振海.试论“比较”[J].哲学研究,1985(4):78-80.

心理发展与教育

2006年第1期

浏览历史

内容加载中请稍等...

基于CTT的锚测验非等组设计中四种等值方法的比较研究被引量：11

参考文献13

共引文献14

同被引文献49

引证文献11

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于CTT的锚测验非等组设计中四种等值方法的比较研究 被引量：11

参考文献13

共引文献14

同被引文献49

引证文献11

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于CTT的锚测验非等组设计中四种等值方法的比较研究被引量：11