期刊文献+
共找到244篇文章
< 1 2 13 >
每页显示 20 50 100
Testing Rating Scale Unidimensionality Using the Principal Component Analysis (PCA)/<i>t</i>-Test Protocol with the Rasch Model: The Primacy of Theory over Statistics 被引量:1
1
作者 Peter Hagell 《Open Journal of Statistics》 2014年第6期456-465,共10页
Psychometric theory requires unidimensionality (i.e., scale items should represent a common latent variable). One advocated approach to test unidimensionality within the Rasch model is to identify two item sets from a... Psychometric theory requires unidimensionality (i.e., scale items should represent a common latent variable). One advocated approach to test unidimensionality within the Rasch model is to identify two item sets from a Principal Component Analysis (PCA) of residuals, estimate separate person measures based on the two item sets, compare the two estimates on a person-by-person basis using t-tests and determine the number of cases that differ significantly at the 0.05-level;if ≤5% of tests are significant, or the lower bound of a binomial 95% confidence interval (CI) of the observed proportion overlaps 5%, then it is suggested that strict unidimensionality can be inferred;otherwise the scale is multidimensional. Given its proposed significance and potential implications, this procedure needs detailed scrutiny. This paper explores the impact of sample size and method of estimating the 95% binomial CI upon conclusions according to recommended conventions. Normal approximation, “exact”, Wilson, Agresti-Coull, and Jeffreys binomial CIs were calculated for observed proportions of 0.06, 0.08 and 0.10 and sample sizes from n= 100 to n= 2500. Lower 95%CI boundaries were inspected regarding coverage of the 5% threshold. Results showed that all binomial 95% CIs included as well as excluded 5% as an effect of sample size for all three investigated proportions, except for the Wilson, Agresti-Coull, and JeffreysCIs, which did not include 5% for any sample size with a 10% observed proportion. The normal approximation CI was most sensitive to sample size. These data illustrate that the PCA/t-test protocol should be used and interpreted as any hypothesis testing procedure and is dependent on sample size as well as binomial CI estimation procedure. The PCA/t-test protocol should not be viewed as a “definite” test of unidimensionality and does not replace an integrated quantitative/qualitative interpretation based on an explicit variable definition in view of the perspective, context and purpose of measurement. 展开更多
关键词 CONFIDENCE INTERVALS Dimensionality PSYCHOMETRICS rasch model Validity
暂未订购
Rating Score Data Analysis by Classical Test Theory and Many-Facet Rasch Model
2
作者 Tsai-Wei Huang Gwo-Jen Guo +1 位作者 William Loadman Fang-Mei Law 《Psychology Research》 2014年第3期222-231,共10页
关键词 h模型 多层面 数据分析 评价 测验 可靠性参数 教育评估 试题难度
在线阅读 下载PDF
Computational Precision of the Power Function for Conditional Tests of Assumptions of the Rasch Model
3
作者 Clemens Draxler Jan Philipp Nolte 《Open Journal of Statistics》 2018年第6期873-884,共12页
Draxler and Zessin [1] derived the power function for a class of conditional tests of assumptions of a psychometric model known as the Rasch model and suggested an MCMC approach developed by Verhelst [2] for the numer... Draxler and Zessin [1] derived the power function for a class of conditional tests of assumptions of a psychometric model known as the Rasch model and suggested an MCMC approach developed by Verhelst [2] for the numerical approximation of the power of the tests. In this contribution, the precision of the Verhelst approach is investigated and compared with an exact sampling procedure proposed by Miller and Harrison [3] for which the discrete probability distribution to be sampled from is exactly known. Results show no substantial differences between the two numerical procedures and quite accurate power computations. Regarding the question of computing time the Verhelst approach will have to be considered much more efficient. 展开更多
关键词 CONDITIONAL Tests CONDITIONAL PROBABILITY DISTRIBUTION HYPERGEOMETRIC DISTRIBUTION Power Function RANDOM Sampling rasch model
在线阅读 下载PDF
A Multi-facet Rasch Model Analyses of Internal Consistency and Rating Bias Detecting in English Tests
4
作者 Zhang Ni 《西安翻译学院学报》 2017年第3期48-53,共6页
在线阅读 下载PDF
基于Rasch模型的生物学试题评分标准构建与检验
5
作者 杨主爱 李文兵 《生物学教学》 北大核心 2025年第9期69-71,共3页
试题评分标准是测验公平的关键之一,而且有助于学生的考后反思和元认知发展。本文以“生态系统”内容为例,通过水平划分、试题及评分标准构建,用Rasch模型的评分尺度结构图作为工具检验评分标准构建的合理性,基于评分尺度结构图分析评... 试题评分标准是测验公平的关键之一,而且有助于学生的考后反思和元认知发展。本文以“生态系统”内容为例,通过水平划分、试题及评分标准构建,用Rasch模型的评分尺度结构图作为工具检验评分标准构建的合理性,基于评分尺度结构图分析评分标准,为一线教师构建试题评分标准提供一定参考依据。 展开更多
关键词 评分标准 rasch模型 生物学试题
在线阅读 下载PDF
多面Rasch模型不同研究设计估计精度比较
6
作者 陈清琳 闫德胜 黎光明 《心理研究》 2025年第5期413-418,共6页
采用模拟研究的方法,探究了在三种被试数量下,交叉设计、嵌套设计和混合设计所估计的评分者宽严程度、项目难度和被试能力等参数估计的精确性。使用R软件模拟数据;使用FACET软件进行参数估计。结果表明:(1)交叉设计下评分者宽严度参数... 采用模拟研究的方法,探究了在三种被试数量下,交叉设计、嵌套设计和混合设计所估计的评分者宽严程度、项目难度和被试能力等参数估计的精确性。使用R软件模拟数据;使用FACET软件进行参数估计。结果表明:(1)交叉设计下评分者宽严度参数估计的精确性最好;(2)嵌套设计下项目难度参数和被试能力均值参数的估计精确性最好;(3)除被试能力标准差参数外,其余各参数估计的精确性良好;(4)被试数量越大,参数估计精确性越高。 展开更多
关键词 多面rasch模型 交叉设计 嵌套设计 混合设计 模拟研究
在线阅读 下载PDF
人生意义量表(修订版)的适用性和推广性:基于CTT和多维Rasch的分析 被引量:20
7
作者 陈维 葛缨 +1 位作者 胡媛艳 张进辅 《中国临床心理学杂志》 CSSCI CSCD 北大核心 2015年第4期604-607,614,共5页
目的:考察人生意义量表(修订版)在大学生群体中的适用性,并分析了它的推广性。方法:采用人生意义量表(修订版)、Rosenberg自尊量表、一般自我效能感量表和孤独感量表对1200名在校大学生进行调查,对问卷的信效度进行了检验。结果:无论正... 目的:考察人生意义量表(修订版)在大学生群体中的适用性,并分析了它的推广性。方法:采用人生意义量表(修订版)、Rosenberg自尊量表、一般自我效能感量表和孤独感量表对1200名在校大学生进行调查,对问卷的信效度进行了检验。结果:无论正交或者斜交旋转,提取的双因子结构相同;多维Rasch分析发现拥有意义感和寻求意义感的项目信度分别为0.809和0.835,分离信度为0.988。结论:人生意义量表(修订版)具有良好的信、效度,在应用研究中具有可推广性。 展开更多
关键词 人生意义 多维rasch 组合信度 聚敛效度 区分效度
原文传递
多维题组效应Rasch模型 被引量:11
8
作者 詹沛达 王文中 +1 位作者 王立君 李晓敏 《心理学报》 CSSCI CSCD 北大核心 2014年第8期1208-1222,共15页
首先,本文诠释了"题组"的本质即一个存在共同刺激的项目集合。并基于此,将题组效应划分为项目内单维题组效应和项目内多维题组效应。其次,本文基于Rasch模型开发了二级评分和多级评分的多维题组效应Rasch模型,以期较好地处理... 首先,本文诠释了"题组"的本质即一个存在共同刺激的项目集合。并基于此,将题组效应划分为项目内单维题组效应和项目内多维题组效应。其次,本文基于Rasch模型开发了二级评分和多级评分的多维题组效应Rasch模型,以期较好地处理项目内多维题组效应。最后,模拟研究结果显示新模型有效合理,与Rasch题组模型、分部评分模型对比研究后表明:(1)测验存在项目内多维题组效应时,仅把明显的捆绑式题组效应进行分离而忽略其他潜在的题组效应,仍会导致参数的偏差估计甚或高估测验信度;(2)新模型更具普适性,即便当被试作答数据不存在题组效应或只存在项目内单维题组效应,采用新模型进行测验分析也能得到较好的参数估计结果。 展开更多
关键词 题组反应模型 多维项目反应模型 项目内多维题组效应 多维题组效应模型 rasch模型
在线阅读 下载PDF
什么是混合式教学设计的难点?——基于Rasch模型的线上线下混合式教学设计方案分析 被引量:110
9
作者 刘徽 滕梅芳 张朋 《中国高教研究》 CSSCI 北大核心 2020年第10期82-87,108,共7页
混合式教学将成为未来高校教学的常态,要从范式变革的层面来深入理解混合式教学,充分融合线上线下的教学。混合式教学要重视教学设计。通过自编的质量评估工具对X大学的32份线上线下混合式教学设计方案进行评估,运用Rasch模型分析数据,... 混合式教学将成为未来高校教学的常态,要从范式变革的层面来深入理解混合式教学,充分融合线上线下的教学。混合式教学要重视教学设计。通过自编的质量评估工具对X大学的32份线上线下混合式教学设计方案进行评估,运用Rasch模型分析数据,找到当前混合式教学在目标设计、评价设计、内容设计、方法设计和资源设计五个方面中存在的难点,并在此基础上,提出混合式教学设计应有逆向思维,贯穿全过程和为学习搭建支架。 展开更多
关键词 混合式教学 教学设计 rasch模型 怀特图
原文传递
中学生语文学科能力表现——基于Rasch模型的语文测试评价 被引量:16
10
作者 张燕华 郑国民 关惠文 《课程·教材·教法》 CSSCI 北大核心 2014年第11期69-74,共6页
以能力考察为核心的语文测试评价框架包括学习理解、实践应用和创新迁移三个能力层级。在建构中学生语文学科能力构成体系的基础上,对北京市两个区的七年级至十一年级共4322名中学生的语文能力进行测试,运用Rasch模型进行分析与讨论,研... 以能力考察为核心的语文测试评价框架包括学习理解、实践应用和创新迁移三个能力层级。在建构中学生语文学科能力构成体系的基础上,对北京市两个区的七年级至十一年级共4322名中学生的语文能力进行测试,运用Rasch模型进行分析与讨论,研究结果发现:从学习理解能力来说,中学生尤其应该加强分析概括能力和领会理解能力的培养;从实践应用能力来说,语文教学应该关注中学生应用交际能力的培养。针对不同的文类,应该培养学生的文类意识;从创新迁移能力来说,应该重视培养中学生的写作能力,尤其在内容创新、表达真情实感等方面更需要加强。 展开更多
关键词 rasch模型 语文学科能力 学生能力 测试评价
在线阅读 下载PDF
学业水平测试中作文评分误差的多面Rasch分析 被引量:9
11
作者 刘红云 陈阅 +1 位作者 骆方 王云峰 《心理科学》 CSSCI CSCD 北大核心 2010年第4期925-927,共3页
使用多面Rasch模型,从评分量表、评分员等层面对参与2007年八年级语文学业水平测试作文评分的17名评分员的评分情况进行了研究。结果发现:(1)评分员的评分等级所对应的能力值呈正常的变化趋势,大部分评分员有较好的内部一致性;(2)不同... 使用多面Rasch模型,从评分量表、评分员等层面对参与2007年八年级语文学业水平测试作文评分的17名评分员的评分情况进行了研究。结果发现:(1)评分员的评分等级所对应的能力值呈正常的变化趋势,大部分评分员有较好的内部一致性;(2)不同评分员的宽严程度有显著差异,评分员之间的一致性整体较好;(3)此外,本文还就评分内部一致性较差的几个评分员的评分做了进一步研究。 展开更多
关键词 作文 评分误差 项目反应理论 多面rasch模型
原文传递
无领导小组讨论的多侧面Rasch模型应用 被引量:8
12
作者 姚若松 赵葆楠 +1 位作者 刘泽 苗群鹰 《心理学报》 CSSCI CSCD 北大核心 2013年第9期1039-1049,共11页
采用项目反应理论(IRT)的多侧面Rasch模型(MFRM),分析评价中心技术中无领导小组讨论(LGD)的测评结果,探讨被试能力水平、评委评分宽严度、评分内部一致性、维度难度和评定等级等问题,进而讨论各种偏差。通过MFRM分析人事测评结果,可深... 采用项目反应理论(IRT)的多侧面Rasch模型(MFRM),分析评价中心技术中无领导小组讨论(LGD)的测评结果,探讨被试能力水平、评委评分宽严度、评分内部一致性、维度难度和评定等级等问题,进而讨论各种偏差。通过MFRM分析人事测评结果,可深入了解被试能力的真实差异、甑别维度难度、探查测评误差源,从而完善测评试题编制、评估或诊断评委合格性、提高测评维度与测评目的匹配性,为拓展项目反应理论在人事测评中的应用提供独特视角。 展开更多
关键词 无领导小组讨论 多侧面rasch模型 项目反应理论 人事测评
在线阅读 下载PDF
Rasch模型在CET考试分数等值中的应用 被引量:19
13
作者 朱正才 杨惠中 杨浩然 《现代外语》 CSSCI 北大核心 2003年第1期69-75,共7页
本文详细描述了Rasch模型在中国大学英语四、六级考试的分数等值系统中的应用情况,并使用真实考试数据进行了Rasch模型背景下的分数等值实验,对分数等值过程中的诸多问题进行详尽的分析和探讨。
关键词 题目反应理论 分数等值 rasch模型
在线阅读 下载PDF
基于Rasch理论的计算机模型教学测验的设计与应用 被引量:13
14
作者 韦斯林 柳秀峰 王祖浩 《中国电化教育》 CSSCI 北大核心 2014年第7期139-144,共6页
该文针对当前国内外基于计算机模型的教学测验研究较为滞后的现状,运用Rasch理论及测量设计"四基石"模型,以1600名中、美中学生为对象,通过两轮实证研究,探讨计算机模型教学测验设计的方法、过程。研究结果表明,Rasch理论及&q... 该文针对当前国内外基于计算机模型的教学测验研究较为滞后的现状,运用Rasch理论及测量设计"四基石"模型,以1600名中、美中学生为对象,通过两轮实证研究,探讨计算机模型教学测验设计的方法、过程。研究结果表明,Rasch理论及"四基石"模型能有效指导计算机模型教学测验的开发、修订,优化测验的质量,为我国相关领域的研究提供有益的启示和借鉴。 展开更多
关键词 计算机模型 rasch模型 教学测验 科学教育
在线阅读 下载PDF
纵向Rasch模型在大学新生适应性追踪研究中的应用 被引量:29
15
作者 曹亦薇 毛成美 《心理学报》 CSSCI CSCD 北大核心 2008年第4期427-436,共10页
对1952名大学新生进行适应性调查,其中285人接受了2次以上的追踪调查,所得的多级评分重复测量数据采用纵向Rasch模型进行统计分析。研究应用SAS的GLIMMIX过程对多层Rasch模型参数估计作了新的尝试。结果表明:(1)新生在第一学年内,学习... 对1952名大学新生进行适应性调查,其中285人接受了2次以上的追踪调查,所得的多级评分重复测量数据采用纵向Rasch模型进行统计分析。研究应用SAS的GLIMMIX过程对多层Rasch模型参数估计作了新的尝试。结果表明:(1)新生在第一学年内,学习和情绪适应总体呈上升趋势,人际适应呈下降趋势;(2)不同个体入学时的适应状况差异显著,但是随时间变化的趋势、快慢相同;(3)学习适应分量表的项目稳定性较好,而人际、情绪适应的部分项目难度存在时间效应。研究结果对新生辅导具有启示意义。 展开更多
关键词 新生适应 项目反应理论 多层模型 纵向rasch模型 SAS GLIMMIX
在线阅读 下载PDF
积极型追随力:概念、结构、量表开发与Rasch分析 被引量:6
16
作者 刘毅 彭坚 路红 《西北师大学报(社会科学版)》 CSSCI 北大核心 2016年第1期115-124,共10页
积极型追随力是指成功、有效的追随者在拥护领导并努力实现共同积极目标的过程中所表现出的积极心理、行为和关系特征的综合体。本研究通过开放式问卷和访谈法搜集有关积极型追随力的条目,运用因素分析探索并验证了积极型追随力的四维结... 积极型追随力是指成功、有效的追随者在拥护领导并努力实现共同积极目标的过程中所表现出的积极心理、行为和关系特征的综合体。本研究通过开放式问卷和访谈法搜集有关积极型追随力的条目,运用因素分析探索并验证了积极型追随力的四维结构:支持力、沟通力、进取心和忠诚度。为了编制一份具有客观测量特性的追随力量表,研究以905名中小学教师为研究对象,运用Rasch模型对积极型追随力量表进行分析。结果显示:修正评分等级后的量表具有较好的分离信度,数据与模型拟合良好,残差主成份分析验证了追随力四个分量表的单向度性,量表试题梯难度与受试者追随力水平对应分布合理。研究厘清了积极型追随力的概念议题,并开发了一份具有较好信效度的量表,使客观测量成为可能。 展开更多
关键词 追随力 rasch模型 因素分析 追随力量表
原文传递
应用Rasch模型对浙江省男男性行为者HIV感染相关性行为风险评估 被引量:3
17
作者 王憓 潘晓红 +3 位作者 马瞧勤 周欣 姜婷婷 陈琳 《中国艾滋病性病》 CAS CSCD 北大核心 2019年第6期622-626,共5页
目的应用罗氏(Rasch)模型在男男性行为者(MSM)中开展艾滋病病毒(HIV)相关的高危性行为风险测量,以评估不同类型的高危性行为对感染HIV的危险程度和排序。方法采用同伴推动抽样法(RDS)选取浙江省的杭州、宁波和温州共1 316名MSM开展横断... 目的应用罗氏(Rasch)模型在男男性行为者(MSM)中开展艾滋病病毒(HIV)相关的高危性行为风险测量,以评估不同类型的高危性行为对感染HIV的危险程度和排序。方法采用同伴推动抽样法(RDS)选取浙江省的杭州、宁波和温州共1 316名MSM开展横断面研究。通过Rasch模型方法评估由12项高危性行为组成的HIV性风险量表。结果Rasch分析结果表明,12项高危性行为满足模型使用的单维性和局部独立性要求。虽然个体信度较低,但是项目信度较高,达0.94。拟合度分析显示,各高危性行为条目与模型拟合较好,其拟合度指标infit和outfit均在可接受范围内。项目难度系数显示"与临时男性性伴有不安全肛交性行为"对感染HIV的风险最大。结论Rasch模型可在MSM中用来测量HIV感染相关性行为风险的水平,并建立每一种高危性行为对HIV传播的风险程度,为在MSM中开展HIV行为干预的设计和评估提供测量工具。 展开更多
关键词 罗氏模型 男男性行为者 艾滋病病毒/艾滋病 性行为风险 评估
原文传递
多面Rasch模型在主观题评分培训中的应用 被引量:16
18
作者 李中权 孙晓敏 +1 位作者 张厚粲 张立松 《中国考试》 2008年第1期26-31,共6页
主观题的评分受到很多因素的影响,如评分者的知识水平、综合能力和个人偏好等。这些评分者偏差不仅会导致不同评分者之M存在主观差异,也会到导致同一评分者在不同的时间也具有主观不稳定性。最终导致主观题评分信度的降低。本研究将多... 主观题的评分受到很多因素的影响,如评分者的知识水平、综合能力和个人偏好等。这些评分者偏差不仅会导致不同评分者之M存在主观差异,也会到导致同一评分者在不同的时间也具有主观不稳定性。最终导致主观题评分信度的降低。本研究将多面Rasch模型运用到某国家级考试论述题的评分培训中。通过分析6名有经验评分者对58份试卷的试评数据,鉴别出四种评分者偏差,然后据此对每个评分者进行个别反馈,从而提高评分的客观性和精确性。 展开更多
关键词 多面rasch模型 主观评分 评分者培训
原文传递
托幼机构教育质量评价中评委偏差的多侧面Rasch分析 被引量:5
19
作者 陈德枝 秦金亮 李克建 《心理科学》 CSSCI CSCD 北大核心 2016年第3期628-636,共9页
采用多侧面Rasch模型对28位评委在托幼机构教育质量评价中的评委偏差进行了分析。分析结果显示:28名评委评分宽严度差异显著;3名评委内部一致性较差,其余25名评委内部一致性较稳定;评委与评价班级的交互作用不显著,与评价项目的交互作... 采用多侧面Rasch模型对28位评委在托幼机构教育质量评价中的评委偏差进行了分析。分析结果显示:28名评委评分宽严度差异显著;3名评委内部一致性较差,其余25名评委内部一致性较稳定;评委与评价班级的交互作用不显著,与评价项目的交互作用显著。研究结果表明MFRM可以对托幼机构教育质量评价的评委偏差进行个体层面的具体分析,从项目反应理论的视角为托幼机构教育质量评价的评委针对性培训、评估评委的合格性从而建立合格评委库等提供现代教育、心理测量学依据。 展开更多
关键词 多侧面rasch模型 评委偏差 托幼机构教育质量评价
原文传递
德国COMET评分量表在我国应用的多面Rasch模型分析 被引量:6
20
作者 何兴国 赵志群 何壮 《职业技术教育》 北大核心 2016年第25期69-74,共6页
德国COMET评分量表是职业能力测评的重要评价工具,其蕴含着设计导向的职业教育思想和综合职业能力的人才培养目标,对我国职业教育评价及改革都具有重要借鉴意义。运用项目反应理论之多面Rasch模型,对COMET评分量表在我国学生职业能力测... 德国COMET评分量表是职业能力测评的重要评价工具,其蕴含着设计导向的职业教育思想和综合职业能力的人才培养目标,对我国职业教育评价及改革都具有重要借鉴意义。运用项目反应理论之多面Rasch模型,对COMET评分量表在我国学生职业能力测评中的适用性进行了分析。结果表明:COMET评分量表总体区分度较高,能够有效地区分我国职业教育背景下的学生职业能力水平;我国学生对COMET评分量表部分项目存在着不适应现象,部分学生答题行为内部一致性较差;我国教师对COMET评分量表宽严尺度把握内部一致性较好,但不同评分教师个体之间的宽严程度还存在差异;评分教师与评分项目交互作用也存在一些显著偏差。 展开更多
关键词 COMET评分量表 多面rasch模型 项目分析 职业能力测评 职业院校
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部