摘要
属性数据分析是统计学中的重要方法,在社会科学领域研究中有着广泛应用,但在当前学术研究应用中存在较多的使用误区。本文通过梳理2010—2024年社会科学领域CSSCI来源期刊中使用Logit模型或Probit模型等分析方法的文献,并从模型选取、变量选择、统计推断、结果解释和因果推断5个方面,总结属性数据分析方法的应用现状及常见错误类型。结果表明,学术研究在使用属性数据分析方法时,主要存在线性模型与非线性模型的混淆使用、变量选择标准缺乏统一性、统计推断方法误用和参数估计结果错误解读等问题。此外,本文分析了错误应用产生的原因,并给出相应的建议。研究结果以期阐释属性数据分析方法常见误区背后的统计学原理,为社会科学研究中正确使用属性数据分析方法提供借鉴。
Categorical data analysis is an important statistical method widely used in social science research.However,there are numerous mistakes in current academic research.This study reviews the literature from CSSCI journals in social sciences between 2010 and 2024 that utilizes methods such as Logit model or Probit model.It summarizes the application status and common error types in categorical data analysis from five aspects:model selection,variable selection,statistical inference,result interpretation,and causal inference.The results indicate that the main issues include the incorrectly distinguish linear and nonlinear models,inconsistent variable selection criteria,misuse of statistical inference methods,and misinterpretation of parameter estimation results when using attribute data analysis methods in academic research.Additionally,this paper analyzes the causes of these mistakes and provides corresponding strategies.The research aims to clarify the statistical principles behind the common mistakes in categorical data analysis methods,and offers guidance for their correct application in social science research.
作者
赵明
王晓军
Zhao Ming;Wang Xiaojun
出处
《统计研究》
北大核心
2025年第11期152-160,共9页
Statistical Research
基金
教育部人文社会科学研究青年项目“普惠医疗保险高质量发展的精算定价模型与风险管理研究”(23YJC790200)
北京市属高等学校优秀青年人才培育计划项目“大数据背景下老年人健康预期寿命不平等的多维测度研究”(BPHR202203166)。