期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
大数据背景下基于概率-非概率样本的高维数据整合推断研究
被引量:
1
1
作者
刘晓宇
金勇进
《数理统计与管理》
北大核心
2025年第3期381-392,共12页
随着大数据时代的到来,以互联网为媒介的网络调查具有成本低、速度快等优势,得到了广泛应用与发展,与此同时,大数据在官方调查和统计中的使用也逐渐受到重视。然而,这些样本通常属于非概率样本,无法反映总体特征,也不能直接采用概率抽...
随着大数据时代的到来,以互联网为媒介的网络调查具有成本低、速度快等优势,得到了广泛应用与发展,与此同时,大数据在官方调查和统计中的使用也逐渐受到重视。然而,这些样本通常属于非概率样本,无法反映总体特征,也不能直接采用概率抽样的推断方法。基于“概率-非概率”样本的数据整合,可以综合两类样本的优势,在保证代表性的同时降低数据收集成本、扩大样本量。大数据背景下,大量辅助信息的获取成为可能,但如何利用这些数据进行有效推断,是数据整合面临的重大挑战。尤其在以倾向得分为基础的推断方法中,倾向得分模型纳入的变量对保证推断效果至关重要。据此,本文借助辅助变量将概率样本的总体代表性融入到涉及非概率样本的整合推断中,在双稳健估计框架下,考虑理想倾向得分模型应包含的变量特征,提出基于Adaptive Lasso对倾向得分模型进行变量选择与估计,并结合超总体模型以及辅助变量层面样本对总体还原程度来设置Adaptive Lasso参数的推断方法。模拟与实证结果显示,本文方法能有效控制非概率样本偏差,提高总体特征估计精度,且在不同收敛因子设置下以及模型错误指定时表现稳定。
展开更多
关键词
数据整合
双稳健
高维变量选择
倾向得分
adaptivelasso
原文传递
题名
大数据背景下基于概率-非概率样本的高维数据整合推断研究
被引量:
1
1
作者
刘晓宇
金勇进
机构
首都经济贸易大学统计学院
中国人民大学应用统计科学研究中心
出处
《数理统计与管理》
北大核心
2025年第3期381-392,共12页
基金
国家社会科学基金青年项目(23CTJ027)。
文摘
随着大数据时代的到来,以互联网为媒介的网络调查具有成本低、速度快等优势,得到了广泛应用与发展,与此同时,大数据在官方调查和统计中的使用也逐渐受到重视。然而,这些样本通常属于非概率样本,无法反映总体特征,也不能直接采用概率抽样的推断方法。基于“概率-非概率”样本的数据整合,可以综合两类样本的优势,在保证代表性的同时降低数据收集成本、扩大样本量。大数据背景下,大量辅助信息的获取成为可能,但如何利用这些数据进行有效推断,是数据整合面临的重大挑战。尤其在以倾向得分为基础的推断方法中,倾向得分模型纳入的变量对保证推断效果至关重要。据此,本文借助辅助变量将概率样本的总体代表性融入到涉及非概率样本的整合推断中,在双稳健估计框架下,考虑理想倾向得分模型应包含的变量特征,提出基于Adaptive Lasso对倾向得分模型进行变量选择与估计,并结合超总体模型以及辅助变量层面样本对总体还原程度来设置Adaptive Lasso参数的推断方法。模拟与实证结果显示,本文方法能有效控制非概率样本偏差,提高总体特征估计精度,且在不同收敛因子设置下以及模型错误指定时表现稳定。
关键词
数据整合
双稳健
高维变量选择
倾向得分
adaptivelasso
Keywords
data intergration
double robustness
variable selection
propensity score
adaptive lasso
分类号
C811 [社会学—统计学]
O212 [理学—概率论与数理统计]
原文传递
题名
作者
出处
发文年
被引量
操作
1
大数据背景下基于概率-非概率样本的高维数据整合推断研究
刘晓宇
金勇进
《数理统计与管理》
北大核心
2025
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部