期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
大数据背景下基于概率-非概率样本的高维数据整合推断研究 被引量:1
1
作者 刘晓宇 金勇进 《数理统计与管理》 北大核心 2025年第3期381-392,共12页
随着大数据时代的到来,以互联网为媒介的网络调查具有成本低、速度快等优势,得到了广泛应用与发展,与此同时,大数据在官方调查和统计中的使用也逐渐受到重视。然而,这些样本通常属于非概率样本,无法反映总体特征,也不能直接采用概率抽... 随着大数据时代的到来,以互联网为媒介的网络调查具有成本低、速度快等优势,得到了广泛应用与发展,与此同时,大数据在官方调查和统计中的使用也逐渐受到重视。然而,这些样本通常属于非概率样本,无法反映总体特征,也不能直接采用概率抽样的推断方法。基于“概率-非概率”样本的数据整合,可以综合两类样本的优势,在保证代表性的同时降低数据收集成本、扩大样本量。大数据背景下,大量辅助信息的获取成为可能,但如何利用这些数据进行有效推断,是数据整合面临的重大挑战。尤其在以倾向得分为基础的推断方法中,倾向得分模型纳入的变量对保证推断效果至关重要。据此,本文借助辅助变量将概率样本的总体代表性融入到涉及非概率样本的整合推断中,在双稳健估计框架下,考虑理想倾向得分模型应包含的变量特征,提出基于Adaptive Lasso对倾向得分模型进行变量选择与估计,并结合超总体模型以及辅助变量层面样本对总体还原程度来设置Adaptive Lasso参数的推断方法。模拟与实证结果显示,本文方法能有效控制非概率样本偏差,提高总体特征估计精度,且在不同收敛因子设置下以及模型错误指定时表现稳定。 展开更多
关键词 数据整合 双稳健 高维变量选择 倾向得分 adaptivelasso
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部