期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
基于Bayesian Lasso方法的变量选择和异常值检测 被引量:2
1
作者 尚华 冯牧 +1 位作者 张贝贝 于凤敏 《计算机应用研究》 CSCD 北大核心 2015年第12期3586-3589,共4页
针对Bayesian Lasso方法的变量选择和异常值检测进行了研究。该方法是在线性回归模型中引入识别变量,借助于双层Bayesian模型和Gibbs抽样算法,给出识别变量后验概率的计算方法和变量选择的方法,通过比较这些识别变量的后验概率进行异常... 针对Bayesian Lasso方法的变量选择和异常值检测进行了研究。该方法是在线性回归模型中引入识别变量,借助于双层Bayesian模型和Gibbs抽样算法,给出识别变量后验概率的计算方法和变量选择的方法,通过比较这些识别变量的后验概率进行异常值定位。最后进行了大量的模拟实验,结果表明,该方法是可行且有效的。 展开更多
关键词 变量选择 异常值 bayesian lasso方法 GIBBS抽样
在线阅读 下载PDF
Bayesian Lasso for Screening Experiments
2
作者 Hidehisa Noguchi Yoshikazu Ojima Seiichi Yasui 《Journal of Mathematics and System Science》 2013年第2期68-74,共7页
The purpose of variable selection is to identify important predictors for response variables. Although there are many varieties of variable selection methods, almost all of them have a problem of not accounting for th... The purpose of variable selection is to identify important predictors for response variables. Although there are many varieties of variable selection methods, almost all of them have a problem of not accounting for the relationship between predictors. Therefore it would well happen that the selected subset of identified predictors leads to hard-to-interpret model consisted of only interaction terms. In design of experiments, the analysis is driven by the effect heredity principle which governs the relationship between an interaction and its corresponding main effects. In this paper, the authors extend the variable selection method the Lasso with effect heredity principle to its Bayesian version. In the example, the authors analyze the data obtained from typical screening design Plackett-Bunnan design and compare the result from the ordinary Bayesian Lasso and proposed method. 展开更多
关键词 Variable selection bayesian lasso effect heredity principle.
在线阅读 下载PDF
Bayesian Lasso with Neighborhood Regression Method for Gaussian Graphical Model 被引量:1
3
作者 Fan-qun LI Xin-sheng ZHANG 《Acta Mathematicae Applicatae Sinica》 SCIE CSCD 2017年第2期485-496,共12页
In this paper, we consider the problem of estimating a high dimensional precision matrix of Gaussian graphical model. Taking advantage of the connection between multivariate linear regression and entries of the precis... In this paper, we consider the problem of estimating a high dimensional precision matrix of Gaussian graphical model. Taking advantage of the connection between multivariate linear regression and entries of the precision matrix, we propose Bayesian Lasso together with neighborhood regression estimate for Gaussian graphical model. This method can obtain parameter estimation and model selection simultaneously. Moreover, the proposed method can provide symmetric confidence intervals of all entries of the precision matrix. 展开更多
关键词 gaussian graphical model regression precision matrix bayesian lasso Frobenius loss
原文传递
基于Lasso-Bayesian改进的Kriging代理模型优化方法及其应用
4
作者 陈再续 田宏杰 +1 位作者 刘亚举 周春 《煤矿机械》 2024年第12期194-199,共6页
为提高Kriging模型的性能并构建高精度代理模型,基于最小绝对收缩和选择算子(Lasso)与Bayesian算法对Kriging方法进行改进,实现了对Kriging模型的超参数调优,提出Lasso-Bayesian-Kriging代理模型的构建方法。采用Lasso正则化对模型输入... 为提高Kriging模型的性能并构建高精度代理模型,基于最小绝对收缩和选择算子(Lasso)与Bayesian算法对Kriging方法进行改进,实现了对Kriging模型的超参数调优,提出Lasso-Bayesian-Kriging代理模型的构建方法。采用Lasso正则化对模型输入进行特征选择,以降低模型复杂度,提高模型的泛化能力。使用Bayesian算法对Kriging中的相关参数、相关函数以及回归函数进行调优,得到高精度的Kriging代理模型。针对某车间加工矿用钻杆过程中的搬运桁架的实际工程问题,采用4种不同方法对桁架静力学分析进行代理建模,以桁架质量和变形量为代理对象,通过k折交叉验证,结果表明,Lasso-Bayesian-Kriging方法构建的代理模型精度最高,其交叉验证的平均决定系数R2分别为0.999、0.962。将优化算法与Lasso-Bayesian-Kriging模型相结合对桁架进行迭代优化,结果表明优化后的桁架在满足刚度的前提下实现了轻量化。 展开更多
关键词 KRIGING模型 bayesian优化 lasso正则化 代理模型 工程优化
原文传递
基于贝叶斯LASSO矩阵指数空间模型辨识布鲁氏菌病发病的关键风险因素 被引量:2
5
作者 张辉国 梁韵婷 胡锡健 《中国人兽共患病学报》 CSCD 北大核心 2023年第12期1233-1238,共6页
目的 探索2020年中国内地31个省、直辖市、自治区布病发病率与气候、自然环境及畜牧业因素间的关系,从众多因素中筛选出关键变量,为布病防控提供科学依据。方法 针对空间自相关性,结合矩阵指数空间模型(MESS)与贝叶斯LASSO建立BL-MESS模... 目的 探索2020年中国内地31个省、直辖市、自治区布病发病率与气候、自然环境及畜牧业因素间的关系,从众多因素中筛选出关键变量,为布病防控提供科学依据。方法 针对空间自相关性,结合矩阵指数空间模型(MESS)与贝叶斯LASSO建立BL-MESS模型,利用置信区间辨识重要变量,通过空间效应分解揭示各因素对布病发病率的潜在关系。结果 我国布病省域发病率存在显著的空间正相关性,关键因素识别结果表明平均气温、平均海拔高度、牧草地面积占比、山羊、绵羊年末存栏量对发病率有显著影响,此外山羊年末存栏量空间溢出效应显著为正,平均海拔高度则相反。表明低海拔的地区及山羊养殖规模较大的省份有布病外溢的风险。结论 新方法显著缩小了参数估计的标准差,提升了精度,并有效识别重要风险因素。布病深受气候因素与畜牧业因素影响,密切关注气候变化与动物防护应是今后布病防控的重要内容。 展开更多
关键词 布鲁氏菌病 矩阵指数空间规范 贝叶斯lasso
暂未订购
面板数据贝叶斯自适应Lasso分位数回归——基于非对称指数幂分布的研究 被引量:4
6
作者 陶长琪 徐玉婷 《统计研究》 CSSCI 北大核心 2022年第9期128-144,共17页
分位数回归的贝叶斯推断目前几乎都建立在非对称拉普拉斯分布(ALD)之上。ALD中尾且缺乏控制尾部参数的弊端使得其在实际数据出现尖峰厚尾以及偏斜分布时不能灵活地反映数据特征,导致贝叶斯分位数估计出现偏差。为克服这一缺陷,本文采用... 分位数回归的贝叶斯推断目前几乎都建立在非对称拉普拉斯分布(ALD)之上。ALD中尾且缺乏控制尾部参数的弊端使得其在实际数据出现尖峰厚尾以及偏斜分布时不能灵活地反映数据特征,导致贝叶斯分位数估计出现偏差。为克服这一缺陷,本文采用具有左右尾参数的非对称指数幂(AEP)分布和基于Gibbs的自适应Metropolis–Hastings抽样方法,对经典贝叶斯分位数回归方法进行了扩展与改进,形成了基于AEP分布的贝叶斯自适应Lasso分位数回归方法,并将该方法首次应用于面板数据中。同时,为检验AEP方法的有效性,本文将该方法与基于偏指数幂(SEP)分布和基于ALD分布的贝叶斯自适应Lasso分位数回归方法进行了模拟比较。结果显示,AEP方法比SEP和ALD方法更不易受极端值的影响,性能更稳定。并且,在不同扰动项分布假设和不同分位数水平下,该方法具有更高精度的变量筛选功能。最后,选取36家我国零售类上市公司为实证研究对象,运用AEP方法对其股票收益率影响因素进行筛选和回归估计,进一步验证了该方法在实际问题中进行变量选择和参数估计的能力。 展开更多
关键词 面板数据 贝叶斯自适应lasso 分位数回归 非对称指数幂分布
在线阅读 下载PDF
基于贝叶斯Lasso处理异常值及重尾数据的研究 被引量:2
7
作者 王新军 朱永忠 李佳蓓 《统计与决策》 CSSCI 北大核心 2018年第6期10-14,共5页
在高维数据回归问题中,由于数据中往往存在异常值,特别地在一些领域内会出现数据波动异常激烈甚至呈现出厚尾的特性,所以对于这类问题,传统的最小二乘估计很难处理。文章对上述的问题,改进现有的Bayesian Lasso方法,在Bayesian Lasso的G... 在高维数据回归问题中,由于数据中往往存在异常值,特别地在一些领域内会出现数据波动异常激烈甚至呈现出厚尾的特性,所以对于这类问题,传统的最小二乘估计很难处理。文章对上述的问题,改进现有的Bayesian Lasso方法,在Bayesian Lasso的Gibbs抽样过程中引入两组潜变量,来模拟模型的随机误差,通过Gibbs抽样以及边缘极大似然法得出参数及潜变量有效的后验分布,提出了一种稳健有效的处理异常值的方法。通过数据仿真以及实例分析,与现有的方法进行比较,结果表明此方法能很好地处理数据中出现异常值以及呈现厚尾特性的数据。 展开更多
关键词 贝叶斯lasso 异常值 重尾 吉布斯抽样
在线阅读 下载PDF
基于自适应LASSO先验的稀疏贝叶斯学习算法 被引量:7
8
作者 白宗龙 师黎明 孙金玮 《自动化学报》 EI CAS CSCD 北大核心 2022年第5期1193-1208,共16页
为了提高稀疏信号恢复的准确性,开展了基于自适应套索算子(Least absolute shrinkage and selection operator,LASSO)先验的稀疏贝叶斯学习(Sparse Bayesian learning,SBL)算法研究.1)在稀疏贝叶斯模型构建阶段,构造了一种新的多层贝叶... 为了提高稀疏信号恢复的准确性,开展了基于自适应套索算子(Least absolute shrinkage and selection operator,LASSO)先验的稀疏贝叶斯学习(Sparse Bayesian learning,SBL)算法研究.1)在稀疏贝叶斯模型构建阶段,构造了一种新的多层贝叶斯框架,赋予信号中元素独立的LASSO先验.该先验比现有稀疏先验更有效地鼓励稀疏并且该模型中所有参数更新存在闭合解.然后在该多层贝叶斯框架的基础上提出了一种基于自适应LASSO先验的SBL算法.2)为降低提出的算法的计算复杂度,在贝叶斯推断阶段利用空间轮换变元方法对提出的算法进行改进,避免了矩阵求逆运算,使参数更新快速高效,从而提出了一种基于自适应LASSO先验的快速SBL算法.本文提出的算法的稀疏恢复性能通过实验进行了验证,分别针对不同大小测量矩阵的稀疏信号恢复以及单快拍波达方向(Direction of arrival,DOA)估计开展了实验.实验结果表明:提出基于自适应LASSO先验的SBL算法比现有算法具有更高的稀疏恢复准确度;提出的快速算法的准确度略低于提出的基于自适应LASSO先验的SBL算法,但计算复杂度明显降低. 展开更多
关键词 稀疏信号恢复 稀疏贝叶斯学习 自适应lasso先验 贝叶斯推断
在线阅读 下载PDF
基于线性插值的贝叶斯Lasso分位数回归及应用 被引量:2
9
作者 赖学方 贺兴时 贺琳 《统计与决策》 CSSCI 北大核心 2017年第18期23-28,共6页
在贝叶斯Lasso分位数回归中,样本似然函数的计算和后验分布的抽样通常难以处理。针对这一问题,文章采用一种基于线性插值的似然函数计算方法,并结合拉普拉斯先验分布,设计出一种新的对后验分布进行抽样的算法。数值模拟结果表明了该方... 在贝叶斯Lasso分位数回归中,样本似然函数的计算和后验分布的抽样通常难以处理。针对这一问题,文章采用一种基于线性插值的似然函数计算方法,并结合拉普拉斯先验分布,设计出一种新的对后验分布进行抽样的算法。数值模拟结果表明了该方法具有较好的适应性和参数估计准确性。 展开更多
关键词 贝叶斯lasso 分位数回归 似然函数 股票净资产收益率
在线阅读 下载PDF
基于分层贝叶斯Lasso的稀疏ISAR成像算法 被引量:8
10
作者 杨磊 夏亚波 +3 位作者 毛欣瑶 廖仙华 方澄 高洁 《电子与信息学报》 EI CSCD 北大核心 2021年第3期623-631,共9页
逆合成孔径雷达(ISAR)目标回波具有明显的稀疏特征,传统的凸优化稀疏ISAR成像算法涉及繁琐的正则项系数调整,严重限制了超分辨成像的精度及便捷程度。针对此问题,该文面向非约束Lasso正则化模型,建立分层贝叶斯概率模型,将非约束的l1范... 逆合成孔径雷达(ISAR)目标回波具有明显的稀疏特征,传统的凸优化稀疏ISAR成像算法涉及繁琐的正则项系数调整,严重限制了超分辨成像的精度及便捷程度。针对此问题,该文面向非约束Lasso正则化模型,建立分层贝叶斯概率模型,将非约束的l1范数正则化问题等效转化成稀疏拉普拉斯先验建模问题,并在分层贝叶斯Lasso模型中建立正则项系数依赖的概率分布,从而为实现完全自动化参数调整提供便利条件。考虑到目标稀疏散射特征和多超参数的高维统计特性,该文应用吉布斯(Gibbs)随机采样方法,实现对ISAR目标稀疏特征的求解,并同步获取包括正则项系数在内的多参数估计。基于该文研究方法可实现全部参数均通过数据学习获得,从而有效避免繁琐的参数调整过程,提升算法的自动化程度。仿真及实测数据均可证明该方法的有效性和优越性。 展开更多
关键词 逆合成孔径雷达 贝叶斯lasso 分层贝叶斯 吉布斯采样
在线阅读 下载PDF
变量选择的稳健贝叶斯LASSO方法
11
作者 梁韵婷 张辉国 胡锡健 《西南师范大学学报(自然科学版)》 CAS 2023年第8期33-40,共8页
针对数据中广泛存在的异常值会扭曲贝叶斯LASSO方法的参数估计和变量选择结果的问题,通过引入异方差扰动的先验设定,借此提升贝叶斯LASSO方法的稳健性,并推导出各参数的后验分布,利用Gibbs抽样得到其估计值与置信区间.该方法在数值模拟... 针对数据中广泛存在的异常值会扭曲贝叶斯LASSO方法的参数估计和变量选择结果的问题,通过引入异方差扰动的先验设定,借此提升贝叶斯LASSO方法的稳健性,并推导出各参数的后验分布,利用Gibbs抽样得到其估计值与置信区间.该方法在数值模拟中表现出较低的拟合误差与较高的变量识别准确率,对糖尿病数据集和血浆β-胡萝卜素水平数据集的分析表明该方法能达到简化模型与减少预测误差的平衡,实现稳健的变量选择与系数估计,并对数据中可能包含的异常值与异方差扰动有良好的抑制作用. 展开更多
关键词 变量选择 贝叶斯lasso 稳健性 异常值 异方差
在线阅读 下载PDF
新生儿坏死性小肠结肠炎的LASSO-BN模型研究 被引量:2
12
作者 杨启越 贾晓云 +4 位作者 张新华 周浩 康娅楠 王星雨 白丽霞 《医学研究杂志》 2024年第11期57-63,共7页
目的 通过LASSO回归进行变量初筛,根据初筛结果进行多因素Logistic回归分析以及采用最大最小爬山法(max-min hill-climbing, MMHC)构建贝叶斯网络模型,探讨新生儿坏死性小肠结肠炎(necrotizing enterocolitis, NEC)的相关因素及各因素... 目的 通过LASSO回归进行变量初筛,根据初筛结果进行多因素Logistic回归分析以及采用最大最小爬山法(max-min hill-climbing, MMHC)构建贝叶斯网络模型,探讨新生儿坏死性小肠结肠炎(necrotizing enterocolitis, NEC)的相关因素及各因素间复杂的网络关系,并通过比较2种模型以寻找最优的建模工具。方法 以2020年1月~2023年12月在山西省儿童医院(山西省妇幼保健院)新生儿内科、新生儿外科、NICU住院的所有NEC患儿为研究对象,回顾性收集NEC调查数据并利用LASSO回归进行变量初筛,根据初筛结果进行多因素Logistic回归分析以及采用MMHC混合算法进行结构学习和极大似然估计法进行参数学习,构建NEC贝叶斯网络模型。结果 经过变量初筛后,早产、低体重出生儿、喂养方式、宫内窘迫及出生后窒息史、贫血、无创呼吸机、益生菌、妊娠期糖尿病、C反应蛋白(C-reactive protein, CRP)和降钙素原(procalcitonin, PCT)10个因素纳入构建模型。贝叶斯网络模型结果显示,建模组和验证组的受试者工作特征(receiver operating characteristic, ROC)曲线下面积分别为0.825和0.817,准确率分别为89.78%和90.43%;多因素Logistic回归分析结果显示,建模组和验证组的ROC曲线下面积分别为0.777和0.741,准确率分别为70.01%和69.44%;贝叶斯网络模型性能优于多因素Logistic回归分析。并且贝叶斯网络模型显示,低体重出生儿、喂养方式、益生菌和PCT与NEC直接相关,早产及无创呼吸机通过低体重出生与NEC间接相关,CRP通过PCT与NEC间接相关。结论 通过比较2种模型,发现贝叶斯网络模型是一种深入研究NEC与相关因素及各因素间网络关系的有效工具。通过这个模型,能够精确地评估NEC与各因素的关联强度,为NEC防治提供科学依据。 展开更多
关键词 lasso回归 LOGISTIC回归分析 贝叶斯网络模型 坏死性小肠结肠炎 相关因素
暂未订购
基于时空组Lasso与分层贝叶斯时空模型的变量选择方法 被引量:1
13
作者 王玲 康子豪 《地球信息科学学报》 EI CSCD 北大核心 2023年第7期1312-1324,共13页
从高维度、大数据量的时空数据中有效选择变量是时空数据领域的重要问题之一,现有的时空数据变量选择的方法在变量选择的过程中未充分考虑时空相关性,时空变量选择阶段与预测阶段分开进行,且往往需要人为设定时空点个数阈值判定变量的取... 从高维度、大数据量的时空数据中有效选择变量是时空数据领域的重要问题之一,现有的时空数据变量选择的方法在变量选择的过程中未充分考虑时空相关性,时空变量选择阶段与预测阶段分开进行,且往往需要人为设定时空点个数阈值判定变量的取舍,从而无法较为准确的选择对因变量影响最大的变量子集,导致后续预测效果较差。本文针对上述不足,提出了一种基于时空组Lasso与分层贝叶斯时空模型的变量选择方法,称为分层贝叶斯时空组Lasso变量选择模型(Hierarchical Bayesian Spatio-temporal Group Lasso Variable Selection Method,HBST-GLVS),该方法首先利用时空组Lasso进行变量选择,通过引入最大时间滞后和最大空间邻域充分考虑时空相关性,并根据时空数据连续性,将同一时空变量的时空点进行整体惩罚,避免人为设定时空点个数引起局部片面性。然后,利用分层贝叶斯时空模型对变量选择的效果进行验证,将变量选择过程与模型验证过程置于同一框架下进行参数的调整,从而得到最优的变量子集。实验结果表明,与现有方法相比,本文方法在北京空气质量数据集、波特兰交通流数据集上的RMSE(Root Mean Square Error)和MAE(Mean Square Error)可分别降低9.6%~25.7%以及6.6%~15.9%。 展开更多
关键词 时空数据 变量选择 时空相关性 时空组lasso 最大时间滞后 最大空间邻域 分层贝叶斯时空模型
原文传递
基于LASSO变量选择联合贝叶斯网络构建恶性肿瘤相关急性肾损伤(AKI)风险预测模型 被引量:22
14
作者 李阳 陈晓泓 +5 位作者 王一梅 胡家昌 沈子妍 沈波 林静 丁小强 《复旦学报(医学版)》 CAS CSCD 北大核心 2020年第4期521-530,共10页
目的利用套索(least absolute shrinkage and selection operator,LASSO)回归和贝叶斯网络分析方法,构建适合肿瘤患者急性肾损伤(acute kidney injury,AKI)发病风险的贝叶斯网络预测模型,为早期识别高危人群,制定AKI精准预防策略提供科... 目的利用套索(least absolute shrinkage and selection operator,LASSO)回归和贝叶斯网络分析方法,构建适合肿瘤患者急性肾损伤(acute kidney injury,AKI)发病风险的贝叶斯网络预测模型,为早期识别高危人群,制定AKI精准预防策略提供科学依据。方法以2014年10月1日至2015年9月30日在复旦大学附属中山医院就诊的恶性肿瘤住院患者为研究对象。于医院数据管理平台收集患者年龄、性别、体重指数、既往病史、肿瘤类型/治疗、基础肝肾功能、生化和电解质指标等数据资料。通过LASSO回归筛选出与AKI发生显著相关的影响因素;借助贝叶斯网络分析进一步描述变量间相互作用并评价模型预测效能。结果26914名研究对象中,AKI发病率为12.4%(n=3326),其中肾癌(27.3%),多发性骨髓瘤(24.1%)和急性粒细胞白血病(23.9%)患者的AKI发病率最高。LASSO回归筛选出22个与AKI发生相关性最显著的变量,包括年龄、性别、体重指数、糖尿病史、肿瘤类型/分期/治疗方式、肝功能、肾小球滤过率(estimated glomerular filtration rate,e GFR)/血清肌酐值/血尿酸、白蛋白、血红蛋白和白细胞计数、血钠/血钾等电解质。贝叶斯网络模型发现血红蛋白、e GFR、血氯和血磷与AKI的发生有直接联系;节点治疗方式通过影响血钠和白蛋白等中间节点间接影响AKI的发生;糖尿病和性别通过节点尿酸间接相连e GFR,而后者是AKI的父节点。模型推理在其他条件一致的情况下,贫血和e GFR≤59 m L·min-1·1.73 m-2的患者发生AKI的概率最高(55.7%);而上述指标均正常者AKI发病率最低(3.0%)。模型评价发现贝叶斯网络模型的分类准确率为88.8%,接受者操作特性曲线曲线下面积为0.806。结论基于LASSO变量选择联合贝叶斯网络分析构建的模型在肿瘤相关AKI的影响因素分析中更符合实际理论,其在发病风险预测中有较好的临床应用价值。 展开更多
关键词 急性肾损伤(AKI) 恶性肿瘤 lasso回归 贝叶斯网络 预测模型
暂未订购
联合自适应LASSO与块稀疏贝叶斯直接定位方法 被引量:2
15
作者 罗军 张顺生 《雷达科学与技术》 北大核心 2024年第3期265-274,共10页
无源定位中,直接定位方法优势在于适用低信噪比、参数独立等。然而,当辐射源距无源侦测系统较远时,受低信噪比的影响,接收信号模型中存在的部分未知参数会大幅降低算法对于辐射源的定位性能。为了有效地解决该难题,给出了一种联合自适应... 无源定位中,直接定位方法优势在于适用低信噪比、参数独立等。然而,当辐射源距无源侦测系统较远时,受低信噪比的影响,接收信号模型中存在的部分未知参数会大幅降低算法对于辐射源的定位性能。为了有效地解决该难题,给出了一种联合自适应LASSO先验与块稀疏贝叶斯的辐射源直接定位方法。经由贝叶斯理论构建分层稀疏模型,联合不同的先验分布以赋予信号中元素独立的自适应LASSO,同时探索信号的块结构和块内相关性,联合具有共享稀疏性的不同基站的字典重建过完备字典,实现远距离辐射源定位。仿真结果表明:在远距离下,当快拍数设置较少,信噪比设定较低时,在辐射源定位效果上所提算法显著优于如MUSIC等传统直接定位算法、Laplace先验方法以及块稀疏贝叶斯方法。 展开更多
关键词 直接定位 自适应lasso先验 块稀疏贝叶斯 过完备字典
在线阅读 下载PDF
贝叶斯LASSO正则加权复合分位回归及其应用 被引量:3
16
作者 田玉柱 田茂再 《应用概率统计》 CSCD 北大核心 2021年第4期390-404,共15页
回归模型一般采取传统的最小二乘估计(LSE)方法,然而当数据包含非正态特征或异常值时该估计方法会导致不稳健的参数估计.与LSE方法相比,即使出现非正态误差或异常数据,复合分位回归(CQR)方法也能提供更稳健的估计结果.基于复合反对称拉... 回归模型一般采取传统的最小二乘估计(LSE)方法,然而当数据包含非正态特征或异常值时该估计方法会导致不稳健的参数估计.与LSE方法相比,即使出现非正态误差或异常数据,复合分位回归(CQR)方法也能提供更稳健的估计结果.基于复合反对称拉普拉斯分布(CALD),本文提出了贝叶斯框架下的加权复合分量回归(WCQR)方法.正则化方法已经被验证可以有效处理高维稀疏回归模型,它可以同时进行变量选择和参数估计.本文结合贝叶斯LASSO正则化方法和WCQR方法来拟合线性回归模型,建立了WCQR的贝叶斯LASSO正则化分层模型,并导出了所有参数的条件后验分布以进行统计推断.最后,通过蒙特卡罗模拟和实际数据分析演示了所提出方法. 展开更多
关键词 WCQR 惩罚lasso 分位回归(QR) MCMC抽样 贝叶斯分层模型
在线阅读 下载PDF
基于Bayesian Bootstrap抽样的高维线性回归模型
17
作者 周超 吴娟 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2021年第5期461-466,共6页
研究小样本下高维线性回归模型中的变量选择问题和模型预测能力。当自变量维数p远大于样本量n时,提出基于Bayesian bootstrap抽样的SCAD(smoothly clipped absolute deviation)压缩方法。仿真和实证分析表明,与SCAD和LASSO(least absolu... 研究小样本下高维线性回归模型中的变量选择问题和模型预测能力。当自变量维数p远大于样本量n时,提出基于Bayesian bootstrap抽样的SCAD(smoothly clipped absolute deviation)压缩方法。仿真和实证分析表明,与SCAD和LASSO(least absolute shrinkage and selection operator)两种传统回归压缩方法相比,本算法受随机干扰影响较小。当样本量较小时,本算法的变量压缩结果更好,变量选择能力更强,模型的标准均方误差值也最小,且模型预测能力提升明显。 展开更多
关键词 高维线性回归 变量选择 小样本 bayesian bootstrap lasso(least absolute shrinkage and selection operator) SCAD(smoothly clipped absolute deviation)
原文传递
基于融合Lasso惩罚变量的贝叶斯混合效应分位数回归方法研究 被引量:1
18
作者 李琼忆 金良琼 +1 位作者 陶永 冉烨军 《宁夏师范学院学报》 2024年第7期12-25,共14页
为了解决混合效应分位数回归模型中大量未知随机效应和固定效应的存在,给模型参数估计与变量选择带来的困难问题.提出一种带有融合Lasso惩罚的贝叶斯混合效应分位数回归方法来估计系数,给出了模型的后验分布,构造了参数估计的Gibbs抽样... 为了解决混合效应分位数回归模型中大量未知随机效应和固定效应的存在,给模型参数估计与变量选择带来的困难问题.提出一种带有融合Lasso惩罚的贝叶斯混合效应分位数回归方法来估计系数,给出了模型的后验分布,构造了参数估计的Gibbs抽样算法.模拟显示,该方法在不同的随机误差分布下都有较强的稳健性,且在稀疏数据类型下相比稠密数据类型具有更好的表现,在变量选择问题上,不仅能选择重要的变量,而且将无关变量推向0附近,提高了模型的乏化能力和解释性,为实际工作者研究稀疏纵向数据提供了一种有效的建模方法. 展开更多
关键词 融合lasso 分位数回归 贝叶斯估计
在线阅读 下载PDF
A Fully Bayesian Sparse Probit Model for Text Categorization
19
作者 Behrouz Madahian Usef Faghihi 《Open Journal of Statistics》 2014年第8期611-619,共9页
Nowadays a common problem when processing data sets with the large number of covariates compared to small sample sizes (fat data sets) is to estimate the parameters associated with each covariate. When the number of c... Nowadays a common problem when processing data sets with the large number of covariates compared to small sample sizes (fat data sets) is to estimate the parameters associated with each covariate. When the number of covariates far exceeds the number of samples, the parameter estimation becomes very difficult. Researchers in many fields such as text categorization deal with the burden of finding and estimating important covariates without overfitting the model. In this study, we developed a Sparse Probit Bayesian Model (SPBM) based on Gibbs sampling which utilizes double exponentials prior to induce shrinkage and reduce the number of covariates in the model. The method was evaluated using ten domains such as mathematics, the corpuses of which were downloaded from Wikipedia. From the downloaded corpuses, we created the TFIDF matrix corresponding to all domains and divided the whole data set randomly into training and testing groups of size 300. To make the model more robust we performed 50 re-samplings on selection of training and test groups. The model was implemented in R and the Gibbs sampler ran for 60 k iterations and the first 20 k was discarded as burn in. We performed classification on training and test groups by calculating P (yi = 1) and according to [1] [2] the threshold of 0.5 was used as decision rule. Our model’s performance was compared to Support Vector Machines (SVM) using average sensitivity and specificity across 50 runs. The SPBM achieved high classification accuracy and outperformed SVM in almost all domains analyzed. 展开更多
关键词 bayesian lasso SHRINKAGE PARAMETER Estimation GENERALIZED Linear Models MACHINE Learning
暂未订购
Bayesian Regularized Quantile Regression Analysis Based on Asymmetric Laplace Distribution
20
作者 Qiaoqiao Tang Haomin Zhang Shifeng Gong 《Journal of Applied Mathematics and Physics》 2020年第1期70-84,共15页
In recent years, variable selection based on penalty likelihood methods has aroused great concern. Based on the Gibbs sampling algorithm of asymmetric Laplace distribution, this paper considers the quantile regression... In recent years, variable selection based on penalty likelihood methods has aroused great concern. Based on the Gibbs sampling algorithm of asymmetric Laplace distribution, this paper considers the quantile regression with adaptive Lasso and Lasso penalty from a Bayesian point of view. Under the non-Bayesian and Bayesian framework, several regularization quantile regression methods are systematically compared for error terms with different distributions and heteroscedasticity. Under the error term of asymmetric Laplace distribution, statistical simulation results show that the Bayesian regularized quantile regression is superior to other distributions in all quantiles. And based on the asymmetric Laplace distribution, the Bayesian regularized quantile regression approach performs better than the non-Bayesian approach in parameter estimation and prediction. Through real data analyses, we also confirm the above conclusions. 展开更多
关键词 ASYMMETRIC LAPLACE Distribution Gibbs Sampling Adaptive lasso lasso bayesian REGULARIZATION QUANTILE Regression
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部