期刊文献+
共找到103篇文章
< 1 2 6 >
每页显示 20 50 100
基于Sparse-Group-Lasso方法的半监督广义可加信贷违约判别模型应用研究
1
作者 杨慧 王博雅 《中央民族大学学报(自然科学版)》 2025年第2期13-20,32,共9页
本文构建了一种新的个人信用贷款违约判别模型,该模型结合了半监督学习和广义半参数可加Logistics回归模型,同时加入Sparse-Group-Lasso(SGL)变量选择技术,使得模型可以同时进行参数估计和显著变量选择,并能充分利用无标记样本信息。此... 本文构建了一种新的个人信用贷款违约判别模型,该模型结合了半监督学习和广义半参数可加Logistics回归模型,同时加入Sparse-Group-Lasso(SGL)变量选择技术,使得模型可以同时进行参数估计和显著变量选择,并能充分利用无标记样本信息。此外,本文利用半监督Logistic回归模型,通过最大化判别精度G-mean来确定最佳违约判别临界点,解决了数据不平衡问题,并将以上模型和方法应用于个人信用贷款违约风险评估中。 展开更多
关键词 半监督 半参数 Sparse-group-lasso 信用评分
在线阅读 下载PDF
基于Group-Lasso方法的非均衡数据信用评分模型 被引量:3
2
作者 韦勇凤 向一波 《中国科学院大学学报(中英文)》 CSCD 北大核心 2021年第2期181-188,共8页
目前商业银行面临的个人信用风险问题极其复杂,如何对个人信用风险进行管理非常重要。个人信用风险建模是其中很关键的一步。利用某商业银行信用卡数据,构建信用评分模型,预测客户的违约概率。通过采用ROSE(random over sampling exampl... 目前商业银行面临的个人信用风险问题极其复杂,如何对个人信用风险进行管理非常重要。个人信用风险建模是其中很关键的一步。利用某商业银行信用卡数据,构建信用评分模型,预测客户的违约概率。通过采用ROSE(random over sampling examples)方法处理类别不均衡的问题,利用Group-Lasso(AUC准则)方法进行变量选择,构建基于Logistic回归的信用评分模型。实证结果表明,该方法对样本数据进行类别不均衡处理的结果比其他模型在判别能力和预测能力上更为有效。采用该方法所构建的模型能够作为客户信用评价决策的有效依据,指导银行及其他金融机构评估顾客个人信用风险,在实际运用中具有良好的可操作性。 展开更多
关键词 信用评分 Logistic回归 group-lasso方法 ROSE
在线阅读 下载PDF
基于Group-Lasso天麻品质形成关键因子的分析 被引量:3
3
作者 王红洁 王科 +1 位作者 余水祥 马云桐 《中草药》 CAS CSCD 北大核心 2023年第13期4278-4285,共8页
目的为提高人工种植天麻的质量,基于Group-Lasso变量筛选构建随机森林回归模型分析影响天麻品质形成的关键因子。方法基于Group-Lasso法,对2007—2022年天麻质量研究文献中天麻素含量及产地环境变量等数据进行变量筛选,并在筛选出的变... 目的为提高人工种植天麻的质量,基于Group-Lasso变量筛选构建随机森林回归模型分析影响天麻品质形成的关键因子。方法基于Group-Lasso法,对2007—2022年天麻质量研究文献中天麻素含量及产地环境变量等数据进行变量筛选,并在筛选出的变量基础上建立随机森林回归模型及计算变量重要性得分。结果最终选择了产区、生长状况、种质类型、产地气候类型、产地土壤类型、最热月均温、产地年降水量、产地年日照时数和无霜期9个变量,基于被选变量与天麻素含量建立随机森林回归模型,模型的均方误差(mean square error,MSE)和平均绝对百分误差(mean absolute percentage error,MAPE)分别为0.1032和14.08%,特征重要性排序显示天麻素含量的最大影响因素是产地年降水量,其次是产地土壤类型、无霜期和产地年日照时数。结论随机森林回归模型有相对较低的误差和较高的预估精度,更适合用于对天麻种植环境的分析和天麻素含量的估算,为人工种植天麻提供参考。 展开更多
关键词 天麻 天麻素 group-lasso 变量筛选 随机森林回归 变量重要性评分
原文传递
基于Group-LASSO方法的广义半参数可加信用评分模型应用研究 被引量:15
4
作者 张娟 张贝贝 《数理统计与管理》 CSSCI 北大核心 2016年第3期517-524,共8页
信用风险是目前商业银行面临的风险中最为重要和最为复杂的,新巴塞尔协议要求各国条件的银行通过实施内部评级法来度量并控制信用风险,内部评级法即通过银行收集的客户相历史数据来构建数学模型,测算客户的违约概率进而对客户进行评分... 信用风险是目前商业银行面临的风险中最为重要和最为复杂的,新巴塞尔协议要求各国条件的银行通过实施内部评级法来度量并控制信用风险,内部评级法即通过银行收集的客户相历史数据来构建数学模型,测算客户的违约概率进而对客户进行评分。文章针对信用评分模型解释变量维数较高,类型丰富,好坏客户类型数量不均衡等特点,利用广义半参数可加模型对户违约概率进行建模,并将Group LASSO方法应用于模型进行变量选择和估计。实证研究表明本文提出的模型和方法与以往常用的线性logistic回归模型相比,在模型的判别能力和预测能以及解释性和计算效率上均有较大优势。 展开更多
关键词 信用风险 广义半参数可加模型 GROUP LASSO方法
原文传递
基于Group-Lasso-Logistic的网络信贷违约预测研究
5
作者 李气芳 周诗妮 《佳木斯大学学报(自然科学版)》 2026年第1期177-180,共4页
针对网络信贷问题,基于某信贷平台数据构建Group-Lasso-Logistic模型,探讨影响贷款申请人违约的因素,并与全变量Logistic模型、逐步回归Logistic模型、Lasso-Logistic模型进行对比分析。研究发现:Group-Lasso-Logistic模型的评价性能最... 针对网络信贷问题,基于某信贷平台数据构建Group-Lasso-Logistic模型,探讨影响贷款申请人违约的因素,并与全变量Logistic模型、逐步回归Logistic模型、Lasso-Logistic模型进行对比分析。研究发现:Group-Lasso-Logistic模型的评价性能最好,且模型最简洁;贷款金额、贷款利率、分期付款金额以及贷款申请状态对贷款申请人违约风险起正向作用;年收入以及贷款人信用档案中当前的信用总额对贷款申请人违约风险起反向作用;贷款人在登记时所提供的房屋所有权状况为1以及验证状态为1或2这类人更容易发生违约;Group-Lasso-Logistic模型具有稳健性,且不同地区之间存在异质性。 展开更多
关键词 网络信贷 group-lasso-Logistic 稳健性 异质性
在线阅读 下载PDF
齿轮传动系统健康监测的故障边频簇惩罚回归提取方法 被引量:1
6
作者 孔德同 李乃鹏 +3 位作者 李鑫宇 刘超 张乐平 黄宇昊 《国防科技大学学报》 北大核心 2025年第4期189-196,共8页
当齿轮发生故障时,频谱中出现以啮合频率及其高阶谐波频率为中心、以齿轮旋转频率为间隔的多阶调制边频簇现象。为了自动聚焦故障边频成分,提出一种惩罚回归的故障边频簇提取方法,通过自适应稀疏群套索回归自数据驱动策略确定惩罚系数大... 当齿轮发生故障时,频谱中出现以啮合频率及其高阶谐波频率为中心、以齿轮旋转频率为间隔的多阶调制边频簇现象。为了自动聚焦故障边频成分,提出一种惩罚回归的故障边频簇提取方法,通过自适应稀疏群套索回归自数据驱动策略确定惩罚系数大小,在线更新频谱权重,以此找到故障边频簇。在稀疏群套索回归获得的各边频权重系数基础上,提出一种新稀疏群套索边带指标对齿轮传动系统进行健康监测,实现齿轮传动系统早期故障预警与定位。结果分析表明,所提出的方法可以实现更准确的齿轮早期故障预警与故障定位。 展开更多
关键词 稀疏群套索 齿轮传动系统 故障边频簇 健康监测
在线阅读 下载PDF
基于线性或非线性结构自动识别的股价预测
7
作者 梁焙婷 王斌会 +1 位作者 王国长 庞檬缘 《系统工程学报》 北大核心 2025年第4期574-594,共21页
针对加性模型中预测变量线性和非线性结构的自动识别问题,提出了一种基于Lasso和群Lasso方法的变量选择和参数估计方法LANEM.首先结合Lasso惩罚和群Lasso惩罚,通过使用三次自然样条基底同时选出无关变量、线性变量以及非线性变量,并利... 针对加性模型中预测变量线性和非线性结构的自动识别问题,提出了一种基于Lasso和群Lasso方法的变量选择和参数估计方法LANEM.首先结合Lasso惩罚和群Lasso惩罚,通过使用三次自然样条基底同时选出无关变量、线性变量以及非线性变量,并利用上证指数数据,采用计算机仿真模拟方法进行股价预测。结果表明,LANEM方法基于股票数据能自动识别出线性预测变量、非线性预测变量和无关预测变量,且结合最小二乘方法得到的LANEMLS方法具有最小的预测误差.同时,稳健性检验证明了LANEM方法不受股票指标、类型和时间的影响,应用股票场景广泛.相较于Lasso和群Lasso方法,LANEM方法有效提高股票指数预测的准确率,对股票的预测和趋势性研究具有现实意义。 展开更多
关键词 股价预测 Lasso方法 群Lasso方法 加性模型 LANEM方法
在线阅读 下载PDF
产妇孕晚期阴道GBS感染的危险因素分析与预测模型构建 被引量:1
8
作者 于文凯 孙梦怡 +2 位作者 辛延明 车春燕 郑康 《中国微生态学杂志》 北大核心 2025年第4期459-466,共8页
目的探讨孕晚期产妇阴道B族链球菌(GBS)感染的危险因素,构建风险列线图预测模型并进行验证。方法研究对象为2023年6月—2024年8月在济宁市第一人民医院进行GBS筛查的161例孕晚期产妇,根据患者阴道是否感染GBS分为感染组(n=96)和正常组(n... 目的探讨孕晚期产妇阴道B族链球菌(GBS)感染的危险因素,构建风险列线图预测模型并进行验证。方法研究对象为2023年6月—2024年8月在济宁市第一人民医院进行GBS筛查的161例孕晚期产妇,根据患者阴道是否感染GBS分为感染组(n=96)和正常组(n=65)。收集两组孕妇临床资料,比较两组孕妇临床指标和实验室检查指标。并使用LASSO回归筛选影响发生GBS感染的危险因素,根据多因素Logist-ic回归分析结果建立列线图预测模型,绘制受试者工作曲线(ROC)、计算曲线下面积(AUC),绘制校准曲线、决策曲线(DCA)和临床影响曲线对列线图稳定性进行验证。结果感染组白细胞计数(WBC)、中性粒细胞计数及其比率(NEU,NEU%)、中性粒细胞与淋巴细胞比值(NLR)、超敏C反应蛋白(hs-CRP)水平高于正常组,淋巴细胞比率(LYM%)、单核细胞比率(MON%)、淋巴细胞与单核细胞比值(LMR)低于正常组,差异均具有统计学意义(P<0.05);Logistic回归分析结果显示NLR、hs-CRP为GBS感染的独立危险因素(P<0.05)。ROC曲线结果显示AUC为0.740(P<0.001,95%CI:0.664~0.815)。校准曲线显示模型预测产妇发生GBS感染风险概率与实际概率基本吻合。DCA曲线显示列线图模型阈值为0.442~1.000,具有明显的临床净获益。临床影响曲线显示在阈值概率0.8时,被该模型划分入高风险的人数与真阳性人数基本一致。结论基于LASSO-logistic回归筛选出的NLR、hs-CRP是孕晚期产妇发生GBS感染风险的独立危险因素,以此建立的列线图模型可早期用于评估孕晚期产妇发生GBS感染的风险,且准确性较高,临床上应予以关注。 展开更多
关键词 B族链球菌 预测模型 LASSO-logistic回归 列线图
原文传递
线性回归模型中基于GMD算法的两阶段组Lasso多变点估计
9
作者 安子祯 董翠玲 《新疆师范大学学报(自然科学版)》 2025年第4期1-9,共9页
利用变量选择方法估计和检测变点是目前流行且有效的方法。文章提出了一种基于GMD算法的两阶段组Lasso多变点估计方法,该方法可以同时估计出线性回归模型中多变点的位置和数量。数值模拟结果显示,与基于GMD算法未分段的组Lasso、未分段... 利用变量选择方法估计和检测变点是目前流行且有效的方法。文章提出了一种基于GMD算法的两阶段组Lasso多变点估计方法,该方法可以同时估计出线性回归模型中多变点的位置和数量。数值模拟结果显示,与基于GMD算法未分段的组Lasso、未分段的自适应Lasso和未分段的Lasso三种变量选择算法的多变点估计方法相比,基于GMD算法的两阶段组Lasso多变点估计方法在估计精度和计算速度两方面均有显著优势。 展开更多
关键词 变量选择 组Lasso GMD算法 线性回归模型 多变点
在线阅读 下载PDF
基于自适应Group Lasso的函数型Logistic可加模型的稀疏估计
10
作者 李纯净 王悦 袁晓惠 《统计与决策》 北大核心 2025年第24期64-69,共6页
文章针对函数型协变量和二元响应变量构建函数型Logistic可加模型,其中的函数型协变量对响应变量的影响以非参数可加形式表示。使用函数主成分分析(FPCA)方法进行降维,计算函数主成分得分并进行缩放;提出一种基于B样条基函数的自适应Gro... 文章针对函数型协变量和二元响应变量构建函数型Logistic可加模型,其中的函数型协变量对响应变量的影响以非参数可加形式表示。使用函数主成分分析(FPCA)方法进行降维,计算函数主成分得分并进行缩放;提出一种基于B样条基函数的自适应Group Lasso方法,该方法可同时实现系数函数估计与非零可加项选择,并通过平滑样条,最终得到相关变量的估计结果。该方法能够在减少可变性、提高预测精度的同时提供适当地拟合。通过建立定理严格证明了该方法的相合性,并采用数值模拟和实证分析验证了该方法的相合性和有效性。 展开更多
关键词 函数型Logistic可加模型 自适应Group Lasso 稀疏估计 平滑样条 相合性
原文传递
基于多头注意力机制和双向长短时记忆网络的DNA结合蛋白和RNA结合蛋白预测
11
作者 韦芹芹 于彬 张岩 《青岛科技大学学报(自然科学版)》 2025年第4期37-45,共9页
提出了一种预测DNA结合蛋白(DBPs)和RNA结合蛋白(RBPs)的方法 BiLSTMMHA。首先,采用组成、转化和分布(composition, transition and distribution, CTD)、二肽偏离预期平均值(dipeptide deviation from expected mean, DDE)、二肽组成(d... 提出了一种预测DNA结合蛋白(DBPs)和RNA结合蛋白(RBPs)的方法 BiLSTMMHA。首先,采用组成、转化和分布(composition, transition and distribution, CTD)、二肽偏离预期平均值(dipeptide deviation from expected mean, DDE)、二肽组成(dipeptide composition,DPC)、分组三肽组成(grouping tripeptide composition, GTPC)、伪氨基酸组成(pseudo amino acid composition, PseAAC) 5种方法提取蛋白质序列的信息。进而将5种方法提取的特征向量进行融合。其次,利用组套索(group lasso)方法降低融合特征的维数,去除无关特征,提高模型预测准确率。最后,将多头注意力机制和双向长短时记忆网络结合,用于预测DNA和RNA结合蛋白预测。在十折交叉验证下,与其他已发表的模型进行比较,并在测试集上与其他方法进行对比。训练集和测试集的预测结果表明,所提出的BiLSTM-MHA模型能有效预测DBPs和RBPs。 展开更多
关键词 DNA和RNA结合蛋白 组套索 多头注意力机制 双向长短时记忆网络
在线阅读 下载PDF
基于LASSO-logistic回归模型的GD29病组DRG超支风险预测模型
12
作者 甘岚澜 伍渊麟 +2 位作者 向贵圆 陈世耕 刘耀 《中国医药导报》 2025年第23期38-43,67,共7页
目的基于LASSO-logistic回归分析探讨GD29病组疾病诊断相关分组(DRG)超支的影响因素并建立列线图预测模型,以便医疗机构针对性地进行风险管理。方法以重庆市2022年1月至2023年3月GD29病组的医保结算信息为研究资料,根据医保支付标准,将... 目的基于LASSO-logistic回归分析探讨GD29病组疾病诊断相关分组(DRG)超支的影响因素并建立列线图预测模型,以便医疗机构针对性地进行风险管理。方法以重庆市2022年1月至2023年3月GD29病组的医保结算信息为研究资料,根据医保支付标准,将患者分为超支组和未超支组,利用LASSO-logistic回归分析GD29病组DRG超支的影响因素,构建列线图预测模型,评价模型的预测效能。结果本研究共纳入2076例患者,其中超支1451例(69.89%)。两组年龄、住院天数、参保类型、其他诊断个数、其他手术个数、医院等级、转科、急性阑尾炎、进行腹腔镜下阑尾切除、粘连积液、合并急性腹膜炎、高血压病、糖尿病比较,差异有统计学意义(P<0.05)。年龄(OR=1.015)、住院天数(OR=1.300)、其他诊断个数(OR=1.457)、医院等级(OR=11.412)、急性阑尾炎(OR=0.471)、进行腹腔镜下阑尾切除(OR=4.276)、粘连积液(OR=2.677)是GD29病组DRG超支的影响因素(P<0.05)。列线图模型预测GD29病组DRG超支风险的曲线下面积为0.846。校准曲线提示预测曲线与标准曲线基本拟合,模型预测准确度较高。决策曲线分析提示在风险阈值范围内,患者的净受益率大于0。结论预测模型能较好地预测GD29病组DRG超支风险,可助力医疗机构精准识别风险因素,从而为医疗机构开展费用管控工作提供参考依据。 展开更多
关键词 疾病诊断相关分组 超支 预测模型 LASSO回归 LOGISTIC回归分析 列线图
暂未订购
基于体质的缺血性中风病复发风险评估模型建立研究 被引量:18
13
作者 王桂倩 谢雁鸣 +4 位作者 易丹辉 张寅 高阳 黎元元 魏瑞丽 《中华中医药杂志》 CAS CSCD 北大核心 2019年第10期4860-4866,共7页
目的:构建基于体质的缺血性中风病复发风险评估模型。方法:采用注册登记研究,共纳入1384例首发动脉粥样硬化性缺血性中风病患者的一般信息及发病时的症状和体征等多维度信息,采用Grouplasso Logistic模型辨识缺血性中风病复发的核心危... 目的:构建基于体质的缺血性中风病复发风险评估模型。方法:采用注册登记研究,共纳入1384例首发动脉粥样硬化性缺血性中风病患者的一般信息及发病时的症状和体征等多维度信息,采用Grouplasso Logistic模型辨识缺血性中风病复发的核心危险因素,运用多因素Logistic模型构建基于体质的缺血性中风病复发风险评估模型。结果:痰湿质患者复发风险是2.133倍,95%CI[1.049,4.340];血瘀质患者复发风险是2.585倍,95%CI[1.288,5.188]。基于体质的缺血性中风病复发风险评估模型AUC值为0.766,西医危险因素缺血性中风病复发风险评估模型的AUC值0.718。结论:基于体质的缺血性中风病复发风险评估模型其预测效能更佳,根据数据来源,该模型可能更适用于缺血性中风病中经络和发病时就诊于三级医院的缺血性中风病复发的风险评估。 展开更多
关键词 缺血性中风病 复发 GROUP lasso LOGISTIC 风险评估 体质
原文传递
正则化稀疏模型 被引量:71
14
作者 刘建伟 崔立鹏 +1 位作者 刘泽宇 罗雄麟 《计算机学报》 EI CSCD 北大核心 2015年第7期1307-1325,共19页
正则化稀疏模型在机器学习和图像处理等领域发挥着越来越重要的作用,它具有变量选择功能,可以解决建模中的过拟合等问题.Tibshirani提出的Lasso使得正则化稀疏模型真正开始流行.文中总结了各种正则化稀疏模型,指出了各个稀疏模型被提出... 正则化稀疏模型在机器学习和图像处理等领域发挥着越来越重要的作用,它具有变量选择功能,可以解决建模中的过拟合等问题.Tibshirani提出的Lasso使得正则化稀疏模型真正开始流行.文中总结了各种正则化稀疏模型,指出了各个稀疏模型被提出的原因、所具有的优点、适宜解决的问题及其模型的具体形式.最后,文中还指出了正则化稀疏模型未来的研究方向. 展开更多
关键词 正则化 稀疏 变量选择 套索 无偏估计 组稀疏 融合套索
在线阅读 下载PDF
基于层次稀疏DBN的瓶颈特征提取方法 被引量:10
15
作者 王一 杨俊安 +1 位作者 刘辉 柳林 《模式识别与人工智能》 EI CSCD 北大核心 2015年第2期173-180,共8页
针对现有语音特征无法有效利用长时段语音和监督性类别信息,及现有瓶颈特征提取方法耗时过长等缺陷,提出基于层次结构稀疏深度可信神经网络的瓶颈特征提取方法.该方法将重叠组套索作为深度可信神经网络目标函数的稀疏正则项使用,从而构... 针对现有语音特征无法有效利用长时段语音和监督性类别信息,及现有瓶颈特征提取方法耗时过长等缺陷,提出基于层次结构稀疏深度可信神经网络的瓶颈特征提取方法.该方法将重叠组套索作为深度可信神经网络目标函数的稀疏正则项使用,从而构建训练速度更快的稀疏深度可信神经网络.然后利用层次结构的网络架构方式,将两个稀疏深度可信神经网络串联后使用,进一步增强瓶颈特征的判决能力.文中将此瓶颈特征应用于音素识别中,实验表明该特征的有效性. 展开更多
关键词 音素识别 深度可信神经网络(DBN) 重叠组套索 层次结构
在线阅读 下载PDF
结构稀疏模型及其算法研究进展 被引量:5
16
作者 刘建伟 崔立鹏 罗雄麟 《计算机科学》 CSCD 北大核心 2016年第S1期1-16,共16页
结构稀疏模型在统计学、信号处理和机器学习等领域中具有重要的应用。结构稀疏模型主要通过在目标函数中引入会导致组稀疏效果的罚函数来实现特征组结构选择。有趣的是一些组稀疏模型不仅能实现特征组选择,而且同时能够实现组内的特征... 结构稀疏模型在统计学、信号处理和机器学习等领域中具有重要的应用。结构稀疏模型主要通过在目标函数中引入会导致组稀疏效果的罚函数来实现特征组结构选择。有趣的是一些组稀疏模型不仅能实现特征组选择,而且同时能够实现组内的特征选择。根据使用的罚函数的类型,结构稀疏模型主要分为组套索模型和非凸罚组稀疏模型两大类。系统地总结了重要的组结构稀疏模型,分析了各种组结构稀疏模型之间的区别与联系,归纳比较了各种组结构稀疏模型的统计特性(例如模型选择一致性、参数估计一致性和oracle性质)和组结构稀疏模型的求解算法。当前,结构套索模型主要包括普通组套索模型、L∞,1组套索模型、重叠组套索模型、树组套索模型、多输出树组套索模型、混合组套索模型、自适应组套索模型、逻辑斯蒂组套索模型和贝叶斯组套索模型。非凸罚组稀疏模型包括组SCAD罚模型、组桥模型和组MC罚模型等。求解组稀疏模型的算法有组最小角回归算法、块坐标下降(上升)算法、活动集算法、内点算法、投影梯度算法、谱投影梯度算法、轮换方向乘子算法和块坐标梯度下降算法等,结合组稀疏模型对这些算法进行了详细的分析。在使用上述优化方法前,通常需要对目标函数进行预处理,将不平滑的、非凸的、块坐标不可分离的组稀疏模型的目标函数向平滑、凸、块坐标可分离的方向进行转化,这一步常利用的技巧有变分不等式、Nesterov的平滑近似技巧、局部一阶泰勒展开近似、局部二次近似、对偶范数和对偶函数等。接着给出了最新提出的一些组稀疏模型,如关于广义加模型的组套索模型、复合组桥模型、平方根组套索模型和关于Tobit模型的组套索模型等。最后,对组稀疏模型未来的研究方向进行了探讨。 展开更多
关键词 稀疏 组稀疏 罚函数 组套索 特征组选择 组内特征选择 算法
在线阅读 下载PDF
基于稀疏组lasso的脑机接口通道和特征选择研究 被引量:8
17
作者 王金甲 薛芳 李慧 《仪器仪表学报》 EI CAS CSCD 北大核心 2015年第8期1831-1837,共7页
脑电信号(EEG)特征提取和分类是脑机接口(BCI)系统的核心问题之一。由于BCI系统中EEG信号多通道采样和特征向量的高维性,有效的特征选择算法已经成为研究中不可分割的一部分。针对EEG特征选择问题采用一种新方法:基于封装式稀疏组lasso... 脑电信号(EEG)特征提取和分类是脑机接口(BCI)系统的核心问题之一。由于BCI系统中EEG信号多通道采样和特征向量的高维性,有效的特征选择算法已经成为研究中不可分割的一部分。针对EEG特征选择问题采用一种新方法:基于封装式稀疏组lasso的EEG融合特征的同时通道和特征选择方法。实验中将该方法与现有的通道选择和特征选择方法进行比较,结果表明,该方法更适用于高维融合特征的最优特征子集选择问题,且该算法稳定、时间成本低。此外,在保证错误率相当或较低的情况下,该方法能够同时实现通道和特征选择。国际BCI竞赛IV的两类运动想象信号的测试错误率为15.28%。 展开更多
关键词 脑机接口 特征融合 通道选择 特征选择 基于稀疏组lasso的logistic回归 块坐标下降
在线阅读 下载PDF
基于随机森林的自适应特征选择算法 被引量:10
18
作者 刘凯 郑山红 +1 位作者 蒋权 赵天傲 《计算机技术与发展》 2018年第9期101-104,111,共5页
为了解决传统的随机森林算法在随机特征选择时,导致少数比较重要的特征变量被过滤掉的问题,以及没有考虑特征变量相关性对预测应变量准确性带来的影响,提出了一种基于随机森林的自适应特征选择算法SARFFS。该算法首先利用卡方检验样本... 为了解决传统的随机森林算法在随机特征选择时,导致少数比较重要的特征变量被过滤掉的问题,以及没有考虑特征变量相关性对预测应变量准确性带来的影响,提出了一种基于随机森林的自适应特征选择算法SARFFS。该算法首先利用卡方检验样本间关联程度后自助采样,并设计出一种特征对类代表强弱程度的计算方法;然后引入自适应稀疏约束机制Group LASSO优化特征的选择;最后在Spark分布式计算平台利用UCI数据集进行实验,结果表明,相比传统的RF算法,SARFFS算法在特征子集选择上具有更好的性能,在F1上提升将近9%。从最终排名靠前的重要特征分析,该算法能够考虑特征间相关性,对预测结果确实有影响,并有效地提高了随机属性权值的可靠性和稳定性。 展开更多
关键词 随机森林 自适应 特征选择 GroupLASSO方法
在线阅读 下载PDF
基于重叠稀疏组深度信念网络的图像识别 被引量:2
19
作者 田进 陈秀宏 +1 位作者 傅俊鹏 徐德荣 《计算机工程与科学》 CSCD 北大核心 2018年第3期515-524,共10页
深度信念网络的隐含神经元大部分为噪声变量,且具有组结构相关性。组稀疏深度信念网络模型通过组Lasso模型对隐含神经元变量进行约束,从而实现变量组选择。然而,组稀疏深度信念网络模型未能考虑特征可同时属于多个特征组,并且隐含神经... 深度信念网络的隐含神经元大部分为噪声变量,且具有组结构相关性。组稀疏深度信念网络模型通过组Lasso模型对隐含神经元变量进行约束,从而实现变量组选择。然而,组稀疏深度信念网络模型未能考虑特征可同时属于多个特征组,并且隐含神经元在变量层面上不稀疏的问题。在组稀疏深度信念网络模型上引入重叠组结构,解释了重叠组Lasso模型在变量层面上比组Lasso模型稀疏的原因,并在变量层面上作进一步的稀疏,提出了重叠稀疏组深度信念网络模型。在MNIST、USPS、ETH-80以及人脸数据集上的识别结果表明,重叠稀疏组深度信念网络具有更高的识别率。 展开更多
关键词 深度信念网络 组Lasso 组稀疏 重叠稀疏组
在线阅读 下载PDF
基于Group Lasso的多源电信数据离网用户分析 被引量:2
20
作者 孙良君 范剑锋 +3 位作者 杨琬琪 史颖欢 高阳 周新民 《南京师范大学学报(工程技术版)》 CAS 2014年第4期77-83,共7页
随着行业竞争愈演愈烈,电信企业的客户流失情况越来越严重,给电信企业造成了巨大损失.通过电信企业的数据来做离网用户的预测,从而进一步作出挽留客户的正确决策,成为电信企业日益关注的问题.面对电信后台汇总的多源数据,经分析发现其... 随着行业竞争愈演愈烈,电信企业的客户流失情况越来越严重,给电信企业造成了巨大损失.通过电信企业的数据来做离网用户的预测,从而进一步作出挽留客户的正确决策,成为电信企业日益关注的问题.面对电信后台汇总的多源数据,经分析发现其呈现天然的组结构.为了选择对于离网类别最具判别性的特征,本文使用了一种基于Group Lasso的组特征选择方法,在此基础上用交叉验证法选择适当的特征组,最终将选择出的少量组特征用于预测离网和停机的宽带用户.实验表明,在江苏某地级市电信离网用户分析数据中取得了比其他特征选择方法的精度平均高至少10%的预测性能. 展开更多
关键词 电信企业 客户流失 多源数据 特征选择 GROUP Lasso
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部