期刊文献+
共找到31,705篇文章
< 1 2 250 >
每页显示 20 50 100
线性模型下的稳健模型平均方法
1
作者 杨佳音 李海霞 +2 位作者 常海艳 付利亚 宋亚飞 《工程数学学报》 北大核心 2026年第1期156-166,共11页
模型平均通过对备选模型的估计进行加权平均得到新估计,该方法具有预测精度高、风险小等优点。现有的频率模型平均方法均是基于最小二乘方法,因此对异常值比较敏感。提出了稳健的Mallows模型平均和基于信息准则的模型平均,通过选取稳健... 模型平均通过对备选模型的估计进行加权平均得到新估计,该方法具有预测精度高、风险小等优点。现有的频率模型平均方法均是基于最小二乘方法,因此对异常值比较敏感。提出了稳健的Mallows模型平均和基于信息准则的模型平均,通过选取稳健目标函数和稳健的误差标准差提升方法的稳健性。模拟研究表明数据中存在异常值或服从重尾分布时,提出的方法明显优于基于最小二乘方法的模型平均。最后,将稳健的模型平均方法应用到波士顿房价数据集上,验证了所提出方法的有效性。 展开更多
关键词 模型平均 稳健估计 迭代加权最小二乘 稳健权重 绝对中位偏差
在线阅读 下载PDF
因子混合模型稳健贝叶斯分析
2
作者 吕天予 夏业茂 《应用数学》 北大核心 2026年第1期161-172,共12页
为了降低异常点或极值数据影响,本文对因子混合模型建立了稳健分析.在参数统计框架内,基于正态尺度混合分布,对数据点赋以适当的权重来降低异常点的影响.我们还对因子负荷采用稀疏化技术来提高模型的泛化能力,并对因子个数和混合分量个... 为了降低异常点或极值数据影响,本文对因子混合模型建立了稳健分析.在参数统计框架内,基于正态尺度混合分布,对数据点赋以适当的权重来降低异常点的影响.我们还对因子负荷采用稀疏化技术来提高模型的泛化能力,并对因子个数和混合分量个数展开选择.随机模拟和对橄榄油数据分析展示了方法的有效性和实用性. 展开更多
关键词 混合因子模型 正态尺度混合 全局-局部收缩 MCMC抽样
在线阅读 下载PDF
基于贝叶斯退化数据融合的机械系统可靠性评估
3
作者 陈伟 《南方农机》 2026年第1期1-4,17,共5页
【目的】解决机械系统功能故障样本稀缺导致寿命评估准确性低的问题。【方法】利用性能退化数据构建维纳过程模型,获得漂移与扩散参数估计。依据维纳过程与逆高斯分布的对应关系,将其转化为退化失效数据的先验,并在贝叶斯框架下完成两... 【目的】解决机械系统功能故障样本稀缺导致寿命评估准确性低的问题。【方法】利用性能退化数据构建维纳过程模型,获得漂移与扩散参数估计。依据维纳过程与逆高斯分布的对应关系,将其转化为退化失效数据的先验,并在贝叶斯框架下完成两类退化数据的融合,同时开展MTBF对比验证。【结果】仅依赖精度退化数据所构建的可靠性模型在中后期往往呈现过快的下降趋势,其MTBF预测与寿命模型存在明显偏差。引入精度失效数据并对退化模型进行贝叶斯更新后,可靠性曲线与基于威布尔分布的寿命模型更为一致,预测误差由33%显著降低至11.1%。【结论】融合失效信息能够显著提高退化模型的稳定性与预测精度,基于贝叶斯退化数据融合的可靠性评估可在小样本功能故障数据下实现有效的寿命预测。 展开更多
关键词 机械系统 可靠性 贝叶斯参数估计 MTBF
在线阅读 下载PDF
基于e值的r阶向上向下检验过程
4
作者 邹文豪 杨建萍 《山东理工大学学报(自然科学版)》 2026年第3期59-66,71,共9页
为解决传统的p值多重检验过程在不规则模型下计算困难问题,在e-BH过程的基础上,提出了基于e值的r阶向上向下检验过程,以进一步提高多重检验过程的检测能力。理论研究该检验过程性能发现,对满足任意相关性条件的e值检验统计量都能将假发... 为解决传统的p值多重检验过程在不规则模型下计算困难问题,在e-BH过程的基础上,提出了基于e值的r阶向上向下检验过程,以进一步提高多重检验过程的检测能力。理论研究该检验过程性能发现,对满足任意相关性条件的e值检验统计量都能将假发现率(False Discovery Rate,FDR)控制到指定水平,同时该过程具有无偏性。使用与FDR、假阴率(False Negatives Rate,FNR)相关的指标,通过模拟实验将基于e值的r阶向上向下检验过程与e-BH过程、传统的p值多重检验过程进行比较,发现该检验过程具有更强的检测能力,完全可以替代传统的p值多重检验过程。 展开更多
关键词 多重假设检验 假发现率 假阴率 e值 无偏性
在线阅读 下载PDF
在给定显著性水平下的系统同步误差的单边检验模型
5
作者 谭俊宇 周健勇 +2 位作者 赖安达 彭嘉乐 范舒晴 《科学技术创新》 2026年第3期5-8,共4页
为评估系统同步误差以及系统误差优化,主要根据列维-林德伯格中心极限定理,对有关随机变量作出了极高精度近似,且相应地分析了期望与方差,以此构造了可作为总体的正态统计量,另将系统的误差优化有效作为原假设,并在给定显著性水平下,根... 为评估系统同步误差以及系统误差优化,主要根据列维-林德伯格中心极限定理,对有关随机变量作出了极高精度近似,且相应地分析了期望与方差,以此构造了可作为总体的正态统计量,另将系统的误差优化有效作为原假设,并在给定显著性水平下,根据t检验法说明了原假设的拒绝域,即给出了样本均值的假设检验范式。 展开更多
关键词 误差优化 列维-林德伯格中心极限定理 显著性水平 t检验法 单边检验
在线阅读 下载PDF
基于k-means算法的聚类个数确定方法改进 被引量:5
6
作者 王丙参 王国长 魏艳华 《统计与决策》 北大核心 2025年第7期59-64,共6页
文章基于k-means算法探讨了最优聚类个数k*的确定方法:第一类是统计量方法;第二类是聚类算法不稳定性方法,即基于两次聚类结果间的距离,利用交叉验证、随机抽样取交集、自助法来构建聚类算法估计不稳定性指标,并根据投票、最小化均值方... 文章基于k-means算法探讨了最优聚类个数k*的确定方法:第一类是统计量方法;第二类是聚类算法不稳定性方法,即基于两次聚类结果间的距离,利用交叉验证、随机抽样取交集、自助法来构建聚类算法估计不稳定性指标,并根据投票、最小化均值方法确定k^(*)。数值模拟结果显示:在给定k^(*)的情况下,聚类结果与标签的距离或相似度可作为评价聚类结果的指标,为聚类算法评价提供了新的借鉴;基于k-means算法确定k^(*)的前提是数据集根据欧氏距离可明显分为几簇,相对而言,聚类算法不稳定性方法优于统计量方法;对于不稳定性指标,交叉验证估计方法与随机抽样取交集估计方法对抽样个数稳健,抽样个数依次建议略少于样本容量的1/3、80%;自助抽样估计方法由于利用了全部样本,因此效率更高;4种不稳定性指标没有显著差异,投票与最小化均值方法也没有显著差异。 展开更多
关键词 K-MEANS算法 聚类个数 统计量 不稳定性
在线阅读 下载PDF
中国中长期总和生育率预测
7
作者 朱紫陌 巴曙松 《西北人口》 北大核心 2026年第1期39-56,共18页
总和生育率(Total Fertility Rate,TFR)将直接影响一个国家未来的人口结构和规模,中国2019年TFR为1.5左右,在此后持续下降,到2022年仅为1.05,成为除韩国外生育率最低的国家。在新生人口严重不足的情况下,科学准确地预测中长期总和生育率... 总和生育率(Total Fertility Rate,TFR)将直接影响一个国家未来的人口结构和规模,中国2019年TFR为1.5左右,在此后持续下降,到2022年仅为1.05,成为除韩国外生育率最低的国家。在新生人口严重不足的情况下,科学准确地预测中长期总和生育率,对准确判断中国未来人口动态、为相关社会经济决策提供科学参考至关重要。针对联合国《世界人口展望》报告中全球趋同假设导致对中国TFR预测结果长期偏高的问题,亟需探索更贴合中国国情的预测模型。研究采用概率人口方法,分别基于“全球趋同”假设、“低生育率陷阱”假设、“区域文化”假设以及“社会发展相似性”假设构建不同先验分布的国家子集,并建立贝叶斯分层模型(BHM),基于1950~2022年历史TFR数据,通过30 000~80 000次的蒙特卡罗模拟预测了未来2022~2100年中国中长期总和生育率轨迹,并给出相应的概率区间。为了评估不同模型预测的准确性,采用1950~2000年的历史数据,对2000~2022年中国和韩国、日本、新加坡、俄罗斯四国的TFR进行回测与交叉验证。结果显示基于“高HDI低TFR国家”假设构建的贝叶斯分层模型预测最优,在对中国近20年TFR的回测中,该模型的95%概率区间覆盖率达到了100%,不仅显著优于联合国模型(覆盖率86.4%),更成功地覆盖了2020年TFR超预期的急剧下降。基于“高HDI低TFR国家”的模型模拟预测结果显示,2035年中国TFR将为1.190(95%概率区间为0.767~1.582),2050年稳定在1.200左右(95%概率区间为0.647~1.728),至世纪末则为1.217(95%概率区间为0.564~1.893)。未来,在制定养老、教育、劳动力等长远规划时,可考虑将约1.2的TFR作为中性情景的基准,并依据其概率区间进行高、中、低三种情景的弹性压力测试;同时,考虑到国内区域发展的巨大差异,可将此方法进一步应用于区域层面,为制定差异化、精细化的人口与经济协调发展政策提供数据支撑。 展开更多
关键词 总和生育率 生育率预测 贝叶斯分层模型 生育水平 人口趋势
在线阅读 下载PDF
徐州引领淮海经济区高质量发展的动力机制及空间效应研究 被引量:2
8
作者 刘宁宁 张晶 罗璐娜 《数理统计与管理》 北大核心 2025年第1期41-54,共14页
淮海经济区地处苏鲁豫皖四省交界,区内经济发展差异较大、协调度不高。本文以淮海经济区核心区域10个城市为研究对象,选取人均GDP为响应变量,产业结构质量化与产业发展合理化为解释变量,科技水平、政府支出等要素为控制变量,借助莫兰指... 淮海经济区地处苏鲁豫皖四省交界,区内经济发展差异较大、协调度不高。本文以淮海经济区核心区域10个城市为研究对象,选取人均GDP为响应变量,产业结构质量化与产业发展合理化为解释变量,科技水平、政府支出等要素为控制变量,借助莫兰指数进行空间相关性检验,结果表明淮海经济区核心区各城市之间的空间相关性显著。采用LM检验、Hausman检验以及Wald检验,选取时空双固定效应下的空间杜宾模型,对淮海经济区核心区经济发展进行空间溢出效应分析,得出产业发展合理化、科技投入、政府支出、市场需求、城市化水平等要素对徐州引领淮海经济区高质量发展有着正向的溢出效应;产业结构质量化、资本投入、劳动力资源等要素对徐州引领经济高质量发展有着负向的溢出效应。 展开更多
关键词 区域中心城市 高质量发展 产业升级 空间效应
原文传递
偏正态数据下三臂非劣效性检验的贝叶斯方法
9
作者 李梦 梁帆 吴刘仓 《应用数学》 北大核心 2026年第1期48-59,共12页
本文提出药物药效数据服从偏正态分布的三臂非劣效性检验的贝叶斯方法,并构造贝叶斯置信区间,同时讨论了样本量的确定问题.通过结合历史数据信息,构造参数的后验分布,给出抽样算法,建立偏正态数据下三臂非劣效性检验的贝叶斯决策准则以... 本文提出药物药效数据服从偏正态分布的三臂非劣效性检验的贝叶斯方法,并构造贝叶斯置信区间,同时讨论了样本量的确定问题.通过结合历史数据信息,构造参数的后验分布,给出抽样算法,建立偏正态数据下三臂非劣效性检验的贝叶斯决策准则以及参数的置信下限.模拟实验给出犯第一类错误率、功效、样本量和经验覆盖概率值,模拟结果显示出所提出方法的有效性.最后,将该方法应用于一个真实的HIV数据集,显示了该方法的实际应用价值. 展开更多
关键词 三臂非劣效性检验 偏正态分布 贝叶斯方法 置信区间
在线阅读 下载PDF
基于核函数的自适应谱聚类与聚类个数确定方法
10
作者 王丙参 魏艳华 李旭 《统计与决策》 北大核心 2025年第11期49-54,共6页
文章先比较了不同核函数对谱聚类(SC)的影响,根据k近邻思想构建三种自适应SC,并根据拉普拉斯矩阵特征值构建聚类个数k^(*)的差分确定法;然后构建聚类-KNN算法,利用它的不稳定性确定k^(*)。数值模拟结果显示:核函数SC适应范围广,在合适... 文章先比较了不同核函数对谱聚类(SC)的影响,根据k近邻思想构建三种自适应SC,并根据拉普拉斯矩阵特征值构建聚类个数k^(*)的差分确定法;然后构建聚类-KNN算法,利用它的不稳定性确定k^(*)。数值模拟结果显示:核函数SC适应范围广,在合适的核函数下,对非凸数据集有效,且推荐使用高斯核;高斯核受全局参数影响显著,三类自适应SC对近邻参数稳健;基于聚类-KNN算法的不稳定性确定k^(*)比统计量方法适应范围更广,对于非凸数据集,基础聚类算法建议选取核函数谱聚类;随机抽样方法对抽样个数m稳健,当m占比较高时,它近似于自助抽样方法。 展开更多
关键词 核函数 谱聚类 聚类个数 不稳定性
在线阅读 下载PDF
数据缺失条件下基于模型平均调整的因果效应估计方法
11
作者 耿智琳 张丽丽 +1 位作者 张耀峰 张志刚 《统计与决策》 北大核心 2025年第18期5-10,共6页
在使用观测数据进行因果推断时,混杂变量偏倚和协变量数据缺失会降低处理效应估计的准确性。针对此问题,文章提出了一种面向协变量缺失数据的模型平均调整因果效应估计方法。该方法首先使用插补方法对缺失数据进行插补;其次,应用模型平... 在使用观测数据进行因果推断时,混杂变量偏倚和协变量数据缺失会降低处理效应估计的准确性。针对此问题,文章提出了一种面向协变量缺失数据的模型平均调整因果效应估计方法。该方法首先使用插补方法对缺失数据进行插补;其次,应用模型平均调整方法,对多个倾向得分估计模型进行加权平均,综合各模型的优点;最后,通过双重调整机制提高倾向得分估计的可靠性和准确性。实验结果表明,相较于基于逻辑回归的逆概率加权方法,所提方法能有效降低混杂偏倚和协变量数据缺失的影响,提高ATE的估计精度,为处理协变量缺失数据的因果效应估计提供了新思路。 展开更多
关键词 协变量缺失 因果效应 逆概率加权 模型平均
在线阅读 下载PDF
一种基于错误发现率的模型选择规则
12
作者 荣晶晶 冶继民 《广西师范大学学报(自然科学版)》 北大核心 2026年第1期110-118,共9页
针对高维稀疏线性回归模型,本文从后验估计角度提出基于错误发现率(false discovery rate,FDR)的模型选择FDR规则;之后在其基础上引入动态信噪比(signal-to-noise ratio,SNR)变化因子,提出对SNR变化更稳健且对数据尺度具有不变性的FDR_... 针对高维稀疏线性回归模型,本文从后验估计角度提出基于错误发现率(false discovery rate,FDR)的模型选择FDR规则;之后在其基础上引入动态信噪比(signal-to-noise ratio,SNR)变化因子,提出对SNR变化更稳健且对数据尺度具有不变性的FDR_(R)规则;结合OMP算法,仿真实验对比分别采用FDR规则、FDR_(R)规则和已有规则下成功选择全部真正变量的概率和FDR值,结果表明,相较于其他规则,FDR_(R)规则在高SNR或大样本量下更稳健,对数据缩放问题更加鲁棒,且错误发现率最低;最后,将所提方法应用到套细胞淋巴瘤患者的真实数据,筛选出影响细胞增殖的基因编号。 展开更多
关键词 高维模型选择 错误发现率 FDR_(R) OMP算法 信噪比
在线阅读 下载PDF
缺席效应作为变量关系的度量
13
作者 张敏 吴喜之 《数理统计与管理》 北大核心 2025年第3期463-480,共18页
无论用何种术语,缺席效应被广泛应用于从经典统计到机器学习,比如在回归诊断中识别影响点或在随机森林中定义变量重要性。本研究建议利用缺席效应来定义变量之间不对称相对关系的度量。作为一个具体实现,我们根据在有监督学习中由于变量... 无论用何种术语,缺席效应被广泛应用于从经典统计到机器学习,比如在回归诊断中识别影响点或在随机森林中定义变量重要性。本研究建议利用缺席效应来定义变量之间不对称相对关系的度量。作为一个具体实现,我们根据在有监督学习中由于变量(或变量群)缺席而造成的预测精度降低为变量之间的关系提供不对称度量(PARA度量)。本文将以决策树作为有监督学习的一个范例,由算法定义PARA度量,该度量可以用于各种变量,特别是包含了分类变量(涉及到其水平(类)层面)。为了说明,我们给出了含有分类变量的包括分类与回归的两个类型数据示例。 展开更多
关键词 缺席效应 预测精度 有监督学习 决策树 PARA(相对)度量
原文传递
混合高频数据下线性模型的经验似然
14
作者 赖喜祥 秦永松 《应用数学》 北大核心 2026年第1期278-291,共14页
高频数据在经济、统计及其他领域被广泛研究,而线性模型是统计学中最常见的回归模型之一.本文利用分组经验似然方法,构造了α-混合高频数据下线性模型回归系数的经验似然比统计量.在一定假设和条件下,证明了该统计量的渐近分布为卡方分... 高频数据在经济、统计及其他领域被广泛研究,而线性模型是统计学中最常见的回归模型之一.本文利用分组经验似然方法,构造了α-混合高频数据下线性模型回归系数的经验似然比统计量.在一定假设和条件下,证明了该统计量的渐近分布为卡方分布,根据此结果进一步给出了回归系数的经验似然置信域.通过模拟比较了经验似然和正态逼近方法的置信域,结果表明,基于经验似然方法构造的置信域的覆盖率优于正态逼近方法.此外,还将理论结果应用于实际数据分析. 展开更多
关键词 混合高频数据 Α-混合 线性模型 经验似然
在线阅读 下载PDF
基于全局和声搜索算法的椭圆拟合
15
作者 雍龙泉 张媛媛 黎延海 《安徽大学学报(自然科学版)》 北大核心 2025年第1期1-7,共7页
建立了椭圆拟合问题的约束优化模型,利用绝对值函数给出了一种约束处理方法,将原问题转化为无约束优化,采用全局和声搜索算法求解.数值实验分别对长轴和短轴在坐标轴上、长轴和短轴不在坐标轴上的椭圆拟合问题进行了研究,结果表明在数... 建立了椭圆拟合问题的约束优化模型,利用绝对值函数给出了一种约束处理方法,将原问题转化为无约束优化,采用全局和声搜索算法求解.数值实验分别对长轴和短轴在坐标轴上、长轴和短轴不在坐标轴上的椭圆拟合问题进行了研究,结果表明在数据没有异常值的条件下,即使有噪声,拟合结果也较好. 展开更多
关键词 椭圆拟合 绝对值函数 约束优化 全局和声搜索算法
在线阅读 下载PDF
基于特征函数局部微扰法的隐含波动率曲面建模
16
作者 孙有发 姚宇航 +1 位作者 邱梓杰 刘彩燕 《数理统计与管理》 北大核心 2025年第2期209-226,共18页
如何对期权的隐含波动率曲面建模,一直以来是金融衍生品领域的难点问题之一。已有文献针对某些特定结构的随机波动率模型,推导出期权的隐含波动率解析表达式(Analytical formula of implie dvolatility,AFIV),但通用性差、或精度不够好... 如何对期权的隐含波动率曲面建模,一直以来是金融衍生品领域的难点问题之一。已有文献针对某些特定结构的随机波动率模型,推导出期权的隐含波动率解析表达式(Analytical formula of implie dvolatility,AFIV),但通用性差、或精度不够好。本文针对一般形式的随机波动率模型,给出获取高精度AFIV的通用方法:首先应用特征函数局部结构微扰法,推导出一般形式随机波动率模型的特征函数表达式;然后基于特征函数与期权价格的关系式,应用参数微扰法推导出隐含波动率的渐近表达式。数值实验和实证结果表明:(1)与同类最新研究(如Ait-Sahalia等,2021)[1-2]相比,本文方法在长到期期权上的定价精度有显著提升,在短到期期权上的定价精度也略优些;(2)与孙有发等(2022)[3]提出的基于特征函数局部结构微扰的期权定价方法相比,本文提出的AFIV方法不仅定价精度高,且拥有更优越的定价效率和参数校准的稳健性。本文提出的AFIV方法,不仅解决了众多性能良好的随机波动率模型在期权市场的运用问题,而且还为公平比较不同标的模型的市场刻画性能提供一种可行方法。 展开更多
关键词 隐含波动率 随机波动率模型 特征函数 微扰法
原文传递
基于最小一乘模型的椭圆拟合
17
作者 雍龙泉 《海军工程大学学报》 北大核心 2025年第5期23-28,共6页
椭圆拟合在数据处理领域应用广泛,具有重要意义。为此,首先建立了椭圆拟合问题的数学模型,分析了最小二乘拟合与最小一乘拟合的几何意义;然后,基于代数距离,选用椭圆拟合的最小一乘模型,采用正弦余弦算法确定模型参数;最后,将算法应用... 椭圆拟合在数据处理领域应用广泛,具有重要意义。为此,首先建立了椭圆拟合问题的数学模型,分析了最小二乘拟合与最小一乘拟合的几何意义;然后,基于代数距离,选用椭圆拟合的最小一乘模型,采用正弦余弦算法确定模型参数;最后,将算法应用于无异常值的椭圆拟合以及含有异常值的椭圆拟合问题,进行数值实验。结果表明:最小二乘模型易受异常值的影响,而最小一乘模型对少量的异常值不敏感,稳健性较强。 展开更多
关键词 椭圆拟合 最小二乘 最小一乘 正弦余弦算法 异常值
在线阅读 下载PDF
基于加权Cucconi统计量的变采样间隔非参数AEWMA控制图设计
18
作者 罗世华 邱婕 《控制与决策》 北大核心 2025年第12期3619-3630,共12页
传统的固定采样间隔(FSI)非参数自适应指数加权移动平均(AEWMA)控制图在应对中小漂移时存在局限,特别是处理漂移类型未知或时变的过程中,常规方法往往表现不佳,且大多数研究侧重于单参数漂移.对此,基于加权Cucconi统计量,提出一种变采... 传统的固定采样间隔(FSI)非参数自适应指数加权移动平均(AEWMA)控制图在应对中小漂移时存在局限,特别是处理漂移类型未知或时变的过程中,常规方法往往表现不佳,且大多数研究侧重于单参数漂移.对此,基于加权Cucconi统计量,提出一种变采样间隔(VSI)的非参数自适应指数加权移动平均(VSI-AWEC)控制图,用于提升对位置-尺度双参数联合漂移的监控能力.首先,结合Cucconi统计量原理和变采样间隔机制,提出该控制图的设计框架;其次,通过蒙特卡洛模拟评估其性能,结果显示,与固定采样间隔控制图相比,VSIAWEC控制图在处理位置-尺度双参数联合漂移时,具有更优的平均报警时间(ATS),能够在不同漂移情境下提高监测灵敏度;然后,分析VSI-AWEC控制图在多种分布下的有效性,并比较不同参数选择对控制图性能的影响.实验结果表明,VSI-AWEC控制图在不依赖分布假设的情况下,能够快速有效地发出警报,特别是在监测小漂移时,表现优异. 展开更多
关键词 Cucconi统计量 变采样间隔 非参数AEWMA控制图 平均报警时间 统计过程监控
原文传递
基于正则判别与样条回归的红外光谱微量物证鉴定研究
19
作者 王星 赵玉冰 +1 位作者 李杰 王元凤 《数理统计与管理》 北大核心 2025年第3期436-450,共15页
红外吸收光谱是法庭科学领域将犯罪现场中微量物证和非物证进行正确识别的重要技术。文章针对具有重复观测量小、高维、宽谱带且图像十分相近不易区分的红外光谱数据,提出了正则判别与函数型数据分析相结合的模型,该模型将用于有效波数... 红外吸收光谱是法庭科学领域将犯罪现场中微量物证和非物证进行正确识别的重要技术。文章针对具有重复观测量小、高维、宽谱带且图像十分相近不易区分的红外光谱数据,提出了正则判别与函数型数据分析相结合的模型,该模型将用于有效波数和波数带提取的双重分析目标。通过真实公开的基础材料含量有微小差异的油漆案例数据,开展了模型性能的实证研究,研究发现:(1)与常用的主成分分析降噪,广义线性套索路径法相比,正则判别有助于红外光谱标志性特征的提取,具有提取的特征准确度高和物证区分精度高的双稳健良好性能;(2)在提取标志性特征的基础上,进一步运用函数型数据分析中的同时置信带方法,通过样条回归估计协方差函数估计局部分段连续光谱波段。实验结果表明:正则判别与函数型数据分析的结合用于红外光谱稀疏标志特征的提取,精准鉴别不同物证和定量估计局部分段连续光谱段方面是行之有效的。 展开更多
关键词 独立正则判别 样条回归 质心收缩算法 红外吸收光谱 均值函数估计
原文传递
函数包络模型的分位数回归算法
20
作者 陈波 崔文泉 《计算机系统应用》 2025年第11期262-269,共8页
函数型分位数回归在许多实际应用中表现良好,特别是在处理具有复杂依赖结构的数据时,常考虑的是标量响应变量与函数型预测变量之间的条件分位数关系.对于函数型数据的回归模型,已知的算法是通过函数主成分基对斜率函数进行近似展开,在... 函数型分位数回归在许多实际应用中表现良好,特别是在处理具有复杂依赖结构的数据时,常考虑的是标量响应变量与函数型预测变量之间的条件分位数关系.对于函数型数据的回归模型,已知的算法是通过函数主成分基对斜率函数进行近似展开,在此基础上再进行估计,本文提出了一种适用于函数型分位数回归,能够提高估计效率,减少预测误差的算法.该算法通过引入函数特征稀疏包络空间,将用于分位数回归的函数预测变量信息集中到一个更小的空间,降低了函数型分位数回归模型的复杂度,然后将集中信息后的分位数回归模型用广义矩估计方法进行估计.实验结果表明,本文算法在公开的函数型数据集CanadianWeather和wheat上优于对比算法. 展开更多
关键词 函数型数据 分位数回归 特征稀疏包络 广义矩估计方法 均方预测误差
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部