现有多跳频信号参数估计方法稀疏线性回归(Sparse Linear Regression,SLR)存在计算量大、内存消耗大的缺点。事实上,频率跳变只在少数几个数据点上发生,大部分数据不包含跳变信息。基于此,提出一种基于正交匹配追踪(Orthogonal Matching...现有多跳频信号参数估计方法稀疏线性回归(Sparse Linear Regression,SLR)存在计算量大、内存消耗大的缺点。事实上,频率跳变只在少数几个数据点上发生,大部分数据不包含跳变信息。基于此,提出一种基于正交匹配追踪(Orthogonal Matching Pursuit,OMP)和SLR相结合的跳频信号参数估计方法。该方法将接收到的样本数据均匀分段,对每段数据用OMP算法预处理,检测出发生频率跳变的数据段以及估计出没有发生跳变的数据段的频率;对这些发生跳变的数据段分别用SLR算法估计得到各段的跳时和频率;拼接可以得到整个样本的跳时、跳频图案等。仿真结果表明,该方法在在保持SLR精确估计性能的同时,能有效减少计算量。展开更多
目的探讨乙型肝炎病毒(hepatitis B virus,HBV)前S/S区氨基酸位点的变异与肝硬化发生发展的潜在关联,为进一步理解HBV变异在疾病进展中的作用及开发针对性治疗策略提供科学依据。方法2018—2022年于甘肃省武威肿瘤医院纳入慢性乙型肝炎(...目的探讨乙型肝炎病毒(hepatitis B virus,HBV)前S/S区氨基酸位点的变异与肝硬化发生发展的潜在关联,为进一步理解HBV变异在疾病进展中的作用及开发针对性治疗策略提供科学依据。方法2018—2022年于甘肃省武威肿瘤医院纳入慢性乙型肝炎(chronic hepatitis B,CHB)感染者建立专病队列,共纳入乙型肝炎表面抗原(hepati-tis B surface antigen,HBsAg)阳性患者3882人。随访至2022年12月31日,对患者血清样本的HBV前S/S区进行二代测序(next-generation sequencing,NGS),将序列进行翻译与基因分型后得到C基因型,并将肝硬化与非肝硬化患者按年龄(±5岁)与性别进行1∶1匹配后,计算氨基酸突变率与香农熵。构建稀疏逻辑回归(sparse logistic regression,SLR)模型,分析乙型肝炎相关肝硬化患者病毒前S/S区氨基酸的特征。结果测序完整的C基因型患者196人,其中肝硬化22人,非肝硬化174人。年龄(±5岁)与性别的1∶1匹配分析后,得到肝硬化组和非肝硬化组各20人。非肝硬化组中接受抗病毒治疗的患者比例高于肝硬化组,差异有统计学意义(χ^(2)=4.912,P<0.05)。肝硬化组前S1区的平均突变频率及香农熵均高于非肝硬化组,差异有统计学意义(Z=3.793、3.057,P<0.05)。共发现8个氨基酸位点的突变频率在2组间差异有统计学意义,有6个是有效突变位点。其中,T68、G73、M120和G318位点突变频率肝硬化组高于非肝硬化组(Z=2.029、2.191、2.299、2.029,P<0.05),而T84、L267、L283和N380位点则相反(Z=2.380、2.056、2.353、2.462,P<0.05)。建立的SLR模型筛选出第380个位点(即N380位点)的突变频率为最高贡献度指标(Z=2.462,P<0.05),其余指标的贡献度虽排在前10,但2组间差异无统计学意义。结论HBV前S/S区氨基酸位点的改变可能影响肝硬化的发展,即前S1区氨基酸突变频率越高肝硬化就越有可能发生;SLR模型的应用为肝硬化预测及精准治疗提供了新的方向。展开更多
稀疏多元逻辑回归(SMLR)是高光谱监督分类中的重要方法,然而仅仅利用光谱信息的SMLR忽略了影像本身的空间特征,在少量监督样本下的分类精度和算法的鲁棒性仍明显不足;虽然通过引入核技巧,核稀疏多元逻辑回归(KSMLR)可以部分克服上述缺点...稀疏多元逻辑回归(SMLR)是高光谱监督分类中的重要方法,然而仅仅利用光谱信息的SMLR忽略了影像本身的空间特征,在少量监督样本下的分类精度和算法的鲁棒性仍明显不足;虽然通过引入核技巧,核稀疏多元逻辑回归(KSMLR)可以部分克服上述缺点,其分类错误仍然有待进一步降低.本文基于核稀疏多元逻辑回归分类误差的统计建模分析,提出一种联合核稀疏多元逻辑回归和正则化错误剔除的高光谱图像分类模型.提出的模型通过引入隐概率场,采取L1范数度量KSMLR分类误差的重尾特性建立数据保真项;利用全变差(Total Variation,TV)正则化度量隐概率场的局部空间光滑性.由Indian Pines和University of Pavia数据集等实测数据应用表明,该方法可以得到更鲁棒和更高的分类精度.展开更多
分布式交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)是求解大规模机器学习问题使用最广泛的方法之一。现有大多数分布式ADMM算法都基于完整的模型更新。随着系统规模及数据量的不断增长,节点间的通信开销逐渐成...分布式交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)是求解大规模机器学习问题使用最广泛的方法之一。现有大多数分布式ADMM算法都基于完整的模型更新。随着系统规模及数据量的不断增长,节点间的通信开销逐渐成为限制分布式ADMM算法发展的瓶颈。为了减少节点间通信开销,提出了一种通信高效的通用一致性异步分布式ADMM算法(General Form Consensus Asynchronous Distributed ADMM,GFC-ADADMM),该算法通过分析高维稀疏数据集的特性,节点间利用关联模型参数代替完整模型参数进行通信,并对模型参数进行过滤以进一步减少节点间传输负载。同时结合过时同步并行(Stale Synchronous Parallel,SSP)计算模型、allreude通信模型及混合编程模型的优势,利用异步allreduce框架并基于MPI/OpenMP混合编程模型实现GFC-ADADMM算法,提高算法计算与通信效率。文中利用GFC-ADADMM算法求解稀疏logistic回归问题,实验测试表明,与现有分布式ADMM算法相比,GFC-ADADMM算法可减少15%~63%的总运行时间,且算法收敛时可达到更高的准确率。展开更多
逻辑回归是经典的分类方法,广泛应用于数据挖掘、机器学习和计算机视觉.现研究带有程。模约束的逻辑回归问题.这类问题广泛用于分类问题中的特征提取,且一般是NP-难的.为了求解这类问题,提出了嵌套BB(Barzilai and Borwein)算法的分裂...逻辑回归是经典的分类方法,广泛应用于数据挖掘、机器学习和计算机视觉.现研究带有程。模约束的逻辑回归问题.这类问题广泛用于分类问题中的特征提取,且一般是NP-难的.为了求解这类问题,提出了嵌套BB(Barzilai and Borwein)算法的分裂增广拉格朗日算法(SALM-BB).该算法在迭代中交替地求解一个无约束凸优化问题和一个带程。模约束的二次优化问题.然后借助BB算法求解无约束凸优化问题.通过简单的等价变形直接得到带程。模约束二次优化问题的精确解,并且给出了算法的收敛性定理.最后通过数值实验来测试SALM-BB算法对稀疏逻辑回归问题的计算精确性.数据来源包括真实的UCI数据和模拟数据.数值实验表明,相对于一阶算法SLEP,SALM-BB能够得到更低的平均逻辑损失和错分率.展开更多
文摘现有多跳频信号参数估计方法稀疏线性回归(Sparse Linear Regression,SLR)存在计算量大、内存消耗大的缺点。事实上,频率跳变只在少数几个数据点上发生,大部分数据不包含跳变信息。基于此,提出一种基于正交匹配追踪(Orthogonal Matching Pursuit,OMP)和SLR相结合的跳频信号参数估计方法。该方法将接收到的样本数据均匀分段,对每段数据用OMP算法预处理,检测出发生频率跳变的数据段以及估计出没有发生跳变的数据段的频率;对这些发生跳变的数据段分别用SLR算法估计得到各段的跳时和频率;拼接可以得到整个样本的跳时、跳频图案等。仿真结果表明,该方法在在保持SLR精确估计性能的同时,能有效减少计算量。
文摘稀疏多元逻辑回归(SMLR)是高光谱监督分类中的重要方法,然而仅仅利用光谱信息的SMLR忽略了影像本身的空间特征,在少量监督样本下的分类精度和算法的鲁棒性仍明显不足;虽然通过引入核技巧,核稀疏多元逻辑回归(KSMLR)可以部分克服上述缺点,其分类错误仍然有待进一步降低.本文基于核稀疏多元逻辑回归分类误差的统计建模分析,提出一种联合核稀疏多元逻辑回归和正则化错误剔除的高光谱图像分类模型.提出的模型通过引入隐概率场,采取L1范数度量KSMLR分类误差的重尾特性建立数据保真项;利用全变差(Total Variation,TV)正则化度量隐概率场的局部空间光滑性.由Indian Pines和University of Pavia数据集等实测数据应用表明,该方法可以得到更鲁棒和更高的分类精度.
文摘分布式交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)是求解大规模机器学习问题使用最广泛的方法之一。现有大多数分布式ADMM算法都基于完整的模型更新。随着系统规模及数据量的不断增长,节点间的通信开销逐渐成为限制分布式ADMM算法发展的瓶颈。为了减少节点间通信开销,提出了一种通信高效的通用一致性异步分布式ADMM算法(General Form Consensus Asynchronous Distributed ADMM,GFC-ADADMM),该算法通过分析高维稀疏数据集的特性,节点间利用关联模型参数代替完整模型参数进行通信,并对模型参数进行过滤以进一步减少节点间传输负载。同时结合过时同步并行(Stale Synchronous Parallel,SSP)计算模型、allreude通信模型及混合编程模型的优势,利用异步allreduce框架并基于MPI/OpenMP混合编程模型实现GFC-ADADMM算法,提高算法计算与通信效率。文中利用GFC-ADADMM算法求解稀疏logistic回归问题,实验测试表明,与现有分布式ADMM算法相比,GFC-ADADMM算法可减少15%~63%的总运行时间,且算法收敛时可达到更高的准确率。
文摘逻辑回归是经典的分类方法,广泛应用于数据挖掘、机器学习和计算机视觉.现研究带有程。模约束的逻辑回归问题.这类问题广泛用于分类问题中的特征提取,且一般是NP-难的.为了求解这类问题,提出了嵌套BB(Barzilai and Borwein)算法的分裂增广拉格朗日算法(SALM-BB).该算法在迭代中交替地求解一个无约束凸优化问题和一个带程。模约束的二次优化问题.然后借助BB算法求解无约束凸优化问题.通过简单的等价变形直接得到带程。模约束二次优化问题的精确解,并且给出了算法的收敛性定理.最后通过数值实验来测试SALM-BB算法对稀疏逻辑回归问题的计算精确性.数据来源包括真实的UCI数据和模拟数据.数值实验表明,相对于一阶算法SLEP,SALM-BB能够得到更低的平均逻辑损失和错分率.