期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于SVRG全局优化的机器人手眼标定 被引量:1
1
作者 王一凡 黄涛 张小明 《机床与液压》 北大核心 2025年第9期1-7,共7页
聚焦于机器人加工视觉导引中的机器人手眼关系X的精确求解。奇异值分解方法求解时易受到外界环境的干扰,传统分步标定方式将手眼关系X中的旋转矩阵和平移分量分开估计,容易导致标定误差逐渐积累。为此,提出一种基于SVRG优化方法的标定... 聚焦于机器人加工视觉导引中的机器人手眼关系X的精确求解。奇异值分解方法求解时易受到外界环境的干扰,传统分步标定方式将手眼关系X中的旋转矩阵和平移分量分开估计,容易导致标定误差逐渐积累。为此,提出一种基于SVRG优化方法的标定方法。采用Kronecker积和奇异值分解来求解标定方程,得到初步解,并随后通过SVRG迭代算法对目标函数进行进一步优化,以提升解的精确性。通过不同噪声水平以及不同标定数据数量的仿真标定试验和机器人手眼标定平台数据集进行了算法验证与分析,并与4种经典求解方法进行比较。研究结果表明,SVRG方法有效控制了迭代过程中噪声方差的收敛,其几何误差的平均值为0.564,标准差为0.271,相较其他4种经典求解方法在准确性和效率方面均具有优势,有助于提高工业机器人加工测量过程中的精度以及可靠性。 展开更多
关键词 机器人加工 全局优化 手眼标定 svrg优化
在线阅读 下载PDF
分布式随机方差消减梯度下降算法topkSVRG 被引量:5
2
作者 王建飞 亢良伊 +1 位作者 刘杰 叶丹 《计算机科学与探索》 CSCD 北大核心 2018年第7期1047-1054,共8页
机器学习问题通常会转换成一个目标函数进行求解,优化算法是求解目标函数中参数的重要工具。随机梯度下降(stochastic gradient descent,SGD)是目前应用最广的算法,因其易受噪声干扰只能达到次线性收敛率,而改进后的随机方差消减梯度法(... 机器学习问题通常会转换成一个目标函数进行求解,优化算法是求解目标函数中参数的重要工具。随机梯度下降(stochastic gradient descent,SGD)是目前应用最广的算法,因其易受噪声干扰只能达到次线性收敛率,而改进后的随机方差消减梯度法(stochastic variance reduction gradient,SVRG)则可以达到线性的收敛率。SVRG是一种串行单机版算法,为了应对大规模数据集分布式训练问题,设计一种以SVRG算法思想为基础的分布式SVRG的实现算法topk SVRG。改进在于:主节点维护一个全局模型,从节点基于本地数据进行局部模型更新。每轮迭代时,选择与当前全局模型距离最小的k个局部模型进行平均来更新全局模型,参数k调大可以提高收敛速度,调小k可以保证收敛。理论分析了算法的线性收敛性,基于Spark进行算法实现,通过与Mini-Batch SGD、CoCoA、Splash及相关算法的实验比较,topkSVRG可以在高精度要求下更快地收敛。 展开更多
关键词 机器学习 优化 随机梯度下降(SGD) 随机方差消减梯度法(svrg) 分布式计算
在线阅读 下载PDF
AdaSVRG:自适应学习率加速SVRG 被引量:5
3
作者 吉梦 何清龙 《计算机工程与应用》 CSCD 北大核心 2022年第9期83-90,共8页
在深度学习任务中,随机方差衰减梯度法通过降低随机梯度方差,因此,其具有较好的稳定性和较高的计算效率。然而,这类方法在学习过程中均使用恒定的学习率,降低了随机方差衰减梯度法的计算效率。基于随机方差衰减梯度法,借鉴动量加速思想... 在深度学习任务中,随机方差衰减梯度法通过降低随机梯度方差,因此,其具有较好的稳定性和较高的计算效率。然而,这类方法在学习过程中均使用恒定的学习率,降低了随机方差衰减梯度法的计算效率。基于随机方差衰减梯度法,借鉴动量加速思想并对梯度估计采取加权平均策略,对学习率利用历史梯度信息进行自动调整,提出了自适应随机方差衰减梯度法。基于MNIST和CIFAR-10数据集,验证提出的自适应随机方差衰减梯度法的有效性。实验结果表明,自适应随机方差衰减梯度法在收敛速度和稳定性方面优于随机方差衰减梯度法和随机梯度下降法。 展开更多
关键词 深度学习 随机方差衰减梯度法 自适应学习率 动量法
在线阅读 下载PDF
基于随机采样的方差缩减优化算法
4
作者 郭振华 闫瑞栋 +2 位作者 邱志勇 赵雅倩 李仁刚 《计算机科学与探索》 北大核心 2025年第3期667-681,共15页
随机梯度下降(SGD)算法因其性能优异而引起了机器学习和深度学习等领域研究人员的广泛关注。然而,SGD使用单样本随机梯度近似样本全梯度导致算法在迭代过程中引入了额外的方差,使得算法的收敛曲线震荡甚至发散,导致其收敛速率缓慢。因此... 随机梯度下降(SGD)算法因其性能优异而引起了机器学习和深度学习等领域研究人员的广泛关注。然而,SGD使用单样本随机梯度近似样本全梯度导致算法在迭代过程中引入了额外的方差,使得算法的收敛曲线震荡甚至发散,导致其收敛速率缓慢。因此,有效减小方差成为当前关键挑战。提出了一种基于小批量随机采样的方差缩减优化算法(DM-SRG),并应用于求解凸优化及非凸优化问题。算法主要特征在于设计了内外双循环结构:外循环结构采用小批量随机样本计算梯度近似全梯度,以达到减少梯度计算开销的目的;内循环结构采用小批量随机样本计算梯度并代替单样本随机梯度,提升算法收敛稳定性。针对非凸目标函数与凸目标函数,理论分析证明了DMSRG算法具有次线性收敛速率。此外,设计了基于计算单元性能评估模型的动态样本容量调整策略,以提高系统训练效率。为评估算法的有效性,分别在不同规模的真实数据集上开展了数值模拟实验。实验结果表明算法较对比算法损失函数减少18.1%并且平均耗时降低8.22%。 展开更多
关键词 随机梯度下降 方差缩减 凸优化 非凸优化 收敛速率
在线阅读 下载PDF
AN ACCELERATED STOCHASTIC TRUST REGION METHOD FOR STOCHASTIC OPTIMIZATION
5
作者 Rulei Qi Dan Xue +1 位作者 Jing Li Yujia Zhai 《Journal of Computational Mathematics》 2025年第5期1169-1193,共25页
In this paper,we propose an accelerated stochastic variance reduction gradient method with a trust-region-like framework,referred as the NMSVRG-TR method.Based on NMSVRG,we incorporate a Katyusha-like acceleration ste... In this paper,we propose an accelerated stochastic variance reduction gradient method with a trust-region-like framework,referred as the NMSVRG-TR method.Based on NMSVRG,we incorporate a Katyusha-like acceleration step into the stochastic trust region scheme,which improves the convergence rate of the SVRG methods.Under appropriate assumptions,the linear convergence of the algorithm is provided for strongly convex objective functions.Numerical experiment results show that our algorithm is generally superior to some existing stochastic gradient methods. 展开更多
关键词 stochastic optimization stochastic variance reduced gradient Trust region gradient descent method Machine learning
原文传递
代价敏感惩罚AdaBoost算法的非平衡数据分类 被引量:20
6
作者 鲁淑霞 张振莲 翟俊海 《南京航空航天大学学报》 CAS CSCD 北大核心 2023年第2期339-346,共8页
针对非平衡数据分类问题,提出了一种基于代价敏感的惩罚AdaBoost算法。在惩罚Adaboost算法中,引入一种新的自适应代价敏感函数,赋予少数类样本及分错的少数类样本更高的代价值,并通过引入惩罚机制增大了样本的平均间隔。选择加权支持向... 针对非平衡数据分类问题,提出了一种基于代价敏感的惩罚AdaBoost算法。在惩罚Adaboost算法中,引入一种新的自适应代价敏感函数,赋予少数类样本及分错的少数类样本更高的代价值,并通过引入惩罚机制增大了样本的平均间隔。选择加权支持向量机(Support vector machine,SVM)优化模型作为基分类器,采用带有方差减小的随机梯度下降方法(Stochastic variance reduced gradient,SVRG)对优化模型进行求解。对比实验表明,本文提出的算法不但在几何均值(G-mean)和ROC曲线下的面积(Area under ROC curve,AUC)上明显优于其他算法,而且获得了较大的平均间隔,显示了本文算法在处理非平衡数据分类问题上的有效性。 展开更多
关键词 非平衡数据 惩罚AdaBoost 自适应代价敏感函数 平均间隔 随机梯度下降
在线阅读 下载PDF
带有方差减小的加权零阶随机梯度下降算法 被引量:6
7
作者 鲁淑霞 张罗幻 +1 位作者 蔡莲香 孙丽丽 《河北大学学报(自然科学版)》 CAS 北大核心 2019年第5期536-546,共11页
随机梯度下降(stochastic gradient descent,SGD)算法是机器学习问题中的高效求解方法之一.但是,对于非平衡数据,传统的随机梯度下降算法,在训练时多数类点被抽到的概率远大于少数类点,易导致计算不平衡;对于目标函数不可导或不易求导... 随机梯度下降(stochastic gradient descent,SGD)算法是机器学习问题中的高效求解方法之一.但是,对于非平衡数据,传统的随机梯度下降算法,在训练时多数类点被抽到的概率远大于少数类点,易导致计算不平衡;对于目标函数不可导或不易求导的问题,计算代价太大或无法进行计算;在每次迭代中利用单个样本梯度近似代替全梯度,这必然会产生方差,严重影响算法的分类性能.针对上述问题,提出了带有方差减小的加权零阶随机梯度下降算法,考虑了数据的间隔分布情况,在目标函数中引入了间隔均值项,并对多数类样例赋予了较小的权值,对少数类样例赋予较大的权值.在对优化问题的求解中,采用零阶优化的方法对梯度进行估计,并且引入了方差减小策略.在一些非平衡数据集上的实验验证了所提算法的有效性,并有效解决了上述问题. 展开更多
关键词 零阶优化 随机梯度下降 方差减小 非平衡数据 支持向量机
在线阅读 下载PDF
批量减数更新方差缩减梯度下降算法BSUG 被引量:6
8
作者 宋杰 朱勇 许冰 《计算机工程与应用》 CSCD 北大核心 2020年第22期117-123,共7页
机器学习问题通常会转换成求解一个目标函数问题。继随机梯度下降(Stochastic Gradient Descent,SGD)之后,随机方差缩减梯度法(Stochastic Variance Reduction Gradient,SVRG)成为如今优化目标函数参数的主流算法,它由于不受方差影响达... 机器学习问题通常会转换成求解一个目标函数问题。继随机梯度下降(Stochastic Gradient Descent,SGD)之后,随机方差缩减梯度法(Stochastic Variance Reduction Gradient,SVRG)成为如今优化目标函数参数的主流算法,它由于不受方差影响达到线性收敛而被人们广泛研究。它的提出导致陆续出现如SAGA(Stochastic Average Gradient Average)和SCSG(Stochastically Controlled Stochastic Gradient)等新型方差缩减算法,它们有着过量消耗内存、迭代缓慢等问题。为了实现小成本存储以及快速迭代的目的,设计了一种以SVRG为基础的新型变异方差缩减算法BSUG(Batch Subtraction Update Gradient)。改进在于:使用小批量样本代替全部样本进行平均梯度计算,同时对平均梯度进行减数更新。每轮迭代中,随机抽取一批小样本进行平均梯度计算,同时在内部迭代时通过对过去模型梯度的舍去来达到更新平均梯度的目的。通过合适地降低批大小B,可以减少内存存储以及迭代次数。理论分析算法的收敛性,并基于Python进行算法实现,通过与Mini-Batch SGD、AdaGrad、RMSProp、SVRG和SCSG等算法进行比较证明了BSUG算法的有效性,并且通过对超参数进行探究证明了算法的稳定性。 展开更多
关键词 机器学习 优化 小批量 减数更新 随机方差缩减梯度法(svrg)
在线阅读 下载PDF
求解非光滑强凸优化问题的减小方差加权随机算法
9
作者 朱小辉 陶卿 《模式识别与人工智能》 EI CSCD 北大核心 2016年第7期577-589,共13页
在光滑问题随机方法中使用减小方差策略,能够有效改善算法的收敛效果.文中同时引用加权平均和减小方差的思想,求解"L1+L2+Hinge"非光滑强凸优化问题,得到减小方差加权随机算法(α-HRMDVR-W).在每步迭代过程中使用减小方差策略... 在光滑问题随机方法中使用减小方差策略,能够有效改善算法的收敛效果.文中同时引用加权平均和减小方差的思想,求解"L1+L2+Hinge"非光滑强凸优化问题,得到减小方差加权随机算法(α-HRMDVR-W).在每步迭代过程中使用减小方差策略,并且以加权平均的方式输出,证明其具有最优收敛速率,并且该收敛速率不依赖样本数目.与已有减小方差方法相比,α-HRMDVR-W每次迭代中只使用部分样本代替全部样本修正梯度.实验表明α-HRMDVR-W在减小方差的同时也节省CPU时间. 展开更多
关键词 机器学习 随机优化 减小方差
在线阅读 下载PDF
基于随机方差减小方法的DDPG算法 被引量:3
10
作者 杨薛钰 陈建平 +2 位作者 傅启明 陆悠 吴宏杰 《计算机工程与应用》 CSCD 北大核心 2021年第19期104-111,共8页
针对深度确定性策略梯度算法(DDPG)收敛速度比较慢,训练不稳定,方差过大,样本应用效率低的问题,提出了一种基于随机方差减小梯度方法的深度确定性策略梯度算法(SVR-DDPG)。该算法通过利用随机方差减小梯度技术(SVRG)提出一种新的创新优... 针对深度确定性策略梯度算法(DDPG)收敛速度比较慢,训练不稳定,方差过大,样本应用效率低的问题,提出了一种基于随机方差减小梯度方法的深度确定性策略梯度算法(SVR-DDPG)。该算法通过利用随机方差减小梯度技术(SVRG)提出一种新的创新优化策略,将之运用到DDPG算法之中,在DDPG算法的参数更新过程中,加入了随机方差减小梯度技术,利用该方法的更新方式,使得估计的梯度方差有一个不断减小的上界,令方差不断缩小,从而在小的随机训练子集的基础上找到更加精确的梯度方向,以此来解决了由近似梯度估计误差引发的问题,加快了算法的收敛速度。将SVR-DDPG算法以及DDPG算法应用于Pendulum和Mountain Car问题,实验结果表明,SVR-DDPG算法具有比原算法更快的收敛速度,更好的稳定性,以此证明了算法的有效性。 展开更多
关键词 深度强化学习 深度Q学习算法(DQN) 深度确定性策略梯度算法(DDPG) 随机方差缩减梯度技术
在线阅读 下载PDF
机器学习中随机方差缩减梯度算法的一种新的步长规则 被引量:1
11
作者 杨一名 王福胜 《太原师范学院学报(自然科学版)》 2021年第4期37-42,共6页
针对大规模机器学习中常见的经验风险最小化问题,提出一种新的随机方差缩减梯度算法(SVRG-CABB).新算法结合了SVRG和复合BB步长的优势,对于初始步长的选取不敏感,在运算过程中通过动态调节步长,提高算法的运算效率.在标准数据集上的数... 针对大规模机器学习中常见的经验风险最小化问题,提出一种新的随机方差缩减梯度算法(SVRG-CABB).新算法结合了SVRG和复合BB步长的优势,对于初始步长的选取不敏感,在运算过程中通过动态调节步长,提高算法的运算效率.在标准数据集上的数值实验结果表明新算法是可行有效的. 展开更多
关键词 机器学习 随机梯度 方差缩减 复合BB步长
在线阅读 下载PDF
带有随机改进Barzilai-Borwein步长的小批量稀疏随机方差缩减梯度法 被引量:1
12
作者 秦传东 杨旭 《计算机应用研究》 CSCD 北大核心 2023年第12期3655-3659,3665,共6页
为了更好地应对当今时代的大规模高维稀疏数据集,融合BB方法、小批量算法与随机方差缩减梯度法(SVRG)优势,提出一种带有随机改进Barzilai-Borwein步长的小批量稀疏随机方差缩减梯度法(MSSVRG-R2BB)。首先,在SVRG外循环中全梯度计算的基... 为了更好地应对当今时代的大规模高维稀疏数据集,融合BB方法、小批量算法与随机方差缩减梯度法(SVRG)优势,提出一种带有随机改进Barzilai-Borwein步长的小批量稀疏随机方差缩减梯度法(MSSVRG-R2BB)。首先,在SVRG外循环中全梯度计算的基础上加入L_1范数次梯度设计出一种稀疏近似梯度用于内循环,得到一种稀疏的SVRG算法(SSVRG)。在此基础上,在小批量的稀疏随机方差缩减梯度法中使用随机选取的改进BB方法自动计算、更新步长,解决了小批量算法的步长选取问题,拓展得到MSSVRG-R2BB算法。数值实验表明,在求解大规模高维稀疏数据的线性支持向量机(SVM)问题时,MSSVRG-R2BB算法不仅可以减小运算成本、更快达到收敛上界,同时能达到与其他先进的小批量算法相同的优化水平,并且对于不同的初始参数选取表现稳定且良好。 展开更多
关键词 随机梯度下降法 小批量算法 Barzilai-Borwein方法 方差缩减 凸优化
在线阅读 下载PDF
一种赋有BB类步长的新随机方差缩减梯度算法
13
作者 陈炫睿 刘泽显 倪艳 《重庆师范大学学报(自然科学版)》 CAS 北大核心 2024年第5期7-17,共11页
为随机方差缩减梯度(stochastic variance reduced gradient,SVRG)算法引入自适应步长,并在此基础上进一步提高算法数值性能。首先利用具有二维二次终止性的BB类步长自适应计算SVRG算法的步长。然后在SVRG算法的内循环中引入停止准则和... 为随机方差缩减梯度(stochastic variance reduced gradient,SVRG)算法引入自适应步长,并在此基础上进一步提高算法数值性能。首先利用具有二维二次终止性的BB类步长自适应计算SVRG算法的步长。然后在SVRG算法的内循环中引入停止准则和负动量来加速算法的收敛速度。利用Matlab对提出的新算法进行数值实验,观察算法的数值性能。通过分析算法的数值实验结果,得出算法性能与在最佳步长调整下的SVRG算法相当,此外新算法对于初始步长的选取不敏感,且具有自动生成最优步长的能力。 展开更多
关键词 随机方差缩减梯度算法 BB类步长 自适应计算 负动量框架
原文传递
一种基于方差缩减的临近随机牛顿算法
14
作者 杜康乐 《应用数学进展》 2022年第7期4708-4717,共10页
本文研究了优化问题中的一类复合优化问题。对于凸非光滑的目标函数,在临近牛顿算法的基础上,引入方差缩减的方法,提出了一种新的一一基于方差缩减的随机牛顿算法(SN V R),并进行了收敛性分析。与ProxSGD,ProxGD,ProxSV RG方法相比,SN ... 本文研究了优化问题中的一类复合优化问题。对于凸非光滑的目标函数,在临近牛顿算法的基础上,引入方差缩减的方法,提出了一种新的一一基于方差缩减的随机牛顿算法(SN V R),并进行了收敛性分析。与ProxSGD,ProxGD,ProxSV RG方法相比,SN V R有更快的收敛速度。 展开更多
关键词 复合优化问题 机器学习 方差缩减 临近随机算法 牛顿算法
在线阅读 下载PDF
求解非凸复合优化问题的随机Douglas-Rachford分裂算法
15
作者 李登辉 孟士博 陈梦婷 《运筹与模糊学》 2024年第6期116-133,共18页
本文研究了大规模非凸复合优化问题,该问题的目标函数为非凸的光滑函数与凸(可能是非光滑的)函数之和,其中非凸的光滑函数具有有限和形式。随着大规模非凸复合优化问题在机器学习、图像处理中广泛应用,设计简洁、高效、计算成本低的优... 本文研究了大规模非凸复合优化问题,该问题的目标函数为非凸的光滑函数与凸(可能是非光滑的)函数之和,其中非凸的光滑函数具有有限和形式。随着大规模非凸复合优化问题在机器学习、图像处理中广泛应用,设计简洁、高效、计算成本低的优化算法来解决大规模非凸复合优化问题已成为当今研究热点之一。求解非凸复合优化问题的一个经典算法是Douglas-Rachford(DR)分裂算法,然而当实际问题规模较大时经典的DR分裂算法计算成本较大。据此本文提出了一种方差缩减的随机DR分裂算法(SDR),将方差缩减的随机梯度引入到DR分裂算法中,以减小算法的计算成本,并基于Kurdyka-Łojasiewicz(KL)框架对算法的收敛性进行了分析。具体的,我们首先建立了Lyapunov函数的下降性,然后建立了DR价值函数的相对误差界条件,最后利用KL性质证明了算法的全局收敛性。此外,通过将SDR算法用于求解l1l2稀疏正则化Logistic回归问题,并与PG、Prox-SARAH进行对比,展示了本文所提出算法的优越性。 展开更多
关键词 非凸复合优化问题 方差缩减的随机梯度算法 Kurdyka-Łojasiewicz不等式 Douglas-Rachford分裂算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部