期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于Nesterov加速的改进自适应优化算法
1
作者 钱振 李德权 《重庆工商大学学报(自然科学版)》 2025年第3期44-51,共8页
目的针对传统优化算法在训练深度学习模型时,由于模型参数量不断增大,网络层数不断加深所产生的训练效率较低的问题,提出一种基于Nesterov加速的Nadabelief优化算法,以提高模型的训练效率。方法首先采取Adabelief算法代替Adam算法,缓解... 目的针对传统优化算法在训练深度学习模型时,由于模型参数量不断增大,网络层数不断加深所产生的训练效率较低的问题,提出一种基于Nesterov加速的Nadabelief优化算法,以提高模型的训练效率。方法首先采取Adabelief算法代替Adam算法,缓解了算法的泛化性问题;接着从一阶矩经典动量项的角度出发,在Adabelief算法的基础上引入了Nesterov动量加速机制,在梯度更新时不仅考虑当前时刻的梯度,还借助于历史累积梯度来修正梯度的更新幅度,进一步提升了算法的效率;最后根据理论分析证明得到算法的遗憾界,确保了算法的收敛性。结果为了验证算法的性能,在凸情况下进行了Logistic回归实验,在非凸情况下进行了图像分类和语言建模实验,通过与Adam、Adabelief等算法的比较,验证了Nadabelief算法的优越性。通过在不同初始学习率下对算法进行测试,验证了算法良好的鲁棒性。结论实验表明:所提出的算法在保持原有Adabelief算法泛化能力的同时兼具更好的收敛精度,在训练深度学习模型时效率得到了进一步提高。 展开更多
关键词 自适应算法 nesterov动量加速 深度学习 图像识别 语言建模
在线阅读 下载PDF
基于AdamW优化算法的胃肠道图像分类应用
2
作者 邵一川 张鹏程 +3 位作者 武志军 孙海静 赵骞 张乐 《沈阳大学学报(自然科学版)》 2025年第5期399-406,共8页
为提高胃肠道图像分类的准确性和稳定性,提出一种基于AdamW的改进优化算法AdamW_snip。该算法在AdamW的更新过程中引入Hessian矩阵估计与Nesterov动量机制,以进一步提升医学图像分类的性能。为验证AdamW_snip的优化效果,开展了多组对比... 为提高胃肠道图像分类的准确性和稳定性,提出一种基于AdamW的改进优化算法AdamW_snip。该算法在AdamW的更新过程中引入Hessian矩阵估计与Nesterov动量机制,以进一步提升医学图像分类的性能。为验证AdamW_snip的优化效果,开展了多组对比实验,与Adam、SGD、AdamW、AdaGrad和RMSProp等优化算法进行比较,并统一采用ResNet18网络架构。实验结果表明,在胃肠道图像测试集上,AdamW_snip优化算法取得了最高的分类准确率(79.50%)和最低的损失值(0.6651)。 展开更多
关键词 胃肠道图片数据集 AdamW算法 Hessian矩阵估计 权重衰减 nesterov动量
在线阅读 下载PDF
一种新的水平集图像分割模型 被引量:4
3
作者 王卫卫 杨塨鹏 +1 位作者 吕畅 杨艳琦 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2013年第6期39-45,91,共8页
在Chan-Vese模型基础上,引入一个非凸的正则项,提出了一个新的变分水平集模型.一方面利用正则项的非凸性可起到更好的边缘保护作用,另一方面为水平集的演化增加了一个驱动力.同时,利用Nesterov算法实现了模型的快速求解.实验结果表明,与... 在Chan-Vese模型基础上,引入一个非凸的正则项,提出了一个新的变分水平集模型.一方面利用正则项的非凸性可起到更好的边缘保护作用,另一方面为水平集的演化增加了一个驱动力.同时,利用Nesterov算法实现了模型的快速求解.实验结果表明,与Chan-Vese模型相比,该模型在准确分割出图像目标的同时更好地刻画了边缘. 展开更多
关键词 图像分割 变分法 水平集 nesterov算法
在线阅读 下载PDF
基于社会媒体内容和网络拓扑的特定话题推特摘要研究 被引量:1
4
作者 贺瑞芳 段兴义 +1 位作者 张雪菲 赵文丽 《计算机学报》 EI CSCD 北大核心 2019年第6期1174-1189,共16页
推特摘要旨在从话题相关的社会媒体短文本中提炼概要的推文集,以获取有效信息,可用于舆情监控、竞争情报分析及电子商务等.然而社会媒体的海量、嘈杂及不规范性使得仅依赖纯文本的传统摘要方法难以直接迁移到社交媒体情景中;而现有的推... 推特摘要旨在从话题相关的社会媒体短文本中提炼概要的推文集,以获取有效信息,可用于舆情监控、竞争情报分析及电子商务等.然而社会媒体的海量、嘈杂及不规范性使得仅依赖纯文本的传统摘要方法难以直接迁移到社交媒体情景中;而现有的推特摘要方法很少考虑数据稀疏性和社会网络传播带来的强冗余性,鲜有通过挖掘推文之间潜在的社会网络结构关系进行文摘内容选择,忽略了信息可以沿着社交网络进行传播.受压缩感知及社会学理论的启发,该文提出基于社会网络和稀疏重构的推特摘要方法(SNSR)以更好地融合社会媒体内容和结构信息.首先,挖掘推文中隐含的摘要模式,将其建模为组稀疏正则项,以捕捉代表性的推特摘要组合;其次,建模社会网络中表达一致性与表达传染性为社会化正则项,以探索推文之间的潜在网络结构关系在推特摘要中的作用;再次,建模社会媒体信息传播带来的强冗余性为多样性正则项,进而将这些约束整合到稀疏重构的推特摘要框架中;最后,提出基于Nesterov加速梯度下降的推特摘要算法,以解决推特摘要优化框架中的覆盖性、稀疏性以及多样性等问题.同时,由于推特摘要标准语料的缺乏,作者建设了12个话题的评测数据集.相关的实验结果证明了文中提出方法的有效性. 展开更多
关键词 推特摘要 稀疏重构 网络拓扑 社会学理论 nesterov加速梯度下降算法
在线阅读 下载PDF
基于热重启学习率的NAG算法在图像分割中的应用 被引量:3
5
作者 陈甦欣 晏文彬 吕华鑫 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2022年第7期920-924,共5页
文章针对水平集演化模型的梯度下降法收敛速度较慢,且对局部极小值较为敏感的问题,提出一种热重启学习率和Nesterov加速梯度(Nesterov accelerated gradient,NAG)算法相结合的水平集演化方法,以替换Chan-Vese(CV)模型中用于演化水平集... 文章针对水平集演化模型的梯度下降法收敛速度较慢,且对局部极小值较为敏感的问题,提出一种热重启学习率和Nesterov加速梯度(Nesterov accelerated gradient,NAG)算法相结合的水平集演化方法,以替换Chan-Vese(CV)模型中用于演化水平集函数的梯度下降法,对2种算法的图像分割速度以及分割精准度进行了对比。首先根据CV模型和距离保持惩罚项建立初始的水平集演化方程;然后对NAG算法增加学习率动态变化项计算梯度来演化水平集函数;最后不断更新得到水平集函数直到收敛。使用ground truth(GT)图像评估分割精准度,通过与传统梯度下降法得到的实验结果对比,改进算法的CPU运行时间减少了30%以上且分割精确度明显提升,表明其可对图像进行有效且快速地分割。 展开更多
关键词 图像分割 基于区域的水平集方法 活动轮廓模型 nesterov加速梯度(NAG)算法 热重启学习率
在线阅读 下载PDF
距离保持水平集演化模型的快速实现算法 被引量:1
6
作者 原泉 王艳 李玉先 《计算机应用》 CSCD 北大核心 2020年第9期2743-2747,共5页
针对梯度下降法收敛性较差、对局部极小值比较敏感的问题,提出一种改进NAG算法,并以此替换距离保持水平集演化(DRLSE)模型中的梯度下降算法,进而得到一个基于NAG的图像快速分割算法。首先,给出初始水平集演化方程;其次,用改进NAG算法计... 针对梯度下降法收敛性较差、对局部极小值比较敏感的问题,提出一种改进NAG算法,并以此替换距离保持水平集演化(DRLSE)模型中的梯度下降算法,进而得到一个基于NAG的图像快速分割算法。首先,给出初始水平集演化方程;其次,用改进NAG算法计算梯度;最后,对水平集函数进行不断更新,从而避免水平集函数陷入局部极小值。实验结果表明,与DRLSE模型中的原算法相比,所提算法迭代次数减少了约30%,CPU运行时间减少了30%以上。该算法实现简单,能够对实时性要求较高的红外图像、医学图像进行快速、有效的分割。 展开更多
关键词 图像分割 水平集方法 活动轮廓模型 距离保持水平集演化模型 NAG算法
在线阅读 下载PDF
自适应Frank-Wolfe算法及其在矩阵填充上的应用 被引量:1
7
作者 汪丽琴 喻高航 张亮亮 《杭州电子科技大学学报(自然科学版)》 2021年第2期88-93,共6页
提出一种矩阵填充问题的自适应Frank-Wolfe算法。首先,采用Nesterov加速策略加速Frank-Wolfe算法,然后,在迭代过程中对矩阵降秩,提高标准Frank-Wolfe算法收敛速率的同时,降低了迭代成本;最后,通过数值实验验证所提算法的有效性。
关键词 Frank-Wolfe算法 矩阵填充 nesterov加速 降秩
在线阅读 下载PDF
三块复合优化问题的加速原始对偶不动点算法
8
作者 罗月英 蔡邢菊 孙越泓 《计算数学》 北大核心 2025年第3期436-450,共15页
对机器学习和图像处理中大量出现的三块复合优化问题,原始对偶不动点算法(PDFP)是解决这类问题的一类有效算法.本文结合PDFP和Nesterov加速技术提出了加速原始对偶不动点算法(APDFP).APDFP可以包含加速临近交替预测校正算法(APAPC)作为... 对机器学习和图像处理中大量出现的三块复合优化问题,原始对偶不动点算法(PDFP)是解决这类问题的一类有效算法.本文结合PDFP和Nesterov加速技术提出了加速原始对偶不动点算法(APDFP).APDFP可以包含加速临近交替预测校正算法(APAPC)作为特殊情况.在适当的条件下,我们证明了APDFP有非遍历意义下O(1/N)的收敛率.此外,针对fused lasso和计算机断层扫描(CT)图像重建问题的数值实验验证了算法的有效性. 展开更多
关键词 加速原始对偶不动点算法 最优性条件 nesterov加速技术
原文传递
基于改进精确扩散算法的虚拟电厂分布式二次调频策略
9
作者 朱承治 袁梦瞳 +3 位作者 薄耀龙 夏杨红 刘可佳 韦巍 《电力系统自动化》 2025年第20期149-160,共12页
虚拟电厂的自动发电控制(AGC)可通过多类型资源协调控制来满足高比例新能源渗透电网的二次调频需求。为解决传统分布式AGC方法收敛不精确和收敛速度慢的问题,提出了一种考虑线路潮流和收敛加速的改进分布式算法。首先,对虚拟电厂的有功... 虚拟电厂的自动发电控制(AGC)可通过多类型资源协调控制来满足高比例新能源渗透电网的二次调频需求。为解决传统分布式AGC方法收敛不精确和收敛速度慢的问题,提出了一种考虑线路潮流和收敛加速的改进分布式算法。首先,对虚拟电厂的有功潮流进行线性化建模,并针对性构建了虚拟电厂AGC指令分解最优问题,在提高调频性能和经济性的同时保障电网安全运行。其次,为了进一步提高优化模型求解速度和精度,提出了基于Nesterov加速梯度的改进精确扩散算法。基于IEEE33节点系统和中国浙江省台州市临海头门港虚拟电厂示范基地的仿真案例研究表明,所提算法不仅在响应精度和收敛速度上明显优于其他算法,且基于该算法的AGC系统在调频性能和经济性上也有显著提升。 展开更多
关键词 虚拟电厂 调频 自动发电控制 潮流 指令分解 分布式优化 精确扩散算法 nesterov加速梯度
在线阅读 下载PDF
凸二次半定规划一个长步原始对偶路径跟踪算法
10
作者 黎健玲 王培培 +1 位作者 曾友芳 简金宝 《应用数学学报》 CSCD 北大核心 2020年第1期12-32,共21页
本文基于Nesterov-Todd方向,并引进中心路径测量函数以及原始对偶对数障碍函数,建立了一个求解凸二次半定规划的长步路径跟踪法.算法保证当迭代点落在中心路径附近时步长1被接受.算法至多迭代O(n|lnε|)次可得到一个ε最优解.论文最后... 本文基于Nesterov-Todd方向,并引进中心路径测量函数以及原始对偶对数障碍函数,建立了一个求解凸二次半定规划的长步路径跟踪法.算法保证当迭代点落在中心路径附近时步长1被接受.算法至多迭代O(n|lnε|)次可得到一个ε最优解.论文最后报告了初步的数值试验结果. 展开更多
关键词 凸二次半定规划 中心路径 nesterov-Todd方向 路径跟踪算法 迭代复杂性
原文传递
Sparse Deep Nonnegative Matrix Factorization 被引量:1
11
作者 Zhenxing Guo Shihua Zhang 《Big Data Mining and Analytics》 2020年第1期13-28,共16页
Nonnegative Matrix Factorization(NMF)is a powerful technique to perform dimension reduction and pattern recognition through single-layer data representation learning.However,deep learning networks,with their carefully... Nonnegative Matrix Factorization(NMF)is a powerful technique to perform dimension reduction and pattern recognition through single-layer data representation learning.However,deep learning networks,with their carefully designed hierarchical structure,can combine hidden features to form more representative features for pattern recognition.In this paper,we proposed sparse deep NMF models to analyze complex data for more accurate classification and better feature interpretation.Such models are designed to learn localized features or generate more discriminative representations for samples in distinct classes by imposing L1-norm penalty on the columns of certain factors.By extending a one-layer model into a multilayer model with sparsity,we provided a hierarchical way to analyze big data and intuitively extract hidden features due to nonnegativity.We adopted the Nesterov’s accelerated gradient algorithm to accelerate the computing process.We also analyzed the computing complexity of our frameworks to demonstrate their efficiency.To improve the performance of dealing with linearly inseparable data,we also considered to incorporate popular nonlinear functions into these frameworks and explored their performance.We applied our models using two benchmarking image datasets,and the results showed that our models can achieve competitive or better classification performance and produce intuitive interpretations compared with the typical NMF and competing multilayer models. 展开更多
关键词 SPARSE NONNEGATIVE Matrix Factorization(NMF) DEEP learning nesterov’s ACCELERATED gradient algorithm
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部