期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
内外特征交互与融合的双流注意力图像修复方法
1
作者 黄光远 黄荣 +1 位作者 周树波 蒋学芹 《电子学报》 北大核心 2025年第4期1293-1307,共15页
注意力机制及其变体已广泛应用于基于深度学习的图像修复领域,它们将破损图像内部分为完好区域和缺失区域,捕获完好区域的远距离上下文信息以填充缺失区域.随着缺失区域增大,完好区域特征减少,限制了注意力机制的性能,从而导致修复效果... 注意力机制及其变体已广泛应用于基于深度学习的图像修复领域,它们将破损图像内部分为完好区域和缺失区域,捕获完好区域的远距离上下文信息以填充缺失区域.随着缺失区域增大,完好区域特征减少,限制了注意力机制的性能,从而导致修复效果不佳.为拓展注意力机制捕获上下文的范围,本文通过矢量量化码本学习视觉原子.这些视觉原子刻画了图像块的结构、纹理等特征,组成用于图像修复的外部特征,以弥补图像内部完好区域特征的不足.在此基础上,本文提出一种内外特征交互与融合的双流注意力图像修复方法.该方法结合内部和外部两个信息源,设计了内部掩码注意力和内外交叉注意力,组成双流注意力以实现内部特征之间以及内部和外部特征之间的交互,生成内外源修复特征.内部掩码注意力通过掩码屏蔽缺失区域特征的干扰,仅在完好区域捕获上下文信息,生成内源修复特征.内外交叉注意力通过计算内部特征与由视觉原子组成的外部特征之间的相似度关系,实现内外特征之间的交互,生成外源修复特征.此外,本文设计了可控特征融合模块,利用内外源修复特征之间的相关性生成空间权重图,为每个空间位置精确地筛选内外源修复特征,从而实现内部与外部特征的融合.在Places2、FFHQ和Paris StreetView三个公开的数据集上的实验结果表明本文方法在PSNR、SSIM、L1、LPIPS和FID指标上比其他先进方法平均提高了3.45%、1.34%、13.91%、13.64%和16.92%.消融实验结果和可视化实验结果表明图像内部特征与由视觉原子组成的外部特征均有益于修复破损图像. 展开更多
关键词 图像修复 矢量量化码本 视觉原子 掩码注意力 交叉注意力 特征融合
在线阅读 下载PDF
鲁棒视觉词汇本的自适应构造与自然场景分类应用 被引量:3
2
作者 杨丹 李博 赵红 《电子与信息学报》 EI CSCD 北大核心 2010年第9期2139-2144,共6页
该文提出了一种视觉词汇本的优化构造策略。首先引入条件数定量评估海量低层特征的稳定性,排除病态特征,筛选稳定的鲁棒视觉特征;通过分析聚类和降维的内在联系,构造了具有聚类结构的视觉特征自适应降维算法;进而利用低维聚类结构信息... 该文提出了一种视觉词汇本的优化构造策略。首先引入条件数定量评估海量低层特征的稳定性,排除病态特征,筛选稳定的鲁棒视觉特征;通过分析聚类和降维的内在联系,构造了具有聚类结构的视觉特征自适应降维算法;进而利用低维聚类结构信息中的邻域支持度,自适应选取最佳的初始视觉词汇,同时选择Sil指标作为目标函数,从而改进流行的LBG词汇本生成算法敏感于初始点的随机选取,并只能得到局部最优等不足。新的视觉词汇本生成算法具有聚类和降维的统一计算功能、良好的鲁棒性和自适应优化等特性。基于概率潜在语义分析技术将该文的视觉词汇本应用于自然场景分类,在13类场景图像库上取得了73.46%的平均分类率。 展开更多
关键词 模式识别 自然场景分类 视觉词汇本 条件数
在线阅读 下载PDF
基于多视觉码本的图像表示 被引量:1
3
作者 宋彦 蒋兵 戴礼荣 《模式识别与人工智能》 EI CSCD 北大核心 2013年第10期909-915,共7页
基于词袋模型的图像表示方法的有效性主要受限于局部特征的量化误差.文中提出一种基于多视觉码本的图像表示方法,通过综合考虑码本构建和编码方法这两个方面的因素加以改进.具体包括:1)多视觉码本构建,以迭代方式构建多个紧凑且具有互... 基于词袋模型的图像表示方法的有效性主要受限于局部特征的量化误差.文中提出一种基于多视觉码本的图像表示方法,通过综合考虑码本构建和编码方法这两个方面的因素加以改进.具体包括:1)多视觉码本构建,以迭代方式构建多个紧凑且具有互补性的视觉码本;2)图像表示,首先针对多码本的情况,依次从各码本中选择相应的视觉单词并采用线性回归估计编码系数,然后结合图像的空间金字塔结构形成最终的图像表示.在一些标准测试集合的图像分类结果验证文中方法的有效性. 展开更多
关键词 图像分类 视觉码本 聚类分析 图像表示
在线阅读 下载PDF
基于双层码本的语音驱动视觉语音合成系统 被引量:2
4
作者 贾熹滨 尹宝才 孙艳丰 《计算机科学》 CSCD 北大核心 2014年第1期100-104,共5页
提出了一种基于双层码本的语音驱动视觉语音合成系统,该系统以矢量量化的思想为基础,建立语音特征空间到视觉语音特征空间的粗耦合映射关系。为加强语音和视觉语音的关联性,系统分别根据语音特征与视觉语音特征的相似性两次对样本数据... 提出了一种基于双层码本的语音驱动视觉语音合成系统,该系统以矢量量化的思想为基础,建立语音特征空间到视觉语音特征空间的粗耦合映射关系。为加强语音和视觉语音的关联性,系统分别根据语音特征与视觉语音特征的相似性两次对样本数据进行自动聚类,构造同时反映语音之间与视觉语音之间相似性的双层映射码本。数据预处理阶段,提出一种能反映视觉语音几何形状特征与牙齿可见度的联合特征模型,并在语音特征LPCC及MFCC基础上采用遗传算法提取视觉语音相关的语音特征模型。合成的视频中图像数据与原始视频中图像数据的比较结果表明,合成结果能在一定程度上逼近原始数据,取得了很好的效果。 展开更多
关键词 双层码本 视觉语音合成 视觉语音特征 语音特征
在线阅读 下载PDF
消除阴影和高亮噪声的双梯柱体码本前景检测模型 被引量:1
5
作者 黄进 金炜东 +2 位作者 秦娜 周艳 刘景波 《西安交通大学学报》 EI CAS CSCD 北大核心 2013年第4期28-34,共7页
为解决智能视觉监控中前景检测存在阴影和高亮噪声影响的问题,提出一种双梯柱体码本(DTCC)前景检测模型。首先,根据阴影与背景相比亮度较低且色度不同的特点,将模型下部构造成正立的梯柱体阴影检测区;随后,根据高亮噪声与背景相比亮度... 为解决智能视觉监控中前景检测存在阴影和高亮噪声影响的问题,提出一种双梯柱体码本(DTCC)前景检测模型。首先,根据阴影与背景相比亮度较低且色度不同的特点,将模型下部构造成正立的梯柱体阴影检测区;随后,根据高亮噪声与背景相比亮度较高、色度不同的特点,将模型上部构造成倒立的梯柱体高亮噪声检测区域;最后,模型中部采用圆柱体构造成主体背景区域,最终形成DTCC模型。实验结果表明:DTCC模型具有更高的实时性,平均帧率约为15.61帧/s,比iGMM模型、CBM模型和HC3模型的帧率分别高出76.05%、24.60%和41.09%;具有更优的阴影和高亮噪声消除性能,平均阴影和高亮噪声消除率分别约为70.61%和83.41%,均高于对比模型。 展开更多
关键词 阴影 高亮噪声 码本 前景检测 智能视觉监控
在线阅读 下载PDF
残差增强的图像描述符 被引量:5
6
作者 魏本昌 郑丽 管涛 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2019年第6期1039-1045,共7页
针对增大视觉码书在提高图像全局描述符——局部特征聚合描述符(VLAD)精度的同时会增加VLAD存储开销的问题,提出一种基于2层结构层次视觉码书生成残差增强的图像全局描述符EVLAD.离线码书生成阶段,首先通过K-means算法生成第1层视觉码书... 针对增大视觉码书在提高图像全局描述符——局部特征聚合描述符(VLAD)精度的同时会增加VLAD存储开销的问题,提出一种基于2层结构层次视觉码书生成残差增强的图像全局描述符EVLAD.离线码书生成阶段,首先通过K-means算法生成第1层视觉码书,然后基于量化残差最小化原则非均匀地生成第2层各视觉子码书.在线EVLAD生成阶段,图像局部特征首先面向细粒度的第2层视觉子码书生成量化残差;然后面向第1层视觉码书进行聚集生成各子向量,EVLAD即为各子向量的串联结果,为了抑制特征空间爆发现象,各子向量和串联结果分别进行了L2归一化.实验结果表明,EVLAD精度优于VLAD和其他各种改进方法. 展开更多
关键词 图像描述符 层次视觉码书 L2归一化 积量化
在线阅读 下载PDF
Data Driven Hierarchical Serial Scene Classification Framework
7
作者 Wen-Gang FENG 《自动化学报》 EI CSCD 北大核心 2014年第4期763-770,共8页
景色分类是一项复杂任务,因为它包括许多内容,捕获它的分发是困难的。一个新奇层次连续景色分类框架在这份报纸被介绍。起初,我们使用层次特征介绍包含特定的目标的全球景色和本地补丁。层次被空间金字塔火柴介绍,并且我们的自己的... 景色分类是一项复杂任务,因为它包括许多内容,捕获它的分发是困难的。一个新奇层次连续景色分类框架在这份报纸被介绍。起初,我们使用层次特征介绍包含特定的目标的全球景色和本地补丁。层次被空间金字塔火柴介绍,并且我们的自己的电报密码本被词的二种不同类型造。第二,我们基于空格金字塔火柴分别地由生产、歧视的方法训练视觉词,它能高效地获得本地补丁标签。然后,我们使用一个神经网络模仿人的决定过程,它从本地标签导致最后的景色范畴。实验证明层次连续景色图象表示和分类模型关于精确性获得优异结果。 展开更多
关键词 分类模型 场景 序列 数据驱动 框架 分层功能 层次结构 判别方法
在线阅读 下载PDF
一种基于随机码本的运动目标检测算法 被引量:5
8
作者 方浩 李艾华 +1 位作者 王涛 苏延召 《光电子.激光》 EI CAS CSCD 北大核心 2014年第11期2158-2163,共6页
针对传统码本算法模型建立时间过长、更新效果差等问题,将视觉背景提取(ViBe)算法中模型建立和更新的思想用于改进码本算法,提出了一种基于随机码本(RCB)的运动目标检测算法。为减少计算量,提出了一种基于YUV空间的码本模型;为减少背景... 针对传统码本算法模型建立时间过长、更新效果差等问题,将视觉背景提取(ViBe)算法中模型建立和更新的思想用于改进码本算法,提出了一种基于随机码本(RCB)的运动目标检测算法。为减少计算量,提出了一种基于YUV空间的码本模型;为减少背景建模时间、提高模型的洁净度,提出了随机选取第1帧图像空间领域内像素点的码本训练方法;为提高背景模型对复杂场景的适应能力,提出了基于随机策略的码本更新方式。与典型算法进行了两组实验。结果表明,本文算法兼有二者的优点,不仅能迅速适应场景的转换,而且在检测精度、动态适应能力和实时性等方面都有较大提高。 展开更多
关键词 空间领域 随机码本(RCB) 视觉背景提取(ViBe) 目标检测
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部