期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
融合注意力的特征聚合孪生网络视觉跟踪
1
作者 金静 牛品 翟凤文 《计算机工程与应用》 北大核心 2025年第12期166-176,共11页
目前以孪生网络为基础的目标跟踪算法,仍然存在网络浅层的特征中有价值的上下文信息无法合理利用的问题。针对这一问题,提出一种融合拆分注意力机制(split-attention,SA)的目标跟踪算法SiamMCFA(siamese multi-channel feature aggregat... 目前以孪生网络为基础的目标跟踪算法,仍然存在网络浅层的特征中有价值的上下文信息无法合理利用的问题。针对这一问题,提出一种融合拆分注意力机制(split-attention,SA)的目标跟踪算法SiamMCFA(siamese multi-channel feature aggregation module)。在骨干网络中引入拆分注意力机制,用来提取浅层特征中有价值的上下文信息,通过像素级互相关模块(pixel-wise cross correlation,PWCC)融合模板区域和搜索区域浅层和深层特征中的上下文信息,以增强模板区域和搜索区域的特征图之间的联系,从而提高跟踪器的鲁棒性。针对因尺度变化而容易导致目标丢失的问题,设计了一个多通道特征聚合模块(multi-channel feature aggregation module,MCFA),用于聚合目标不同区域的特征信息,使跟踪器尽可能地区分目标和语义背景,进一步提升跟踪准确性。最后,在OTB100、VOT2019、GOT10K和LaSOT四个数据集上进行了详尽的实验评估,结果显示,SiamMCFA与当前基于孪生网络的先进的跟踪器SiamCAR相比,其成功率(success rate)与精准度(precision)分别提高了2.26和2.83个百分点。与SiamIRCA相比成功率与精准度提高了0.3和0.9个百分点。 展开更多
关键词 目标跟踪 孪生网络 拆分注意力 像素级互相关 多通道特征聚合
在线阅读 下载PDF
一种基于逐像素级投票的快速多聚焦图像融合方法
2
作者 罗回彬 翟鹤翔 赵伟康 《激光杂志》 北大核心 2025年第2期124-130,共7页
探索并构建了一种基于逐像素投票的快速图像融合方法。首先,通过在不同滑动窗口步长下进行相关的可视化和定量分析实验,从中确认了使用像素步长为2的滑动窗口的融合图像性能非常接近于使用像素步长为1的滑动窗口的性能。因此,在新的快... 探索并构建了一种基于逐像素投票的快速图像融合方法。首先,通过在不同滑动窗口步长下进行相关的可视化和定量分析实验,从中确认了使用像素步长为2的滑动窗口的融合图像性能非常接近于使用像素步长为1的滑动窗口的性能。因此,在新的快速图像融合方法中采用了像素步长为2的滑动窗口,以降低总体融合计算时间。其次,采用减小源图像分辨率的方法进一步降低快速融合算法的计算复杂度。实验结果表明,在不降低融合效果的情况下,选择合适的缩放比例可以有效提高融合算法的运行速度。此外,还对由摄影设备抖动引起的图像位移数据集进行了相关实验。提出的快速融合算法具有很强的鲁棒性,并且能够有效地融合具有轻微抖动的多聚焦源图像。 展开更多
关键词 多聚焦图像融合 滑窗 逐像素投票
原文传递
Deepfake Detection Using Adversarial Neural Network
3
作者 Priyadharsini Selvaraj Senthil Kumar Jagatheesaperumal +3 位作者 Karthiga Marimuthu Oviya Saravanan Bader Fahad Alkhamees Mohammad Mehedi Hassan 《Computer Modeling in Engineering & Sciences》 2025年第5期1575-1594,共20页
With expeditious advancements in AI-driven facial manipulation techniques,particularly deepfake technology,there is growing concern over its potential misuse.Deepfakes pose a significant threat to society,partic-ularl... With expeditious advancements in AI-driven facial manipulation techniques,particularly deepfake technology,there is growing concern over its potential misuse.Deepfakes pose a significant threat to society,partic-ularly by infringing on individuals’privacy.Amid significant endeavors to fabricate systems for identifying deepfake fabrications,existing methodologies often face hurdles in adjusting to innovative forgery techniques and demonstrate increased vulnerability to image and video clarity variations,thereby hindering their broad applicability to images and videos produced by unfamiliar technologies.In this manuscript,we endorse resilient training tactics to amplify generalization capabilities.In adversarial training,models are trained using deliberately crafted samples to deceive classification systems,thereby significantly enhancing their generalization ability.In response to this challenge,we propose an innovative hybrid adversarial training framework integrating Virtual Adversarial Training(VAT)with Two-Generated Blurred Adversarial Training.This combined framework bolsters the model’s resilience in detecting deepfakes made using unfamiliar deep learning technologies.Through such adversarial training,models are prompted to acquire more versatile attributes.Through experimental studies,we demonstrate that our model achieves higher accuracy than existing models. 展开更多
关键词 Deepfake GENERALIZATION forgery detection pixel-wise Gaussian blurring virtual adversarial training
在线阅读 下载PDF
Self-Supervised Monocular Depth Estimation with Scene Dynamic Pose
4
作者 Jing He Haonan Zhu +1 位作者 Chenhao Zhao Minrui Zhao 《Computers, Materials & Continua》 2025年第6期4551-4573,共23页
Self-supervised monocular depth estimation has emerged as a major research focus in recent years,primarily due to the elimination of ground-truth depth dependence.However,the prevailing architectures in this domain su... Self-supervised monocular depth estimation has emerged as a major research focus in recent years,primarily due to the elimination of ground-truth depth dependence.However,the prevailing architectures in this domain suffer from inherent limitations:existing pose network branches infer camera ego-motion exclusively under static-scene and Lambertian-surface assumptions.These assumptions are often violated in real-world scenarios due to dynamic objects,non-Lambertian reflectance,and unstructured background elements,leading to pervasive artifacts such as depth discontinuities(“holes”),structural collapse,and ambiguous reconstruction.To address these challenges,we propose a novel framework that integrates scene dynamic pose estimation into the conventional self-supervised depth network,enhancing its ability to model complex scene dynamics.Our contributions are threefold:(1)a pixel-wise dynamic pose estimation module that jointly resolves the pose transformations of moving objects and localized scene perturbations;(2)a physically-informed loss function that couples dynamic pose and depth predictions,designed to mitigate depth errors arising from high-speed distant objects and geometrically inconsistent motion profiles;(3)an efficient SE(3)transformation parameterization that streamlines network complexity and temporal pre-processing.Extensive experiments on the KITTI and NYU-V2 benchmarks show that our framework achieves state-of-the-art performance in both quantitative metrics and qualitative visual fidelity,significantly improving the robustness and generalization of monocular depth estimation under dynamic conditions. 展开更多
关键词 Monocular depth estimation self-supervised learning scene dynamic pose estimation dynamic-depth constraint pixel-wise dynamic pose
在线阅读 下载PDF
基于多视单目影像光度法的月球南极像素级三维重建
5
作者 陈泽宇 李兆津 +2 位作者 吴波 贾然野 彭悦 《遥感学报》 北大核心 2025年第2期415-428,共14页
月球表面精细三维重建对月球探测任务和科学研究具有重要意义。过去几十年的研究主要侧重于激光测高与摄影测量方法的研究,但受限于硬件和方法原理,其三维重建DEM(Digital Elevation Model)的最高分辨率只能达到几十米或图像分辨率的若... 月球表面精细三维重建对月球探测任务和科学研究具有重要意义。过去几十年的研究主要侧重于激光测高与摄影测量方法的研究,但受限于硬件和方法原理,其三维重建DEM(Digital Elevation Model)的最高分辨率只能达到几十米或图像分辨率的若干倍,无法为地势复杂的月球南极探测提供有效支撑。影像光度法因其可以充分利用图像中每个像素的明暗信息,从而重建像素级分辨率的DEM受到了广泛关注。但月球南极太阳高度角接近0°,阴影效应严重,使用单张图像无法覆盖所有区域。其次,图像之间光照存在较大差异,直接通过多张图像建立约束方程容易造成冲突,使得优化计算不收敛,无法有效重建三维地形。因此,本文提出了一种基于多张单目影像光度法的像素级三维重建方法,方法的输入为多张高分辨率影像和相应的现有低分辨DEM,通过构建多分辨率金字塔尺度空间,通过影像光度法逐级优化DEM,将原始的低分辨率DEM提升至像素级。在损失函数方面,本文充分考虑到月球南极图像之间的阴影差异,提出了相似性约束,从而保证在引入多光照方向约束的同时,也可有效利用每张图像特有的信息。在损失优化方面,本文引入了自适应学习率优化器,从而更好地保证损失函数的收敛。而优化过程中的梯度更新也为影像光度法的重建质量提供了参考。本文选取了月球南极着陆探测的重点区域—沙克尔顿撞击坑周边的两个局部区域来验证算法的有效性。与公开发布的基于摄影测量方法和激光点云生成的DEM相比,本文所提方法得到的DEM获得了更精细的像素级地形细节,高程精度优于一个像素。基于影像光度法DEM生成的光照模拟影像与遥感影像基本一致,证明实验区地形得到了较好的恢复。本文提出的新算法可以有效重建月球南极大范围高精度、像素级分辨率的DEM,为后续的月球南极探测任务和科学研究提供重要的数据支撑。 展开更多
关键词 月球南极 数字高程模型 像素级三维重建 影像光度法 摄影测量
原文传递
融合像素互相关的Transformer跟踪算法
6
作者 薛紫涵 葛海波 +1 位作者 杨雨迪 田攀帅 《计算机工程与应用》 北大核心 2025年第12期279-290,共12页
Siamese网络互相关操作的局部匹配性无法有效获得全局上下文信息,而Transformer网络依赖全局关系获得语义信息,但需要更多的局部边缘信息来区分目标和背景。因此,提出了一种结合像素互相关(pixel-wise crosscorrelation,PW-Corr)和Trans... Siamese网络互相关操作的局部匹配性无法有效获得全局上下文信息,而Transformer网络依赖全局关系获得语义信息,但需要更多的局部边缘信息来区分目标和背景。因此,提出了一种结合像素互相关(pixel-wise crosscorrelation,PW-Corr)和Transformer的目标跟踪算法。构建并行编码器并采用非线性重加权注意力(non-linear reweighting attention,NRA)提高Transformer获取全局上下文的能力;设计解码器并融合像素互相关从空间和通道两方面的交互提高特征融合的精确度,过滤多余背景干扰。分类回归任务使用一个基于多层感知器(multi-layer perceptron,MLP)的分类头和具有全局上下文感知模块(global context awareness module,GCAM)的回归头,捕捉全局信息同时提取目标局部信息,促进算法对跟踪目标的准确定位。实验结果表明,改进后的算法在OTB100数据集上成功率和准确率分别可达70.6%、92.1%,提高了跟踪的成功率和准确率。 展开更多
关键词 Transformer网络 像素互相关 注意力机制 全局上下文感知
在线阅读 下载PDF
基于深度可分离卷积的实时农业图像逐像素分类研究 被引量:14
7
作者 刘庆飞 张宏立 王艳玲 《中国农业科学》 CAS CSCD 北大核心 2018年第19期3673-3682,共10页
【目的】为了提高作物和杂草的识别准确率和实时性,以苗期甜菜田间彩色图像为研究对象,提出了基于深度可分离卷积的实时农业图像逐像素分类方法。【方法】本研究使用由农业机器人采集的苗期甜菜田间彩色图像,通过人工逐像素标注方法将... 【目的】为了提高作物和杂草的识别准确率和实时性,以苗期甜菜田间彩色图像为研究对象,提出了基于深度可分离卷积的实时农业图像逐像素分类方法。【方法】本研究使用由农业机器人采集的苗期甜菜田间彩色图像,通过人工逐像素标注方法将彩色图像中各个像素点标注为作物、杂草、土壤3个类别,并将单一类别的标注信息分别置于3个不同的图像通道,构成用于训练和测试的数据集。首先,建立以编码器-解码器为基础的深度可分离卷积神经网络模型,将编码器部分和解码器部分进行多尺度合并,由编码器部分决定像素位置,解码器部分获得像素分类;然后,为了解决分类类别覆盖率不平衡的问题,通过单通道标注信息训练,提高了低覆盖率分类类别的准确率,再将多个训练结果输出,实现对图像中的土壤、杂草、作物的识别;为了控制网络参数规模,采用宽度乘数控制点卷积核的个数,同时在不同分辨率输入条件下对网络模型进一步测试,以讨论网络模型的实时性。最后,使用随机数据增强技术扩充数据集,数据集中的80%用于网络参数的训练,20%用于测试网络性能。【结果】(1)通过与已有逐像素分类方法比较,本文方法获得较高的分类准确率。其中,SegNet方法逐像素分类的平均准确率为90.06%,U-Net方法平均准确率为92.06%,三通道标记训练的本文网络平均准确率为92.70%,单通道标记训练的本文网络平均准确率达94.99%。(2)通过计算不同方法单一类别逐像素分类的各项指标,论证了本文提出的单通道标注信息训练方法在处理分类类别覆盖率不平衡和训练样本较少情况下的优势。对杂草逐像素分类的准确率,SegNet方法为18.39%,U-Net方法为18.33%,三通道标记训练的本文网络为22.87%,单通道标记训练的本文网络准确率达41.94%。(3)通过宽度乘数可以有效控制网络模型的参数规模,当宽度乘数为1时,参数尺寸为676.8万,当宽度乘数为0.1时,参数尺寸降低到7.72万,是原始网络参数规模的1.14%,对土壤、杂草、作物的逐像素分类准确率分别仅降低2.81%、2.78%、3.7%,按照识别精度需求参数规模还可以进一步减小。(4)在输入分辨率和宽度乘数的共同作用下,讨论了网络的实时处理能力。采用GPU硬件加速对3个类别同时识别的速率可达20 fps,对单一类别识别速率达60 fps。可满足农业除草系统和作物监测系统实时在线运行。【结论】本文所提出的基于深度可分离卷积的逐像素分类方法,能对农业图像中的土壤、杂草、作物实施有效逐像素分类,同时该方法能对单一类别逐像素分类进行实时处理,满足实际系统的应用需求。 展开更多
关键词 作物与杂草识别 深度学习 卷积神经网络 逐像素分类 语义分割
在线阅读 下载PDF
基于深度像素级特征的孪生网络目标跟踪方法 被引量:4
8
作者 王向军 郝忻 王霖 《传感技术学报》 CAS CSCD 北大核心 2023年第10期1576-1583,共8页
目标尺度变化和低分辨率的复杂场景往往会影响目标跟踪算法的性能进而导致跟踪精度下降。针对此问题,提出了一种基于深度像素级特征的孪生网络目标跟踪方法。引入像素级特征融合方法对目标模板和搜索区域的多层特征进行融合、设计基于... 目标尺度变化和低分辨率的复杂场景往往会影响目标跟踪算法的性能进而导致跟踪精度下降。针对此问题,提出了一种基于深度像素级特征的孪生网络目标跟踪方法。引入像素级特征融合方法对目标模板和搜索区域的多层特征进行融合、设计基于残差网络和拓扑结构的特征深层提取模块、依据判据筛选历史信息得到合适模板特征进行模板更新。实验结果表明,所提改进算法在VOT2018数据集上比基础算法的EAO值提升了5.31%,准确率提升了0.83%,鲁棒性提升了3.85%;在OTB100数据集上,所提算法精确率为91.4%,成功率为71.7%,与基础算法相比,精确率提升了3.28%,成功率提升了5.13%。 展开更多
关键词 目标跟踪 孪生网络 像素级特征融合 模板更新
在线阅读 下载PDF
牛眼虹膜定位算法研究及其在肉食品追溯系统中的应用 被引量:9
9
作者 李超 赵林度 《中国安全科学学报》 CAS CSCD 北大核心 2011年第3期124-130,共7页
为实现动物个体的精确鉴别,提高肉食品的安全性,将动物虹膜识别技术引入到肉食品供应链中,构建了基于虹膜识别的肉食品安全可追溯系统业务流程,实现了肉食品"从农场到餐桌"的安全保障;并以牛眼虹膜为例,根据其非同心椭圆的结... 为实现动物个体的精确鉴别,提高肉食品的安全性,将动物虹膜识别技术引入到肉食品供应链中,构建了基于虹膜识别的肉食品安全可追溯系统业务流程,实现了肉食品"从农场到餐桌"的安全保障;并以牛眼虹膜为例,根据其非同心椭圆的结构特征和图像仿射变换不变特征的原理,提出了一种牛眼虹膜快速定位方法。将牛眼虹膜内、外边界分别转化为圆形,对内边界采用灰度均值法粗定位与"三点定圆"精定位相结合的方法实现,对外边界设计了一种逐点扫描分层圆环算法来精确拟合。实验结果表明:该方法避免了虹膜信息丢失,减少了空间参数的选择运算。 展开更多
关键词 动物个体标识 追溯 牛眼虹膜 仿射变换 虹膜定位 三点定圆 逐点扫描分层圆环算法
原文传递
一种基于SAR图像视觉特征的改进像素掩蔽方法 被引量:9
10
作者 雷斌 丁赤飚 《电子测量技术》 2014年第11期37-41,共5页
像素掩蔽模型用于描述人眼视觉对图像噪声的敏感性与图像局部特征的关系,在图像压缩、数字水印嵌入、信息隐藏等领域中有重要应用。由于SAR图像反映目标及背景对微波的散射特性,其可视化特征与传统的光学遥感图像存在较大差异,导致基于... 像素掩蔽模型用于描述人眼视觉对图像噪声的敏感性与图像局部特征的关系,在图像压缩、数字水印嵌入、信息隐藏等领域中有重要应用。由于SAR图像反映目标及背景对微波的散射特性,其可视化特征与传统的光学遥感图像存在较大差异,导致基于光学图像的像素掩蔽模型不适用于SAR图像。提出一种基于SAR图像视觉特征的改进像素掩蔽方法,应用于对数变换后的SAR图像,在保持视觉质量的同时,可以显著的提高嵌入信息的强度。实验结果显示,该方法应用于基于小波变换的数字水印算法,可以极大的提升方法的鲁棒性和不可见性。 展开更多
关键词 合成孔径雷达 数字水印 信息隐藏 像素掩蔽
在线阅读 下载PDF
基于加权融合策略的单幅图像去雾算法 被引量:1
11
作者 王崟 王敬东 +1 位作者 魏雪迎 刘云霄 《光电子技术》 CAS 北大核心 2018年第1期32-39,48,共9页
基于暗元先验的去雾算法在利用边缘保护操作消除景深突变处产生的光晕现象时没有区分边缘的类型,导致了透射率的估计不合理,降低了去雾的质量。提出一种基于加权融合策略的透射率估计方法,通过块级暗通道和像素级暗通道的相关特性获取... 基于暗元先验的去雾算法在利用边缘保护操作消除景深突变处产生的光晕现象时没有区分边缘的类型,导致了透射率的估计不合理,降低了去雾的质量。提出一种基于加权融合策略的透射率估计方法,通过块级暗通道和像素级暗通道的相关特性获取景深信息导向图,从而在景深突变处和非景深突变的局部合理选取像素级暗通道和块级暗通道,保护了景深边缘处的突变性,同时减少了局部纹理边缘噪声的影响,获得了更准确的透射率估计结果。实验结果表明,该算法能有效避免光晕现象,改善局部细节模糊的问题,得到更优的去雾视觉效果。 展开更多
关键词 暗通道先验 像素级暗通道 块级暗通道 景深信息导向图 加权融合 透射率估计
原文传递
基于像素点回归的孪生网络目标跟踪算法 被引量:1
12
作者 刘庆玲 余晗华 《应用科技》 CAS 2022年第5期24-31,共8页
为了解决孪生网络目标跟踪算法中互相关操作引入过多的背景干扰容易导致跟踪漂移的问题,提出了一种包含高精度相似度匹配且基于像素点回归的孪生网络目标跟踪算法。通过对Transformer的改进,设计出一种高精度的相似度匹配模块用于取代... 为了解决孪生网络目标跟踪算法中互相关操作引入过多的背景干扰容易导致跟踪漂移的问题,提出了一种包含高精度相似度匹配且基于像素点回归的孪生网络目标跟踪算法。通过对Transformer的改进,设计出一种高精度的相似度匹配模块用于取代互相关系列操作,用以减少目标的背景干扰,并提出一种基于像素点回归的边界框预测策略用于取代锚框机制,用以提升算法的泛化性能。通过在目标跟踪数据集上的测试结果表明,该算法有效地提升了在包含背景杂乱、遮挡等挑战的复杂场景下的跟踪效果,并且可以实现实时跟踪。 展开更多
关键词 目标跟踪 孪生网络 相似度匹配 互相关操作 TRANSFORMER 边界框预测 锚框机制 像素点回归
在线阅读 下载PDF
基于像素级水平的通道自适应水下图像增强算法
13
作者 彭晏飞 张添淇 安彤 《液晶与显示》 CAS CSCD 北大核心 2024年第8期1037-1045,共9页
现有基于深度学习的算法采用编解码方式在高维特征中对水下图像进行增强,没有考虑水下图像的通道差异性退化特点,导致增强效果普遍较差。针对这一问题,提出了一种基于像素级水平的通道自适应水下图像增强算法,将水下图像在像素级分R、G... 现有基于深度学习的算法采用编解码方式在高维特征中对水下图像进行增强,没有考虑水下图像的通道差异性退化特点,导致增强效果普遍较差。针对这一问题,提出了一种基于像素级水平的通道自适应水下图像增强算法,将水下图像在像素级分R、G和B三通道进行增强。此算法分4个阶段,通过4个阶段的分通道特征提取完成整个增强过程。首先,通过增强网络的局部和全局语义,优化通道衰减来修复上下文的颜色通道;其次,通过注意机制聚合空间和通道特征,并抑制不相关的颜色定位跳跃信息;然后,通过优化注意力机制调整自适应特征;最后,为提高算法色偏纠正能力,提出了一个色偏纠正模块,在第四阶段使用色偏调节模块进一步调整图像的色偏问题。在UIEB数据集和EUVP数据集上与其他算法进行对比,本文算法的PSNR指标提高了14.35%,SSIM提高了5.8%,UIQM提高了3.2%,UCIQE提高了13.7%,且主观效果最佳。 展开更多
关键词 水下图像增强 通道增强 像素级增强 深度学习
在线阅读 下载PDF
一种高效且轻量的RGB单帧人脸反欺诈模型
14
作者 李家春 李博文 常建波 《山东大学学报(工学版)》 CSCD 北大核心 2023年第6期1-7,共7页
针对在仅具有三原色(red-green-blue,RGB)摄像头的通用消费设备上部署基于深度学习的人脸反欺诈(face anti-spoofing,FAS)算法时存在的挑战问题,提出一种高效且轻量的RGB单帧FAS(efficient and lightweight RGB frame-level face anti-s... 针对在仅具有三原色(red-green-blue,RGB)摄像头的通用消费设备上部署基于深度学习的人脸反欺诈(face anti-spoofing,FAS)算法时存在的挑战问题,提出一种高效且轻量的RGB单帧FAS(efficient and lightweight RGB frame-level face anti-spoofing,EL-FAS)模型。探索一种新的全局空间自注意力机制捕获全局上下文信息的依赖关系,以提高模型泛化能力并在受限条件下实现高检测性能;设计一种等通道像素级二元监督方法,强制模型从不同的像素中学习共享特征;采用Bottleneck模块搭建骨干网络以减少模型参数。试验结果表明,EL-FAS模型在OULU-NPU数据集的大多数协议上平均分类错误率R_(ACE)最低,取得较好的人脸欺诈检测效果,在SiW数据集和跨数据集测试中也取得较好的性能,并且模型轻量,参数只有1.34×10^(6)个。 展开更多
关键词 深度学习 人脸反欺诈 自注意力机制 像素级监督 轻量级模型
原文传递
基于高光谱成像技术的配方烟丝组分判别 被引量:9
15
作者 梅吉帆 李智慧 +5 位作者 李嘉康 苏子淇 徐波 堵劲松 徐大勇 李华杰 《分析测试学报》 CAS CSCD 北大核心 2021年第8期1151-1157,共7页
应用近红外(1 000~2 200 nm)高光谱成像技术开展了面对像素、面对样本的配方烟丝4种组分(叶丝、梗丝、薄片丝、膨胀丝)的判别研究。以样本高光谱图像的所有像素点光谱数据进行面对像素的组分判别;以样本所有像素点的平均光谱数据进行面... 应用近红外(1 000~2 200 nm)高光谱成像技术开展了面对像素、面对样本的配方烟丝4种组分(叶丝、梗丝、薄片丝、膨胀丝)的判别研究。以样本高光谱图像的所有像素点光谱数据进行面对像素的组分判别;以样本所有像素点的平均光谱数据进行面对样本的组分判别。采用二阶导数法结合萨维茨基-戈莱平滑(SG)滤波对光谱数据进行预处理。通过面对像素数据的主成分分析,证实了基于面对像素的高光谱数据进行组分判别的可行性,以前5主成分建立的支持向量机模型很好地实现了叶丝与梗丝、叶丝与薄片丝的判别任务。建立了面对样本的4组分的K近邻和支持向量机判别模型,通过连续投影算法和二阶导数法进行特征波长选择,筛选出具有高判别准确率的波段,组分判别率达86.97%。 展开更多
关键词 配方烟丝 组分判别 近红外高光谱成像技术 像素分类 主成分分析 连续投影算法 二阶导数法
在线阅读 下载PDF
基于深度卷积神经网络的肾透明细胞癌细胞核分割 被引量:10
16
作者 鲁浩达 徐军 +3 位作者 刘利卉 周超 周晓军 张泽林 《生物医学工程研究》 北大核心 2017年第4期340-345,共6页
肾透明细胞癌病理图像中细胞核的形态和位置信息对肾癌的良恶性分级诊断具有重要意义,为提高肾透明细胞癌细胞核分割的质量,本研究提出了基于深度卷积神经网络的细胞核分割方法。首先,根据标定的病理图像中细胞核轮廓,构建细胞核分割样... 肾透明细胞癌病理图像中细胞核的形态和位置信息对肾癌的良恶性分级诊断具有重要意义,为提高肾透明细胞癌细胞核分割的质量,本研究提出了基于深度卷积神经网络的细胞核分割方法。首先,根据标定的病理图像中细胞核轮廓,构建细胞核分割样本集;然后,深度卷积神经网络通过隐式特征学习对细胞核分割模型进行训练,避免人为设计特征;最后,利用细胞核分割模型对病理图像进行逐像素分割。实验结果表明,深度卷积神经网络的细胞核分割算法在肾透明细胞癌细胞核分割的像素准确率高达90.33%,细胞核分割性能稳定,深度卷积神经网络强大的鲁棒性和适应性使得肾透明细胞癌细胞核自动分割具有可能。 展开更多
关键词 分割 卷积神经网络 细胞核 肾透明细胞癌 逐像素
暂未订购
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割 被引量:6
17
作者 骆小飞 徐军 陈佳梅 《自动化学报》 EI CSCD 北大核心 2017年第11期2003-2013,共11页
上皮和间质组织是乳腺组织病理图像中最基本的两种组织,约80%的乳腺肿瘤起源于乳腺上皮组织.为了构建基于乳腺组织病理图像分析的计算机辅助诊断系统和分析肿瘤微环境,上皮和间质组织的自动分割是重要的前提条件.本文构建一种基于逐像... 上皮和间质组织是乳腺组织病理图像中最基本的两种组织,约80%的乳腺肿瘤起源于乳腺上皮组织.为了构建基于乳腺组织病理图像分析的计算机辅助诊断系统和分析肿瘤微环境,上皮和间质组织的自动分割是重要的前提条件.本文构建一种基于逐像素点深度卷积网络(CN-PI)模型的上皮和间质组织的自动分割方法.1)以病理医生标注的两类区域边界附近具有类信息为标签的像素点为中心,构建包含该像素点上下文信息的正方形图像块的训练集.2)以每个正方形图像块包含的像素的彩色灰度值作为特征,以这些图像块中心像素类信息为标签训练CN模型.在测试阶段,在待分割的组织病理图像上逐像素点地取包含每个中心像素点上下文信息的正方形图像块,并输入到预先训练好的CN网络模型,以预测该图像块中心像素点的类信息.3)以每个图像块中心像素为基础,逐像素地遍历图像中的每一个像素,将预测结果作为该图像块中心像素点类信息的预测标签,实现对整幅图像的逐像素分割.实验表明,本文提出的CN-PI模型的性能比基于图像块分割的CN网络(CN-PA)模型表现出了更优越的性能. 展开更多
关键词 深度卷积网络 乳腺组织病理图像 上皮和间质组织分割 逐像素分割
在线阅读 下载PDF
基于深度反卷积网络的虹膜定位方法研究 被引量:2
18
作者 徐霄 陈阳 +1 位作者 张飞云 乔宇 《集成技术》 2016年第1期57-67,共11页
精确而快速地进行虹膜定位是有效地进行虹膜识别的重要前提。传统的虹膜定位方法有Daugman定位法、Hough变换定位法等,但其对睫毛比较浓密、虹膜被遮挡较多等情况下的图片处理效果不是很好。文章在总结前人工作的基础上,实现了一套基于... 精确而快速地进行虹膜定位是有效地进行虹膜识别的重要前提。传统的虹膜定位方法有Daugman定位法、Hough变换定位法等,但其对睫毛比较浓密、虹膜被遮挡较多等情况下的图片处理效果不是很好。文章在总结前人工作的基础上,实现了一套基于深度学习的虹膜定位系统。该系统利用深度学习方法,根据虹膜图像区域的特点,对图像进行像素级分类。根据像素分类结果,可以很好地标识虹膜区域和非虹膜区域,达到定位识别虹膜区域的目的,并在中国科学院自动化所公布的虹膜数据集CASIA-Iris V3-Interval上验证了文章工作的有效性,像素分类精度达到约98.4%,达到了较高的鲁棒性。 展开更多
关键词 虹膜定位 深度学习 像素级分类
在线阅读 下载PDF
结合图像块比较与残差图估计的人脸伪造检测 被引量:7
19
作者 冯才博 刘春晓 +1 位作者 王昱烨 周其当 《中国图象图形学报》 CSCD 北大核心 2024年第2期457-467,共11页
目的 由于不同伪造类型样本的数据分布差距较大,现有人脸伪造检测方法的准确度不够高,而且泛化性能差。为此,本文引入“图像块归属纯净性”和“残差图估计可靠性”的概念,提出了基于图像块比较和残差图估计的人脸伪造检测方法。方法 除... 目的 由于不同伪造类型样本的数据分布差距较大,现有人脸伪造检测方法的准确度不够高,而且泛化性能差。为此,本文引入“图像块归属纯净性”和“残差图估计可靠性”的概念,提出了基于图像块比较和残差图估计的人脸伪造检测方法。方法 除了骨干网络,本文的人脸伪造检测神经网络主要由纯净图像块比较模块和可靠残差图估计模块两部分组成。为了避免在同时包含人脸和背景像素的图像块上提取的混杂特征对于图像块比较的干扰,纯净图像块比较模块中选择只包含人脸像素的纯净人脸图像块和只包含背景像素的纯净背景图像块,通过比较两种图像块纯净特征之间的差异来检测伪造图像,图像块的纯净性保障了特征提取的纯净性,从而提高了特征比较的鲁棒性。考虑到靠近伪造边缘的像素比远离伪造边缘的像素具有较高的残差估计准确度,本文在可靠残差图估计模块中根据像素到伪造边缘的距离设计了一个距离场加权的残差损失来引导网络的训练过程,使网络重点关注输入图像与对应真实图像在伪造边缘附近的差异,对于可靠信息的关注进一步增强了伪造检测的鲁棒性。结果在FF++(FaceForensics++)数据集上的测试结果显示:与对比算法中性能最好的F2Trans-B相比,本文方法的准确率和AUC(area under the ROC curve)指标分别提高了2.49%和3.31%,在FS(FaceSwap)与F2F(Face2Face)两种伪造数据上的准确率指标分别提高了6.01%和3.99%。在泛化性能方面,与11种已有方法在交叉数据集上的测试结果显示:本文方法与其中性能最好的方法相比,在CDF(Celeb-DF)数据集上的视频AUC指标和图像AUC指标分别提高了1.85%和1.03%。结论 与对比方法相比,由于提高了特征信息的纯净性和可靠性,本文提出的人脸图像伪造检测模型的泛化能力和准确率优于对比方法。 展开更多
关键词 人脸图像伪造检测 深度伪造 多任务学习 泛化性能 像素级监督 卷积神经网络
原文传递
PNET:像素级台标识别网络 被引量:3
20
作者 徐佳宇 张冬明 +3 位作者 靳国庆 包秀国 袁庆升 张勇东 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2018年第10期1878-1889,共12页
台标识别是典型的细微目标识别问题,针对台标区域小、信息量低,且镂空、半透明台标极易受到画面背景影响的难题,提出一个基于端到端全卷积网络的像素级台标识别网络——PNET.首先构建一个像素级标注的台标数据集,通过视频抽帧和图像预... 台标识别是典型的细微目标识别问题,针对台标区域小、信息量低,且镂空、半透明台标极易受到画面背景影响的难题,提出一个基于端到端全卷积网络的像素级台标识别网络——PNET.首先构建一个像素级标注的台标数据集,通过视频抽帧和图像预处理获得台标图像集,并提出一种逐图像的像素级半自动标注方法获得二值标签图像集;然后提出一个像素级台标识别网络,在典型分类网络AlexNet,VGG的基础上,通过微调,将分类网络在分类任务中学习到的网络参数转换为像素级台标识别网络在台标分割任务中的所需的网络参数;最后引入跨层架构,融合来自网络深层的全局信息和浅层的局部信息.实验结果表明PNET实现了准确的像素级分割,准确率高达98.3%,在NVIDIA Tesla K80上单幅图像识别时间不超过1.5 s. 展开更多
关键词 视频分类 台标识别 全卷积网络 像素级半自动标注 跨层架构
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部