期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于DO-Conv结构的孪生网络目标跟踪系统研究
1
作者 蒋淦华 郭宏 +1 位作者 朱於峰 熊杰 《电子产品世界》 2025年第10期53-57,共5页
针对卷积神经网络(convolutional neural network,CNN)在目标跟踪中表达能力受限的情况,构建了一种基于深度过参数化卷积(depthwise over-parameterized convolution,DO-Conv)结构的孪生网络目标跟踪系统。在特征提取阶段,引入了DO-Con... 针对卷积神经网络(convolutional neural network,CNN)在目标跟踪中表达能力受限的情况,构建了一种基于深度过参数化卷积(depthwise over-parameterized convolution,DO-Conv)结构的孪生网络目标跟踪系统。在特征提取阶段,引入了DO-Conv模块,同时设计了DO-Conv结构替换策略,以强化中高层语义特征表达。在匹配阶段,构建了基于相关性卷积的特征相似度计算机制。在训练优化环节,引入联合损失函数与正则约束,有效提升了响应图平滑性与系统收敛效率。为验证孪生网络目标跟踪系统的有效性,选用GOT-10k数据集对其与其他典型孪生网络目标跟踪系统开展对比实验。结果表明,本文所构建的孪生网络目标跟踪系统在精度与成功率上均显著优于其他目标跟踪系统,并兼具实时性与鲁棒性,验证了DOConv结构在复杂场景下的高适应性。 展开更多
关键词 do-conv 孪生网络 目标跟踪 特征匹配
在线阅读 下载PDF
基于DO-Conv改进的端到端车牌识别算法 被引量:1
2
作者 赖珍向 丁磊 +1 位作者 邓杰航 顾国生 《计算机科学与应用》 2021年第3期588-595,共8页
提出了基于DO-Conv改进的端到端车牌识别算法,该算法引入一种新颖的深度过参数化卷积(Depthwise Over-Parameterized Convolutional Layer,DO-Conv),用于替换常规卷积,提升图像特征提取的有效性,从而提高车牌识别的准确率。研究结果表明... 提出了基于DO-Conv改进的端到端车牌识别算法,该算法引入一种新颖的深度过参数化卷积(Depthwise Over-Parameterized Convolutional Layer,DO-Conv),用于替换常规卷积,提升图像特征提取的有效性,从而提高车牌识别的准确率。研究结果表明:改进后的算法在合成数据集和SYSU数据集上的识别准确率分别为97.42%和95.08%,均优于使用传统卷积的端到端识别算法。 展开更多
关键词 车牌识别 端到端 深度过参数化卷积 do-conv
在线阅读 下载PDF
基于DO-Conv的DBNet文本检测方法研究 被引量:3
3
作者 曾祥福 钟维良 +1 位作者 郑阳超 陈海钦 《工业控制计算机》 2022年第11期100-101,103,共3页
目前,文本检测任务主要有基于回归的方法和基于分割的方法,基于回归的方法能够完成一般的文本检测任务,但是较难处理弯曲文本,基于分割的方法利用了图像分割,通过后处理的方式可以检测弯曲文本,得到较好的包围曲线,但是同时也增加了处... 目前,文本检测任务主要有基于回归的方法和基于分割的方法,基于回归的方法能够完成一般的文本检测任务,但是较难处理弯曲文本,基于分割的方法利用了图像分割,通过后处理的方式可以检测弯曲文本,得到较好的包围曲线,但是同时也增加了处理的步骤和预测的时间。DBNet方法提出可学习阈值并设计了一个二值化函数,简化了后处理的步骤,在文本检测任务中取得了很好的效果。随着越来越多的网络被提出并且在计算机视觉中都有不错的效果,针对基于分割方法的后处理复杂和预测速度慢问题,在DBNet方法上应用了较为新的ResNeSt网络,同时引入了DO-Conv卷积方式。实验结果表明,该方法在多个指标上都要优于DBNet方法,有较好的文本检测性能。 展开更多
关键词 文本检测 DBNet ResNeSt do-conv
在线阅读 下载PDF
VG-DOCoT:a novel DO-Conv and transformer framework via VAE-GAN technique for EEG emotion recognition 被引量:1
4
作者 Yanping ZHU Lei HUANG +3 位作者 Jixin CHEN Shenyun WANG Fayu WAN Jianan CHEN 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2024年第11期1497-1514,共18页
Human emotions are intricate psychological phenomena that reflect an individual’s current physiological and psychological state.Emotions have a pronounced influence on human behavior,cognition,communication,and decis... Human emotions are intricate psychological phenomena that reflect an individual’s current physiological and psychological state.Emotions have a pronounced influence on human behavior,cognition,communication,and decision-making.However,current emotion recognition methods often suffer from suboptimal performance and limited scalability in practical applications.To solve this problem,a novel electroencephalogram(EEG)emotion recognition network named VG-DOCoT is proposed,which is based on depthwise over-parameterized convolutional(DO-Conv),transformer,and variational automatic encoder-generative adversarial network(VAE-GAN)structures.Specifically,the differential entropy(DE)can be extracted from EEG signals to create mappings into the temporal,spatial,and frequency information in preprocessing.To enhance the training data,VAE-GAN is employed for data augmentation.A novel convolution module DO-Conv is used to replace the traditional convolution layer to improve the network.A transformer structure is introduced into the network framework to reveal the global dependencies from EEG signals.Using the proposed model,a binary classification on the DEAP dataset is carried out,which achieves an accuracy of 92.52%for arousal and 92.27%for valence.Next,a ternary classification is conducted on SEED,which classifies neutral,positive,and negative emotions;an impressive average prediction accuracy of 93.77%is obtained.The proposed method significantly improves the accuracy for EEG-based emotion recognition. 展开更多
关键词 Emotion recognition Electroencephalogram(EEG) Depthwise over-parameterized convolutional(do-conv) Transformer Variational automatic encoder-generative adversarial network(VAE-GAN)
原文传递
基于MobileNet-DOA的无人机射频信号识别方法 被引量:2
5
作者 晏行伟 孔令轩 +1 位作者 刘坤 刘安娜 《雷达科学与技术》 北大核心 2025年第1期57-66,共10页
针对当前低信噪比环境下,基于射频信号的无人机型号和飞行模式识别率低的问题,本文提出了一种基于MobileNet-DOA模型的无人机射频信号识别方法。该方法首先对原始无人机射频信号进行基于变分模态分解的信号预处理,降低背景噪声和同频干... 针对当前低信噪比环境下,基于射频信号的无人机型号和飞行模式识别率低的问题,本文提出了一种基于MobileNet-DOA模型的无人机射频信号识别方法。该方法首先对原始无人机射频信号进行基于变分模态分解的信号预处理,降低背景噪声和同频干扰,然后利用短时傅里叶变换将预处理信号转换为时频图,最后利用MobileNet-DOA模型完成无人机射频信号识别。在模型方面,本文首先将DOConv卷积融合到MobileNetv4模型中,在增强模型特征提取能力的同时,提高了训练和运算速度。其次,使用FA注意力机制进一步提升了模型在低信噪比环境下的识别准确率。实验结果表明,该方法在-15~15 dB信噪比范围内的平均检测准确率达到了94.83%,可应用于无人机实时检测识别系统中。 展开更多
关键词 无人机射频信号识别 变分模态分解 MobileNet模型 DOConv卷积 FA注意力机制
在线阅读 下载PDF
融合Transformer和CNN的手掌静脉识别网络 被引量:4
6
作者 吴凯 沈文忠 +1 位作者 贾丁丁 梁娟 《计算机工程与应用》 CSCD 北大核心 2023年第24期98-109,共12页
针对手掌静脉特征提取识别精度不高问题,提出了掌静脉识别网络PVCodeNet。该网络设计了改进的BasicBlock和Transformer Encoder模块结合并运用扩大决策边界的损失函数AAM-Loss(additive angular margin loss)。该网络首次将Transformer ... 针对手掌静脉特征提取识别精度不高问题,提出了掌静脉识别网络PVCodeNet。该网络设计了改进的BasicBlock和Transformer Encoder模块结合并运用扩大决策边界的损失函数AAM-Loss(additive angular margin loss)。该网络首次将Transformer Encoder模块成功用于掌静脉图像全局特征提取,改进的BasicBlock使用深度超参数化卷积Do-Conv取代传统卷积Conv进行特征提取使提取的特征更加具有区分性,该模块还加入规一化的注意力机制NAM模块,通过应用权重稀疏性惩罚项抑制不显著性特征的权值来提取图像在通道和空间域上重要的细节特征。在手掌关键点定位、ROI提取、图像增强方面作了详细描述,在特征向量维度、AAM-Loss参数设置方面做了详细实验,在PolyU数据库和自建库SEPAD-PV数据库上进行消融实验测试,EER均达到了0,成功实现了最高识别率的突破。为了验证该网络的泛化性能,还在具有相似纹理特征的掌纹数据库Tongji和指静脉数据库SDUMLA上进行验证,EER远远优于其他主流算法,充分证明了提出算法的优越性。 展开更多
关键词 手掌静脉识别 Transformer编码模块 深度超参数化卷积(do-conv) 规一化注意力机制(NAM) 扩大决策边界的损失函数(AAM-Loss)
在线阅读 下载PDF
胎盘超声图像分割
7
作者 徐成 张芸 曾祥进 《计算机与现代化》 2024年第5期115-119,126,共6页
妊娠早期的胎盘形状和大小与胎儿生长等临床结果紧密相关。针对人工手动标注胎盘轮廓较为耗时的分割方法,设计一种新型深度学习分割网络:DEC-U-Net,该模型设计依据U-Net架构,在U-Net下采样阶段使用深度超参数化卷积代替2D卷积并且联合EC... 妊娠早期的胎盘形状和大小与胎儿生长等临床结果紧密相关。针对人工手动标注胎盘轮廓较为耗时的分割方法,设计一种新型深度学习分割网络:DEC-U-Net,该模型设计依据U-Net架构,在U-Net下采样阶段使用深度超参数化卷积代替2D卷积并且联合ECA(Efficient Channel Attention)注意力机制,在不过多引入参数量的同时提高对胎盘细节特征识别的准确度。将交叉注意力机制引入跳跃链接,解决胎盘边界模糊、对比度不均等问题。与普通U-Net网络相比,本文算法分别在交并比(IoU)、召回率(Recall)、精确度(Precision)、Dice系数上提升4.14、9.59、6.2、16.41个百分点。实验结果表明,改进后的网络模型具有较好的分割效果,能够将超声图像中的胎盘进行精确分割。 展开更多
关键词 胎儿超声图像 胎盘检测 do-conv ECA注意力 MHCA
在线阅读 下载PDF
基于改进LadderNet的视网膜血管分割应用 被引量:1
8
作者 吴亚兰 蒋传健 《信息技术与信息化》 2024年第4期118-121,共4页
视网膜血管的分割有助于辅助医学工作者对眼部或全身性疾病进行诊断和治疗。为进一步提升视网膜血管的分割精度,改进LadderNet架构应用于视网膜血管分割。首先结合DO-Conv,提出改进的池化卷积块替换LadderNet中的池化卷积层,保留强上下... 视网膜血管的分割有助于辅助医学工作者对眼部或全身性疾病进行诊断和治疗。为进一步提升视网膜血管的分割精度,改进LadderNet架构应用于视网膜血管分割。首先结合DO-Conv,提出改进的池化卷积块替换LadderNet中的池化卷积层,保留强上下文特征;其次引入不平衡注意力模块应用在改进LadderNet网络末端,处理血管和背景,以及粗血管和细小血管之间的类不平衡问题。所提的方法在数据集DRIVE上实验得到AUC、SE、SP评价指标值分别为0.9564、0.7863和0.9802。实验结果表明,改进LadderNet对提升视网膜血管分割精度有一定的作用。 展开更多
关键词 视网膜眼底图像 血管分割 LadderNet do-conv 不平衡注意力模块
在线阅读 下载PDF
GMTS: GNN-based multi-scale transformer siamese network for remote sensing building change detection
9
作者 Xinyang Song Zhen Hua Jinjiang Li 《International Journal of Digital Earth》 SCIE EI 2023年第1期1685-1706,共22页
With the remarkable success of change detection(CD)in remote sensing images in the context of deep learning,many convolutional neural network(CNN)based methods have been proposed.In the current research,to obtain a be... With the remarkable success of change detection(CD)in remote sensing images in the context of deep learning,many convolutional neural network(CNN)based methods have been proposed.In the current research,to obtain a better context modeling method for remote sensing images and to capture more spatiotemporal characteristics,several attention-based methods and transformer(TR)-based methods have been proposed.Recent research has also continued to innovate on TR-based methods,and many new methods have been proposed.Most of them require a huge number of calculation to achieve good results.Therefore,using the TR-based mehtod while maintaining the overhead low is a problem to be solved.Here,we propose a GNN-based multi-scale transformer siamese network for remote sensing image change detection(GMTS)that maintains a low network overhead while effectively modeling context in the spatiotemporal domain.We also design a novel hybrid backbone to extract features.Compared with the current CNN backbone,our backbone network has a lower overhead and achieves better results.Further,we use high/low frequency(HiLo)attention to extract more detailed local features and the multi-scale pooling pyramid transformer(MPPT)module to focus on more global features respectively.Finally,we leverage the context modeling capabilities of TR in the spatiotemporal domain to optimize the extracted features.We have a relatively low number of parameters compared to that required by current TR-based methods and achieve a good effect improvement,which provides a good balance between efficiency and performance. 展开更多
关键词 Remote sensing(RS) change detection(CD) depthwise over-parameterized convolutional(do-conv) attention mechanism transformer graph convolution
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部