期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于改进ConvMixer和动态焦点损失的视听情感识别 被引量:6
1
作者 师硕 覃嘉俊 +1 位作者 于洋 郝小可 《电子学报》 EI CAS CSCD 北大核心 2024年第8期2824-2835,共12页
视听双模态情感识别是情感计算领域的研究热点.目前情感识别方法存在无法同时提取视频局部和全局特征,多模态数据融合简单,损失函数在模型优化中无法关注错分样本等问题,导致情感识别结果精确度不高.本文提出一种基于改进的ConvMixer和... 视听双模态情感识别是情感计算领域的研究热点.目前情感识别方法存在无法同时提取视频局部和全局特征,多模态数据融合简单,损失函数在模型优化中无法关注错分样本等问题,导致情感识别结果精确度不高.本文提出一种基于改进的ConvMixer和动态权重焦点损失函数的视听情感识别方法.采用空间和时间邻接矩阵代替ConvMixer中的深度分离卷积,提取视频时域空域上的全局和局部特征.提出跨模态时间注意力模块,以对称结构捕捉模态间的时间相关性,提高特征融合效果.结合混淆矩阵计算具有动态权重的焦点损失函数,差异化地加大错分样本在损失中的占比,优化模型参数.在公开数据集上的实验结果表明,本文方法能提取到代表性特征,可有效优化网络结构,提高了情感识别的准确率. 展开更多
关键词 情感识别 convmixer 注意力机制 多模态特征融合 焦点损失函数
在线阅读 下载PDF
一种基于ConvMixer骨干的显著性目标检测模型
2
作者 张斯博 朱敬华 +1 位作者 奚赫然 杜欣月 《黑龙江大学工程学报(中英俄文)》 2024年第1期48-57,共10页
显著性目标检测(Saliency Object Detection,SOD)算法多采用基于卷积神经网络(Convolutional Neural Network,CNN)的骨干网络提取特征,然而CNN无法获取图像的长范围特征依赖。视觉转换器(Vision Transformer,ViT)将图像划分为图块(patc... 显著性目标检测(Saliency Object Detection,SOD)算法多采用基于卷积神经网络(Convolutional Neural Network,CNN)的骨干网络提取特征,然而CNN无法获取图像的长范围特征依赖。视觉转换器(Vision Transformer,ViT)将图像划分为图块(patch),通过Transformer在patch之间传播全局上下文信息获得长范围特征依赖,但Transformer的自注意力层具有二次方的时间复杂性。因此,提出一种低复杂性的基于patch的SOD算法CM-PoolNet,对经典的显著性目标检测PoolNet模型的骨干网络进行改进,使用卷积模型ConvMixer替换VGG和RestNet,提出新的特征融合方法。基于U型结构,编码器对输入图像进行Patch Embedding,送入重复堆叠的由深度可分离卷积和膨胀卷积构成的ConvMixer特征提取器中。为解码器设计了基于patch的特征融合模块。设计了BCE、SSIM和IOU 3种损失,引导模型在像素级、图块级、特征图级3级层次中学习输入图像和真值图像之间的转换。在DUTS数据集和ECSSD数据集上进行实验,结果表明:提出的模型能够有效地分割突出的目标区域,并且准确预测具有清晰边界的精细结构。 展开更多
关键词 显著性目标检测 补丁嵌入 混合损失函数 PoolNet convmixer
在线阅读 下载PDF
基于ConvMixer架构的高效点云分类方法
3
作者 王淳 赵艳明 冯燕 《中国传媒大学学报(自然科学版)》 2024年第1期56-64,共9页
近年来,视觉Transformer模型在点云分类等三维计算机视觉任务中显现出潜在的优越性,但其有效性来源仍然模糊不清。研究它们在视觉任务中的性能是完全归功于Transformer结构本身的优越性,还是至少部分得益于使用局部块作为输入表示,是非... 近年来,视觉Transformer模型在点云分类等三维计算机视觉任务中显现出潜在的优越性,但其有效性来源仍然模糊不清。研究它们在视觉任务中的性能是完全归功于Transformer结构本身的优越性,还是至少部分得益于使用局部块作为输入表示,是非常必要的。受此启发,本文提出了一种简单但仍然有效的点云分类和分割模型PointConvMixer,用ConvMixer架构取代了Point-BERT中的标准Transformer。PointConvMixer在ModelNet40数据集上的整体分类准确率达到92.3%,在ShapeNet Parts数据集上进行点云部分分割时mIOUI和mIOUC分别为85.4%和83.9%,均优于基于Transformer的对比模型。此外,本文还进一步提出PPFConvMixer,其利用高效的局部特征描述符PPF增强了PointConvMixer,从而优化了点云分类性能。在查询半径为0.25m时,PPFConvMixer的总体分类准确率达到了93.8%。 展开更多
关键词 三维点云分类 深度学习 convmixer Point Pair Feature
在线阅读 下载PDF
基于改进YOLOv7-tiny的无人机航拍图像小目标检测算法 被引量:4
4
作者 张光华 李聪发 +1 位作者 李钢硬 卢为党 《工程科学与技术》 北大核心 2025年第3期235-246,共12页
无人机航拍图像目标检测是无人机应用的一项重要技术,针对无人机航拍图像中目标尺度变化大、小尺寸目标分布密集、背景复杂而导致的漏检和误检问题,本文提出一种基于YOLOv7-tiny带ConvMixer检测头的无人机航拍图像小目标检测算法。首先... 无人机航拍图像目标检测是无人机应用的一项重要技术,针对无人机航拍图像中目标尺度变化大、小尺寸目标分布密集、背景复杂而导致的漏检和误检问题,本文提出一种基于YOLOv7-tiny带ConvMixer检测头的无人机航拍图像小目标检测算法。首先,将激活函数LeakyReLU替换为SiLU,弥补LeakyReLU缺少的非线性表达,提升模型训练时的收敛速度与模型泛化能力;其次,为了增强对多尺度目标的特征提取能力,额外设计了小目标检测层,并衍生出一个微小目标检测头,增大了模型感受野,更好地解决目标尺度剧烈变化带来的大尺度方差问题,提升了小目标的检测能力;此外,在预测头部分集成ConvMixer层,ConvMixer中的深度卷积和逐点卷积有助于找到传递给预测头的特征信息中的空间和通道关系,提升对微小目标的处理能力;最后,将YOLOv7-tiny的耦合检测头替换为更高效的解耦头,对定位与分类任务解耦出单独的特征通道,增强对目标的分类和定位能力。为了全面验证每个改进点的有效性,本文从两个方向设计了消融实验,并对比分析了改进算法与其他算法的检测性能。实验结果表明,本文算法在Visdrone2021数据集上平均精度均值(mAP)达到40.9%,较基线算法提升了3.7%,模型内存为28.2 MB,检测速度达到35.8帧/s,改进算法综合性能与对比的主流先进算法相比更优。通过检测效果分析可知,本文算法在无人机航拍图像检测上的误检和漏检问题得到较大改善。综上,本文算法的准确性和实时性能胜任航拍图像小目标检测任务。 展开更多
关键词 无人机航拍图像 小目标检测 SiLU convmixer 更高效的解耦头
在线阅读 下载PDF
改进YOLOv5的水面小目标检测算法
5
作者 甘浪雄 王梦颖 +1 位作者 韩延胜 冯辉 《武汉理工大学学报(交通科学与工程版)》 2025年第2期448-454,共7页
本文提出了一种改进YOLOv5的水面小目标检测算法.在网络结构上对浅层特征进行融合,新增一个检测头用于微小目标的检测.利用ConvMixer的结构特性,设计C3_CML模块用于取代原主干网络和颈部网络中特定位置的C3模块,通过增强图像特征信息空... 本文提出了一种改进YOLOv5的水面小目标检测算法.在网络结构上对浅层特征进行融合,新增一个检测头用于微小目标的检测.利用ConvMixer的结构特性,设计C3_CML模块用于取代原主干网络和颈部网络中特定位置的C3模块,通过增强图像特征信息空间通道位置关系的提取能力,从而提升对有效目标区域的关注,同时降低模型复杂度.设计了新的损失函数,综合使用IOU(intersection over union)和NWD(normalized wasserstein distance)作为新的边界框损失评价指标,降低对小目标位置偏差的敏感性,显著提高小目标的检测性能.结果表明:相比原始YOLOv5算法,改进后的算法有效减少了水面密集小目标和极小目标的漏检率,同时检测精度得到了显著提高. 展开更多
关键词 水面小目标检测 YOLOv5 convmixer NWD
在线阅读 下载PDF
基于改进YOLOv7模型的地铁隧道衬砌表观病害检测方法 被引量:2
6
作者 陈霆 雷洋 +1 位作者 白堂博 许贵阳 《铁道建筑》 北大核心 2024年第3期94-99,共6页
针对地铁隧道内部光线昏暗,诸多附属设备与衬砌表观病害纹理及灰度近似,病害检测精度低的问题,提出了一种基于改进YOLOv7(You Only Look Once v7)的地铁隧道衬砌表观病害与附属设施的检测方法。在原YOLOv7模型的骨干部分引入混合卷积模... 针对地铁隧道内部光线昏暗,诸多附属设备与衬砌表观病害纹理及灰度近似,病害检测精度低的问题,提出了一种基于改进YOLOv7(You Only Look Once v7)的地铁隧道衬砌表观病害与附属设施的检测方法。在原YOLOv7模型的骨干部分引入混合卷积模块(Mixed Convolutional Module,ConvMixer)并增加了微小物体检测头,降低网络复杂度并提高对微小病害的敏感度;在原YOLOv7模型的颈部将路径聚合网络(Path Aggregation Network,PANet)替换为双向特征金字塔网络(Bidirectional Feature Pyramid Network,BiFPN),用于捕获全局特征信息,在隧道复杂环境下精确定位;在最大池化卷积(MaxPooling Convolution,MPC)模块中引入无参注意力机制(Simple Parameter Free Attention Mechanism,SimAM),给检测目标的特征矢量赋予三维权重,以增加检测精度。检测结果表明,本文提出的改进模型的检测准确率和召回率分别达到89.1%、87.8%,且权重文件大小仅为59.6 MB,检测速率为89帧/s。该模型在保证较高检测精度的同时降低了权重文件大小,提高了检测速率,适用于隧道巡检系统。 展开更多
关键词 铁路隧道 检测精度 深度学习 衬砌病害 YOLOv7 convmixer BiFPN SimAM
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部