期刊文献+
共找到80篇文章
< 1 2 4 >
每页显示 20 50 100
IDSSCNN-XgBoost:Improved Dual-Stream Shallow Convolutional Neural Network Based on Extreme Gradient Boosting Algorithm for Micro Expression Recognition
1
作者 Adnan Ahmad Zhao Li +1 位作者 Irfan Tariq Zhengran He 《Computers, Materials & Continua》 SCIE EI 2025年第1期729-749,共21页
Micro-expressions(ME)recognition is a complex task that requires advanced techniques to extract informative features fromfacial expressions.Numerous deep neural networks(DNNs)with convolutional structures have been pr... Micro-expressions(ME)recognition is a complex task that requires advanced techniques to extract informative features fromfacial expressions.Numerous deep neural networks(DNNs)with convolutional structures have been proposed.However,unlike DNNs,shallow convolutional neural networks often outperform deeper models in mitigating overfitting,particularly with small datasets.Still,many of these methods rely on a single feature for recognition,resulting in an insufficient ability to extract highly effective features.To address this limitation,in this paper,an Improved Dual-stream Shallow Convolutional Neural Network based on an Extreme Gradient Boosting Algorithm(IDSSCNN-XgBoost)is introduced for ME Recognition.The proposed method utilizes a dual-stream architecture where motion vectors(temporal features)are extracted using Optical Flow TV-L1 and amplify subtle changes(spatial features)via EulerianVideoMagnification(EVM).These features are processed by IDSSCNN,with an attention mechanism applied to refine the extracted effective features.The outputs are then fused,concatenated,and classified using the XgBoost algorithm.This comprehensive approach significantly improves recognition accuracy by leveraging the strengths of both temporal and spatial information,supported by the robust classification power of XgBoost.The proposed method is evaluated on three publicly available ME databases named Chinese Academy of Sciences Micro-expression Database(CASMEII),Spontaneous Micro-Expression Database(SMICHS),and Spontaneous Actions and Micro-Movements(SAMM).Experimental results indicate that the proposed model can achieve outstanding results compared to recent models.The accuracy results are 79.01%,69.22%,and 68.99%on CASMEII,SMIC-HS,and SAMM,and the F1-score are 75.47%,68.91%,and 63.84%,respectively.The proposed method has the advantage of operational efficiency and less computational time. 展开更多
关键词 ME recognition dual stream shallow convolutional neural network euler video magnification TV-L1 XgBoost
在线阅读 下载PDF
结合对比学习和双流网络融合知识图谱摘要模型 被引量:3
2
作者 赵霞 王钊 《计算机应用研究》 北大核心 2025年第3期720-727,共8页
提出了一种融合对比学习与双流网络的新型知识图谱摘要模型(KGDR-CLSUM),旨在解决现有模型在生成摘要时存在的事实性错误和信息提取不足的问题。该模型通过设计双流网络同时处理文本特征和知识图谱特征,并采用对比学习来强化这两类特征... 提出了一种融合对比学习与双流网络的新型知识图谱摘要模型(KGDR-CLSUM),旨在解决现有模型在生成摘要时存在的事实性错误和信息提取不足的问题。该模型通过设计双流网络同时处理文本特征和知识图谱特征,并采用对比学习来强化这两类特征的有效融合。此外,引入动量蒸馏策略以降低知识图谱中的数据噪声,从而提升摘要生成的质量和准确性。在CNN/Daily Mail数据集上,KGDR-CLSUM相较于基线模型PEGASUS BASE,在ROUGE-1、ROUGE-2和ROUGE-L指标上分别提升了3.03%、3.42%和2.56%,在XSum数据集上更是达到了7.54%、8.78%和8.51%的显著提升。此外,人工评分显著高于ChatGPT,进一步证明了该模型的优越性能。结果表明,KGDR-CLSUM在生成摘要时,尤其在短文本生成任务中,能够有效降低错误信息,并显著提高摘要的质量。 展开更多
关键词 文本摘要 知识图谱 动量蒸馏 对比学习 双流网络
在线阅读 下载PDF
基于改进TCNN算法的脑电动态连续情绪识别研究
3
作者 揭丽琳 刘勇 +3 位作者 王铭勋 邹杨萌 徐亦璐 鲁宇明 《电子学报》 北大核心 2025年第4期1347-1360,共14页
在现实生活中,人类情绪具有动态和多样化的特征,受外部环境、社交互动以及个体内在状态的共同影响.针对脑电情绪识别研究通常局限于实验室的静态场景,未能充分考虑情绪的动态连续性的问题,本文提出了一种基于改进TCNN算法的脑电动态连... 在现实生活中,人类情绪具有动态和多样化的特征,受外部环境、社交互动以及个体内在状态的共同影响.针对脑电情绪识别研究通常局限于实验室的静态场景,未能充分考虑情绪的动态连续性的问题,本文提出了一种基于改进TCNN算法的脑电动态连续情绪识别方法 .首先,设计了适用于动态情境的脑电数据采集范式,使用64通道的脑电设备收集24名受试者在经历开心至平静、平静至开心、平静至悲伤、悲伤至平静、平静至紧张和紧张至平静六种动态连续情绪转变时的脑电信号,并进行了动态连续情绪标签的标注.其次,对现有的TCNN算法进行了改进,构建了一种双流网络模型进行动态连续情绪识别.该模型通过短期流利用时序卷积模块捕捉局部时间序列特征,而长期流则通过Transformer模块捕捉全局时间序列特征.最后,对提取的脑电特征进行特征层融合,以获得更加精准的动态连续情绪识别结果.结果表明:在采集的动态连续情绪数据集上,本文方法在六种情绪的valence和arousal上分别取得了最小误差均值0.083和0.084;在DEAP数据集上,valence和arousal的误差分别低至0.108和0.113.与四种传统机器学习算法以及GRU、CGRU、CNN、CNN-LSTM、CNN-Bi-LSTM、TCNN等六种深度学习模型相比,本文方法表现出了更高的识别精度和稳定性,能够有效满足应用场景的需求. 展开更多
关键词 脑电信号 情绪识别 特征提取 特征融合 双流网络模型
在线阅读 下载PDF
SiamMT:基于自适应特征融合机制的可修正RGBT目标跟踪算法
4
作者 齐咏生 姜政廷 +2 位作者 刘利强 苏建强 张丽杰 《控制与决策》 北大核心 2025年第4期1312-1320,共9页
针对传统RGBT目标跟踪算法网络精确度低、鲁棒性差,以及在目标尺度变化大和长时跟踪过程中存在目标丢失无法找回等问题,提出一种新的基于自适应特征融合机制的可修正RGBT目标跟踪算法.首先,引入一种特征层与模态间双自适应融合机制,充... 针对传统RGBT目标跟踪算法网络精确度低、鲁棒性差,以及在目标尺度变化大和长时跟踪过程中存在目标丢失无法找回等问题,提出一种新的基于自适应特征融合机制的可修正RGBT目标跟踪算法.首先,引入一种特征层与模态间双自适应融合机制,充分利用两模态间的互补信息,增强RGB与红外特征的跨模态融合;然后,设计一种后端时序约束回归模块,利用上一帧信息对IOU计算以及边界框回归进行约束,有效减少相似物干扰;最后,提出一种基于元学习的在线模板更新机制,对回归阶段得分较高的模板图像进行更新存储,解决长时跟踪中累计误差和目标难以找回问题.采用权威的目标跟踪数据集GTOT、RGBT234和VOT-RGBT2019进行算法验证,所提出方法均可取得极具竞争力的结果.将算法移植到嵌入式设备Jetson Xavier NX上进行性能测试,实验结果表明:所提出算法运行速度可达到29帧/s,相比于当前流行的多种RGBT算法,具有更为全面的跟踪性能,且能够有效解决相似物干扰、目标丢失难找回等问题. 展开更多
关键词 目标跟踪 孪生网络 RGBT 元学习 特征融合
原文传递
用于红外-可见光图像分类的跨模态双流交替交互网络
5
作者 郑宗生 杜嘉 +3 位作者 成雨荷 赵泽骋 张月维 王绪龙 《计算机应用》 北大核心 2025年第1期275-283,共9页
多特征模态融合时存在噪声的叠加,而为减小模态间的差异采用的级联方式的结构也未充分利用模态间的特征信息,因此设计一种跨模态双流交替交互网络(DAINet)方法。首先,构建双流交替增强(DAE)模块,以交互双分支形式融合模态特征,并通过学... 多特征模态融合时存在噪声的叠加,而为减小模态间的差异采用的级联方式的结构也未充分利用模态间的特征信息,因此设计一种跨模态双流交替交互网络(DAINet)方法。首先,构建双流交替增强(DAE)模块,以交互双分支形式融合模态特征,并通过学习模态数据的映射关系,以红外-可见光-红外(IR-VIS-IR)和可见光-红外-可见光(VIS-IR-VIS)的双向反馈调节实现模态间噪声的交叉抑制;然后,构建跨模态特征交互(CMFI)模块,并引入残差结构将红外-可见光模态内以及模态间的低层特征和高层特征进行有效融合,从而减小模态间的差异并充分利用模态间的特征信息;最后,在自建红外-可见光多模态台风数据集及RGB-NIR多模态公开场景数据集上进行实验,以验证DAE模块和CMFI模块的有效性。实验结果表明,与简单级联融合方法相比,所提的基于DAINet的特征融合方法在自建台风数据集上的红外模态和可见光模态上的总体分类精度分别提高了6.61和3.93个百分点,G-mean值分别提高了6.24和2.48个百分点,表明所提方法在类别不均衡分类任务上的通用性;所提方法在RGB-NIR数据集上的2种测试模态下的总体分类精度分别提高了13.47和13.90个百分点。同时,所提方法在2个数据集上分别与IFCNN(general Image Fusion framework based on Convolutional Neural Network)和DenseFuse方法进行对比的实验结果表明,所提方法在自建台风数据集上的2种测试模态下的总体分类精度分别提高了9.82、6.02和17.38、1.68个百分点。 展开更多
关键词 跨模态 深度学习 图像分类 特征学习 双流网络
在线阅读 下载PDF
WiFi信号可视化与双流网络融合的手势识别
6
作者 丁昊 袁江琳 +2 位作者 石鸿凌 龚晓龙 孙美静 《无线电工程》 2025年第5期959-965,共7页
手势动作根据信号波动范围可分为对应于人机交互中的基础大尺度动作与富含复杂语义信息的精细小尺度动作。现有WiFi手势识别系统在面对这些不同尺度的动作时,依赖多个独立的网络模型,需多对收发器按照严格限制的位置进行布设。基于WiFi... 手势动作根据信号波动范围可分为对应于人机交互中的基础大尺度动作与富含复杂语义信息的精细小尺度动作。现有WiFi手势识别系统在面对这些不同尺度的动作时,依赖多个独立的网络模型,需多对收发器按照严格限制的位置进行布设。基于WiFi信号可视化技术和双流网络的系统,通过引入跨模态交互模块(Cross-modal Interaction Module, CIM)和谱特征转移(Spectral Feature Transformation, SFT)模块,展现出了对收发设备位置和手势动作尺度的自适应能力,成功应用于单发单收场景。在公开数据集Widar3上进行的实验表明,系统在同样的实验场景下识别准确率高于其他方法。在单发单收场景下,对同时包含大尺度与精细小尺度手势动作的数据集,当WiFi收发器位置固定时,系统平均识别准确率达到94.85%;在收发器位置不固定的情况下,平均识别准确率仍能达到91.26%。 展开更多
关键词 WiFi信号可视化 双流网络 手势识别 跨模态交互 谱特征转移
在线阅读 下载PDF
基于WOA-VMD和PSO-DSN的短期时空光伏功率预测
7
作者 赵英男 彭真 阮玉园 《计算机系统应用》 2025年第8期264-275,共12页
由于太阳能具有间歇性、不稳定性和随机性,精确的短期光伏(photovoltaic,PV)功率预测具有较大的挑战,阻碍了光伏与智能电网的有机整合.为此,本文提出了一种名为WVPD(WOA-VMD和PSO-DSN)的方法.首先,应用变分模态分解(variational mode de... 由于太阳能具有间歇性、不稳定性和随机性,精确的短期光伏(photovoltaic,PV)功率预测具有较大的挑战,阻碍了光伏与智能电网的有机整合.为此,本文提出了一种名为WVPD(WOA-VMD和PSO-DSN)的方法.首先,应用变分模态分解(variational mode decomposition,VMD)获得多个本征模态函数(intrinsic mode function,IMF)分量.同时,结合鲸鱼优化算法(whale optimization algorithm,WOA)算法进行模式分量和惩罚因子参数优化,解决VMD分解不足和模式混合问题.然后,利用PV功率和数值天气预报(numerical weather prediction,NWP)数据的空间和时间相关性构建新型双流网络(dual-stream network,DSN),即结合挤压和激励网络(squeeze-andexcitation networks,SENet)以及双向门控循环单元(bidirectional gated recurrent unit,BiGRU).同时,采用粒子群优化算法(particle swarm optimization,PSO)优化DSN中学习率和批量大小.最后,验证得出与深度学习混合模型相比,MSE平均提升78.6%,RMSE平均提升53.7%,MAE平均提升37.7%,所提出的WVPD性能优越.代码共享于https://github.com/ruanyuyuan/PV-power-forecast. 展开更多
关键词 光伏功率预测 变分模态分解 双流网络 鲸鱼优化算法 粒子群优化
在线阅读 下载PDF
基于双流金字塔增强的DSCN模型在校园网络安全中的优化研究
8
作者 张友海 程小东 《湖州师范学院学报》 2025年第8期59-67,共9页
针对校园网络安全入侵检测中存在的复杂网络流量模式识别困难和实时响应能力不足的问题,提出一种基于双流金字塔增强策略的深度可分离卷积网络(DSCN)模型,以优化校园网络安全入侵检测与响应系统。该模型通过双流结构融合低分辨率与高分... 针对校园网络安全入侵检测中存在的复杂网络流量模式识别困难和实时响应能力不足的问题,提出一种基于双流金字塔增强策略的深度可分离卷积网络(DSCN)模型,以优化校园网络安全入侵检测与响应系统。该模型通过双流结构融合低分辨率与高分辨率路径的多尺度信息,显著提升其对复杂网络流量模式的识别能力,同时深度可分离卷积(DSC)通过分解卷积操作,有效降低模型的计算复杂度,进而提升系统的实时响应能力。将该模型在KDD Cup 1999、CICIDS 2017、CICIDS 2021和UNSW-NB15数据集上进行验证,结果表明,该模型在入侵检测率、误报率、响应时间等多项指标上表现优异,为校园网络安全防护提供了一种高效的技术解决方案。 展开更多
关键词 校园网络安全 入侵检测 深度可分离卷积网络 双流金字塔增强策略
在线阅读 下载PDF
基于脑电频谱时空特征的认知负荷评估 被引量:1
9
作者 王雨佳 鞠翔宇 +1 位作者 于扬 李明 《控制理论与应用》 北大核心 2025年第1期50-58,共9页
准确的认知负荷评估对于增强人机协调能力、提升人机共融系统效率具有重要意义.目前常用的基于脑电信号的认知负荷评估技术中,在提取和利用频谱信息的时间和空间关系等方面普遍缺少有效手段.本文针对脑电频谱图空间分辨率低的特点,引入... 准确的认知负荷评估对于增强人机协调能力、提升人机共融系统效率具有重要意义.目前常用的基于脑电信号的认知负荷评估技术中,在提取和利用频谱信息的时间和空间关系等方面普遍缺少有效手段.本文针对脑电频谱图空间分辨率低的特点,引入胶囊网络有效表征不同导联之间的相对空间关系;针对脑电频谱图随时间波动的特点,设计了由长短期记忆网络等组成的时间特征学习支路,最终通过时空特征融合构建了一种新的认知负荷评估算法.基于公开数据集的测试结果表明,本文所提算法的四分类正确率达到99.27%(被试内)和95.16%(跨被试),在现有算法中性能最优.消融实验表明,算法的时、空特征提取模块可分别对脑电频谱图的时空特征进行有效表征,所提出的双路网络结构能有效完成时空特征的高效融合. 展开更多
关键词 认知负荷评估 脑电频谱图 时空特征 时空双路神经网络
在线阅读 下载PDF
基于多细粒度双流网络的行人重识别
10
作者 宋晓勇 孙学宏 +3 位作者 刘丽萍 覃国车 余彤 李享国 《电子测量与仪器学报》 北大核心 2025年第8期250-257,共8页
在实际监控场景中行人重识别任务面临诸多挑战,如部分图像遮挡(树木、人、汽车、小物体等)导致识别过程中关键信息丢失和识别精度下降。在遮挡行人重识别任务中,通常采用局部联合全局特征或姿态估计器的方法来解决识别精度低等问题,虽... 在实际监控场景中行人重识别任务面临诸多挑战,如部分图像遮挡(树木、人、汽车、小物体等)导致识别过程中关键信息丢失和识别精度下降。在遮挡行人重识别任务中,通常采用局部联合全局特征或姿态估计器的方法来解决识别精度低等问题,虽然在部分遮挡情况下利用单流网络有较好的识别性能,但在处理过程中未能充分挖掘剩余关键特征信息。为此,提出了一种基于多细粒度双流网络的遮挡行人重识别方法,通过设计多细粒度局部特征提取策略、双流特征处理网络和特征权重融合模块来增强关键特征信息提取能力。该方法采用视觉Transformer(ViT)提取全局特征,并将其划分为多组局部特征。随后,各组局部特征分别经过双流特征处理网络,将通过双流网络的特征进行特征权重融合,从而更有效地挖掘关键特征信息。在Occluded-Duke、Market-1501、DukeMTMC-reID和MSMT17数据集上实验结果证明所提方法的有效性与合理性,平均精度均值(mAP)/Rank-1指标分别达到了61.3%/68.3、89.0%/95.2%、82.5%/91.1%和66.8%/84.5%。 展开更多
关键词 遮挡行人重识别 多细粒度特征提取 双流网络 特征融合
原文传递
面向校园场景视频监控的人体行为识别方法 被引量:1
11
作者 米家辉 李鸿天 袁家政 《传感器与微系统》 北大核心 2025年第5期138-141,共4页
校园内的异常行为检测目的是识别与正常校园行为模式不符的行为或事件,有助于提升校园安全管理水平。针对此类问题,本文提出了一种融合注意力机制的双流网络模型用于识别校园场景下的人体行为。模型以Inception v1网络作为基准模型,并... 校园内的异常行为检测目的是识别与正常校园行为模式不符的行为或事件,有助于提升校园安全管理水平。针对此类问题,本文提出了一种融合注意力机制的双流网络模型用于识别校园场景下的人体行为。模型以Inception v1网络作为基准模型,并在残差模块中融合注意力机制。模型在Kinetics-400数据集上进行预训练,而后在校园场景数据集上进行训练和实验。实验对比了添加注意力机制模块的位置和数量差异对实验结果的影响。实验结果表明,本文模型能够有效检测出监控视频中的行为类别,所提出的方法准确率可达91.7%,较基准模型提升了4.5%。 展开更多
关键词 深度学习 注意力机制 双流网络 校园场景
在线阅读 下载PDF
基于双流时空融合网络的无人车路径规划优化方法
12
作者 胡季雨 陈奇 《智能物联技术》 2025年第4期73-77,共5页
为了提升无人车在动态复杂环境中的路径规划能力,构建基于分层强化学习的双流时空融合网络,研究多模态输入的高维特征建模与动态适应机制。结合时空概率场与可变形注意力模块,实现对障碍物行为的不确定性建模与滚动优化控制。结果表明,... 为了提升无人车在动态复杂环境中的路径规划能力,构建基于分层强化学习的双流时空融合网络,研究多模态输入的高维特征建模与动态适应机制。结合时空概率场与可变形注意力模块,实现对障碍物行为的不确定性建模与滚动优化控制。结果表明,所提方法在仿真环境中具有较低的轨迹偏差、碰撞概率及规划延迟,具有良好的安全性与实时性。 展开更多
关键词 深度学习 路径规划 双流网络 注意力机制
在线阅读 下载PDF
基于双流自适应特征融合的多模态烟草文档分类
13
作者 孙首名 张琦 +2 位作者 王喆 苏娜 沈奇 《绿洲农业科学与工程》 2025年第1期160-163,共4页
针对烟草文档自动化分类的需求,提出一种基于双流自适应特征融合的多模态烟草文档分类网络,名为DSAFFNet。该网络结合烟草文档的文本模态和图像模态,采用DSAFF(Dual-StreamAdaptiveFeatureFusion)模块对不同模态特征的重要性自适应调整... 针对烟草文档自动化分类的需求,提出一种基于双流自适应特征融合的多模态烟草文档分类网络,名为DSAFFNet。该网络结合烟草文档的文本模态和图像模态,采用DSAFF(Dual-StreamAdaptiveFeatureFusion)模块对不同模态特征的重要性自适应调整权重,实现灵活而精确的多模态融合。试验结果表明,所提网络在烟草文档数据集上的表现优于以往分类方法。 展开更多
关键词 烟草文档分类 多模态学习 双流网络
在线阅读 下载PDF
融合递进式域适应和交叉注意力的事故检测方法
14
作者 张奇 周威 +1 位作者 胡伟超 于鹏程 《计算机工程与应用》 北大核心 2025年第6期349-360,共12页
道路交通事故是导致财产损失、人员伤亡和交通拥堵的主要原因之一。快速准确地检测事故对于提高应急救援速度和降低人员伤亡率至关重要。近年来,基于视觉的事故检测方法成为主流,且随深度学习技术的应用取得了显著进展。然而,现有方法... 道路交通事故是导致财产损失、人员伤亡和交通拥堵的主要原因之一。快速准确地检测事故对于提高应急救援速度和降低人员伤亡率至关重要。近年来,基于视觉的事故检测方法成为主流,且随深度学习技术的应用取得了显著进展。然而,现有方法应用于国内监控场景时存在精度不高的问题,主要原因是用于模型训练的开源数据与国内监控事故视频数据间存在较大的域偏移。为了避免重新构建并标注一个大型国内监控事故数据集的繁琐性,提出了一种域适应双流网络,充分利用现有开源事故数据集实现面向国内监控场景的道路事故检测。具体地提出了一种“由粗到细”递进式域适应方法,指导模型以捕捉域不变事故外观特征。构建交叉注意力融合网络实现外观特征和运动特征的关联与交互,缓解因场景差异导致的特征偏差问题。实验结果表明,所提方法在国内监控场景下取得了较高的检测性能,验证了其有效性和可靠性。有望为提升人民生命安全和交通效率提供了重要的技术支持。 展开更多
关键词 智能交通 计算机视觉 事故检测 域适应双流网络
在线阅读 下载PDF
基于全色-多光谱双流卷积网络的端到端地物分类方法
15
作者 李英龙 邓毓弸 +3 位作者 孔赟珑 陈静波 孟瑜 刘帝佑 《自然资源遥感》 北大核心 2025年第5期152-161,共10页
多光谱(multispectral,MS)影像和全色(panchromatic,PAN)影像是可见-近红外光学遥感影像的主要数据源。在典型的地物分类处理流程中,通常采用像素级融合方法来提高MS影像的空间分辨率,然后再进行影像分类。然而,像素级融合过程通常耗时... 多光谱(multispectral,MS)影像和全色(panchromatic,PAN)影像是可见-近红外光学遥感影像的主要数据源。在典型的地物分类处理流程中,通常采用像素级融合方法来提高MS影像的空间分辨率,然后再进行影像分类。然而,像素级融合过程通常耗时较长且和地物分类的优化目标不匹配,已无法满足端到端遥感影像分类的需求。为了应对这些挑战,文章提出一种无需进行像素级融合的双流全卷积神经网络DSEUNet。该方法基于EfficientNet-B3网络构建2个分支,分别提取PAN影像和MS影像的特征并进行特征级融合,最后解码输出分类结果。考虑到PAN影像和MS影像表达地物要素的特征侧重点不同,文章在全色分支加入空间注意力机制以提高对细节、边缘等空间信息的感知能力,在多光谱分支加入通道注意力机制以提高对多波段反射率差异的感知能力。10 m地表覆盖数据集生产实验和网络结构消融实验表明,该文提出的网络具有更高的分类精度和更快的推理速度,在保持骨干网络相同的前提下,DSEUNet与传统对像素级融合影像分类的方法相比,分类精度的mIoU提升1.62百分点,mFscore提升1.36百分点,Kappa系数提升1.49百分点,推理速度提升17.69%。 展开更多
关键词 地物分类 深度学习 双流网络 全色影像 多光谱影像
在线阅读 下载PDF
基于双流网络融合的三维人体网格重建
16
作者 于冰 程广 +1 位作者 黄东晋 丁友东 《图学学报》 北大核心 2025年第3期625-634,共10页
三维人体网格重建在计算机视觉、动画制作和虚拟现实等领域具有重要的应用价值。然而,目前大多数方法主要聚焦于单幅图像的三维人体重建,如何从视频数据中准确、平滑地重建三维人体动作仍然是一个难题。为此,提出了一种双流网络融合结构... 三维人体网格重建在计算机视觉、动画制作和虚拟现实等领域具有重要的应用价值。然而,目前大多数方法主要聚焦于单幅图像的三维人体重建,如何从视频数据中准确、平滑地重建三维人体动作仍然是一个难题。为此,提出了一种双流网络融合结构,以三维人体姿态为中介,在视频数据中实现三维人体网格重建。首先,利用三维姿态估计流网络对输入视频进行三维关节点估计,获得精确的关节信息;其次,通过时序特征聚合流网络提取视频的时序图像特征,捕获人体运动位置信息和时序姿态特征信息;最后,设计融合解码器,将三维关节点、时序图像特征与SMPL模板提供的网格结构进行回归,预测三维网格顶点坐标。实验结果表明,该方法相对于MPS-Net方法具有更好的预测精度,在3DPW数据集上比MPS-Net的平均关节位置误差(MPJPE)低了9.3%;在MPI-INF-3DHP数据集上比MPS-Net的MPJPE低了9.2%,同时重建结果在视觉效果上更为合理,展现出更高的准确性和平滑性。 展开更多
关键词 三维人体重建 SMPL模型 注意力机制 双流网络结构 时空信息关联
在线阅读 下载PDF
基于残差多尺度融合的双流深度网络红外步态识别
17
作者 张云佐 杨月辉 +2 位作者 董旭 康伟丽 白晶 《北京航空航天大学学报》 北大核心 2025年第11期3688-3697,共10页
针对卷积神经网络在低质量红外图像的步态识别中不能充分捕捉和利用时空信息的问题,提出了一种基于剪影差分融合流和剪影流的残差多尺度融合的双流深度网络模型。在模型输入端采用Faster R-CNN和Deeplab v3+算法相结合的细粒度人体剪影... 针对卷积神经网络在低质量红外图像的步态识别中不能充分捕捉和利用时空信息的问题,提出了一种基于剪影差分融合流和剪影流的残差多尺度融合的双流深度网络模型。在模型输入端采用Faster R-CNN和Deeplab v3+算法相结合的细粒度人体剪影分割策略来提取剪影,以减少噪点信息的影响,避免特征丢失;在模型上支流网络中引入步态剪影差分融合模块来获取相邻剪影帧之间的差异变化信息;在模型的特征提取部分使用残差单元和多尺度特征提取融合技术分别加深网络层次和提取不同粒度的时空信息;通过多尺度金字塔映射模块进一步增强模型对局部和全局特征的表征能力。由CASIA-C数据集上的4组不同行走条件对比实验数据可知,所提方法的平均步态识别率为98.85%,优于当前主流方法。 展开更多
关键词 红外步态识别 细粒度剪影 剪影差分融合图 残差多尺度特征融合 双流网络 金字塔映射
原文传递
基于影像学特征与临床数据的乳腺癌胸大肌筋膜转移预测模型
18
作者 王旭禛 范逸怡 +2 位作者 周敏 赵灿 蒋丽萍 《中国医学物理学杂志》 2025年第8期1036-1041,共6页
目的:为提升预测乳腺癌胸大肌筋膜转移的准确性,构建一种结合临床数据与影像学特征的创新CNNTransformer双流并行网络架构,并通过遗传算法筛选出最优特征子集,以优化模型性能。方法:该架构并行处理临床记录和影像数据,包括分辨率、对比... 目的:为提升预测乳腺癌胸大肌筋膜转移的准确性,构建一种结合临床数据与影像学特征的创新CNNTransformer双流并行网络架构,并通过遗传算法筛选出最优特征子集,以优化模型性能。方法:该架构并行处理临床记录和影像数据,包括分辨率、对比度、灰度分布、纹理特征等物理特征,捕捉其潜在关联。同时,使用遗传算法去除冗余特征,保留对胸大肌筋膜转移预测最相关的物理和临床特征。结果:融合影像与临床特征的CNN-Transformer模型在加权F1分数、AUCROC等评估指标上均表现优异,优于单独使用影像或临床数据的模型。结论:本文提出的双流并行网络架构与特征选择策略显著提升了预测乳腺癌胸大肌筋膜转移的准确性,并证明影像特征在提高模型性能中的重要性。 展开更多
关键词 乳腺癌 胸大肌筋膜转移 物理特征 双流并行网络
暂未订购
基于双流卷积神经网络的人脸欺诈检测
19
作者 李晓洁 张青云 +1 位作者 李佳 束鑫 《计算机与数字工程》 2025年第6期1740-1745,共6页
针对传统方法通常基于手工提取特征或单一特征进行真假人脸区分导致的跨数据集通用性不高的问题,论文提出了一种基于双流卷积神经网络的人脸欺诈检测方法。网络的一个分支将输入的RGB图像转为灰度图,经多尺度Retinex方法处理后传送到改... 针对传统方法通常基于手工提取特征或单一特征进行真假人脸区分导致的跨数据集通用性不高的问题,论文提出了一种基于双流卷积神经网络的人脸欺诈检测方法。网络的一个分支将输入的RGB图像转为灰度图,经多尺度Retinex方法处理后传送到改进的MobileNet以提取光照特征。另一个分支将RGB图像直接馈送到改进的MobileNet中以提取人脸特征。最后,融合两个分支提取的特征,用于判断输入人脸图像的真实性。实验表明,该方法较于现有方法在通用性方面有很大提高。 展开更多
关键词 人脸欺诈检测 双流卷积神经网络 MSR 改进的MobileNet
在线阅读 下载PDF
基于双流卷积神经网络的手势动作识别方法
20
作者 刘琳 单彩云 《微型电脑应用》 2025年第8期240-243,共4页
由于手势动作相似度较高,无法准确捕捉教师或学生的手势动作。为了有效提高课堂教学质量,提出基于双流卷积神经网络的手势动作识别方法。结合灰度化处理方法与直方图均衡化处理方法对课堂监控视频内的单帧图像展开预处理,构建双流卷积... 由于手势动作相似度较高,无法准确捕捉教师或学生的手势动作。为了有效提高课堂教学质量,提出基于双流卷积神经网络的手势动作识别方法。结合灰度化处理方法与直方图均衡化处理方法对课堂监控视频内的单帧图像展开预处理,构建双流卷积神经网络,利用空间域神经网络提取视频影像信息内的静态手势特征。采用TV-L1算法将原始视频图像转化为堆叠光流图,进而得到课堂监控视频中的动态手势特征。将2个网络提取到的手势特征传输至Softmax分类器中进行特征映射,实现课堂手势动作的分类识别。实验结果表明,所提方法建立的双流卷积神经网络具备较强的学习能力,手势动作识别准确率较高。 展开更多
关键词 双流卷积神经网络 手势动作识别 灰度化处理 TV-L1算法 Softmax分类器
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部