期刊文献+
共找到1,037篇文章
< 1 2 52 >
每页显示 20 50 100
Explosive Field Visualization Based on Image Fusion
1
作者 张文耀 蒋凌霜 《Journal of Beijing Institute of Technology》 EI CAS 2009年第2期136-140,共5页
The advantages and disadvantages of two existing methods for explosive field visualization are analyzed in this paper. And a new method based on image fusion is proposed to integrate their complementary advantages. Wi... The advantages and disadvantages of two existing methods for explosive field visualization are analyzed in this paper. And a new method based on image fusion is proposed to integrate their complementary advantages. With the method, two source images built by equal mapping and modulus mapping are individually decomposed into two Gauss-Laplacian pyramid sequences. Then, the two individual sequences are used to make a composite one according to the process of fusion. Finally, a new image is reconstructed from the composite sequence. Experimental results show that the new images integrate the advantages of sources, effectively improve the visualization, and disclose more information about explosive field. 展开更多
关键词 explosive field visualIZATION image fusion pyramid transform
在线阅读 下载PDF
基于时空交互网络的人体行为检测方法研究 被引量:1
2
作者 田青 张浩然 +2 位作者 楚柏青 张正 豆飞 《计算机应用与软件》 北大核心 2025年第4期156-165,共10页
针对现有的人体行为检测方法中,存在特征融合能力较差、时序信息相关性不强和行为边界不明确等问题,提出一种基于时空交互网络的人体行为检测方法。重新设计了双流特征提取模块,在空间流和时空流两个网络之间添加连接层;分别在空间流和... 针对现有的人体行为检测方法中,存在特征融合能力较差、时序信息相关性不强和行为边界不明确等问题,提出一种基于时空交互网络的人体行为检测方法。重新设计了双流特征提取模块,在空间流和时空流两个网络之间添加连接层;分别在空间流和时间流网络中引入改进的空间变换网络和视觉注意力模型;设计基于像素筛选器的特征融合模块,用于重点区域时序信息相关性的计算和两类不同维度特征的聚合;对网络的损失函数进行了优化。在AVA数据集上的实验结果表明该方法在检测精度、速度以及泛化能力上具有优越性。 展开更多
关键词 时空交互网络 人体行为检测 视觉注意力 特征融合 损失函数
在线阅读 下载PDF
照度条件自适应的粒度渐进多模态图像融合方法 被引量:1
3
作者 王传云 孙冬冬 +3 位作者 周明奇 王田 高骞 李照奎 《工程科学学报》 北大核心 2025年第6期1257-1271,共15页
为应对光照条件复杂多变下的多场景视觉感知挑战,本文提出了一种照度条件自适应的粒度渐进多模态图像融合方法.首先,设计了基于大模型的场景信息嵌入模块,通过预训练的图像编码器对输入的可见光图像进行场景建模,并利用不同的线性层对... 为应对光照条件复杂多变下的多场景视觉感知挑战,本文提出了一种照度条件自适应的粒度渐进多模态图像融合方法.首先,设计了基于大模型的场景信息嵌入模块,通过预训练的图像编码器对输入的可见光图像进行场景建模,并利用不同的线性层对场景向量进行处理.随后,利用处理后的场景向量对图像重建阶段的图像特征在通道维度上进行调控,使得融合模型能够根据不同的场景光照生成不同风格的融合图像.其次,为了解决现有特征提取模块在特征表达上的不足,本文设计了基于状态空间方程的特征提取模块,以线性复杂度实现全局特征感知,减少了信息传输过程中的信息丢失,提升了融合图像的视觉效果.最后,设计了粒度渐进融合模块,利用状态空间方程对多模态特征进行全局聚合,并引入跨模态坐标注意力机制对聚合后的特征进行精细调优,从而实现多模态特征从全局到局部的多阶段融合,增强了网络的信息整合能力.在训练过程中,本文采用先验知识生成增强图像作为标签,并根据不同环境构建同源与异构的损失函数,以实现场景自适应的多模态图像融合.实验结果显示,本文方法在暗光场景数据集MSRS和LLVIP、混合光照数据集TNO、连续场景数据集RoadScene以及雾霾场景数据集M3FD上的表现均优于11种先进算法,在定量和定性对比中取得了更好的视觉效果和更高的定量指标.所提出的方法在自动驾驶、军事侦察和环境监控等任务中展现出较大的潜力. 展开更多
关键词 视觉感知优化 图像融合 多模态 场景自适应 状态空间模型 跨模态注意力机制
在线阅读 下载PDF
基于特征融合和增强的蚕茧图像分类模型
4
作者 刘莫尘 侯欣 +6 位作者 韦伟 张鑫山 李法德 宋占华 张桂征 梁光健 闫银发 《蚕业科学》 北大核心 2025年第1期59-67,共9页
为对原料茧中的上车茧和下茧进行准确分类,实现蚕茧分拣智能化、机械化,文中提出了一种基于多尺度特征融合和增强的双线性池化分类模型。首先以ResNet41作为特征提取骨干网络构建双线性池化模型,增强网络特征提取能力的同时得到不同维... 为对原料茧中的上车茧和下茧进行准确分类,实现蚕茧分拣智能化、机械化,文中提出了一种基于多尺度特征融合和增强的双线性池化分类模型。首先以ResNet41作为特征提取骨干网络构建双线性池化模型,增强网络特征提取能力的同时得到不同维度语义信息;然后引入自适应空间特征融合模块,融合蚕茧浅层图像信息和深层语义信息,解决ResNet41在特征提取过程中出现的信息丢失问题;最后采用挤压和激发模块抑制冗余信息,降低分类偏差。改进模型B-Res41-ASE在测试集中的分类准确率和F 1值分别为93.7%和94.9%,对上车茧的分类精确率为97.8%,对黄斑茧、柴印茧、烂茧、瘪茧、薄皮茧等下茧的分类精确率分别为96.4%、93.7%、98.6%、94.5%、93.1%,相比于改进前模型和常用的细粒度分类模型均有明显优势,且B-Res41-ASE对蚕茧的可判别区域的聚焦更精准。实验结果表明,文中提出的优化方法在分类准确率、鲁棒性等方面优于其他蚕茧分类模型,可为蚕茧智能分拣提供理论依据。 展开更多
关键词 蚕茧分类 双线性池化 自适应空间特征融合 可视化分析
原文传递
自动驾驶环境下车道级雷视融合SLAM
5
作者 马庆禄 蹇秋伟 +1 位作者 李美强 邹政 《汽车工程》 北大核心 2025年第6期1155-1168,共14页
为提升自动驾驶车辆在多车道行驶与作业时的道路环境感知能力,提出了自动驾驶环境下车道级雷视融合方法 LLV-SLAM(lane-level LiDAR-visual fusion SLAM),并构建了适用于雷视融合的实时定位与建图算法(simultaneous localization and ma... 为提升自动驾驶车辆在多车道行驶与作业时的道路环境感知能力,提出了自动驾驶环境下车道级雷视融合方法 LLV-SLAM(lane-level LiDAR-visual fusion SLAM),并构建了适用于雷视融合的实时定位与建图算法(simultaneous localization and mapping,SLAM)。首先,在视觉特征点提取的基础上引入直方图均衡化,并利用激光雷达获取特征点深度信息,通过视觉特征跟踪以提升SLAM系统鲁棒性。其次,利用视觉关键帧信息对激光点云进行运动畸变校正,并将LeGO-LOAM(lightweight and groud-optimized lidar odometry and mapping)融入视觉ORBSLAM2(oriented FAST and rotated BRIEF SLAM2)以增强闭环检测与矫正性能,降低系统累计误差。最后,将视觉图像所获取的位姿进行坐标转换作为激光里程计的位姿初值,辅助激光雷达SLAM进行三维场景重建。实验结果表明:相比于传统的SLAM方法,融合后的LLV-SLAM方法平均定位时延减少了41.61%;在x、y、z方向上的平均定位误差分别减少了34.63%、38.16%、24.09%;在滚转角、俯仰角、偏航角方向上的平均旋转误差减少了40.8%、37.52%、39.5%。LLV-SLAM算法有效抑制了LeGO-LOAM算法的尺度漂移,实时性和鲁棒性有显著提升,能够满足自动驾驶车辆对多车道道路环境的感知需要。 展开更多
关键词 自动驾驶 同步定位与建图 雷视融合 车道级定位
在线阅读 下载PDF
基于距离误差模型的焊接机器人双目视觉融合目标定位方法研究
6
作者 钟利军 甘荣飞 《传感技术学报》 北大核心 2025年第9期1655-1660,共6页
为了提高焊接机器人对焊缝目标的定位精度,提出一种基于距离误差模型的焊接机器人双目视觉融合目标定位方法。基于双目视觉系统左右相机采集的图像,提取目标图像感兴趣区域。利用二值矩阵去除噪点;通过最小二乘法补全焊缝信息,提取焊缝... 为了提高焊接机器人对焊缝目标的定位精度,提出一种基于距离误差模型的焊接机器人双目视觉融合目标定位方法。基于双目视觉系统左右相机采集的图像,提取目标图像感兴趣区域。利用二值矩阵去除噪点;通过最小二乘法补全焊缝信息,提取焊缝直线特征。通过双目视觉融合的方式将焊缝划分为多个直焊缝,通过直线拟合极线得到各个焊点的坐标位置。建立焊接机器人距离误差模型,对测距误差展开补偿,确定焊缝的最终位置。实验结果表明,所提方法应用后,目标定位结果和实际焊点之间距离较近,距离误差补偿后的均方根误差平均值为0.18446,定位目标耗时在60 ms以下,可以准确定位焊缝位置,同时耗时更短。 展开更多
关键词 视觉传感定位 双目视觉融合定位 距离误差模型 焊接机器人
在线阅读 下载PDF
成品油管道运行多参数时空模式提取与可视化
7
作者 纪连恩 邢智博 +1 位作者 吴昆 赵伟 《计算机辅助设计与图形学学报》 北大核心 2025年第8期1453-1464,共12页
成品油管道运行过程不仅具有典型的时空特点,且其运行模式需要由多个监测参数综合表征.针对现有的时空模式分析方法难以揭示多参数的综合时空特征的问题,提出一种基于多参数融合的张量分解方法用于成品油管道运行多参数时空模式的提取.... 成品油管道运行过程不仅具有典型的时空特点,且其运行模式需要由多个监测参数综合表征.针对现有的时空模式分析方法难以揭示多参数的综合时空特征的问题,提出一种基于多参数融合的张量分解方法用于成品油管道运行多参数时空模式的提取.首先根据不同分析角度,通过对管道运行的多维监测参数进行信息量及相关性分析实现分组融合;然后将融合后的时空数据建模为张量,使用张量分解及聚类的方法获取数据集的多维时空模式;最后对不同模式下原始多参数变化趋势的对比分析,进一步发现运行模式的时空规律.基于所提方法设计了一套可视化系统MPVis,以支持用户从不同分析角度对多参数表征的综合时空模式进行提取及可视化.通过真实成品油管道数据的案例结果表明,该方法为后续成品油管道数据分析提供了一种新思路. 展开更多
关键词 时空模式可视化 参数融合 成品油管道 张量分解
在线阅读 下载PDF
复杂光照环境下的视觉惯性定位方法 被引量:1
8
作者 程向红 钟志伟 +2 位作者 刘丰宇 吴建峰 吴昕怡 《中国惯性技术学报》 北大核心 2025年第3期229-238,共10页
光流法假设条件严格,对光照条件、载体机动敏感。为了提高光流法特征跟踪和匹配的稳定性,提高视觉惯性定位精度,提出了一种基于精细预积分和自适应特征权重的视觉惯性定位方法。首先,在传统预积分模型的基础上,考虑惯性元件的比例因子... 光流法假设条件严格,对光照条件、载体机动敏感。为了提高光流法特征跟踪和匹配的稳定性,提高视觉惯性定位精度,提出了一种基于精细预积分和自适应特征权重的视觉惯性定位方法。首先,在传统预积分模型的基础上,考虑惯性元件的比例因子和非正交误差,通过精细预积分得到关键帧之间的位姿变化量;其次,用其辅助光流金字塔的跟踪迭代,减少匹配搜索时间并减少特征点误匹配概率。最后,基于特征匹配置信度的差异,利用所设计的特征权重在滑窗内自适应地融合多传感器信息。实验结果表明:在EuRoC数据集中,所提方法能够有效剔除特征错误匹配;在实际实验中,相较于R-VIO、MSCKF和VINS-Mono算法,所提方法的绝对轨迹均方根误差分别平均减小了68.39%、59.06%和29.89%,证明其在各种环境下均具有较强的鲁棒性。 展开更多
关键词 视觉/惯性 光流跟踪 自适应权重 传感器融合
在线阅读 下载PDF
行星探测特征信息提取与知识挖掘关键技术及应用研究
9
作者 凌宗成 李勃 +10 位作者 魏广飞 郭弟均 吕英波 刘长卿 朱凯 陈剑 赵强 李静 胡国平 王娇 刘建忠 《数据与计算发展前沿(中英文)》 2025年第4期3-19,共17页
【目的】本文针对行星探测数据的深度挖掘和智能提取的迫切需求,基于国内外行星探测获取的海量遥感数据,开展了行星探测特征信息提取与知识挖掘的关键技术及其应用研究。【方法】突破了多源、异构的行星数据的重构融合和可视化技术,克... 【目的】本文针对行星探测数据的深度挖掘和智能提取的迫切需求,基于国内外行星探测获取的海量遥感数据,开展了行星探测特征信息提取与知识挖掘的关键技术及其应用研究。【方法】突破了多源、异构的行星数据的重构融合和可视化技术,克服了单一传感器成像信息不足的问题,可生成具有丰富空间和光谱信息的高质量遥感图像。建立了基于可见近红外光谱探测数据的物质成分反演模型,可提取月球及火星矿物光谱特征参量并反演月表元素、矿物的含量与分布。开发了融合多源数据的月壤厚度反演与次表层结构反演算法,利用微波和雷达数据获取月壤厚度及其物理性质,可对次表层结构和地层信息进行分析。利用月球和火星的影像及高程数据,实现了表面多尺度地形因子计算和基于深度学习的典型形貌特征自动提取、绝对模式年龄计算和地质要素制图功能。【结果】在此基础上,实现形貌要素、物质成分信息、次表层结构的集成平台展示和互操作分析,研制了具有自主知识产权的行星数据分析挖掘软件工具。该工具将在国家空间科学数据中心公开部署,并在山东大学威海行星数据系统(PDS)实验室镜像发布,以支撑行星数据制图和地质演化等相关研究。 展开更多
关键词 行星探测数据 知识挖掘 物质成分 次表层结构 形貌要素 可视化 重构融合
在线阅读 下载PDF
跨模态自适应特征融合的视觉问答方法
10
作者 陈巧红 项深祥 +1 位作者 方贤 孙麒 《哈尔滨工业大学学报》 北大核心 2025年第4期94-104,共11页
为提高视觉问答(VQA)中跨模态融合与交互的精确度,减少多模态特征信息的丢失,提出了一种新颖的基于跨模态自适应特征融合的视觉问答方法。首先,该方法设计了卷积自注意力单元,包含自注意力层和空洞卷积层,前者用于捕捉全局特征信息,后... 为提高视觉问答(VQA)中跨模态融合与交互的精确度,减少多模态特征信息的丢失,提出了一种新颖的基于跨模态自适应特征融合的视觉问答方法。首先,该方法设计了卷积自注意力单元,包含自注意力层和空洞卷积层,前者用于捕捉全局特征信息,后者用于捕捉视觉对象间的空间关系。其次,通过自适应特征融合层,将全局关系与空间关系进行有效结合,使模型在处理图像特征时能够同时考虑全局关系和视觉对象之间的关联性,从而克服了传统注意力机制忽视空间关系的问题。最后,基于不同模态特征在答案预测中贡献程度的差异,该方法还构建了多模态门控融合模块,根据多模态特征间的重要程度自适应地融合特征,减少多模态信息的丢失,同时不会带来额外的计算资源开销。研究结果表明,该方法在未使用额外数据集预训练的情况下,在VQA2.0的测试-开发集、测试-标准集和GQA数据集上的整体准确率分别达到71.58%、72.00%、58.14%,显著优于传统自注意力方法,该研究成果可为跨模态特征融合领域提供了重要的参考和借鉴。 展开更多
关键词 视觉问答(VQA) 特征融合 多模态 注意力机制 门控机制
在线阅读 下载PDF
低信噪比下多级特征深度融合的视听语音增强
11
作者 张天骐 沈夕文 +1 位作者 唐娟 谭霜 《通信学报》 北大核心 2025年第5期133-144,共12页
为解决视听语音增强中特征提取受限、模态间的特征融合度低等问题,提出一种在低信噪比下的多级特征深度融合的视听语音增强方法。该方法采用视、听编码网络-视听融合网络-听觉解码网络的结构,在听觉编码网络中设计一种多路协作单元(MCU)... 为解决视听语音增强中特征提取受限、模态间的特征融合度低等问题,提出一种在低信噪比下的多级特征深度融合的视听语音增强方法。该方法采用视、听编码网络-视听融合网络-听觉解码网络的结构,在听觉编码网络中设计一种多路协作单元(MCU);在每层的视觉和听觉编码网络间设计一种视听注意力融合模块(AVAFM);在视听融合网络中设计一种融合加权模块(FWB),将每级输出进行特征优化、动态加权得到更具判别性的特征。最终在TMSV、LGRID视听数据集上的多种低信噪比的实验结果表明,LGRID视听数据集下的平均PESQ、STOI分别提升52.30%~74.06%、46.74%~67.15%,且相比纯音频语音增强,在-5dB、-2dB、1dB低信噪比下的平均PESQ和STOI分别提升38.95%和33.92%,表现出所提网络的高降噪性能和添加视觉信息的有效性。 展开更多
关键词 视听语音增强 低信噪比 多级特征融合 融合加权 视听注意力
在线阅读 下载PDF
基于视觉属性的多模态可解释图像分类方法 被引量:3
12
作者 王辉 黄宇廷 +3 位作者 夏玉婷 范自柱 罗国亮 杨辉 《自动化学报》 北大核心 2025年第2期445-456,共12页
基于深度神经网络(Deep neutral networks,DNN)的分类方法因缺乏可解释性,导致在金融、医疗、法律等关键领域难以获得完全信任,极大限制了其应用.现有多数研究主要关注单模态数据的可解释性,多模态数据的可解释性方面仍存在挑战.为解决... 基于深度神经网络(Deep neutral networks,DNN)的分类方法因缺乏可解释性,导致在金融、医疗、法律等关键领域难以获得完全信任,极大限制了其应用.现有多数研究主要关注单模态数据的可解释性,多模态数据的可解释性方面仍存在挑战.为解决这一问题,提出一种基于视觉属性的多模态可解释图像分类方法,该方法将可见光和深度图等不同视觉模态提取的属性融入模型的训练过程,不仅能通过视觉属性和决策树对已有的神经网络黑盒模型进行解释,而且能在训练过程中进一步提升模型解释信息的能力.引入可解释性通常会造成模型精度的降低,该方法在保持模型具有良好可解释性的同时,仍具有较高的分类精度,在NYUDv2、SUN RGB-D和RGB-NIR三个数据集上,相比于单模态可解释方法,该模型准确率明显提升,并达到与多模态不可解释模型相媲美的性能. 展开更多
关键词 可解释性 视觉属性 多模态融合 决策树 图像分类
在线阅读 下载PDF
面向聚变堆冷却管可视化的管道中心线提取方法研究与应用
13
作者 罗月童 董子秋 +1 位作者 彭俊 赵东晟 《计算机科学》 北大核心 2025年第S2期450-454,共5页
冷却管是遍布聚变反应堆的重要部件,其对聚变堆的核安全有重要影响,研究冷却管的可视化对改进聚变核安全有重要意义。因为冷却管呈线性分布,所以基于管道中心线进行可视化是常用方法,但从复杂冷却管的面片模型中提取中心线非常繁琐。针... 冷却管是遍布聚变反应堆的重要部件,其对聚变堆的核安全有重要影响,研究冷却管的可视化对改进聚变核安全有重要意义。因为冷却管呈线性分布,所以基于管道中心线进行可视化是常用方法,但从复杂冷却管的面片模型中提取中心线非常繁琐。针对这个问题,提出了一种解决方法,首先使用平均曲率流算法提取中心线附近的离散点,然后设计了一种优化方法,基于管道段是圆柱或圆环及管道段之间的连接关系这个先验知识,从离散点构建准确的中心线段,包括中心线段的类型、方程及中心线段之间的连接关系。使用国际热核聚变实验堆(International Thermonuclear Experimental Reactor,ITER)的冷却管验证所提方法的有效性,实验结果表明,所提取管道中心线符合要求,能有效支持后续可视化任务,证明了所提方法是有效的。 展开更多
关键词 聚变堆 冷却管道 可视化 中心线提取 优化调整
在线阅读 下载PDF
图像与激光测距融合的遥感卫星大型天线形变测量方法 被引量:1
14
作者 朱子仪 孙鹏 +3 位作者 董明利 燕必希 王君 王磊 《红外与激光工程》 北大核心 2025年第5期254-262,共9页
针对卫星天线在轨展开后的形变自主测量需求,提出了一种相机、激光测距仪融合的卫星面板形变高精度测量方法。首先,建立了相机与扫描式激光测距仪融合测量的数学模型,由一台相机、一个二维转台和一个激光测距仪组成。其次,提出一种基于B... 针对卫星天线在轨展开后的形变自主测量需求,提出了一种相机、激光测距仪融合的卫星面板形变高精度测量方法。首先,建立了相机与扫描式激光测距仪融合测量的数学模型,由一台相机、一个二维转台和一个激光测距仪组成。其次,提出一种基于BSLO-d(Blood-Sucking Leech Optimizer-distance)仿生优化的激光测距仪高精度指向方法,利用BSLO优化算法对旋转角度进行全局寻优,实现激光光轴指向的初步自主瞄准。最终,设计一种相机与扫描式激光测距融合的三维坐标解算方法,利用测距信息和像面坐标信息,以及相机外参数、标定得到的激光出射点和激光光轴方向向量,解算目标点的三维坐标。通过实测实验可知,指向方法中水平转角和竖直转角的均方根误差(RMSE)分别为0.435 mrad和0.787 mrad,三维坐标测量误差分别为0.948 mm、0.268 mm和0.127 mm。文中所提出的BSLO-d指向角度解算模型和融合测量模型,实现通过非正交二维转台带动激光测距仪进行视觉引导自主瞄准,并通过测距信息和像面坐标解算目标点的三维坐标。在指向角度解算和三维坐标测量方面速度较快具有较高的精度,且系统结构紧凑、易于搭建和标定。因此,该方法为卫星天线在轨高精度型面测量提供了一种新的解决方案。 展开更多
关键词 视觉与激光融合测量 摄影测量 激光测距 三维点测量
原文传递
基于多模态视听融合的Transformer语音识别算法研究 被引量:2
15
作者 赵小芬 彭朋 《传感器与微系统》 北大核心 2025年第2期48-52,共5页
针对单模态语音识别在复杂环境中易受噪音、口音、语速等因素干扰的局限性,本研究提出一种基于多模态视听融合的Transformer语音识别算法。通过综合音频和视频两种模态信息,并引入不同模态间的动态权重分配机制,有效解决了模态间信息分... 针对单模态语音识别在复杂环境中易受噪音、口音、语速等因素干扰的局限性,本研究提出一种基于多模态视听融合的Transformer语音识别算法。通过综合音频和视频两种模态信息,并引入不同模态间的动态权重分配机制,有效解决了模态间信息分布不均的问题。通过将原始音频和视觉信号转换为Transformer模型可处理的特征表示,并结合编码器和解码器结构实现语音到文本的精确转换,利用多头自注意力机制捕捉序列间的内在相关性。实验结果表明,本算法在字错误率上降低了6%~22%,显著提升了语音识别率,验证了算法的有效性和优越性。 展开更多
关键词 多模态 视听融合 语音识别 TRANSFORMER 动态权重分配机制
在线阅读 下载PDF
基于CiteSpace的人工智能在阿尔茨海默病研究中的应用可视化分析
16
作者 赖胜圣 张刚平 +1 位作者 刘文平 陈灿洋 《现代信息科技》 2025年第9期136-145,150,共11页
该研究通过文献计量分析,探讨人工智能在阿尔茨海默病研究中的发展趋势和应用热点。基于Web of Science核心数据库,检索了2013—2023年间的3 680篇相关文献,利用CiteSpace软件进行共现分析与关键词聚类,分析了发文趋势、国家和机构的合... 该研究通过文献计量分析,探讨人工智能在阿尔茨海默病研究中的发展趋势和应用热点。基于Web of Science核心数据库,检索了2013—2023年间的3 680篇相关文献,利用CiteSpace软件进行共现分析与关键词聚类,分析了发文趋势、国家和机构的合作情况、核心作者及共被引文献等。研究结果表明,人工智能在阿尔茨海默病领域的应用主要集中在影像数据分析与早期诊断、多模态数据融合以及脑网络功能连接三个方向。同时,任务分析和迁移学习作为新兴热点,显示了人工智能在个体化诊断和长期病情管理中的潜力。从结果分析可知,人工智能在阿尔茨海默病诊断与治疗中的应用正处于快速发展阶段,未来研究将聚焦于算法的泛化能力提升和多模态数据处理能力,以提供更加精准的诊断和个体化治疗方案。 展开更多
关键词 阿尔茨海默病 可视化分析 多模态数据融合 神经网络 机器学习
在线阅读 下载PDF
基于双传感器差分机制的铁磁性金属板件亚表面腐蚀缺陷脉冲涡流可视化检测 被引量:3
17
作者 王瑾 李勇 +4 位作者 苏冰洁 高文龙 向异 刘正帅 陈振茂 《中国机械工程》 北大核心 2025年第3期381-390,共10页
针对铁磁性金属板件亚表面腐蚀缺陷,提出了一种基于双传感器差分机制的脉冲涡流可视化检测方法。该方法利用双传感器差分探头拾取脉冲涡流检测信号,提取检测信号下降沿对数曲线斜率和归一化差分信号峰值作为信号特征,用于对不同尺寸缺... 针对铁磁性金属板件亚表面腐蚀缺陷,提出了一种基于双传感器差分机制的脉冲涡流可视化检测方法。该方法利用双传感器差分探头拾取脉冲涡流检测信号,提取检测信号下降沿对数曲线斜率和归一化差分信号峰值作为信号特征,用于对不同尺寸缺陷进行可视化检测。通过仿真及实验研究,建立了所提信号特征与缺陷尺寸间的关联规律,并验证了双传感器差分探头相较于传统单传感器探头在降低噪声干扰和提高检测灵敏度方面具有优势。此外,提出了对两种信号特征进行融合的方法,结果表明,使用融合信号特征的缺陷图像信噪比更高。所提方法为铁磁性金属板件亚表面腐蚀缺陷的可视化检测提供了一种有效且可靠的解决方案。 展开更多
关键词 电磁无损检测 脉冲涡流检测 亚表面腐蚀缺陷 信号特征融合 可视化检测
在线阅读 下载PDF
基于多语义关联与融合的视觉问答模型
18
作者 周浩 王超 +1 位作者 崔国恒 罗廷金 《计算机应用》 北大核心 2025年第3期739-745,共7页
弥合视觉图像和文本问题之间的语义差异是提高视觉问答(VQA)模型推理准确性的重要方法之一。然而现有的相关模型大多数基于低层图像特征的提取并利用注意力机制推理问题的答案,忽略了高层图像语义特征如关系和属性特征等在视觉推理中的... 弥合视觉图像和文本问题之间的语义差异是提高视觉问答(VQA)模型推理准确性的重要方法之一。然而现有的相关模型大多数基于低层图像特征的提取并利用注意力机制推理问题的答案,忽略了高层图像语义特征如关系和属性特征等在视觉推理中的作用。为解决上述问题,提出一种基于多语义关联与融合的VQA模型以建立问题与图像之间的语义联系。首先,基于场景图生成框架提取图像中的多种语义并把它们进行特征精炼后作为VQA模型的特征输入,从而充分挖掘图像场景中的信息;其次,为提高图像特征的语义价值,设计一个信息过滤器过滤图像特征中的噪声和冗余信息;最后,设计多层注意力融合和推理模块将多种图像语义分别与问题特征进行语义融合,以强化视觉图像重点区域与文本问题之间的语义关联。与BAN(Bilinear Attention Network)和CFR(Coarse-to-Fine Reasoning)模型的对比实验结果表明,所提模型在VQA2.0测试集上的准确率分别提高了2.9和0.4个百分点,在GQA测试集上的准确率分别提高了17.2和0.3个百分点。这表明所提模型能够更好地理解图像场景中的语义并回答组合式视觉问题。 展开更多
关键词 多语义特征融合 视觉问答 场景图 属性注意力 关系注意力
在线阅读 下载PDF
心电形态与节律特征融合的轻量房颤检测模型及可解释性研究 被引量:1
19
作者 高宁 李玉榕 +2 位作者 陈泓 陈文升 贾梓豪 《电子学报》 北大核心 2025年第2期503-513,共11页
房颤是一种常见的心律失常,通常与中风、心力衰竭等心血管疾病相关.近年来,虽然有许多研究者使用深度学习方法在房颤检测上取得了重大进展,但所提出的方法大都需要大量的计算资源,并且由于深度学习模型的黑盒效应,模型的检测结果较难以... 房颤是一种常见的心律失常,通常与中风、心力衰竭等心血管疾病相关.近年来,虽然有许多研究者使用深度学习方法在房颤检测上取得了重大进展,但所提出的方法大都需要大量的计算资源,并且由于深度学习模型的黑盒效应,模型的检测结果较难以在临床上推广应用.为此,本文提出一种基于特征融合的轻量房颤检测模型并对其开展可解释性研究,模型由ECG(ElectroCardioGram)主干网络和RRI(R-R Interval)支路组成.ECG主干网络使用深度可分离卷积以及少量的标准卷积来提取心电信号的深层形态特征,RRI支路使用多尺度卷积提取RRI的深层节律特征,网络通过融合二者来学习全面鲁棒的特征表示,实现准确的房颤检测.进一步,基于Grad-CAM++来可视化不同特征对于分类结果的贡献实现模型的可解释性分析.本文在长期房颤数据库LTAFDB进行训练与数据集内部测试,准确率达到了97.99%.为了验证模型的泛化性能,利用MIT-BIH心房颤动数据库AFDB与中国生理信号挑战赛数据库CPSC2021开展跨数据集的外部测试,分别取得了95.17%和93.81%的准确率.实验结果表明,本文提出的方法具有轻量级特性,稳定性和准确性良好,同时可解释性深度学习的引入使得本文所提出的方法在房颤的临床诊断中具有更加广阔的应用前景. 展开更多
关键词 心电信号 房颤 轻量级神经网络 可视化技术 特征融合
在线阅读 下载PDF
视听融合耦合坐标自注意的单目深度估计
20
作者 马存良 蒲江川 +2 位作者 许春冬 易见兵 嘉明珍 《计算机辅助设计与图形学学报》 北大核心 2025年第2期265-276,共12页
针对单目图片和声音回波信号都含空间信息这一特点,提出一种视听融合的单目深度估计方法.首先,通过池化金字塔模块融合分析回波与材料特征来自适应估计单目图片的离散深度值;然后,采用卷积神经网络和Transformer相结合的方法对单目图片... 针对单目图片和声音回波信号都含空间信息这一特点,提出一种视听融合的单目深度估计方法.首先,通过池化金字塔模块融合分析回波与材料特征来自适应估计单目图片的离散深度值;然后,采用卷积神经网络和Transformer相结合的方法对单目图片进行编码,改进坐标注意力提出坐标自注意力模块对图片特征解码获得离散深度值的概率分布;最后,将像素点的深度值建模为离散深度值的期望来构建最终深度图.实验结果表明,在仿真数据集Replica和Matterport3D数据集上,所提方法的均方根误差分别为0.204和0.875,相对误差分别为0.095和0.161,均取得具有竞争力的结果;在真实数据和含噪声数据中,该方法能够应用于真实场景的深度估计. 展开更多
关键词 单目深度估计 视听融合 池化金字塔模块 自注意力
在线阅读 下载PDF
上一页 1 2 52 下一页 到第
使用帮助 返回顶部