期刊文献+
共找到670篇文章
< 1 2 34 >
每页显示 20 50 100
无人机引导下多消防机器人协同作业
1
作者 华长春 穆殿瑞 +1 位作者 陈健楠 魏饶 《自动化学报》 北大核心 2026年第2期267-283,共17页
复杂火灾场景下传统消防手段存在全局感知能力不足、协同能力弱等问题,因此提出一种基于无人机空中引导的多消防机器人协同作业系统.通过构建空-地异构协同架构,融合无人机全局态势感知与地面消防机器人精准作业能力,实现火灾动态环境... 复杂火灾场景下传统消防手段存在全局感知能力不足、协同能力弱等问题,因此提出一种基于无人机空中引导的多消防机器人协同作业系统.通过构建空-地异构协同架构,融合无人机全局态势感知与地面消防机器人精准作业能力,实现火灾动态环境下的高效协同灭火.通过融合先验地图、高空侦察信息和多视角观测信息,构建适用于灭火指控的多图层火场地图,在保障关键信息获取的同时兼顾建图效率.同时结合水柱轨迹模型、多视角观测信息及结构层数据,实现水柱轨迹和落点的准确检测.然后设计队列式与多形态主从编队模式,配合快速队形重构算法生成编队参考信号.进而,基于提出的柔性预定性能函数设计无人机位姿矢量控制器,以及基于改进视距导引法设计多消防机器人编队控制器.最后,开展空-地多机协同控制算法的仿真验证,并将系统集成到开诚RXB-MC80BD消防机器人上进行应用测试. 展开更多
关键词 多图层火场建图 柔性预定性能控制 无人机位姿矢量控制 消防机器人多模态编队
在线阅读 下载PDF
基于单目图像的多目标三维视觉定位方法
2
作者 黄舒雯 郭柯宇 +3 位作者 宋翔宇 韩锋 孙士杰 宋焕生 《计算机应用》 北大核心 2026年第1期207-215,共9页
针对现有的三维视觉定位方法依赖昂贵传感器设备、系统成本高且在复杂多目标定位中准确度和鲁棒性不足的问题,提出一种基于单目图像的多目标三维视觉定位方法。该方法结合自然语言描述,在单个RGB图像中实现对多个三维目标的识别。为此,... 针对现有的三维视觉定位方法依赖昂贵传感器设备、系统成本高且在复杂多目标定位中准确度和鲁棒性不足的问题,提出一种基于单目图像的多目标三维视觉定位方法。该方法结合自然语言描述,在单个RGB图像中实现对多个三维目标的识别。为此,构建一个多目标视觉定位数据集Mmo3DRefer,并设计跨模态匹配网络TextVizNet。TextVizNet通过预训练的单目检测器生成目标的三维边界框,并借助信息融合模块与信息对齐模块实现视觉与语言信息的深度整合,进而实现文本指导下的多目标三维检测。与CORE-3DVG(Contextual Objects and RElations for 3D Visual Grounding)、3DVG-Transformer和Multi3DRefer(Multiple 3D object Referencing dataset and task)等5种方法对比的实验结果表明,与次优方法Multi3DRefer相比,TextVizNet在Mmo3DRefer数据集上的F1-score、精确度和召回率分别提升了8.92%、8.39%和9.57%,显著提升了复杂场景下基于文本的多目标定位精度,为自动驾驶和智能机器人等实际应用提供了有效支持。 展开更多
关键词 三维视觉定位 单目图像 多模态技术 目标检测 场景理解
在线阅读 下载PDF
基于关键路径点的深度强化学习复合路径规划
3
作者 孙超 王江 +2 位作者 穆朝絮 邢良平 孙长银 《中国科学:信息科学》 北大核心 2026年第2期394-408,共15页
本文提出了一种结合Voronoi图和深度强化学习的机器人路径规划方法.在全局规划方面,通过Voronoi图构建“安全区域”,利用A*算法和关键路径点提取算法优化路径点,为局部规划提供目标.局部规划采用融合阶段关键点与均衡回放策略的RainbowD... 本文提出了一种结合Voronoi图和深度强化学习的机器人路径规划方法.在全局规划方面,通过Voronoi图构建“安全区域”,利用A*算法和关键路径点提取算法优化路径点,为局部规划提供目标.局部规划采用融合阶段关键点与均衡回放策略的RainbowDQN(stage-key&weight-balanced replay Rainbow deep Q-network,SW-RDQN)算法,通过3项关键设计提升复杂动态环境下的导航适应性:首先,采用多阶段路径分割策略对全局路径进行划分与剪枝,提取并保留关键路径点信息;其次,结合轨迹落点预测与环境势场设计奖励函数,引导智能体学习更安全有效的避障行为;最后,采用基于奖励与TD误差动态加权的优先经验回放,通过偏移与对数归一化提升关键经验采样概率,从而提高训练效率.状态输入融合了卷积和多层感知机提取信息,取若干场景帧送入长短期记忆网络模型,最后由稠密层做出决策,提升了机器人对动态环境的感知和响应能力.该方法有效提升了机器人在动态环境中的路径规划精度与鲁棒性. 展开更多
关键词 多阶段路径分割 VORONOI图 SW-RDQN 落点预测 场景避障导航
原文传递
一种抗遮挡重叠与尺度变化的行人检测算法
4
作者 马晞茗 李宁 吴迪 《现代电子技术》 北大核心 2026年第1期41-48,共8页
针对复杂人群密集场景中因行人目标受遮挡和行人目标尺度不一等因素导致行人检测器检测精度下降、漏检率变高的问题,基于Faster R-CNN算法进行改进,提出一种抗遮挡重叠与尺度变化的行人检测算法。在特征提取环节,设计一种融合注意力机... 针对复杂人群密集场景中因行人目标受遮挡和行人目标尺度不一等因素导致行人检测器检测精度下降、漏检率变高的问题,基于Faster R-CNN算法进行改进,提出一种抗遮挡重叠与尺度变化的行人检测算法。在特征提取环节,设计一种融合注意力机制的循环多尺度特征提取网络,用于学习更为丰富细致的多尺度特征信息,并重点聚焦于关键特征信息,提升网络对不同尺度行人目标的灵敏度;对于损失函数模块,引入斥力损失以降低目标相互遮挡对检测造成的干扰;在后处理环节,设计一种基于遮挡重叠率补偿的非极大值抑制算法,使得实际的抑制阈值能够随着遮挡程度的变化而自适应调整,从而进一步降低密集处行人目标的漏检率。实验结果表明:改进后算法的检测性能更为出色,在CrowdHuman和CityPersons数据集上的检测平均精度相比基准算法分别提升了2.5%和1.9%,对数平均漏检率分别降低了3.5%和3.2%,在TJU-DHD-pedestrian数据集上不同尺度行人目标的对数平均漏检率也得到较为明显的降低,所提算法可以适用于复杂场景中的行人检测。 展开更多
关键词 行人检测 人群密集场景 Faster R-CNN 多尺度特征融合 损失函数 非极大值抑制
在线阅读 下载PDF
基于不确定场景下的分布式储能系统随机优化模型
5
作者 顾阳 顾佳琪 +4 位作者 李光熹 刘晗 任飞 岳付昌 李红 《电力信息与通信技术》 2026年第2期38-49,共12页
大规模可再生能源及柔性负荷的接入使得配电网源荷侧的不确定性问题不容忽视,同时高渗透率的分布式光伏也对配电网的安全稳定运行带来了更大的挑战。文章以配电台区分布式光伏与储能系统为研究对象,针对分布式光伏以及用户负荷预测的不... 大规模可再生能源及柔性负荷的接入使得配电网源荷侧的不确定性问题不容忽视,同时高渗透率的分布式光伏也对配电网的安全稳定运行带来了更大的挑战。文章以配电台区分布式光伏与储能系统为研究对象,针对分布式光伏以及用户负荷预测的不确定性,提出一种基于K-means算法多场景模拟的分布式储能系统随机优化运行模型,采用拉丁超立方采样法建立光-荷时序模型,并开展场景模拟。在K-means聚类算法基础上结合Kantorovich思想提出改进的场景削减方法的2个过程。以经济效益、电压偏差和负荷波动为指标建立多目标双层运行-规划模型,运用改进的多目标粒子群优化算法对模型求解,将模拟退火算法中的接收准则嵌入到粒子群算法更新规则中避免其早熟收敛,求得全局最优配置方案。最后,通过IEEE33节点的配电网仿真测试,分析验证了所建模型和所提方法的有效性与合理性。 展开更多
关键词 分布式储能系统 源荷不确定性 多场景模拟 随机优化运行 多目标优化
在线阅读 下载PDF
多场景下规模化高铁快运基地布局方案研究
6
作者 刘佳林 《工程建设与设计》 2026年第2期35-37,共3页
对多场景下规模化高铁快运基地布局方案进行了研究,分析了经济、交通、环境等高铁快运基地布局影响因素,探讨了站台装卸作业区、动车组存车场、货运汽车接驳区等功能区划分及工艺布局,并针对城市中心区域、郊区、交通枢纽等不同场景提... 对多场景下规模化高铁快运基地布局方案进行了研究,分析了经济、交通、环境等高铁快运基地布局影响因素,探讨了站台装卸作业区、动车组存车场、货运汽车接驳区等功能区划分及工艺布局,并针对城市中心区域、郊区、交通枢纽等不同场景提出布局特点及优化方案。 展开更多
关键词 高铁快运基地 多场景布局 影响因素
在线阅读 下载PDF
基于YOLO11的远距复杂场景小目标检测
7
作者 熊诗雨 狄永正 +1 位作者 纪雯 史红周 《计算机系统应用》 2026年第1期152-163,共12页
远距复杂场景中的小目标检测任务因目标尺寸小、形态不规则、纹理信息弱且易被背景干扰,长期面临检测精度低与鲁棒性差的挑战.针对上述问题,本文提出一种改进的检测算法ReF-YOLO(remote-enhanced fusion YOLO),在YOLO11框架基础上从特... 远距复杂场景中的小目标检测任务因目标尺寸小、形态不规则、纹理信息弱且易被背景干扰,长期面临检测精度低与鲁棒性差的挑战.针对上述问题,本文提出一种改进的检测算法ReF-YOLO(remote-enhanced fusion YOLO),在YOLO11框架基础上从特征提取、特征融合与检测头设计这3方面进行系统优化.具体而言,引入融合通道注意与空间建模的C3k2DCASC模块,增强主干网络对非规则目标的表达能力;设计结合主干同尺度特征的L-Fuse结构与高效下采样模块SCDown,提升语义与细节对齐效果;并增设高分辨率P2检测分支,有效提升极小目标的感知与定位能力.在VisDrone2019典型小目标数据集上的实验表明,所提方法的mAP@0.5相较于YOLO11n提升4.9%,在小目标检测任务中表现出更优的准确性与稳定性,验证了其在远距复杂场景下的实用性与泛化能力. 展开更多
关键词 小目标检测 YOLO11 特征提取 多尺度融合 远距复杂场景
在线阅读 下载PDF
场景流与推理辅助的多帧点云目标检测模型
8
作者 赵芃康 李翔宇 +4 位作者 齐洪钢 邓永强 李娟娟 梁浩 苗军 《微电子学与计算机》 2026年第1期11-21,共11页
随着自动驾驶技术的进步,基于激光雷达点云的3D目标检测已成为关键任务。然而,现有方法大多依赖单帧检测,未充分利用时序信息,导致检测精度不高,存在遮挡和目标丢失等问题。为此,提出了一种新型多帧目标检测模型,通过集成多帧信息来提... 随着自动驾驶技术的进步,基于激光雷达点云的3D目标检测已成为关键任务。然而,现有方法大多依赖单帧检测,未充分利用时序信息,导致检测精度不高,存在遮挡和目标丢失等问题。为此,提出了一种新型多帧目标检测模型,通过集成多帧信息来提高检测性能。为了有效利用多帧信息,所提模型引入了匹配推理模块和场景流模块。其中,匹配推理模块根据目标的初始位置推断其运动方向和速度,更新目标的后续位置。场景流模块则整合了点云中各点的位置信息、速度和方向,为推理过程提供更准确的数据支持。实验表明:所提模型在nuScencs数据集中达到了59.2%的mAP和67.4%的NDS,在KITTI数据集中重要的车类别中等难度评价中取得了89.03%的平均精度,优于大部分目标检测模型。同时,将检测结果可视化,通过多种消融实验进一步验证了该模型的有效性和所提出改进的可行性。 展开更多
关键词 目标检测 多帧检测 激光雷达点云 场景流 融合推理
在线阅读 下载PDF
水电工程三维场景构建与多图形引擎应用研究
9
作者 李谧 李磊 杨明桃 《水利水电快报》 2026年第2期124-130,共7页
为解决水电工程三维场景数据多源异构、多精度并存、数据量大,且单一构建手段及图形引擎不能满足多级、多精度三维数字化应用需求的问题,融合Unreal Engine、Unity 3D、BIM及GIS等技术的特点,提出了以需求为导向的水电工程三维场景分级... 为解决水电工程三维场景数据多源异构、多精度并存、数据量大,且单一构建手段及图形引擎不能满足多级、多精度三维数字化应用需求的问题,融合Unreal Engine、Unity 3D、BIM及GIS等技术的特点,提出了以需求为导向的水电工程三维场景分级分类构建方式,并探讨了多源三维数据融合的技术路线。在此基础上,形成以不同三维图形引擎为主体的场景应用技术方案,并根据不同类型三维图形引擎的数字化场景呈现特征,提出多图形引擎自适应融合的技术方法,实现满足轻量化高效应用需求的三维场景构建与应用,有效解决水电工程全场景三维数字化应用的难题。工程应用表明,该方法显著提升了数字化模型的实用性与交互性,提高了三维场景的调度显示效率,为智慧水电建设提供了技术支撑。 展开更多
关键词 BIM GIS Unreal Engine Unity 3D 三维场景 多图形引擎
在线阅读 下载PDF
通过多源地理场景数据提取基础地理实体
10
作者 杨蕊宁 李波 《地理空间信息》 2026年第1期71-74,共4页
随着地理场景数据建设朝着广域化覆盖、精细化建模的方向发展,地理实体这一概念在空间数据中得到了广泛应用,逐渐改变了基础测绘生产模式和服务方式,但基础地理实体的数据建设仍在探索过程中。依托立体影像、卫星图像、倾斜模型、激光... 随着地理场景数据建设朝着广域化覆盖、精细化建模的方向发展,地理实体这一概念在空间数据中得到了广泛应用,逐渐改变了基础测绘生产模式和服务方式,但基础地理实体的数据建设仍在探索过程中。依托立体影像、卫星图像、倾斜模型、激光点云等多源地理场景数据,深入研究了基础地理实体智能化提取技术,并在典型区域内进行示范性建设。研究结果可用于完善基础地形图与各类专业数据转换的生产成果,完成基础地理实体的现势性更新,以提高数据生产效率。 展开更多
关键词 基础地理实体 智能化提取 多源地理场景
在线阅读 下载PDF
翼行AI外骨骼——多模态全场景智能助行方舟
11
作者 王如会 王旭 《科学技术创新》 2026年第5期221-224,共4页
在全球老龄化及肢体残障群体规模扩大背景下,行走不便人群对高效辅助器具需求迫切。翼行AI外骨骼融合AI与医疗技术,集成GSM模块、北斗+GPS双模定位模块等多模块,具备精准辅助调节、智能安全保障等功能,可实时监测生理指标与步态特征并... 在全球老龄化及肢体残障群体规模扩大背景下,行走不便人群对高效辅助器具需求迫切。翼行AI外骨骼融合AI与医疗技术,集成GSM模块、北斗+GPS双模定位模块等多模块,具备精准辅助调节、智能安全保障等功能,可实时监测生理指标与步态特征并生成康复报告。其通过大数据构建用户画像数据库,实现模块化设计与个性化定制,应用场景广泛。该项目技术源于自主研发与产学研合作,采用线上线下融合销售模式,预计经营第3年实现收支平衡,致力于帮助行走不便者重获行走自由,推动智能行走辅佐器行业发展。 展开更多
关键词 AI外骨骼 全场景配适 多模态融合 康复辅助
在线阅读 下载PDF
动态环境下基于贝叶斯多视图估计的视觉惯性SLAM方法
12
作者 宁一鹏 范金龙 +3 位作者 王坚 郭郑伟 贾祥 柴大帅 《中国惯性技术学报》 北大核心 2026年第2期134-141,共8页
针对动态环境下视觉惯性同步定位与建图(SLAM)系统定位精度下降与鲁棒性不足的问题,提出了一种基于贝叶斯多视图估计的动态惯性视觉SLAM方法。首先,设计了一种基于贝叶斯的多视图动态特征点估计方法,通过贝叶斯滤波融合历史帧观测信息,... 针对动态环境下视觉惯性同步定位与建图(SLAM)系统定位精度下降与鲁棒性不足的问题,提出了一种基于贝叶斯多视图估计的动态惯性视觉SLAM方法。首先,设计了一种基于贝叶斯的多视图动态特征点估计方法,通过贝叶斯滤波融合历史帧观测信息,构建特征点动态概率模型,实现对特征点动态概率的精确估计;其次,提出特征点权重优化算法,动态调整特征点权重,提升系统在动态场景下的定位精度;最后,构建基于加权优化的位姿估计,实现相机与惯性测量装置的紧耦合。实验结果表明,相较于ORB-SLAM3算法,所提方法在TUM RGB-D和KITTI数据集上的绝对轨迹均方根误差分别平均降低了96.68%和27.80%,提升了系统在动态场景下的定位精度与鲁棒性。 展开更多
关键词 视觉惯性SLAM 多视图估计 特征点权重 动态场景 目标检测
在线阅读 下载PDF
复杂场景移动机器人定位与建图研究进展
13
作者 张怡俊 崔国华 +2 位作者 张振山 何维瀚 薛慧 《控制工程》 北大核心 2026年第2期291-302,共12页
同步定位与建图(simultaneous localization and mapping, SLAM)技术是移动机器人研究及应用的关键问题,旨在解决机器人在复杂环境中实现自主定位与地图构建等功能。对SLAM的系统组成、关键技术及应用进行了简要介绍;重点围绕特征点法... 同步定位与建图(simultaneous localization and mapping, SLAM)技术是移动机器人研究及应用的关键问题,旨在解决机器人在复杂环境中实现自主定位与地图构建等功能。对SLAM的系统组成、关键技术及应用进行了简要介绍;重点围绕特征点法、滤波法、图优化法、多传感器融合和动态场景5个方面,综述了SLAM系统的关键技术、国内外研究现状及标志性应用进展;并结合代表性系统,比较分析了不同方法之间的优缺点,详细阐述了多传感器融合SLAM系统,同时对复杂场景下的SLAM技术进行了展望。 展开更多
关键词 复杂场景 移动机器人 定位与建图 位姿估计 多传感器融合
原文传递
空间信息增强的室内多任务RGB-D场景理解 被引量:1
14
作者 孙国栋 熊晨韵 +1 位作者 刘俊杰 张杨 《北京航空航天大学学报》 北大核心 2025年第7期2209-2217,共9页
移动机器人在探索三维空间时需要获取大量场景信息,这些信息包含语义、实例对象、位置关系等多个方面。理解场景信息的准确性和计算复杂性是移动端关注的2个焦点。基于此,提出了一种适用于室内场景理解的空间信息增强的多任务学习方法... 移动机器人在探索三维空间时需要获取大量场景信息,这些信息包含语义、实例对象、位置关系等多个方面。理解场景信息的准确性和计算复杂性是移动端关注的2个焦点。基于此,提出了一种适用于室内场景理解的空间信息增强的多任务学习方法。该方法由包含通道-空间注意力融合模块的编码器及多任务头的解码器组成,可同时实现语义分割、全景分割(实例分割)和方向估计多个任务。其中,通道-空间注意力融合模块旨在增强RGB和深度各自的模态特征,由简单卷积构成的空间注意力机制可降低收敛速度,与通道注意力机制信息融合后,进一步强化全局信息的位置特征。语义分支的上下文模块位于解码器后,为像素级语义信息提供有力支持,有助于减小模型大小。同时,设计了一种基于硬参数共享且能均衡训练任务的损失函数,探讨合适的轻量级骨干网络和任务数量对提升场景理解算法性能的影响。在新增标签注释的室内数据集NYUv2和SUN RGB-D上,评估了多任务学习方法的有效性,综合性全景分割精度分别提高了2.93%和4.87%。 展开更多
关键词 场景理解 多任务学习 RGB-D 空间信息 室内场景
原文传递
基于归一化流的多模态多尺度工业场景缺陷检测 被引量:2
15
作者 曲海成 林俊杰 《中国图象图形学报》 北大核心 2025年第2期451-466,共16页
目的工业缺陷检测是现代工业质量控制中至关重要的一环,针对工业多模态缺陷检测场景下,捕捉不同形状大小、在RGB图像上感知度低的缺陷,以及减少单模态原始特征空间内存在的噪声对多模态信息交互的干扰的挑战,提出了一种基于归一化流的... 目的工业缺陷检测是现代工业质量控制中至关重要的一环,针对工业多模态缺陷检测场景下,捕捉不同形状大小、在RGB图像上感知度低的缺陷,以及减少单模态原始特征空间内存在的噪声对多模态信息交互的干扰的挑战,提出了一种基于归一化流的多模态多尺度缺陷检测方法。方法首先,使用Vision Transformer和Point Transformer对RGB图像和3D点云两个模态的信息提取第1、3、11块的特征构建特征金字塔,保留低层次特征的空间信息助力缺陷定位任务,并提高模型对不同形状大小缺陷的鲁棒性;其次,为了简化多模态交互,使用过点特征对齐算法将3D点云特征对齐至RGB图像所在平面,通过构建对比学习矩阵的方式实现无监督多模态特征融合,促进不同模态之间信息的交互;此外,通过设计代理任务的方式将信息瓶颈机制扩展至无监督,并在尽可能保留原始信息的同时,减少噪声干扰得到更充分有力的多模态表示;最后,使用多尺度归一化流结构捕捉不同尺度的特征信息,实现不同尺度特征之间的交互。结果本文方法在MVTec-3D AD数据集上进行性能评估,实验结果显示Detection AUCROC(area under the curve of the receiveroperating characteristic)指标达到93.3%,SegmentationAUPRO(area under the precision-recall overlap)指标达到96.1%,Segmentation AUCROC指标达到98.8%,优于大多数现有的多模态缺陷检测方法。结论本文方法对于不同形状大小、在RGB图像上感知度低的缺陷有较好的检测效果,不但减少了原始特征空间内噪声对多模态表示的影响,并且对不同形状大小的缺陷具有一定的泛化能力,较好地满足了现代工业对于缺陷检测的要求。 展开更多
关键词 多模态多尺度工业场景 缺陷检测 无监督特征融合(UFF) 代理任务 归一化流
原文传递
复杂场景下的多人人体姿态估计算法
16
作者 石磊 王天宝 +3 位作者 孟彩霞 王清贤 高宇飞 卫琳 《郑州大学学报(理学版)》 北大核心 2025年第4期1-7,共7页
复杂场景下人员的交叉遮挡,导致现有的人体姿态估计算法存在准确度不高和人体骨架错连的问题。为此,提出一种复杂场景下的多人人体姿态估计优化算法。首先,使用分组分块级联卷积替换普通卷积,结合特征融合促进特征通道之间的信息交互,... 复杂场景下人员的交叉遮挡,导致现有的人体姿态估计算法存在准确度不高和人体骨架错连的问题。为此,提出一种复杂场景下的多人人体姿态估计优化算法。首先,使用分组分块级联卷积替换普通卷积,结合特征融合促进特征通道之间的信息交互,在不引入额外计算成本的前提下提高算法精度;其次,引入空间注意力机制挖掘与人体姿态估计任务相关的空间语义特征,将网络结构并行化处理以提高算法性能;最后,对大卷积核和空间注意力机制的嵌入位置进行轻量化处理,减少时间开销。与现有的自底向上的姿态估计算法OpenPifPaf++相比,所提算法在COCO 2017数据集上平均准确率提高0.8个百分点;在CrowdPose数据集上平均准确率比OpenPifPaf算法提高1.2个百分点,复杂场景下对应的准确率提高1.5个百分点。 展开更多
关键词 复杂场景 多人人体姿态估计 分组卷积 空间注意力机制 轻量化
在线阅读 下载PDF
基于Transformer和CNN的非结构化场景语义分割方法 被引量:1
17
作者 杨森 杨长春 +1 位作者 王彭 王宇鹏 《计算机仿真》 2025年第4期244-248,410,共6页
为解决大多数分割算法只适用于结构化道路,在非结构化场景中会遇到错误分割、实时性低等问题,提出了一种用于非结构化场景分割的结合Transformer和卷积神经网络(CNN)的方法—TrCNet。上述方法有效地把Transformer和CNN结合起来,编码器由... 为解决大多数分割算法只适用于结构化道路,在非结构化场景中会遇到错误分割、实时性低等问题,提出了一种用于非结构化场景分割的结合Transformer和卷积神经网络(CNN)的方法—TrCNet。上述方法有效地把Transformer和CNN结合起来,编码器由CNN构成,负责提取多尺度的局部特征。特征被输入到解码器中的Transformer模块,对局部特征进行全局建模和上下文关联,图像中的全局语义信息得到有效编码,同时保留了局部特征的细节。此外还设计了多尺度特征融合模块(MFFM),以在不同层级之间传递和融合特征信息,进一步提高语义分割的准确性和效果。实验结果表明,TrCNet在RUGD和RELLIS测试集中的Mio U分别达到了50.51%和52.29%,同时FLOPs和Params仅为18.24G和23.71M,可以有效解决非结构化场景中的分割不准确、实时性不高的难题。 展开更多
关键词 非结构化环境 语义分割 多尺度特征融合
在线阅读 下载PDF
基于多轮对话场景感知模型的虚拟教学平台设计研究 被引量:1
18
作者 燕青 《自动化与仪器仪表》 2025年第7期179-183,189,共6页
为提升日语教学系统的交互性和个性化教学能力,研究结合Watson的技术架构,设计了虚拟日语教学平台。利用长短期记忆网络(Long Short-Term Memory,LSTM)编码器学习对话上下文信息。引入注意力机制以生成符合当前教学场景的应答,并结合Seq... 为提升日语教学系统的交互性和个性化教学能力,研究结合Watson的技术架构,设计了虚拟日语教学平台。利用长短期记忆网络(Long Short-Term Memory,LSTM)编码器学习对话上下文信息。引入注意力机制以生成符合当前教学场景的应答,并结合Seq2Seq和注意力机制。生成符合在复杂教学场景中的应答,同时提升交互自然度。结果表明,虚拟教学平台的平均分数为97.3,明显高于传统方法的73.7,表明虚拟平台在提升学习成绩上具有显著优势。其次,在学习时间上,虚拟教学平台的学习时间为66.7小时,低于传统方法的80.1小时,显示虚拟平台在效率上的提升。平台响应时间方面,虚拟平台的响应时间比传统方法要更快。此次研究实现了面向小学生英语领域的教学平台构建,并完成了系统功能模块的开发与测试。研究通过功能测试验证了平台在处理多轮互动时的应答质量。 展开更多
关键词 多轮对话场景感知 WATSON LSTM 虚拟教学平台
原文传递
融合场景特征的跨模态图像美学评价 被引量:1
19
作者 牛玉贞 陈珊珊 +1 位作者 李悦洲 刘文犀 《计算机辅助设计与图形学学报》 北大核心 2025年第7期1270-1282,共13页
现有的图像美学评价方法通常依赖图像本身而忽略了用户评论中的丰富语义信息,因此在性能方面呈现一定的局限性.一些研究尝试结合用户评论辅助进行图像美学评价,但未能充分地挖掘图像特征,且未能较好地对图像-文本特征的复杂关系进行建模... 现有的图像美学评价方法通常依赖图像本身而忽略了用户评论中的丰富语义信息,因此在性能方面呈现一定的局限性.一些研究尝试结合用户评论辅助进行图像美学评价,但未能充分地挖掘图像特征,且未能较好地对图像-文本特征的复杂关系进行建模,导致图像-文本信息利用不充分且交互不够紧密.为解决上述问题,提出一种融合场景特征的跨模态图像美学评价方法.由于图像场景通常会影响人们对图像的美学评价,因此首先提取图像的场景特征和美学特征,并使用多尺度特征融合模块将两者深度融合;考虑图像-文本特征之间的内在相关性,使用多头交叉注意力机制在图像特征和文本特征之间进行交叉注意力计算,将图像-文本模态信息进行交互融合;最后将融合后的跨模态特征用于美学评价.在通用的大型图像美学评价数据集AVA上的广泛实验结果表明,所提方法在ACC,SRCC和PLCC指标上分别达到了86.96%,0.8523和0.8648,超越了文中对比的跨模态图像美学评价方法. 展开更多
关键词 图像美学评价 跨模态学习 场景特征 多头交叉注意力机制 多尺度特征融合
在线阅读 下载PDF
复杂场景下SAR图像多尺度舰船检测算法 被引量:1
20
作者 贺顺 王雨竹 杨志伟 《电子技术应用》 2025年第3期59-64,共6页
针对复杂场景下的多尺度SAR舰船目标检测存在误检漏检的问题,提出了一种改进的SAR舰船目标检测方法。首先,利用多尺度目标特征提取网络提取特征信息,以提升多尺度目标的检测能力并减少冗余计算。其次,引入可形变卷积(DConv)通过自适应... 针对复杂场景下的多尺度SAR舰船目标检测存在误检漏检的问题,提出了一种改进的SAR舰船目标检测方法。首先,利用多尺度目标特征提取网络提取特征信息,以提升多尺度目标的检测能力并减少冗余计算。其次,引入可形变卷积(DConv)通过自适应调整卷积核的形状来提升复杂场景下SAR舰船目标的检测性能。最后,引入了注意力机制来抑制背景杂波并增强特征信息。实验结果表明,在SSDD数据集和HRSID数据集上改进方法的检测精度分别达到了97.9%和93.1%,整体性能优于现有主流目标检测算法。 展开更多
关键词 目标检测 复杂场景 多尺度船舶检测 合成孔径雷达(SAR) 深度学习
在线阅读 下载PDF
上一页 1 2 34 下一页 到第
使用帮助 返回顶部