期刊文献+
共找到1,240篇文章
< 1 2 62 >
每页显示 20 50 100
基于改进YOLOv7的无人机图像小目标检测算法 被引量:1
1
作者 金涛 李昭蒂 《实验室研究与探索》 北大核心 2025年第7期118-124,143,共8页
针对无人机图像背景复杂、遮挡及尺度变化导致的小目标错检和漏检问题,提出基于YOLOv7算法的小目标检测改进模型。该模型通过引入坐标注意力机制(CA)优化特征提取,使用自适应激活函数(ACON)增强网络非线性表达能力;同时,采用NWD作为新... 针对无人机图像背景复杂、遮挡及尺度变化导致的小目标错检和漏检问题,提出基于YOLOv7算法的小目标检测改进模型。该模型通过引入坐标注意力机制(CA)优化特征提取,使用自适应激活函数(ACON)增强网络非线性表达能力;同时,采用NWD作为新度量改进损失函数,以更精确衡量边界框相似性。此外,使用轻量级上采样算子CARAFE扩大感受野并聚合上下文信息。在VisDrone2019和NWPU VHR-10数据集上的实验表明,改进算法与原算法相比,mAP0.5和mAP0.5∶0.95指标均有显著提升,且与其他主流算法相比,检测精度也有明显优势。该方法为复杂环境下无人机图像小目标检测的实际应用提供了技术支撑,有助于推动相关领域的技术进步。 展开更多
关键词 无人机图像 YOLOv7算法 小目标检测 注意力机制 激活函数
在线阅读 下载PDF
集成光计算:现状、挑战与展望(特邀)
2
作者 项水英 王一芝 +11 位作者 牛欣然 余梦婷 张钰娜 余澄扬 曾鑫涛 郑殿壮 张雅慧 郭星星 韩亚楠 解长健 王涛 郝跃 《光子学报》 北大核心 2025年第9期100-118,共19页
人工智能、深度学习及大模型的飞速发展对算力和能源提出了迫切需求。传统电子计算芯片依赖冯诺伊曼架构,越来越难以支撑人工智能所需的训练及推理算力需求。随着光子集成技术的不断进步,片上集成光子神经网络芯片得到飞速发展,具有超... 人工智能、深度学习及大模型的飞速发展对算力和能源提出了迫切需求。传统电子计算芯片依赖冯诺伊曼架构,越来越难以支撑人工智能所需的训练及推理算力需求。随着光子集成技术的不断进步,片上集成光子神经网络芯片得到飞速发展,具有超高速、大带宽、多维度等优势,成为人工智能底层算力硬件的重要补充。本文回顾了国内外集成光计算方面的研究进展,重点分析了当前面临的挑战,并对未来的发展提出了展望。 展开更多
关键词 光计算 光子神经网络芯片 光子线性计算 光子非线性计算
在线阅读 下载PDF
基于增量式PID和注意力机制在复杂场景下的车道线检测算法 被引量:1
3
作者 郑斌 彭淇 崔朋飞 《物联网技术》 2025年第9期11-15,共5页
在自动驾驶系统中,确保车道线检测既可靠又精确,是一项至关重要但同时又极具挑战性的工作。当前,基于深度学习的方法在车道线检测领域展现了卓越的性能,然而在夜晚、道路弯曲等复杂场景下,仍然很难准确检测车道。针对这一问题,提出了Inc... 在自动驾驶系统中,确保车道线检测既可靠又精确,是一项至关重要但同时又极具挑战性的工作。当前,基于深度学习的方法在车道线检测领域展现了卓越的性能,然而在夜晚、道路弯曲等复杂场景下,仍然很难准确检测车道。针对这一问题,提出了IncrPID-ATTNet模型,它是一种将增量式PID和注意力机制与深度神经网络(DNN)相结合的模型。首先,借鉴增量式PID控制算法思想改进优化器,加快复杂场景下网络模型收敛的速度,并提升车道检测的性能。其次,为了解决在遮挡、车道丢失等情况下局部特征存在局限性,从而导致车道线检测精度偏低的问题,引入了一种新型注意力机制来聚合全局信息。该模型在具有挑战性场景的车道线检测数据集CULane中,兼顾了准确性和速度。其车道线检测速度比最先进方法的检测速度快约2.16倍,可达到379.2帧/s的良好性能,在夜晚、道路弯曲等复杂场景下其F1分数也优于最先进的方法。 展开更多
关键词 车道线检测 控制算法 自动驾驶 神经网络 注意力机制 深度学习
在线阅读 下载PDF
人工智能驱动的交互式数字媒体创作技术探究 被引量:1
4
作者 韩晓娟 《信息记录材料》 2025年第4期191-193,共3页
人工智能技术的快速发展为数字媒体创作带来了革命性的变革,本研究旨在探索人工智能技术在数字媒体创作中的应用路径和实践模式,以提升创作效率并拓展艺术表现形式。通过对人工智能驱动的交互式数字媒体创作技术进行系统分析,探讨了生... 人工智能技术的快速发展为数字媒体创作带来了革命性的变革,本研究旨在探索人工智能技术在数字媒体创作中的应用路径和实践模式,以提升创作效率并拓展艺术表现形式。通过对人工智能驱动的交互式数字媒体创作技术进行系统分析,探讨了生成对抗网络、自然语言处理及机器学习在数字媒体创作中的具体应用。研究结果表明:人工智能技术能够显著提升创作效率,增强用户交互体验,并为创作者提供新的艺术表现形式。通过分析典型案例,可知人工智能辅助创作的关键技术路径和应用模式,为推动交互式数字媒体创作的发展提供了理论依据和实践指导。 展开更多
关键词 人工智能 交互式数字媒体 创作技术 生成对抗网络 机器学习
在线阅读 下载PDF
基于ISPO算法的并联式冷水机组负荷比优化
5
作者 王凯 方明 +2 位作者 陈雄风 黄云龙 胡一迪 《电子制作》 2025年第10期51-55,共5页
在满足末端冷负荷的前提下,针对并联式冷水机组进行负荷比优化来降低机组总能耗,具有较强的现实意义。因此本文在随机油漆算法(SPO)基础上,提出了一种改进随机油漆优化算法(ISPO)。首先利用轮盘赌适应度距离平衡策略来增强算法搜索的多... 在满足末端冷负荷的前提下,针对并联式冷水机组进行负荷比优化来降低机组总能耗,具有较强的现实意义。因此本文在随机油漆算法(SPO)基础上,提出了一种改进随机油漆优化算法(ISPO)。首先利用轮盘赌适应度距离平衡策略来增强算法搜索的多样性,同时避免陷入局部最优解。其次利用协方差矩阵学习策略来增强算法寻找到全局最优解的可能性。最后,非垄断搜索策略能够逐维调整最优解,因而提高最优解的质量。经测试,ISPO算法在CEC2017测试集上具有较为优异的寻优性能。最后,将ISPO算法和其余7种算法应用于并联式冷水机组的负荷比优化问题。实验结果表明,在满足三种末端冷负荷的需求下,ISPO所计算的机组负荷比最优,能耗最低。对比原始SPO算法,ISPO的功率能耗分别降低了59.59kW(3.6%),21.13kW(1.5%),18.01kW(1%),实现了节能减排作用。 展开更多
关键词 并联式冷水机组 负荷比 随机油漆优化算法 ISPO 能耗
在线阅读 下载PDF
基于语义分割的静脉输液液位检测
6
作者 邹学玉 熊莉娅 +1 位作者 周箩鱼 喻旸 《长江大学学报(自然科学版)》 2025年第4期119-126,共8页
为了解决人工监控静脉输液过程效率低问题,利用摄像头拍摄的输液容器图片,对输液容器液位线进行检测。通过语义分割来预测输液图片中每个像素点的标签,将液位检测问题转化为三类分割问题:背景、有液区域和无液区域。其中,将背景分割出... 为了解决人工监控静脉输液过程效率低问题,利用摄像头拍摄的输液容器图片,对输液容器液位线进行检测。通过语义分割来预测输液图片中每个像素点的标签,将液位检测问题转化为三类分割问题:背景、有液区域和无液区域。其中,将背景分割出来获得输液目标,再以液位线为界限把输液目标分割为有液区域和无液区域,从而实现输液目标液位检测。首先,通过标注不同光照条件、容量和背景下的单目标和双目标图片,创建输液目标数据集。然后,搭建基于VGG16(visual geometry group)的U-Net模型和基于Mobilenetv2、ResNet50的金字塔场景解析网络(PSPNet)模型。三个网络结合迁移学习方法,弥补自建输液数据集不足问题,加速模型学习效率。试验结果表明,三个网络都能分割输液目标,其中,基于VGG16网络的U-Net模型更优,其平均交并比(MIoU)为89.5%,平均像素精度(MPA)为94.8%。 展开更多
关键词 液位检测 语义分割 编码解码结构 卷积神经网络 残差网络
在线阅读 下载PDF
Enhanced-YOLOv5s施工安全帽佩戴检测算法研究
7
作者 张昱 冉祥东 周聪 《物联网技术》 2025年第21期22-24,共3页
针对施工现场人员安全帽佩戴情况检测困难、传统人工巡检效率低、主观性强等问题,亟需设计一种智能化解决方案。本研究旨在设计一种高效的安全帽佩戴检测算法,以提升施工安全监管的智能化水平。以YOLOv5s目标检测框架为基础,针对施工现... 针对施工现场人员安全帽佩戴情况检测困难、传统人工巡检效率低、主观性强等问题,亟需设计一种智能化解决方案。本研究旨在设计一种高效的安全帽佩戴检测算法,以提升施工安全监管的智能化水平。以YOLOv5s目标检测框架为基础,针对施工现场小目标检测精度低、遮挡干扰严重等特点,在YOLOv5s网络中引入卷积块注意力模块(CBAM)与高效通道注意力模块(ECA),构建Enhanced-YOLOv5s模型;自建施工场景图像数据集,采用mAP、Precision、Recall等指标评估模型性能。实验结果表明,Enhanced-YOLOv5s模型在保持网络轻量化的同时,显著提升了特征提取能力与检测鲁棒性,尤其在小目标检测精度与稳定性上表现优异,可实现对安全帽佩戴情况的高效检测。该算法为智慧工地安全监管提供了切实可行的技术路径,对深度学习目标检测算法在工业场景的应用推广具有参考价值。 展开更多
关键词 安全帽佩戴检测 Enhanced-YOLOv5s 目标检测 CBAM ECA 智慧工地
在线阅读 下载PDF
基于深度学习的花卉图像识别分类系统设计与实现
8
作者 张晓琴 马新如 费腾 《企业科技与发展》 2025年第8期106-111,共6页
为满足花卉图像识别需求,文章构建了一个包含41类共9 992张国内常见花卉的图像数据集。该数据集融合了Oxford公开数据与自主采集的图像,并采用随机翻转、颜色扰动等数据增强方法进行处理。通过优化ResNet18等4种深度学习模型,结合迁移... 为满足花卉图像识别需求,文章构建了一个包含41类共9 992张国内常见花卉的图像数据集。该数据集融合了Oxford公开数据与自主采集的图像,并采用随机翻转、颜色扰动等数据增强方法进行处理。通过优化ResNet18等4种深度学习模型,结合迁移学习、动态学习率调整和Dropout正则化等策略,显著提升了模型性能。实验结果表明,优化后的ResNet18模型在验证集上的准确率达到96.19%,较初始性能提升20%以上。在此基础上,设计并实现了Web端花卉识别分类系统“花眸识界”。该系统支持图像上传、多模型选择、识别记录管理等功能,为国内花卉识别提供了高效、实用的解决方案,可应用于农业生产、生态保护等领域。 展开更多
关键词 花卉图像 深度学习 卷积神经网络 识别系统
在线阅读 下载PDF
基于ConvNeXt和注意力的多动症分类
9
作者 汪涛 吴茜 《计算机与现代化》 2025年第7期15-20,共6页
注意缺陷与多动障碍(Attention Deficit and Hyperactivity Disorder,ADHD)俗称多动症,是一种常见的儿童行为异常性疾病。由于目前多动症尚无明确病因,且多动症患者与正常儿童的脑部结构仅存在细微差异,导致临床医生难以进行有效诊断。... 注意缺陷与多动障碍(Attention Deficit and Hyperactivity Disorder,ADHD)俗称多动症,是一种常见的儿童行为异常性疾病。由于目前多动症尚无明确病因,且多动症患者与正常儿童的脑部结构仅存在细微差异,导致临床医生难以进行有效诊断。针对此类疾病,本文提出一种基于ConvNeXt和注意力机制的卷积神经网络,用于区分多动症患者和正常儿童。首先对结构磁共振图像进行预处理,其次加载预训练模型,通过包含多维协作注意力的ConvNeXt网络进行深层特征提取,重构ConvNeXt输出层并得到最终分类结果。在ADHD-200数据集上进行验证,实验结果表明,其分类准确性达到97.3%,优于目前的主流方法,并且模型的热力图提示了前额叶等与疾病相关的脑部区域,因此可以作为一种有效、便捷的多动症辅助诊断方法。 展开更多
关键词 多动症 ConvNeXt 图像分类 磁共振成像
在线阅读 下载PDF
基于注意力引导特征融合的3D目标检测算法
10
作者 郑斌 崔朋飞 彭淇 《物联网技术》 2025年第19期58-63,共6页
随着科技“大爆炸”时代的来临,自动驾驶迎来了快速发展时期,3D目标检测的作用也日益突出。其中以多传感器融合为基础的目标检测方式得到不断优化与改进,但是当前的融合方式仍较“粗放”,未考虑不同传感器的特性对融合效果的影响。基于... 随着科技“大爆炸”时代的来临,自动驾驶迎来了快速发展时期,3D目标检测的作用也日益突出。其中以多传感器融合为基础的目标检测方式得到不断优化与改进,但是当前的融合方式仍较“粗放”,未考虑不同传感器的特性对融合效果的影响。基于以上情况,结合语义分割的方法提出了一种基于注意力机制引导的特征融合模块(AGFM),用于优化不同模态数据的融合。AGFM通过语义分割和注意力机制动态调整LiDAR和相机特征的权重,充分地融合两种模态的特征。此外,该算法还结合了鸟瞰图(BEV)特征融合方法,进一步提升了检测性能。在nuScenes数据集上对所提出的方法进行了验证,实验结果表明,该算法实现了两种模态数据的深度融合,并且使3D目标检测结果达到了SOTA水平。 展开更多
关键词 自动驾驶 3D目标检测 多传感器 特征融合 注意力机制 深度学习
在线阅读 下载PDF
基于动态特征融合的机翼结冰区域检测算法
11
作者 张德银 李俊佟 +2 位作者 张裕尧 吴章辉 何骏翔 《自动化应用》 2025年第6期40-43,48,共5页
严重的机翼结冰会对飞行安全构成巨大威胁,结冰越厚、结冰区域越大,对飞行安全的危害程度也越大。目前,机翼结冰区域的检测通常依赖于飞行员目测和单点传感器检测相结合的方法,但这种方法存在结冰边界模糊、难以量化判断以及检测区域范... 严重的机翼结冰会对飞行安全构成巨大威胁,结冰越厚、结冰区域越大,对飞行安全的危害程度也越大。目前,机翼结冰区域的检测通常依赖于飞行员目测和单点传感器检测相结合的方法,但这种方法存在结冰边界模糊、难以量化判断以及检测区域范围小的缺陷。为此,提出了一种基于动态特征融合的机翼结冰大范围区域检测算法。在UNeXt神经网络的基础上,引入了残差结构卷积块和动态特征融合模块,构建了一种新的D型结构DR-UNeXt神经网络算法,用于机翼结冰区域的检测。在自建的机翼结冰数据集上对DR-UNeXt新型网络算法进行了实验验证。结果表明,与UNeXt算法相比,DR-UNeXt新型神经网络算法在参数量仅增加12.9%、计算量仅增加31.22 GFLOPs的情况下,IoU从0.941提升至0.957,Dice系数从0.965提升至0.978。引入动态特征融合模块和残差结构卷积块能够更精准地提取机翼结冰区域的边缘信息,提高检测准确率,量化结冰区域,为防冰除冰提供数据支撑。 展开更多
关键词 D型结构 DR-UNeXt 动态特征融合 结冰区域检测 机翼结冰
在线阅读 下载PDF
基于数据宽度处理的药物性质分类预测神经网络模型
12
作者 李梦 应豪 《重庆工商大学学报(自然科学版)》 2025年第6期86-96,共11页
目的针对常规数据处理导致分类预测精度不高等问题,提出Optuna-MLP-LightGBM组合模型用于抗癌候选药物的性质分类预测。方法针对收集的1974种化合物(每个化合物各729个分子描述符),首先利用多层感知机(MLP)对高维数据进行聚合处理,再采... 目的针对常规数据处理导致分类预测精度不高等问题,提出Optuna-MLP-LightGBM组合模型用于抗癌候选药物的性质分类预测。方法针对收集的1974种化合物(每个化合物各729个分子描述符),首先利用多层感知机(MLP)对高维数据进行聚合处理,再采用跳转连接实现数据的宽度处理,将输出数据与输入数据合并组成宽度数据集,以此提高数据的特征识别,同时避免有用信息的缺失从而提高信息的流通;然后,用LightGBM替换MLP神经网络中的分类层,可以更好地进行分类处理及避免过拟合问题,最后构建基于Optuna优化的MLP-LightGBM分类预测模型,用于候选药物的小肠上皮细胞渗透性(Caco-2)的分类预测。结果模型准确率、AUC值和F 1值分别达到91.03%、97.31%和90.48%,由消融实验可以发现,通过MLP-LightGBM实现数据宽度处理以及分类后,模型分类效果相比MLP模型得到提升,3种指标分别提升了0.51%、1.22%和0.7%;与逻辑回归(LR)、Attentive FP、MLP等传统模型相比该模型能更好整合数据信息,其中与基模型相比平均增长幅度分别达到5.94%、5.65%和6.56%。结论由于跳接处理使MLP网络可以达到特征的有效提取和扩充数据集的目的,同时引入机器学习可以更好地提高分类精度,因此在药物高通量筛选中可以成为重要的辅助工具。 展开更多
关键词 MLP神经网络 LightGBM Optuna自动化调参 抗癌候选药物 分类预测
在线阅读 下载PDF
基于深度学习的车窗状态识别算法
13
作者 田苗法 常媛媛 程煜 《机电工程技术》 2025年第12期102-107,155,共7页
为提高复杂交通场景下车窗状态的自动化识别精度,提出了一种基于改进型YOLOv5S的车窗状态检测模型。该检测模型在骨干网络中嵌入CA注意力机制模块使模型能够更精准地聚焦车窗边缘、开合角度等关键区域特征;使用BiFPN模块替换FPN模块以... 为提高复杂交通场景下车窗状态的自动化识别精度,提出了一种基于改进型YOLOv5S的车窗状态检测模型。该检测模型在骨干网络中嵌入CA注意力机制模块使模型能够更精准地聚焦车窗边缘、开合角度等关键区域特征;使用BiFPN模块替换FPN模块以增强其特征融合能力,通过双向跨尺度连接与可学习权重机制,实现了多尺度特征的动态优化融合;采用EIoU损失函数替代原CIoU损失函数,通过增加中心点距离惩罚项与宽高比解耦优化策略,有效解决了重叠区域回归偏差问题。与YOLOv5S基础模型相比,改进后的模型在自建的车窗状态数据集上取得显著性能提升,识别准确率提高了1.4%,召回率提高了2.1%,平均精度均值mAP@50提高了2.4%,从而验证了所提出的改进策略的有效性。 展开更多
关键词 YOLOv5S 深度学习 车窗状态 目标检测
在线阅读 下载PDF
基于FEW-YOLOv8遥感图像目标检测算法 被引量:1
14
作者 席阳丽 屈丹 +1 位作者 王芳芳 都力铭 《郑州大学学报(工学版)》 北大核心 2025年第4期62-69,共8页
针对遥感图像目标检测任务中进行特征提取时缺少小目标信息,特征融合过程中部分信息丢失,小目标特征信息不明显,导致小目标检测精度不高的问题,提出了一种基于FEW-YOLOv8模型的遥感图像目标检测算法。首先,优化骨干网络架构,使用Faster... 针对遥感图像目标检测任务中进行特征提取时缺少小目标信息,特征融合过程中部分信息丢失,小目标特征信息不明显,导致小目标检测精度不高的问题,提出了一种基于FEW-YOLOv8模型的遥感图像目标检测算法。首先,优化骨干网络架构,使用FasterNet骨干网络,更有效地提取了遥感图像中小目标的空间特征,使得网络模型更专注于微小目标,从而提升小目标检测精度。其次,使用EMA注意力与C2f构建全新的C2f_EMA模块,替换Neck结构中的C2f模块,在融合特征前进行特征注意力加强操作,使网络模型更突出特征信息中小目标部分,有效解决特征融合过程中小目标特征丢失问题。最后,采用带有动态非单调FM的WIoUv3作为边界框的损失函数,提高了模型的边界框定位精度,并且提升了对小目标的检测性能。实验结果显示:在NWPU VHR-10数据集上经过优化的YOLOv8算法的mAP 50相较于原始YOLOv8算法提高了7.71百分点,在HRSC2016和DOTA v1.0上分别提高了9.70百分点和12.32百分点,证明所提算法能够有效提升遥感图像中小目标的检测精度。 展开更多
关键词 遥感图像 YOLOv8 FasterNet骨干网络 EMA注意力机制 WIoU损失函数
在线阅读 下载PDF
基于BERT的多特征融合中文命名实体识别 被引量:2
15
作者 孙璐冰 康怡琳 +1 位作者 王俊 朱容波 《中南民族大学学报(自然科学版)》 CAS 2025年第1期68-74,共7页
针对中文命名实体识别往往需要引入外部知识获取深层语义信息,以及基于RNN结构的模型对空间特征提取效果不佳等问题,提出了基于BERT的多特征融合中文命名实体识别模型.通过BERT模型获取输入文本序列的深层次语义信息,利用MHSA模块和IDCN... 针对中文命名实体识别往往需要引入外部知识获取深层语义信息,以及基于RNN结构的模型对空间特征提取效果不佳等问题,提出了基于BERT的多特征融合中文命名实体识别模型.通过BERT模型获取输入文本序列的深层次语义信息,利用MHSA模块和IDCNN模块增强特征提取能力.前者利用相对位置编码和多头自注意力机制来捕获输入序列的隐藏特征,使模型能够考虑到字符间的距离方向信息;后者则可以对空间特征建模,获得输入序列的全局信息.通过将两个模块的输出特征进行连接,增强模型性能.实验结果表明:模型在MSRA、Resume和Weibo三个公共数据集上的F1值分别达到了95.12%、95.45%和66.14%,优于其它最新模型,验证了模型在中文命名实体识别上的有效性. 展开更多
关键词 自然语言处理 中文命名实体识别 BERT模型 迭代膨胀卷积神经网络 自注意力
在线阅读 下载PDF
EFormer:基于分频和广注意力的高效Transformer医学图像配准模型
16
作者 黄星宇 王丽会 +3 位作者 唐堃 程欣宇 张健 叶晨 《计算机科学》 北大核心 2025年第7期151-160,共10页
医学图像配准对于多种后处理步骤至关重要。目前基于卷积和Transformer的单流或双流网络架构能够实现良好的配准性能,但在配准性能与计算效率之间仍然难以取得平衡。为了解决这个问题,提出了一种高效的Transformer配准网络EFormer。其... 医学图像配准对于多种后处理步骤至关重要。目前基于卷积和Transformer的单流或双流网络架构能够实现良好的配准性能,但在配准性能与计算效率之间仍然难以取得平衡。为了解决这个问题,提出了一种高效的Transformer配准网络EFormer。其主要由分频器模块(Frequency Division Module, FDM)和广注意力模块(Broad Attention Module, BAM)组成。具体而言,在编解码器中使用多个FDM模拟双流网络并行提取局部-全局信息以提高计算效率;利用BAM增强多个FDM中局部信息的传递以保留配准中重要的语义特征。在3个数据集上的定性和定量比较实验结果表明,相比主流配准模型,EFormer在DSC,ASSD,HD95和雅可比行列式负值百分比4个评价指标上分别至少优化了1.3%,2.6%,0.6%和95%。此外,使用EFormer-tiny时,计算效率(Flops)优化了14%,表明EFormer能够以最快的计算速度在基于Transformer的网络中实现最佳的配准结果。 展开更多
关键词 医学图像配准 分频 广注意力 高效Transformer
在线阅读 下载PDF
基于DeepViT和彩虹散射的含颗粒液滴多参数提取方法
17
作者 黄林滨 李天池 +2 位作者 李灿 李宁 翁春生 《化工进展》 北大核心 2025年第4期1859-1866,共8页
提出了一种基于DeepViT深度学习模型和彩虹散射的含颗粒液滴多参数提取方法,实现了从消光彩虹图像中对宿主液滴粒径和内含物体积分数的同时精确测量。介绍了DeepViT模型的基本组成和实现手段,包括训练数据预处理以及网络超参数的设置。... 提出了一种基于DeepViT深度学习模型和彩虹散射的含颗粒液滴多参数提取方法,实现了从消光彩虹图像中对宿主液滴粒径和内含物体积分数的同时精确测量。介绍了DeepViT模型的基本组成和实现手段,包括训练数据预处理以及网络超参数的设置。随后,展示了含颗粒液滴彩虹光路系统和典型测量信号,分析了该方法在不同粒径和体积分数工况下的测量结果,并与消光彩虹法的测量值对比。本方法在0~0.3%体积分数条件下测量的粒径相对误差均在±0.5%以内,而消光彩虹法最大相对误差约为2%;在120~140μm粒径范围条件下测量内含物体积分数的最大绝对误差小于0.01%。所提出的基于DeepViT方法可快速地实现对动态含颗粒液滴这类非均质液滴的高精度原位参数测量,为含颗粒液滴测量技术的发展提供新思路。 展开更多
关键词 深度学习 彩虹散射 含颗粒液滴 液滴粒径 内含物体积分数 多相流
在线阅读 下载PDF
无人机视角多源目标检测数据集UAV-RGBT及算法基准
18
作者 汪进中 戴顺 +5 位作者 张秀伟 田雪涛 邢颖慧 汪芳 尹翰林 张艳宁 《电子学报》 北大核心 2025年第3期686-704,共19页
基于无人机(Unmanned Aerial Vehicle,UAV)平台的可见光(Red Green Blue,RGB)和热红外(Thermal infrared,T)多源目标检测,可实现全天时、全天候的目标侦察,在军用和民用领域有着重要的应用价值.受限于数据拍摄获取和处理的复杂性,当前... 基于无人机(Unmanned Aerial Vehicle,UAV)平台的可见光(Red Green Blue,RGB)和热红外(Thermal infrared,T)多源目标检测,可实现全天时、全天候的目标侦察,在军用和民用领域有着重要的应用价值.受限于数据拍摄获取和处理的复杂性,当前少有公开的UAV视角RGB-T多源目标检测数据集,一定程度上限制了UAV视角RGB-T多源目标检测算法的研究和应用.与此同时,UAV应用场景复杂多变,其飞行高度、速度、焦距和背景等快速变化,所拍摄目标在图像上呈现出尺度多样、稠密/稀疏分布不均衡、类别不平衡等特点,具有一定的挑战性.此外,在诸如目标侦察、交通监控等高时效性应用场景中,算法需在保证高精度的同时实现实时目标检测,因此,算法的设计必须充分考虑精度与速度之间的平衡.针对上述问题,本文构建了一个跨季节、跨昼夜、多类别、多尺度的大规模UAV视角RGB-T多源图像数据集UAV-RGBT,包含20个类别、5117对RGB-T图像和超11万个标注,有助于推进UAV视角多源目标检测算法的研究.同时,基于YOLOv8n模型,本文提出了一种UAV视角多源目标检测(UAV-based Dualbranch Multispectral object Detection,UAV-DMDet)模型,其通过多源交叉注意力融合和多源特征分解组合方法有效促进了多源特征的深度融合,较好地实现了模型参数量、检测速度和检测精度的均衡.实验结果表明:在UAVRGBT数据集上,UAV-DMDet模型较单源YOLOv8n模型,在RGB和T模态方面,mAP@0.5分别提高了3.61%、11.03%,mAP@0.5:0.95分别提高了0.84%、6.76%;在DroneVehicle数据集上,mAP@0.5和mAP@0.5:0.95较主流算法I2MDet提高了2.66%和12.36%;在检测速度方面,以640×640分辨率图像为例,UAV-DMDet模型在单张GeForce RTX 3090显卡上FP32精度推理速度可达31帧/s,在华为昇腾710处理器上FP16精度推理速度可达58帧/s,可有效应用于UAV视角RGB-T多源实时目标检测任务. 展开更多
关键词 无人机(UAV) 可见光-热红外(RGB-T)多源目标检测 数据集 多源特征融合 YOLOv8
在线阅读 下载PDF
TLIR:基于双层迭代细化模型的有限角CT重建
19
作者 李青 王涛 +2 位作者 强彦 张斌 武炜 《太原理工大学学报》 北大核心 2025年第5期839-854,共16页
【目的】有限角度重建是计算机断层扫描(CT)中典型的不适定问题。在实际应用中,受限于固定式扫描目标可供扫描角度有限和患者承受辐射能力等问题,通常无法获得完整的投影数据,通过传统分析迭代方法重建的图像会出现严重的结构失真和倾... 【目的】有限角度重建是计算机断层扫描(CT)中典型的不适定问题。在实际应用中,受限于固定式扫描目标可供扫描角度有限和患者承受辐射能力等问题,通常无法获得完整的投影数据,通过传统分析迭代方法重建的图像会出现严重的结构失真和倾斜伪影。【方法】针对该问题提出了一种双层迭代细化模型(TLIR)来恢复有限角度CT图像中缺失部分的结构细节,从中重建出高质量的CT图像。具体而言,修改去噪扩散概率模型使之适用于条件图像生成以实现图像域恢复问题,模型输出从噪声混叠的有限角CT图像开始,使用在各种噪声水平下训练的残差U-Net迭代细化输出图像。此外,深度模型在推理过程中会损坏采样部分的正弦数据,对此提出了名为DSEM的可学习模块来恢复被深度模型篡改的正弦数据。将两个模块交替执行,形成双层迭代细化模型。训练和推理过程中,双层迭代的结构也使得网络具备更加强大的鲁棒性。【结果】TLIR在90°和120°有限角度采样下都表现出强大的重建性能,在峰值信噪比方面比现有先进方法平均提升了2.0009 dB和2.5 dB,证明了本模型的有效性。 展开更多
关键词 计算机断层扫描(CT) 迭代重建 有限角度CT重建 扩散模型 数据保真约束
在线阅读 下载PDF
多粒度遮挡特征增强的行人搜索算法
20
作者 苗春玲 张红云 +2 位作者 吴卓嘉 张齐贤 苗夺谦 《智能系统学报》 北大核心 2025年第1期230-242,共13页
现有行人搜索方法着重于从有限的标注场景图中学习有效的行人表征,虽然这些方法取得了一定的效果,但学习更具有身份辨别力的行人表征通常依赖于大规模的标注数据,而获取大规模的标注数据是一个资源、劳动密集型的过程。为此,该文提出了... 现有行人搜索方法着重于从有限的标注场景图中学习有效的行人表征,虽然这些方法取得了一定的效果,但学习更具有身份辨别力的行人表征通常依赖于大规模的标注数据,而获取大规模的标注数据是一个资源、劳动密集型的过程。为此,该文提出了一种场景图多粒度遮挡特征增强算法,对原始场景图进行多粒度随机遮挡,扩充训练数据,并从遮挡后的场景图中生成具有多样化信息的虚拟特征,最后利用生成的虚拟特征增强真实特征中的行人表征。进一步,基于生成对抗学习,该文设计了多粒度特征对齐模块,用于对齐遮挡图像特征和原始图像特征,保持两者语义一致性。实验结果表明,在CUHK-SYSU和PRW数据集上,该算法能够显著提升行人搜索任务的搜索精度。 展开更多
关键词 深度学习 计算机视觉 行人搜索 目标检测 粒计算 数据处理 特征提取 生成对抗网络 对齐
在线阅读 下载PDF
上一页 1 2 62 下一页 到第
使用帮助 返回顶部