期刊文献+
共找到78篇文章
< 1 2 4 >
每页显示 20 50 100
机器视觉技术在大体型家畜无接触体尺测量中的研究进展 被引量:2
1
作者 李振波 孙浩翔 +2 位作者 郭倩男 张涵钰 刘皓南 《农业工程学报》 北大核心 2025年第7期1-12,共12页
家畜体尺能直接反映其生长发育状态,对育种和养殖过程管理具有重要意义。基于机器视觉的家畜无接触体尺测量技术可以解决传统人工接触式测量中耗时、费力和主观误差等问题,同时能够降低养殖人员的劳动强度,避免家畜产生应激反应。近年来... 家畜体尺能直接反映其生长发育状态,对育种和养殖过程管理具有重要意义。基于机器视觉的家畜无接触体尺测量技术可以解决传统人工接触式测量中耗时、费力和主观误差等问题,同时能够降低养殖人员的劳动强度,避免家畜产生应激反应。近年来,随着机器视觉技术的迅猛发展,家畜无接触体尺测量方法也取得了突破性的进步。该研究聚焦于牛、羊、马和猪4种常见大体型家畜,按照体尺测量任务流程,概述了常见的家畜图像采集场景、图像采集设备和设备部署方式。基于近5年机器视觉在家畜无接触体尺测量中的应用,阐述了目前家畜图像分割算法和家畜体尺测量算法的研究现状。当前研究的着重点主要在于加速体尺测量过程,提升测量结果精度,以及增强测量设备的便携性这3个核心方面。结合当前研究中存在的公开数据集不足、深度学习前沿方法应用较少、算法在实际生产中应用和部署困难等问题,提出了未来应围绕应用生成式模型扩充家畜图像数据集、加速深度学习方法的迁移,开发适用多种家畜的通用测量模型等方面展开研究,旨在为后续的研究及应用提供参考。 展开更多
关键词 体尺测量 家畜 机器视觉 深度学习 图像采集 图像分割 数据集
在线阅读 下载PDF
基于语义分割的长白山火山岩性遥感数据集
2
作者 李成范 韩晶鑫 +5 位作者 盘晓东 刘岚 颜丽丽 康建红 刘学锋 肖舟怡 《岩石学报》 北大核心 2025年第4期1442-1453,共12页
火山岩性数据集是利用深度学习进行火山遥感岩性智能识别的关键和数据基础。当前,缺乏可信的火山岩性遥感数据集,制约了大区域、复杂地质环境下火山岩性智能识别的快速发展。本文在归纳和整合长白山火山岩性主要类型的基础上,以哨兵2(Se... 火山岩性数据集是利用深度学习进行火山遥感岩性智能识别的关键和数据基础。当前,缺乏可信的火山岩性遥感数据集,制约了大区域、复杂地质环境下火山岩性智能识别的快速发展。本文在归纳和整合长白山火山岩性主要类型的基础上,以哨兵2(Sentinel-2)遥感图像为数据源,结合地质资料和野外核查制作了一个基于深度学习语义分割的长白山火山岩性遥感数据集。该数据集内容包含遥感图像、标签数据、说明文件,岩性类型覆盖玄武质火山岩、粗面质火山岩、碱流质火山岩、火山岩性混合堆积(碎屑堆积、火山泥流堆积、火山空落堆积);共计36张样本图像,单张图像尺寸为395像元×395像元,空间分辨率为10m。利用经典的深度卷积神经网络(deep convolution neural network,DCNN)DeepLab V3+模型对火山岩性数据集进行了测试和验证,实验结果表明本文数据集具有较强的火山岩性描述能力,鲁棒性和泛化性较好,总体准确率均高于88%;特征训练与提取过程中人为干扰较少,自动化水平较高。可为火山岩性智能识别提供数据基础,提高野外火山遥感岩性调查的准确性和效率。 展开更多
关键词 长白山火山 语义分割 岩性数据集 岩性识别 遥感图像
在线阅读 下载PDF
沥青拌和站混合料装车场景小样本语义分割
3
作者 郭涛 夏晓华 +3 位作者 霍少波 李晓娟 孙建红 侯广涛 《公路工程》 2025年第5期223-231,共9页
针对深度学习在沥青拌和站混合料装车场景图像语义分割中数据量有限而导致的模型易过拟合、网络泛化能力不足等问题,提出了一种优化后的小样本语义分割方法。首先修改SegNet模型的主干网络,建立ResNet50-SegNet模型,然后将该模型解码器... 针对深度学习在沥青拌和站混合料装车场景图像语义分割中数据量有限而导致的模型易过拟合、网络泛化能力不足等问题,提出了一种优化后的小样本语义分割方法。首先修改SegNet模型的主干网络,建立ResNet50-SegNet模型,然后将该模型解码器部分的标准卷积替换为深度可分离卷积,最后结合迁移学习对沥青拌和站混合料装车场景图像进行语义分割。改进后的模型具有更深的网络结构和更好的特征提取能力。采用深度可分离卷积替换标准卷积能够减少模型参数量,使模型更加轻量化,避免过拟合。通过迁移学习加速模型的训练速度、提高模型的泛化能力,有效地解决了数据不足带来的模型精度不高等问题。试验结果表明,提出的模型在数据集只有120幅图像样本的条件下准确率为99.36%,mIoU值为98.72%,FPS值为30.51,与原始模型相比分别提高了4.24个百分点、8.03个百分点和18.62,并且与经典模型和先进模型相比在小样本条件下获得了更好的分割效果。模型结合以上3种方法,取得了较高的准确率、mIoU值及FPS值,具有良好应用前景。 展开更多
关键词 道路建筑施工 小样本语义分割 深度可分离卷积 迁移学习 混合料装车 沥青拌和站
在线阅读 下载PDF
基于边缘感知DeepLabV3+模型的耕地系统生境类型识别方法
4
作者 边振兴 姚舒译 +2 位作者 刘晓雨 王楚翘 刘佳玥 《农业工程学报》 北大核心 2025年第18期280-290,共11页
针对耕地系统生境分类标准缺失、类型覆盖不全,以及现有模型难以协同语义与边缘特征导致多尺度生境(大尺度田块与微型生境)分割精度低、边界模糊等问题,该研究拟构建包含15类耕地系统生境的类别完备、标注精细的超高分辨率遥感影像数据... 针对耕地系统生境分类标准缺失、类型覆盖不全,以及现有模型难以协同语义与边缘特征导致多尺度生境(大尺度田块与微型生境)分割精度低、边界模糊等问题,该研究拟构建包含15类耕地系统生境的类别完备、标注精细的超高分辨率遥感影像数据集,提出边缘感知DeepLabV3+模型。该模型编码器使用分层可变形卷积,保证精度同时减少88.85%训练参数量;解码器集成多尺度特征与双模态边缘感知以实现细节语义特征融合,引入混合损失函数和分层差异化学习率进行优化。基于此数据集的试验表明,该模型平均交并比和准确率达到66.55%和80.31%,较基准网络提升9.74%和4.05%。消融试验验证了双模态边缘感知具有互补性,使田埂等微型生境交并比提升6.99%~36.56%。该研究构建了基于边缘感知语义分割的耕地系统生境识别方法,以较低成本实现米级精度识别,为精细化耕地生境监测提供有效技术支撑。 展开更多
关键词 边缘感知 DeepLabV3+ 超高分辨率遥感影像 耕地系统生境数据集 多尺度特征融合 语义分割
在线阅读 下载PDF
CAMF-Net:基于上下文感知的高分辨率无人机图像语义分割模型
5
作者 程尧 左伟庆 +4 位作者 崔泽宇 夏国臻 刘诚锴 周晨 郭兰图 《湘潭大学学报(自然科学版)》 2025年第1期36-52,共17页
该文首先介绍了校园场景无人机图像语义分割数据集,这是一个用于校园场景语义分割的新型高分辨率无人机图像数据集.该数据集包含2 767张航拍图像,每张图像都标注了5个类别,用于语义注释任务.此外,通过采用交叉注意力来增强传统的U-Net架... 该文首先介绍了校园场景无人机图像语义分割数据集,这是一个用于校园场景语义分割的新型高分辨率无人机图像数据集.该数据集包含2 767张航拍图像,每张图像都标注了5个类别,用于语义注释任务.此外,通过采用交叉注意力来增强传统的U-Net架构,有效地融合不同分辨率下的特征,促进特征交互.这种方法解决了传统U-Net中由于下采样导致的层间信息分布不均匀的问题,确保了各级特征的完整性,从而更全面地表征图像.在校园场景无人机图像语义分割数据集上的验证显示,与其他经典方法相比,该文的方法将平均交并比提高了约2.3%.校园场景无人机图像语义分割数据集现可通过以下链接下载:https://drive.google.com/file/d/1rm-9MumRAXhe_jrFJ0igyDDiflfExvuD/view?usp=drive_link. 展开更多
关键词 无人机 语义分割 数据集 U-Net 交叉注意力 多尺度融合
在线阅读 下载PDF
基于改进PointNet++的船舶管路重建方法
6
作者 冯彦淏 邓志杰 +2 位作者 刘维 沈彬 王皓 《机械设计与研究》 北大核心 2025年第5期86-92,共7页
船舶的管路系统是船舶可靠运行的保障,具有零部件种类多和结构复杂的特点。针对船舶管路系统在维护与替换过程中重建效率低和精度差的问题,对经典的点云深度学习网络PointNet++进行了改进,提出了一种船舶管路的重建方法。通过构建管路... 船舶的管路系统是船舶可靠运行的保障,具有零部件种类多和结构复杂的特点。针对船舶管路系统在维护与替换过程中重建效率低和精度差的问题,对经典的点云深度学习网络PointNet++进行了改进,提出了一种船舶管路的重建方法。通过构建管路部件分割数据集,生成了高质量训练样本;对PointNet++模型采取多尺度采样半径调整和损失均衡化的改进策略,使其能够准确和均衡地捕捉各类部件的局部特征;根据分割结果求解出零部件特征参数和零部件之间的连接关系,实现了拓扑结构的恢复和管路的重建。实验结果显示,改进后的PointNet++模型在管路部件分割精度上取得了提升,对少数类部件的识别和分割更为精准;在管路重建方面实现了较高的精度,同时也保证了安装精度和可替换性,验证了所提方法可以满足实际船舶维修中高精度、自动化重建管路的需求,有效提升了管路替换的生产效率和可靠性。 展开更多
关键词 管路重建 虚拟数据集 点云分割 PointNet++
原文传递
SWLS:沙湾市遥感图像土地覆盖语义分割数据集
7
作者 卢毅果 钱育蓉 +3 位作者 白璐 范迎迎 李志财 刘鹏 《新疆大学学报(自然科学版中英文)》 2025年第4期434-443,共10页
近年来,随着国产高分卫星数据获取的便利性提升,遥感图像在城市扩展监测、水资源管理及农业应用等领域的解译需求愈发迫切,遥感图像语义分割技术逐渐成为核心手段之一,高质量的基准数据集是训练和评估遥感图像语义分割算法的基础.现有... 近年来,随着国产高分卫星数据获取的便利性提升,遥感图像在城市扩展监测、水资源管理及农业应用等领域的解译需求愈发迫切,遥感图像语义分割技术逐渐成为核心手段之一,高质量的基准数据集是训练和评估遥感图像语义分割算法的基础.现有土地覆盖语义分割数据集大多缺乏近红外波段,地物标注精细度和多样性不足,且缺少新疆特有地貌的数据支持,限制了模型在特定地区实际应用的效果.为此,提出了一个专注于新疆沙湾市的高分辨率多光谱卫星遥感图像土地覆盖语义分割数据集Shawan Land-cover Semantic Segmentation Dataset(SWLS),该数据集基于高分一号卫星(GF-1)的多光谱图像,涵盖了RGB和近红外4个波段,具有更精细的地物标注,尤其在防风林和建筑物等复杂类别上具备差异化标注.在SWLS数据集上对多种经典卷积神经网络和Transformer架构的语义分割模型进行了全面评估,卷积架构模型最高mIoU为87.46%,Transformer架构最高mIoU为69.83%. 展开更多
关键词 高分卫星 遥感图像 语义分割 数据集
在线阅读 下载PDF
基于深度学习的肾脏超声图像分割:现状与挑战
8
作者 尹诗 施振扬 +2 位作者 吴梦麟 蔡金燕 余德 《计算机科学》 北大核心 2025年第9期16-24,共9页
肾脏超声图像分割作为一项关键的临床任务,在疾病诊断和治疗规划中发挥着重要作用。该综述系统回顾了2017至2024年间肾脏超声图像分割领域的重要研究成果,重点分析了二维和三维分割技术及异常病变肾脏分割方法。对于二维超声图像,总结了... 肾脏超声图像分割作为一项关键的临床任务,在疾病诊断和治疗规划中发挥着重要作用。该综述系统回顾了2017至2024年间肾脏超声图像分割领域的重要研究成果,重点分析了二维和三维分割技术及异常病变肾脏分割方法。对于二维超声图像,总结了4类分割技术方法:1)基于纹理特征提取的传统分割方法;2)U-Net及其改进架构;3)融合肾脏形状和边界先验知识的深度监督学习方法;4)多模态信息融合分割技术。此外,详细梳理了当前公开可用的数据集和标准化评估指标,为后续研究提供了可靠的比较基准。尽管当前二维分割方法已取得显著进展,但仍面临诸多挑战:精细解剖结构的分割精度有待提升,三维分割技术尚未成熟,异常病变分割研究明显不足,以及高质量训练数据严重匮乏等关键问题。这些技术瓶颈的突破将直接决定该领域研究成果的临床转化前景。展望未来,需要重点发展精细结构与三维分割技术、探索跨模态学习方法、深化组织特征信息融合策略,并着力构建大模型和高质量数据集,以全面提升肾脏超声分割技术的临床应用价值。 展开更多
关键词 肾脏超声分割 深度学习 肾脏异常 评估指标 公开数据集
在线阅读 下载PDF
汉字计算机字库笔画标注数据集 被引量:1
9
作者 廖丹青 王存睿 战国栋 《大连民族大学学报》 2025年第1期53-58,共6页
在使用深度学习辅助计算机字库生成汉字的过程中,常面临笔画黏连、笔画错误和风格细节不足等问题。为了提高生成模型的质量,结合字体设计行业的实际需求,构建了包含71种笔画、1 960个汉字字符的笔画标注数据集。该数据集涵盖了不同结构... 在使用深度学习辅助计算机字库生成汉字的过程中,常面临笔画黏连、笔画错误和风格细节不足等问题。为了提高生成模型的质量,结合字体设计行业的实际需求,构建了包含71种笔画、1 960个汉字字符的笔画标注数据集。该数据集涵盖了不同结构和复杂度的汉字,71种笔画是在GB13000.1标准的32类笔画基础上结合行业实际扩展出来的类别。使用Labelme工具对数据集进行人工标注,并将标注的汉字图像生成的JSON数据转换为VOC格式,最终得到8位笔画图像数据集。通过使用FCN、U-Net和Seg Net对数据集进行测试,并将原始图像与预测结果进行对比,结果显示预测效果良好,且评价指标MPA、MIoU及FWIoU所得数值均良好,证明了该数据集的有效性。 展开更多
关键词 自定义数据集 字体风格迁移 笔画分割 深度学习
在线阅读 下载PDF
不同标注质量混凝土裂缝数据集对语义分割模型性能的影响
10
作者 何吉 郑雯婷 《计算机应用文摘》 2025年第17期57-59,共3页
为探究不同标注质量的混凝土裂缝数据集对语义分割模型性能的影响,文章构建了高质量标注和低质量标注的混凝土裂缝数据集,并将两类数据集分别应用于U-Net,DeepLabv3+和PSPNet等语义分割模型,开展深入对比实验。结果表明,3种模型在高质... 为探究不同标注质量的混凝土裂缝数据集对语义分割模型性能的影响,文章构建了高质量标注和低质量标注的混凝土裂缝数据集,并将两类数据集分别应用于U-Net,DeepLabv3+和PSPNet等语义分割模型,开展深入对比实验。结果表明,3种模型在高质量标注数据集上的各项机器学习指标均明显优于低质量标注数据集,说明高质量的标注能够有效提升语义分割模型的性能。该成果明确了数据集标注质量对语义分割模型性能的关键影响,为语义分割技术的发展与应用提供了有力支持。 展开更多
关键词 语义分割模型 数据集 标注质量
在线阅读 下载PDF
图像簇块扩张卷积驱动的工业相机颜色恒常系统
11
作者 陈湘军 《实验室研究与探索》 北大核心 2025年第10期105-112,共8页
为解决工业相机颜色恒常性任务中存在高质量数据集匮乏与实时处理的需求的问题,提出了一种结合数据增强与轻量网络方法。通过归一化光照色度均匀采样策略和图像簇块分割扩展数据集,解决标签分布不均和样本不足的问题;设计了一个由特征... 为解决工业相机颜色恒常性任务中存在高质量数据集匮乏与实时处理的需求的问题,提出了一种结合数据增强与轻量网络方法。通过归一化光照色度均匀采样策略和图像簇块分割扩展数据集,解决标签分布不均和样本不足的问题;设计了一个由特征提取模块和融合模块组成的5层卷积分段网络,在保证精度的同时显著降低了复杂度。实验结果表明,在Gehler-Shi/NUS数据集上,中位数误差分别仅为2.17°和2.73°。在部署工业相机并集成FPGA后,平均角度误差为1.52°,处理延迟≤10 ms,可支持4K@30f/s实时色彩校正。该方法在实现接近最优精度的同时,具备了更高的稳定性和处理效率,为工业复杂光照环境下的实时色彩校正提供了可靠解决方案。 展开更多
关键词 颜色恒常性 归一均匀采样 簇块扩张卷积 分段神经网络 扩展数据集
在线阅读 下载PDF
SWCC:新疆农作物遥感图像语义分割基准数据集
12
作者 张妍 卢毅果 +1 位作者 范迎迎 钱育蓉 《微电子学与计算机》 2025年第9期25-33,共9页
农作物语义分割能够识别图像中的不同农作物区域,提供像素级别的细粒度信息,有助于相关农业研究人员更好地了解农田资源的分布和状态,从而支持更精确的农业管理和决策过程。提出了一个新的农作物语义分割基准数据集(Shawan Crop Classif... 农作物语义分割能够识别图像中的不同农作物区域,提供像素级别的细粒度信息,有助于相关农业研究人员更好地了解农田资源的分布和状态,从而支持更精确的农业管理和决策过程。提出了一个新的农作物语义分割基准数据集(Shawan Crop Classification Dataset,SWCC)。该数据采集自中国新疆沙湾地区,由Gaofen-1卫星拍摄,包含分辨率为2 m全色和8 m多光谱的数据,经过融合之后得到2 m的多光谱数据。SWCC数据集中的所有对象都通过精准目视解译与实地考察,标注了5个类别。与现有的专用农作物语义分割数据集相比,SWCC数据集具有3个特点:覆盖新疆多样农作物类别,具有高度的代表性,为农业科学研究提供了宝贵的数据资源;实现2m高分辨率多光谱数据融合,显著提升图像细节与信息量;选取RGB和近红外4个波段,全面提取农作物特征信息。基于SWCC数据集,本文评估了几种先进的算法,为基于深度学习的农作物语义分割方法提供了基准,这对于评估算法的改进是有价值的。 展开更多
关键词 农作物语义分割 深度学习 基准数据集 高光谱 多光谱
在线阅读 下载PDF
基于深度学习的航空点云语义分割研究进展
13
作者 潘洁晨 邢帅 +3 位作者 曹家印 戴莫凡 黄高爽 职露 《地球信息科学学报》 北大核心 2025年第9期1999-2020,共22页
【意义】随着遥感测绘与自动驾驶技术的快速发展,三维点云语义分割作为数字孪生系统的核心基础技术,其研究热度持续升温。航空点云语义分割被认为是有望提升三维地理信息系统的自动化、智能化的关键技术之一。【分析】在深度学习技术和... 【意义】随着遥感测绘与自动驾驶技术的快速发展,三维点云语义分割作为数字孪生系统的核心基础技术,其研究热度持续升温。航空点云语义分割被认为是有望提升三维地理信息系统的自动化、智能化的关键技术之一。【分析】在深度学习技术和激光雷达(Light Detection and Ranging,LiDAR)、深度相机、三维激光扫描仪等传感器的推动下,点云语义分割技术通过精确的特征提取和高效的模型训练能够实现大规模点云数据的自动分类和高精度识别。然而,相比于高密度、类别均衡的典型点云语义分割数据集(如室内点云数据或自动驾驶和机器人领域的室外点云数据),航空点云由于其特有的数据特性(如大范围三维地形覆盖、动态平台运动误差累积、地物空间尺度差异大、复杂地物遮挡等因素),在点云配准、特征提取等关键环节仍面临显著挑战,目前基于深度学习的航空点云语义分割研究仍处于起步阶段。同时,受限于数据不同获取方式、不同分辨率、不同属性信息,现有研究距离算法落地应用还有一段距离。【进展】本文旨在对这一领域的发展进行全面的分析研究,包括各类适应算法的特点、数据集、性能指标和最新提出的方法,以及它们的优势和局限性。此外,本文还提供与现有技术水平的定量比较,对有代表性的方法进行研究,包括精度分析和适用性能分析。【展望】最后,总结分析航空点云语义分割技术突破亟需在特征表达、多模态融合、小样本学习、点云语义分割算法可解释性及大模型基准构建等多个维度开展系统性研究创新,不仅有助于解决当前算法在实际部署中的瓶颈问题,还可为数字孪生城市、灾害应急响应等重大应用提供可靠的技术支撑。 展开更多
关键词 航空点云 语义分割 三维地理信息 深度学习 特征提取 数据集 注意力机制
原文传递
图像分割与多尺度注意力Transformer结合的真实视图三维重建
14
作者 郝森烜 肖易寒 《应用科技》 2025年第1期189-197,共9页
为了解决在真实视图上三维重建效果不佳的问题,提出图像分割与多尺度注意力Transformer结合的真实视图三维重建方法。该方法分为原始图像分割和三维重建2部分,首先从多视角真实视图中用改进的DeepLabv3+模型分割出目标图像,然后送入引... 为了解决在真实视图上三维重建效果不佳的问题,提出图像分割与多尺度注意力Transformer结合的真实视图三维重建方法。该方法分为原始图像分割和三维重建2部分,首先从多视角真实视图中用改进的DeepLabv3+模型分割出目标图像,然后送入引入多尺度注意力的Transformer模型输出重建结果。图像分割部分将原DeepLabv3+模型的主干网络换成优化的MobileNetv2网络以降低模型参数量。三维重建部分首先把由粗到细的多尺度注意力机制引入Transformer网络来聚合全局到局部的特征;再使用引入多尺度立方体注意力机制的细化器修正体素模型,提高重建精度。在ShapeNet数据集和真实视图数据集上进行验证,实验结果表明此方法可以提高真实视图三维重建的速度和精度,且优于多个重建模型。 展开更多
关键词 真实视图 三维重建 体素模型 Transformer模型 注意力机制 图像分割 DeepLabv3+模型 ShapeNet数据集
在线阅读 下载PDF
基于跨数据集多任务学习的透明物体语义分割
15
作者 朱松豪 吴家骏 孙冬轩 《南京邮电大学学报(自然科学版)》 北大核心 2025年第6期87-96,共10页
由于透明物体具有透视、反射等特性,使得用于自然图像语义分割的传统网络模型难以准确判断透明物体图像像素的语义类别,从而导致如何准确识别透明物体边界成为当前透明物体语义分割的主要挑战。为提升透明物体语义分割任务中的准确性,... 由于透明物体具有透视、反射等特性,使得用于自然图像语义分割的传统网络模型难以准确判断透明物体图像像素的语义类别,从而导致如何准确识别透明物体边界成为当前透明物体语义分割的主要挑战。为提升透明物体语义分割任务中的准确性,提出一种跨数据集多任务的透明物体语义分割模型。该模型以Transformer作为骨干网络,并利用深度信息估计和边缘信息估计两个分支任务辅助语义分割主任务。深度信息估计分支有助于精确识别物体的空间结构,边缘信息估计分支有助于准确提取物体的边界特征,从而提高模型对透明物体在复杂场景中的位置、边界及形状的识别精度。此外,文中使用两类数据集进行半监督的跨数据集训练,即基于精细类别标注数据集训练的模型为粗略类别标注数据集的分割结果提供伪标签,实现训练数据集的扩充及重要特征的融合。Trans10k_V2、MSD、TROSD等公开数据集的实验结果表明,与其他分割方法相比,所提的跨数据集多任务模型有效提高了透明物体语义分割的平均交并比及准确率。 展开更多
关键词 跨数据集 多任务学习 透明物体 语义分割
在线阅读 下载PDF
An Analysis of OpenSeeD for Video Semantic Labeling
16
作者 Jenny Zhu 《Journal of Computer and Communications》 2025年第1期59-71,共13页
Semantic segmentation is a core task in computer vision that allows AI models to interact and understand their surrounding environment. Similarly to how humans subconsciously segment scenes, this ability is crucial fo... Semantic segmentation is a core task in computer vision that allows AI models to interact and understand their surrounding environment. Similarly to how humans subconsciously segment scenes, this ability is crucial for scene understanding. However, a challenge many semantic learning models face is the lack of data. Existing video datasets are limited to short, low-resolution videos that are not representative of real-world examples. Thus, one of our key contributions is a customized semantic segmentation version of the Walking Tours Dataset that features hour-long, high-resolution, real-world data from tours of different cities. Additionally, we evaluate the performance of open-vocabulary, semantic model OpenSeeD on our own custom dataset and discuss future implications. 展开更多
关键词 Semantic segmentation Detection LABELING OpenSeeD Open-Vocabulary Walking Tours dataset VIDEOS
在线阅读 下载PDF
DU-Net:一种协同优化模型的小样本脑血管分割方法
17
作者 张灿 陈铎友 +3 位作者 王周 陈云青 陈诚 肖若秀 《工程科学学报》 北大核心 2025年第9期1862-1872,共11页
脑血管分割是脑血管疾病筛选、病理发展追踪和精准手术治疗的重要基础.受限于患者隐私保护和脑血管复杂的手工标注,现有的脑血管公开数据集样本少、人工标注信息不足,从而限制发展高性能的脑血管分割方法.为解决上述问题,本文提出了一... 脑血管分割是脑血管疾病筛选、病理发展追踪和精准手术治疗的重要基础.受限于患者隐私保护和脑血管复杂的手工标注,现有的脑血管公开数据集样本少、人工标注信息不足,从而限制发展高性能的脑血管分割方法.为解决上述问题,本文提出了一种粗–精分割的Double U-Net协同优化模型(DU-Net),旨在提高小样本相位对比磁共振血管成像(Phase contrast magnetic resonance angiography,PC-MRA)脑血管分割数据集下的性能表现.首先,DU-Net的两部分路径骨干由3D U-Net构成,其中粗分割路径采用低通道数量的轻量卷积核,从而减少协同训练负担,实现脑血管拓扑特征的初步学习.接着,将拓扑形态传递到精分割路径,从而为模型补偿泛化特征.此外,在精分割路径的跳跃连接部分引入了压缩激励(Squeeze and excitation,SE)模块,为目标区域赋予更高的学习权重.实验结果显示,DU-Net在小样本脑血管数据集上的查准率、查全率、杰卡德系数和Dice系数分别是78.29%、67.91%、57.81%和72.59%,综合表现最优.结果表明,DU-Net具备更强的特征学习与识别能力,能够在小样本数据集上实现精确脑血管分割. 展开更多
关键词 脑血管分割 深度学习 相位对比磁共振血管成像 小样本数据集 协同优化 压缩激励模块
在线阅读 下载PDF
基于深度学习的三维点云分割综述 被引量:20
18
作者 卢健 贾旭瑞 +3 位作者 周健 刘薇 张凯兵 庞菲菲 《控制与决策》 EI CSCD 北大核心 2023年第3期595-611,共17页
作为三维场景理解的重要技术之一,三维点云分割受到广泛的关注,具有重要的研究价值和广阔的应用前景.基于此,梳理基于深度学习的三维点云分割技术的最新研究进展;在介绍三维点云分割常用的8个室内和室外数据集的基础上,重点阐述和分析... 作为三维场景理解的重要技术之一,三维点云分割受到广泛的关注,具有重要的研究价值和广阔的应用前景.基于此,梳理基于深度学习的三维点云分割技术的最新研究进展;在介绍三维点云分割常用的8个室内和室外数据集的基础上,重点阐述和分析现有主要基于深度学习的语义分割、实例分割和部件分割方法,并基于量化数据进行部分方法的效能比较;最后从10个方面总结现有方法的不足,并针对性地提出工作展望. 展开更多
关键词 深度学习 三维点云 数据集 语义分割 实例分割 部件分割
原文传递
一种改进FCN的输电线路航拍图像语义分割方法 被引量:11
19
作者 赵振兵 李胜利 +2 位作者 戚银城 翟永杰 张珂 《中国科技论文》 CAS 北大核心 2018年第14期1614-1620,共7页
针对输电线路航拍图像中存在的背景复杂,绝缘子外观多样,导/地线相对细小,关键目标间相互遮挡等难点问题,传统的分割方法中人工选取特征对多类目标分割普适性较低,分割效果相对较差等不足,提出了一种改进全卷积网络的输电线路航拍图像... 针对输电线路航拍图像中存在的背景复杂,绝缘子外观多样,导/地线相对细小,关键目标间相互遮挡等难点问题,传统的分割方法中人工选取特征对多类目标分割普适性较低,分割效果相对较差等不足,提出了一种改进全卷积网络的输电线路航拍图像语义分割方法。首先构建了输电线路航拍可见光图像语义分割数据集,训练深度网络达到对关键部件分割的目的;其次在全卷积网络语义分割方法的基础上,改进深度网络,在网络提取的深度特征上采样阶段采用多尺度的膨胀卷积;最后加入概率图模型条件随机场进一步优化分割效果。实验结果表明,所提方法平均像素分类精确度提高了2.43%,均交并比提高了3.53%,实现了输电线路航拍图像绝缘子、线路金具、导/地线、杆塔关键部件端到端的自动化分割。 展开更多
关键词 输电线路 航拍图像 语义分割 全卷积网络 数据集
在线阅读 下载PDF
基于红外注意力提升机制的热成像测温区域实例分割 被引量:4
20
作者 易诗 李俊杰 贾勇 《电子与信息学报》 EI CSCD 北大核心 2021年第12期3505-3512,共8页
AI+热成像人体温度监测系统被广泛用于人群密集的人体实时温度测量。此类系统检测人的头部区域进行温度测量,由于各类遮挡,温度测量区域可能太小而无法正确测量。为了解决这个问题,该文提出一种融合红外注意力提升机制的无锚点实例分割... AI+热成像人体温度监测系统被广泛用于人群密集的人体实时温度测量。此类系统检测人的头部区域进行温度测量,由于各类遮挡,温度测量区域可能太小而无法正确测量。为了解决这个问题,该文提出一种融合红外注意力提升机制的无锚点实例分割网络,用于实时红外热成像温度测量区域实例分割。该文所提出的实例分割网络在检测阶段和分割阶段融合红外空间注意力模块(ISAM),旨在准确分割红外图像中的头部裸露区域,以进行准确实时的温度测量。结合公共热成像面部数据集和采集的红外热成像数据集,制作了"热成像温度测量区域分割数据集"用于网络训练。实验结果表明:该方法对红外热成像图像中头部裸露测温区域的平均检测精度达到88.6%,平均分割精度达到86.5%,平均处理速度达到33.5 fps,在评价指标上优于大多数先进的实例分割方法。 展开更多
关键词 红外热成像 人体体温监测系统 红外注意力提升机制 无锚点实例分割网络 热成像温度测量区域分割数据集
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部