基于扩散模型多模态提示的电力人员行为图像生成

Image generation for power personnel behaviors based on diffusion model with multimodal prompts

下载PDF

导出

摘要电力人员行为的特殊性与复杂性导致其图像数据稀缺,给数据驱动下的行为识别带来了挑战.在稳定扩散模型的基础上,充分融合人体骨架、掩膜以及文本描述信息,加入关键点损失函数,建立多模态条件控制的电力人员行为图像生成模型PoseNet,该模型可以生成高质量的可控人体图像.设计基于关键点相似度的图像滤波器,以去除错误、低质量的生成图像;采用双阶段训练策略,在通用数据上对模型进行预训练,并在私有数据上微调,提升模型性能;针对电力人员行为特点,设计集通用、专用评价指标于一体的生成图像评价指标集,分析不同评价指标下的图像生成效果.实验结果表明,与主流人体生成模型ControlNet、HumanSD相比,该模型的生成结果更精准、真实、效果更优. A multimodal conditional-control image generation model PoseNet for power personnel behaviors was established to address the challenges posed to data-driven behavior identification due to the scarcity of image data caused by the unique and complex nature of power personnel behaviors.On the basis of the stable diffusion model,the human skeleton,mask and text description information were fully integrated,and the key point loss function was added to the model,enabling the model to generate high-quality and controllable human body images.An image filter based on the similarity of the key points was designed to remove the erroneous and low-quality generated images,and the two-stage training strategy was used to pre-train the model on the generic data and fine-tune the model on the private data to improve the model performance.For the behavioral characteristics of the power personnel,a set of evaluation metrics for generating images integrating the generic and specialized evaluation metrics was designed,and the image generation performance under different evaluation metrics was analyzed.The experimental results showed that compared with the mainstream human generation models ControlNet and HumanSD,this model achieved more accurate,realistic and superior results.

作者朱志航闫云凤齐冬莲 ZHU Zhihang;YAN Yunfeng;QI Donglian(College of Electrical Engineering,Zhejiang University,Hangzhou 310027,China;Hainan Institute of Zhejiang University,Sanya 572025,China)

机构地区浙江大学电气工程学院浙江大学海南研究院

出处《浙江大学学报(工学版)》北大核心 2026年第1期43-51,70,共10页 Journal of Zhejiang University(Engineering Science)

关键词条件图像生成模型数据扩充人体关键点图像分割扩散模型深度学习 conditional image generation model data augmentation human body keypoint image segmentation diffusion model deep learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1王刘旺.机器视觉技术在电力安全监控中的应用综述[J].浙江电力,2022,41(10):16-26. 被引量：17
2赵振兵,张薇,翟永杰,赵文清,张珂,孔英会,戚银城.电力视觉技术的概念、研究现状与展望[J].电力科学与工程,2020,36(1):1-8. 被引量：40
3齐冬莲,韩译锋,周自强,闫云凤.基于视频图像的输变电设备外部缺陷检测技术及其应用现状[J].电子与信息学报,2022,44(11):3709-3720. 被引量：34
4闫云凤,陈汐,金浩远,齐冬莲,储海东,汪金维.基于计算机视觉的电力作业人员行为分析研究现状与展望[J].高电压技术,2024,50(5):1842-1854. 被引量：16
5陈佛计,朱枫,吴清潇,郝颖明,王恩德,崔芸阁.生成对抗网络及其在图像生成中的应用研究综述[J].计算机学报,2021,44(2):347-369. 被引量：115
6张美锋,谭翼坤,陈世俊,王怀祥.基于DAGAN的电气设备小样本红外图像生成技术与应用[J].电工技术,2023(6):76-79. 被引量：1
7何宇浩,宋云海,何森,周震震,孙萌,陈毅,闫云凤.面向电力缺陷场景的小样本图像生成方法[J].浙江电力,2024,43(1):126-132. 被引量：5
8杨剑锋,秦钟,庞小龙,贺志华,崔春晖.基于深度学习网络的输电线路异物入侵监测和识别方法[J].电力系统保护与控制,2021,49(4):37-44. 被引量：73
9王德文,李业东.基于WGAN图片去模糊的绝缘子目标检测[J].电力自动化设备,2020,40(5):188-194. 被引量：21
10黄文琦,许爱东,明哲,唐吉霖,胡浩基,邓子杰.基于生成对抗网络的变电站工作人员行为预测的方法[J].南方电网技术,2019,13(2):45-50. 被引量：16

二级参考文献259

1黄南天,杨学航,蔡国伟,宋星,陈庆珠,赵文广.采用非平衡小样本数据的风机主轴承故障深度对抗诊断[J].中国电机工程学报,2020,40(2):563-574. 被引量：38
2刘行谋,田浩,杨永明,王燕,赵小翔.复杂环境背景下绝缘子缺陷图像检测方法研究[J].电子测量与仪器学报,2022,36(2):57-67. 被引量：25
3王德文,杨凯华.基于生成式对抗网络的窃电检测数据生成方法[J].电网技术,2020,44(2):775-782. 被引量：62
4姚晓通,刘力,李致远.基于Canny边缘特征点的接触网绝缘子识别方法[J].电瓷避雷器,2020(1):142-148. 被引量：23
5赵一展,周吕,潘元进,马俊,李佳豪.一般消费级无人机的树障监测精度验证[J].测绘通报,2021(S01):159-164. 被引量：5
6彭明智,许尧,胡永波,吴永恒,袁洪德.基于人工智能技术的变电站二次设备智能巡检技术[J].高电压技术,2023,49(S01):90-96. 被引量：55
7王刘旺,周自强,林龙,韩嘉佳.人工智能在变电站运维管理中的应用综述[J].高电压技术,2020,46(1):1-13. 被引量：95
8张运楚,梁自泽,傅思遥,谭民,吴功平.基于结构约束的架空输电线路巡线机器人障碍识别[J].机器人,2007,29(1):1-6. 被引量：24
9石延辉,罗毅,涂光瑜,吴彤.一种适用于隔离开关的边缘提取算法[J].继电器,2007,35(12):23-26. 被引量：4
10黄宇,付琨,吴一戎.基于Markov随机场K-Means图像分割算法[J].电子学报,2009,37(12):2700-2704. 被引量：21

共引文献360

1杜文风,王英奇,王辉,赵艳男,高博青,董石麟.基于边界平衡生成对抗网络的十字板式节点新构形智能生成方法[J].建筑结构学报,2022,43(S01):315-324. 被引量：4
2刘兰兰,万旭东,汪志刚,张建,彭昊,杨嘉妮.基于超分辨率重建与多尺度特征融合的输电线路缺陷检测方法[J].电子测量与仪器学报,2023,37(1):130-139. 被引量：33
3李健,庞留记,吴浩,王心宇.融合注意力机制的改进Mask-RCNN遥感影像建筑物提取[J].测绘科学,2024,49(1):79-89. 被引量：9
4焦润童,倪虹霞,王智昱.基于Faster RCNN算法的输电线路防震锤识别研究[J].长春工程学院学报（自然科学版）,2021,22(1):38-43. 被引量：6
5杨基础,董燊,杨小民.海藻糖对固定化酶的保护作用[J].化工学报,2000,51(2):193-197. 被引量：22
6闫振琪,盛林泉,陈新明,王富连.萨福克肉用羊杂交试验[J].中国草食动物,2000,2(1):22-23. 被引量：3
7金玥佟,杨耀权,杜永昂.电力监控场景下基于光流特征点的目标跟踪算法[J].电力科学与工程,2020,36(5):40-47. 被引量：2
8顾洁,孟璐,朱曈彤,刘书琪,金之俭.数据驱动的无精确建模含源配电网无功运行优化[J].电力自动化设备,2021,41(1):1-8. 被引量：22
9陈月卿,胡琳,吴毅翔,郑剑辉,张振兴,杨艳,王波.基于改进BOF算法的压板状态识别方法研究[J].智慧电力,2021,49(2):99-106. 被引量：7
10赵振兵,张帅,蒋炜,吴鹏.基于DBSCAN-FPN的输电线路螺栓缺销检测方法[J].中国电力,2021,54(3):45-54. 被引量：16

1马英,乔露宁.高质量发展背景下公立医院全面预算管理优化路径研究[J].中国总会计师,2025(10):142-144. 被引量：1
2Zhenyi LIAO,Qingsong XIE,Zhijie DENG.LOVECon:text-driven training-free long video editing with ControlNet[J].Science China(Information Sciences),2025,68(10):139-140.
3文海名,孙昱,李凌云.基于AIGC的建筑设计图像生成应用研究[J].中外建筑,2025(10):90-97. 被引量：1
4姜光辉,常亚静,程军利,单浩,宋雪娟.湛江组结构性黏土地基钻孔施工中糊钻易发性评价[J].黑龙江科技大学学报,2025,35(4):628-634.
5钟振辉,林文雄,张美宋.人工智能背景下智慧消防实时监控与预警系统设计研究[J].消防界(电子版),2025,11(12):13-15.
6林志平.建筑消防工程项目成本控制探讨[J].建材发展导向,2025,23(21):88-90.
7龙卫球,邰江丽.生成式人工智能用户交互中的个人信息保护[J].西南政法大学学报,2025,27(5):3-12.
8王丽馨,魏明宇,刘禹彤,王鑫太,侯兆轩.基于集对分析的电网调峰调频混合储能选型方法[J].高电压技术,2025,51(10):5306-5316.
9郝尚君,程晓雅,李霄雯.RAG数据问答中心管理系统[J].计算机时代,2025(11):61-65.
10卫仲杰.商业建筑改造项目的特殊性与复杂性——以西郊百联购物中心整体改建项目为例[J].城市建筑空间,2025,32(11):88-91.

浙江大学学报(工学版)

2026年第1期

浏览历史

内容加载中请稍等...

基于扩散模型多模态提示的电力人员行为图像生成

参考文献13

二级参考文献259

共引文献360

相关作者

相关机构

相关主题

浏览历史