基于人物交互视觉语言模型的变电站复杂违规行为检测

Detection of complex violations in substations based on human-interactive visual language model

下载PDF

导出

摘要针对变电站工作人员操作行为违规检测问题,研究基于人物交互关系的视觉语言模型,采用目标文本语义向量与图像特征向量的深度融合,对人、物体以及2者的交互关系进行准确的识别。首先,对人物交互行为进行主谓宾三元组的形式进行标注,然后,采用预训练文本编码器、图像编码器将要识别的人物交互关系目标进行编码,再使用迭代式多模态融合机制来帮助模型进行变电站工作人员违规行为的检测。最后通过实验对比人物交互视觉语言模型在违规行为检测任务中与传统目标检测模型的效果,实验结果表明:采用基于人物交互视觉语言模型在识别精度上提升了10%,召回率降低4%,且在迭代层数为6时整体模型性能达到最优,验证了本方法在变电站复杂违规行为检测任务上效果优越。 Aiming at the problem of violation detection of substation staff's operation behavior,a visual language model based on human object interaction relationship is studied.The deep fusion of target text semantic vector and image feature vector is used to accurately identify people,objects and their interaction relationship.Firstly,the hu⁃man object interaction behavior is marked in the form of subject-predicate-object triples.Then,the pre-trained text encoder and image encoder are used to encode the human object interaction relationship target to be identified,and then the iterative multi-modal fusion mechanism is used to help the model detect the violation behavior of substa⁃tion staff.Finally,the effect of the human object interaction visual language model in the violation behavior detec⁃tion task is compared with the traditional target detection model through experiments.The experimental results show that the recognition accuracy based on the human-interactive visual language model is improved by 10%,the recall rate is reduced by 4%,and the overall model performance is optimal when the number of iterations is 6,which verifies that this method has superior performance in the detection task of complex violations in substations.

作者刘志鹏赵天成 LIU Zhipeng;ZHAO Tiancheng(State Grid Hubei Electric Power Co.,Ltd.Ultra High Voltage Company,Wuhan 430050,China;Binjiang Institute of Zhejiang University,Hangzhou 310053,China)

机构地区国网湖北省电力有限公司超高压公司浙江大学滨江研究院

出处《粘接》 2025年第8期177-180,共4页 Adhesion

关键词人物交互视觉语言模型变电站违规行为检测多模态 human interaction visual language model substation violation detection multimodal

分类号 TM63 [电气工程—电力系统及自动化] O44 [理学—电磁学]

引文网络
相关文献

参考文献11

1陈浩,李杏,陈江,黎艺苗,陈婷.基于大数据和人工智能的电力安全监管新模式探索[J].电力安全技术,2023,25(9):1-3. 被引量：3
2贺红梅,黑文斌,安军.信息化手段在电力企业外包施工作业安全监管中的应用研究[J].内蒙古科技与经济,2020(22):96-97. 被引量：6
3尹维崴,李睿,王燕,高帅.基于智能感知的电力作业安全风险管控技术研究[J].技术与市场,2021,28(11):132-134. 被引量：7
4徐守坤,王雅如,顾玉宛,李宁,庄丽华,石林.基于改进Faster RCNN的安全帽佩戴检测研究[J].计算机应用研究,2020,37(3):901-905. 被引量：78
5尚福瑞,范云飞,郝强,甄志伟.基于深度学习的工程作业智能监控技术的模型优化测试[J].粘接,2023,50(4):182-186. 被引量：8
6黄文杰,徐文峰,张春凤,董成斌,万琳.一种结合Alphapose和ResNet的电力施工人员着装检测模型[J].电力信息与通信技术,2022,20(3):40-47. 被引量：5
7丘浩,张炜,彭博雅,丁兆钧,林翔宇.基于YOLOv3的特定电力作业场景下的违规操作识别算法[J].电力科学与技术学报,2021,36(3):195-202. 被引量：29
8赵佳琦,张迪,周勇,陈思霖,唐嘉澜,姚睿.基于深度强化学习的遥感图像可解释目标检测方法[J].模式识别与人工智能,2021,34(9):777-786. 被引量：8
9莫蓓蓓,吴克河.引入Self-Attention的电力作业违规穿戴智能检测技术研究[J].计算机与现代化,2020,0(2):115-121. 被引量：5
10沈茂东,周伟,宋晓东,裴健,邓昊,马超,房凯.基于改进Mask RCNN的电力检修违规操作检测[J].计算机系统应用,2020,29(8):158-164. 被引量：3

二级参考文献73

1孙凤杰,崔维新,张晋保,张旭东,肖学东.远程数字视频监控与图像识别技术在电力系统中的应用[J].电网技术,2005,29(5):81-84. 被引量：72
2田芳,董春晖,李亚楼,王海宁,印永华,严剑峰,徐得超,何江.电力系统运行及安全监控仿真系统的研究与开发[J].中国电机工程学报,2011,31(28):80-86. 被引量：18
3张明媛,曹志颖,赵雪峰,杨震.基于深度学习的建筑工人安全帽佩戴识别研究[J].安全与环境学报,2019,19(2):535-541. 被引量：77
4高文胜,张博文,周瑞旭,符祥干,陈钦柱,黄松,梁亚峰.基于雷电定位系统监测数据的雷暴云趋势预测[J].电网技术,2015,39(2):523-529. 被引量：37
5潘坚跃,麻立群,彭斌,李敏,陈希.人体及穿戴特征识别在电力设施监控中的应用[J].电子设计工程,2015,23(10):68-71. 被引量：10
6杨明.新形势下电力安全监察工作的重点分析[J].山东工业技术,2015(24):204-204. 被引量：7
7贾峻苏,鲍庆洁,唐慧明.基于可变形部件模型的安全头盔佩戴检测[J].计算机应用研究,2016,33(3):953-956. 被引量：26
8韩豫,张泾杰,孙昊,姚佳玥,尤少迪.基于图像识别的建筑工人智能安全检查系统设计与实现[J].中国安全生产科学技术,2016,12(10):142-148. 被引量：32
9李慧霞,李临生,闫庆森,周景文.基于Mean Shift算法的目标跟踪综述[J].计算机与现代化,2017(1):65-70. 被引量：7
10刘兆星.试论做好电力安全监管工作的途径[J].技术与市场,2017,24(3):171-171. 被引量：7

共引文献143

1任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321. 被引量：3
2王刘旺,周自强,林龙,韩嘉佳.人工智能在变电站运维管理中的应用综述[J].高电压技术,2020,46(1):1-13. 被引量：95
3郭梦浩,徐红伟.基于Faster RCNN的红外热图像热斑缺陷检测研究[J].计算机系统应用,2019,28(11):265-270. 被引量：41
4孔英会,王维维,张珂,戚银城.基于改进Mask R-CNN模型的电力场景目标检测方法[J].科学技术与工程,2020,20(8):3134-3142. 被引量：22
5张博,宋元斌,熊若鑫,张世超.融合人体关节点的安全帽佩戴检测[J].中国安全科学学报,2020,30(2):177-182. 被引量：16
6肖体刚,蔡乐才,汤科元,高祥,张超洋.改进SSD的安全帽佩戴检测方法[J].四川轻化工大学学报（自然科学版）,2020,33(4):68-76. 被引量：9
7陈志韬,殷恺铭,张洋,金睿哲,支文瑜,沈春锋.基于EfficientDet的安全帽佩戴检测研究[J].信息技术与标准化,2021(1):19-23. 被引量：4
8王雨生,顾玉宛,封晓晨,符心宇,庄丽华,徐守坤.基于姿态估计的安全帽佩戴检测方法研究[J].计算机应用研究,2021,38(3):937-940. 被引量：20
9翟鑫,李昕.基于深度学习的下井人员安全状态快速检测算法研究[J].河南科技,2021,40(2):8-11.
10岳诗琴,张乾,邵定琴,范玉,白金华.基于ResNet50-SSD的安全帽佩戴状态检测研究[J].长江信息通信,2021(3):86-89. 被引量：7

1医学论文表与图的写作要求[J].中国医学创新,2025,22(22):89-89.
2高南,吴全玉,胡鸣瑛,刘晓杰,潘玲佼,王永星.一种脑电信号与面部表情融合的多模态情绪识别方法[J].江苏理工学院学报,2025,31(3):118-127.
3医学论文表与图的写作要求[J].中国医学创新,2025,22(21):85-85.
4马增琛,孙彦文,南博,武永祥,张凯歌.基于解耦知识蒸馏的视觉大模型轻量化技术研究[J].火力与指挥控制,2025,50(7):199-207.
5本刊编辑部.关于论文中表的基本要求[J].国际放射医学核医学杂志,2025,49(6):365-365.
6李新放,曹金凤,李建伟,崔菁菁,苏天赟.基于支持向量机算法的含油沉积物识别研究[J].海洋科学进展,2025,43(3):636-650.
7李娜,张文,尹琪,牛晓栋,张笑瑛,潘新鑫.一种基于SAM改进的滑坡识别方法[J].物联网技术,2025,15(15):146-149.
8王业辉,黄咏秋,甄先通,张磊.基于多层级特征融合与解码的参考图像分割模型[J].南开大学学报(自然科学版),2025,58(3):19-31.
9张卓群,王荣波,黄孝喜.基于多特征融合的医疗文本命名实体识别研究[J].杭州电子科技大学学报(自然科学版),2025,45(4):32-41.
10王友卫,刘奥,凤丽洲.基于知识蒸馏和评论时间的文本情感分类新方法[J].吉林大学学报(工学版),2025,55(5):1664-1674.

粘接

2025年第8期

浏览历史

内容加载中请稍等...

基于人物交互视觉语言模型的变电站复杂违规行为检测

参考文献11

二级参考文献73

共引文献143

相关作者

相关机构

相关主题

浏览历史