基于自动语义编辑的目标检测测试数据生成方法

Test Data Generation for Object Detection Based on AutomatedSemantic Editing

下载PDF

导出

摘要目标检测系统的测试数据生成对评估模型性能和发现潜在缺陷至关重要。现有方法在生成数据的多样性和真实性方面仍存在局限。该文提出了一种基于自动语义编辑的目标检测测试数据生成方法SemaGen,通过构建高质量语义对象库并结合自动化语义编辑策略,实现对图像的插入、删除和替换等高级语义操作。具体而言,该方法首先通过多重筛选机制构建语义对象库,确保对象的语义完整性和场景适应性;其次,利用场景复杂度量化模型,综合考虑背景占比、实例数量和空间分布等因素,实现编辑策略的自适应选择;最后,提出基于对象重要性的替换策略、迭代式删除方法以及考虑语义相似度的智能插入机制,确保生成图像的真实性和多样性。实验结果表明,SemaGen在三种对象操作任务上显著优于现有方法,生成的图像质量更高,FID得分更优,证实了该方法在生成数据质量方面的优越性。在目标检测模型测试中,SemaGen成功发现YOLO v11、SSD和Mask R-CNN等主流检测器在复杂场景下的性能缺陷,为目标检测测试用例生成提供了新的思路和工具。 Test data generation for object detection systems is crucial for evaluating model performance and identifying potential defects.Existing methods still have limitations in generating diverse and realistic data.We present SemaGen,a test data generation method for object detection based on automated semantic editing,which achieves advanced semantic operations such as insertion,deletion,and replacement through constructing high-quality semantic object libraries and combining automated editing strategies.Specifically,the proposed method first constructs a semantic object library through multiple screening mechanisms to ensure object semantic integrity and scene adaptability.Secondly,it utilizes a scene complexity quantification model that comprehensively considers background ratio,instance quantity,and spatial distribution to achieve adaptive selection of editing strategies.Finally,it proposes an object importance-based replacement strategy,an iterative deletion method,and an intelligent insertion mechanism considering semantic similarity to ensure the authenticity and diversity of generated images.The experimental results show that SemaGen significantly outperforms the existing methods on the three object manipulation tasks,generates higher quality images with better FID scores,and confirms its superiority in generating data quality.In object detection model testing,SemaGen successfully identifies performance deficiencies of mainstream detectors such as YOLO v11,SSD,and Mask R-CNN in complex scenarios,providing new insights and tools for generating object detection test cases.

作者陈皓明桂智明刘艳芳范鑫鑫路云峰 CHEN Hao-ming;GUI Zhi-ming;LIU Yan-fang;FAN Xin-xin;LU Yun-feng(School of Computer Science and Technology,Beijing University of Technology,Beijing 100124,China;School of Computer Science and Engineering,Beihang University,Beijing 100083,China;Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190,China;School of Reliability and Systems Engineering,Beihang University,Beijing 100088,China)

机构地区北京工业大学计算机学院北京航空航天大学计算机学院中国科学院计算技术研究所北京航空航天大学可靠性与系统工程学院

出处《计算机技术与发展》 2025年第7期16-23,共8页 Computer Technology and Development

基金复杂关键软件环境全国重点实验室自主课题(SKLSDE-2023ZX-17)。

关键词目标检测语义编辑测试数据生成深度神经网络图像生成 object detection semantic editing test data generation deep neural networks image generation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1钱忠胜,俞情媛,张丁,姚昌森,秦朗悦,成轶伟.结合SVM与XGBoost的链式多路径覆盖测试用例生成[J].软件学报,2024,35(6):2795-2820. 被引量：3
2谢瑞麟,崔展齐,陈翔,郑丽伟.IATG:基于解释分析的自动驾驶软件测试方法[J].软件学报,2024,35(6):2753-2774. 被引量：4
3魏瑀皓,姚永明.一种基于蜕变测试的卫星遥感目标检测模型鲁棒性测试方法[J].现代计算机,2023,29(20):35-39. 被引量：2
4王丹,王兴亚,黄松,王梅娟.基于蜕变测试的图像分类软件的鲁棒性评估方法[J].网络安全技术与应用,2023(12):41-44. 被引量：2
5朱向雷,王海弛,尤翰墨,张蔚珩,张颖异,刘爽,陈俊洁,王赞,李克秋.自动驾驶智能系统测试研究综述[J].软件学报,2021,32(7):2056-2077. 被引量：39

二级参考文献20

1姜慧研,宗茂,刘相莹.基于ACO-SVM的软件缺陷预测模型的研究[J].计算机学报,2011,34(6):1148-1154. 被引量：44
2余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：649
3姚香娟,巩敦卫,李彬.融入神经网络的路径覆盖测试数据进化生成[J].软件学报,2016,27(4):828-838. 被引量：16
4杨宏宇,徐晋.基于改进随机森林算法的Android恶意软件检测[J].通信学报,2017,38(4):8-16. 被引量：41
5戚荣志,王志坚,黄宜华,李水艳.基于Spark的并行化组合测试用例集生成方法[J].计算机学报,2018,41(6):1284-1299. 被引量：24
6陈铁明,杨益敏,陈波.Maldetect:基于Dalvik指令抽象的Android恶意代码检测系统[J].计算机研究与发展,2016,53(10):2299-2306. 被引量：15
7纪守领,李进锋,杜天宇,李博.机器学习模型可解释性方法、应用与安全研究综述[J].计算机研究与发展,2019,56(10):2071-2096. 被引量：212
8夏春艳,张岩,万里,宋妍,肖楠,郭冰.基于否定选择遗传算法的路径覆盖测试数据生成[J].电子学报,2019,47(12):2630-2638. 被引量：17
9王赞,闫明,刘爽,陈俊洁,张栋迪,吴卓,陈翔.深度神经网络测试研究综述[J].软件学报,2020,31(5):1255-1275. 被引量：47
10廖伟志,夏小云,贾小军.基于蚁群算法的多路径覆盖测试数据生成[J].电子学报,2020,48(7):1330-1342. 被引量：22

共引文献44

1王嘉凯,刘艾杉,李思民,刘祥龙,吴文峻.智能系统全生命周期安全测试理论与方法[J].智能安全,2023,2(1):27-36. 被引量：2
2王奕涵,陈方圆.一种基于ONEPOINT的自动驾驶解决方案[J].长江信息通信,2021,34(10):31-34. 被引量：3
3何佳颖,田言康,刘飞虎.自动驾驶试验场及虚拟测试场景研究[J].汽车实用技术,2022,47(5):21-25. 被引量：3
4吴昊,王浩,苏醒,李明昊,许封元,仲盛.自动驾驶系统中视觉感知模块的安全测试[J].计算机研究与发展,2022,59(5):1133-1147. 被引量：5
5冯立业.自动驾驶车辆技术发展及应用[J].汽车测试报告,2022(8):14-16.
6桂晶晶,吴芯洋,曾月,付泽宇.我国智能汽车发展现状及前景[J].中国高新科技,2022(4):60-61. 被引量：3
7王爱兵,杨晓文,韩燮,郭新东,彭志斌,郭子军,贾彩琴.优化球查询算法的点云分割[J].计算机技术与发展,2022,32(8):55-59. 被引量：1
8胡健,龚克,毛伊敏,陈志刚,陈亮.基于Im2col的并行深度卷积神经网络优化算法[J].计算机应用研究,2022,39(10):2950-2956. 被引量：14
9姜文涛,崔江磊.旋转区域提议网络的孪生神经网络跟踪算法[J].计算机工程与应用,2022,58(24):247-255. 被引量：3
10王妍,詹雨薇,罗昕,刘萌,许信顺.视频片段检索研究综述[J].软件学报,2023,34(2):985-1006. 被引量：5

1蒋壮强,蔡杰,王玉辉,史泽源.一种低压抽出式开关柜机器人末端执行器的设计与分析[J].机械研究与应用,2025,38(3):72-75.
2陈国珍,宋夏云.研究型审计模式在社会保险基金审计中的应用研究[J].复印报刊资料(财会文摘),2024(4):77-81.
3吴俊遐,游旭,周朝当,普涵宇,刘芳.青少年抑郁症患者事件相关电位(ERP):基于Go-P3与NoGo-P3的执行功能研究[J].心理月刊,2025,20(11):136-138.
4王克菲,侯维,宋文艳,刘晖,郑素军.4A型家族性遗传性血色病1例[J].中华肝脏病杂志,2025,33(5):489-492.
5李新萍,崔佳成,袁永清,王东.抑郁症患者认知操作功能与反刍的相关性研究[J].中国病案,2025,26(6):106-108.
6高永梅,黄成文渊,文佳.航空综合电子信息系统故障推理算法设计与验证[J].标准科学,2025(S1):268-274.
7赵宏,王贺,李文改.对比学习改进文本生成图像方法的研究[J].计算机工程与应用,2025,61(14):264-273.
8班魁国,高佼,阮久宏,沈本兰.基于传感器数据融合的地铁车站隔栏递物检测方法[J].山东交通学院学报,2025,33(3):1-11.
9曹宏利.机器人力位混合控制算法的仿真控制策略模型研究[J].农机使用与维修,2025(7):100-103. 被引量：1
10侯彦,车蕾,李慧.面向中文的多层次扰动定位文本对抗样本生成方法[J].计算机工程,2025,51(7):232-243.

计算机技术与发展

2025年第7期

浏览历史

内容加载中请稍等...

基于自动语义编辑的目标检测测试数据生成方法

参考文献5

二级参考文献20

共引文献44

相关作者

相关机构

相关主题

浏览历史