基于GAN的语义对齐网络半监督跨模态哈希方法

Semi-supervised Cross-modal Hashing Method for Semantic Alignment Networks Based on GAN

下载PDF

导出

摘要监督方法在跨模态检索中已有不少成果,是比较热门的方法。然而,这类方法过于依赖标记的数据,没有充分利用无标签数据所包含的丰富信息。为了解决这一问题,人们开始研究无监督方法,但是仅依靠未标记数据的效果并不理想。对此,提出了基于GAN的语义对齐网络半监督跨模态哈希方法(GAN-SASCH)。该模型基于生成对抗网络,结合了语义对齐的概念。生成对抗网络分为两个模块,分别是生成器和判别器,生成器学习拟合未标记数据的相关性分布并生成虚假的数据样本,判别器则用于判断数据对样本是来自数据集还是生成器。通过这两个模块之间展开极大极小的对抗博弈游戏,不断提升生成对抗网络的性能。语义对齐能充分利用不同模态之间的相互作用和对称性,统一不同模态的相似性信息,有效地指导哈希代码的学习过程。除此之外,还引入了自适应学习优化参数以提升模型性能。在NUS-WIDE和MIRFLICKR25K数据集上,对比了所提方法与9种相关前沿方法,使用MAP与PR图两种评价指标验证了所提方法的有效性。 Supervised methods have achieved a lot of results in cross-modal retrieval and have become popular methods.However,these methods rely too much on labeled data and do not make full use of the rich information contained in unlabeled data.To solve this problem,unsupervised methods have been studied,but when relying solely on unlabeled data,the results are not ideal.Therefore,this paper proposes a semi-supervised cross-modal hashing method for semantic alignment networks based on GAN(GAN-SASCH).This model is based on generative adversarial networks that incorporate the concept of semantic alignment.The generative adversarial network is divided into two modules.The generator learns to fit the correlation distribution of the unlabeled data and generates a spurious data sample,and the discriminator is used to determine whether the data pair sample comes from the dataset or the generator.By developing a very small adversarial game between these two modules,the performance of the generative adversarial network is continuously improved.Semantic alignment can make full use of the interaction and symmetry between different modalities,unify the similarity information of different modalities,and effectively guide the learning process of hash code.In this paper,adaptive learning optimization parameters are also introduced to improve the performance of the model.On NUS-WIDE and MIRFLICKR25K datasets,we compare the proposed method with 9 related frontier methods,and verify the effectiveness of the proposed method by using two evaluation indicators,MAP and PR map.

作者刘华咏朱婷 LIU Huayong;ZHU Ting(School of Computer Science,Central China Normal University,Wuhan 430079,China)

机构地区华中师范大学计算机学院

出处《计算机科学》北大核心 2025年第6期159-166,共8页 Computer Science

基金教育部人文社会科学研究项目(21YJA870005)。

关键词跨模态哈希生成对抗网络语义对齐半监督自适应学习 Cross-modal hash Generative adversarial network Semantic alignment Semi-supervised Adaptive learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1陈宁,段友祥,孙歧峰.跨模态检索研究文献综述[J].计算机科学与探索,2021,15(8):1390-1404. 被引量：11
2李玉强,陆子微,刘春.基于对比学习的无监督三元哈希方法[J].计算机应用研究,2023,40(5):1434-1440. 被引量：3
3彭良康,卢向明,徐清波.基于深度学习的跨模态哈希检索研究进展[J].数据通信,2022(3):32-38. 被引量：3

二级参考文献5

1任艳多.大规模数据检索中基于哈希编码的量化技术综述[J].数据通信,2018(2):45-48. 被引量：1
2朱路,田晓梦,曹赛男,刘媛媛.基于高阶语义相关的子空间跨模态检索方法研究[J].数据分析与知识发现,2020,4(5):84-91. 被引量：4
3李长升,闵齐星,成雨蓉,袁野,王国仁.捕获局部语义结构和实例辨别的无监督哈希[J].软件学报,2021,32(3):742-752. 被引量：5
4杨粟,欧阳智,杜逆索.基于相关度距离的无监督并行哈希图像检索[J].计算机应用,2021,41(7):1902-1907. 被引量：6
5张晶晶,李秋艳,刘硕,张萌,刘瑞鹏,蔡子凡.基于深度学习的人脸识别在身份认证领域应用综述[J].数据通信,2021(4):1-6. 被引量：12

共引文献14

1杜锦丰,王海荣,梁焕,王栋.基于表示学习的跨模态检索方法研究进展[J].广西师范大学学报（自然科学版）,2022,40(3):1-12. 被引量：4
2朱维乔.深度学习驱动的跨模态视觉数据搜索研究综述[J].高校图书馆工作,2022,42(5):41-45.
3徐文婉,周小平,王佳.跨模态检索技术研究综述[J].计算机工程与应用,2022,58(23):12-23. 被引量：8
4徐清振,肖彬.公共空间共享参数的跨模态检索研究[J].华南师范大学学报（自然科学版）,2023,55(1):88-93.
5宗林林,于红,刘馨月,徐秀娟,张晓彤,张宪超.数据结构与算法创新实验教学实践——以跨模态检索为例[J].实验室研究与探索,2023,42(6):169-173. 被引量：4
6罗江华,张玉柳.基于跨模态理解与重构的适应性数字教育资源:模型构建与实践框架[J].现代远程教育研究,2023,35(6):91-101. 被引量：25
7李博睿.基于深度学习的动漫人脸识别综述[J].计算机应用文摘,2023,39(23):108-110.
8杜鹏举.多模态数据融合与检索技术研究[J].自动化与仪器仪表,2023(10):23-26. 被引量：3
9党张敏,喻崇仁,殷双飞,张宏娟,陕振,马连志.基于CLIP与注意力机制的跨模态哈希检索算法[J].计算机工程与设计,2024,45(3):852-858. 被引量：7
10亢洁,刘威.特征融合的装修案例跨模态检索方法[J].智能系统学报,2024,19(2):429-437.

1白向明.测绘工程测量中测绘新技术的应用分析[J].中文科技期刊数据库(全文版)工程技术,2019(3):00198-00198.
2陈鹏,邵玉萍,任小芳,郭蕴源,何建华.膝骨关节炎的康复策略与前沿方法[J].中医康复,2025,2(7):73-80. 被引量：4
3李坤,陈剑钧,李国胜,姜晓道.小样本学习研究综述[J].机电工程技术,2025,54(6):160-168. 被引量：6
4李嘉琪,夏尚飞,吉晨晖.基于正负图对比学习的旋转机械半监督故障诊断方法[J].机械设计与研究,2025,41(1):226-233.
5肖德轩,秦智,黄源源,卢嘉中.基于迁移学习的软件定义网络异常检测模型[J].成都信息工程大学学报,2025,40(3):264-272.
6屈新东,朱绍柯,罗凌琦.基于机器半监督学习的改进自训练模型在互联网电信业务质差用户识别中的实践研究[J].长江信息通信,2025,38(4):218-220.
7张颂,陈璐.基于整合框架的员工变革支持行为研究述评及展望[J].技术经济,2025,44(5):94-107.
8谢明朗,袁贞明,施军平,田昕.基于深度哈希的多模态临床数据相似病例检索[J].计算机系统应用,2025,34(5):173-184.
9胡昊男.智能印刷时代的产线移动机器人——调度管理与轨迹规划的前沿探索[J].印刷工业,2025(2):17-20. 被引量：1
10莫惠宁,裴京楠,李倩,韦彩柳,张洪平.牛大力总生物碱的抗肝癌作用及其作用机制[J].中医药导报,2025,31(5):28-32.

计算机科学

2025年第6期

浏览历史

内容加载中请稍等...

基于GAN的语义对齐网络半监督跨模态哈希方法

参考文献3

二级参考文献5

共引文献14

相关作者

相关机构

相关主题

浏览历史