基于子图邻域学习的网络视频突发事件挖掘

Cross-Media Video Event Mining Based on Subgraph Neighborhood Learning

下载PDF

导出

摘要基于异构信息网络的跨媒体关联挖掘成为新的研究热点。一般情况下,视频中非线性视觉信息和失范的文本会使得模态间关联极其稀疏。现有方法多采用嵌入多条语义路径来增强媒体间关联。然而,这种方法往往忽略了路径中局部子图结构内节点间的关联,导致节点的子图邻域信息被遗漏,节点嵌入无法捕捉与邻域节点的关联性,进而引起网络视频突发事件挖掘效果不佳。因此,本文提出了一种基于子图邻域学习的跨媒体语义关联增强方法。具体来说,该方法将异构图分解为不同类型子图,在不同子图中捕捉邻域节点的关联,得到关联丰富后的节点最终嵌入。首先,将不同模态节点初级特征映射到统一空间后,将异构图分解为同构和异构子图,以获取节点基于元路径的同构邻居和一阶异构邻居;然后,通过特定注意力机制分别嵌入基于同构和异构子图的邻域节点,捕获子图内节点邻域信息;最后,通过图级注意力聚合同构和异构子图间交互和语义信息,得到邻域关联后的节点最终嵌入,在下游任务中实现网络视频突发事件的准确挖掘。通过在10个真实数据集上的实验验证,本文方法展现了较高的可靠性,且所提模型在性能上超越了现有方法。 Cross-media association mining based on heterogeneous information networks has received wide-spread attention.Typically,the non-linear visual information and the inaccurate textual information within videos result in extremely sparse associations between them.Existing methods often enhance these associations by embedding multiple semantic paths.However,these approaches overlook the associations between nodes within local subgraph structures,leading to the omission of neighborhood information.As a result,node embeddings fail to capture the association with neighboring nodes,ultimately leading to poor performance in web video event mining.To address this issue,this paper proposes a cross-media semantic association enhancement method based on subgraph neighborhood learning.Specifically,this method decomposes heterogeneous graph into different types of subgraphs,captures the associations of neighboring nodes within these subgraphs,and obtains the final node embeddings.Initially,node attributes are projected into a shared latent space using type-specific linear transformations.Subsequently,the heterogeneous graph is divided into multiple subgraphs,including homogeneous and heterogeneous structures based on predefined metapaths.Subsequently,tailored attention are independently applied to each subgraph to capture the neighborhood information of nodes.Finally,information from different subgraphs is fused through graph-level attention,aggregating the interactions and semantic information.The learned representations are evaluated by web video event mining.Through experiments on 10 real-world datasets,the proposed method in this paper has demonstrated high reliability and outperformed existing methods in terms of performance.

作者张承德周璇 ZHANG Cheng-De;ZHOU Xuan(School of Information Engineering,Zhongnan University of Economics and Law,Wuhan 430073)

机构地区中南财经政法大学信息工程学院

出处《计算机学报》北大核心 2025年第5期1134-1150,共17页 Chinese Journal of Computers

基金国家社会科学基金一般项目(22BXW081)资助。

关键词跨媒体网络视频事件挖掘子图子图邻域学习 cross-media webvideo event mining subgraph subgraph neighborhood learning

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1张承德,刘雨宣,肖霞,梅凯.跨媒体语义关联增强的网络视频热点话题检测[J].计算机研究与发展,2023,60(11):2624-2637. 被引量：3
2卓昀侃,綦金玮,彭宇新.跨媒体深层细粒度关联学习方法[J].软件学报,2019,30(4):884-895. 被引量：14
3蒲瞻星,葛永新.基于多特征融合的小样本视频行为识别算法[J].计算机学报,2023,46(3):594-608. 被引量：13
4肖国庆,李雪琪,陈玥丹,唐卓,姜文君,李肯立.大规模图神经网络研究综述[J].计算机学报,2024,47(1):148-171. 被引量：22
5娄铮铮,朱军娇,张万闯,吴宾.用户生成内容场景下角色导向图神经推荐方法[J].计算机学报,2024,47(6):1288-1303. 被引量：1

二级参考文献22

1Shuang Yang,Yan Tang.News Topic Detection Based on Capsule Semantic Graph[J].Big Data Mining and Analytics,2022,5(2):98-109. 被引量：3
2吴飞,庄越挺.互联网跨媒体分析与检索:理论与算法[J].计算机辅助设计与图形学学报,2010,22(1):1-9. 被引量：35
3崔婉秋,杜军平,寇菲菲,李志坚,Lee JangMyung.面向微博短文本的社交与概念化语义扩展搜索方法[J].计算机研究与发展,2018,55(8):1641-1652. 被引量：5
4吴宾,娄铮铮,叶阳东.联合正则化的矩阵分解推荐算法[J].软件学报,2018,29(9):2681-2696. 被引量：29
5吴云鹏,赵晨阳,时增林,叶阳东.基于流密度的多重交互集体行为识别算法[J].计算机学报,2017,40(11):2519-2532. 被引量：7
6黄立威,江碧涛,吕守业,刘艳博,李德毅.基于深度学习的推荐系统研究综述[J].计算机学报,2018,41(7):1619-1647. 被引量：457
7彭宇新,綦金玮,黄鑫.多媒体内容理解的研究现状与展望[J].计算机研究与发展,2019,56(1):183-208. 被引量：38
8钟庆虹,乔晓东,张运良,翁梦娟.基于LDA2Vec和残差网络的跨媒体融合方法研究[J].数据分析与知识发现,2019,3(10):78-88. 被引量：4
9丁重阳,刘凯,李光,闫林,陈博洋,钟育民.基于时空权重姿态运动特征的人体骨架行为识别研究[J].计算机学报,2020,43(1):29-40. 被引量：34
10葛尧,陈松灿.面向推荐系统的图卷积网络[J].软件学报,2020,31(4):1101-1112. 被引量：52

共引文献48

1朱路,田晓梦,曹赛男,刘媛媛.基于高阶语义相关的子空间跨模态检索方法研究[J].数据分析与知识发现,2020,4(5):84-91. 被引量：4
2冯姣,陆昶谕.基于残差注意力网络的跨媒体检索方法[J].计算机科学,2021,48(S01):122-126. 被引量：5
3王金婉,朱学芳.迁移学习在信息资源开发及服务中的应用探索[J].情报理论与实践,2021,44(7):145-151. 被引量：1
4田枫,李闯,刘芳,李婷玉,张蕾,刘志刚.基于柯西分布的深度哈希跨媒体检索[J].计算机系统应用,2021,30(8):171-178. 被引量：1
5李春芳,刘永久,王楷翔,杨睿,张凌飞,李敏,邓智铭,石民勇.一种多模态跨媒体检索的融媒体影视系统[J].中国传媒大学学报（自然科学版）,2021,28(4):63-71. 被引量：2
6杜锦丰,王海荣,李明亮,梁焕.多层语义对齐的跨模态检索方法研究[J].郑州大学学报（理学版）,2021,53(4):83-88. 被引量：3
7梁美玉,王笑笑,杜军平.基于多模态图和对抗哈希注意力网络的跨媒体细粒度表示学习[J].模式识别与人工智能,2022,35(3):195-206. 被引量：3
8朱维乔.深度学习驱动的跨模态视觉数据搜索研究综述[J].高校图书馆工作,2022,42(5):41-45.
9曹夏琳,莫永华.“意向性”多媒体表征促进深度学习研究[J].教育信息化论坛,2022,6(19):27-29.
10吕亚飞,熊伟,张筱晗.一种通用的跨模态遥感信息关联学习方法[J].武汉大学学报（信息科学版）,2022,47(11):1887-1895. 被引量：3

1解萧语,王春娟,解晓明.中国式现代化视域下制造业高质量发展评估与空间分异研究[J].集美大学学报(哲社版),2025,28(3):66-77.
2丁蓉.无线传感器网络中基于子图的异常检测方法[J].信息记录材料,2025,26(6):78-79.
3郭振华,宋波.基于多特征融合的医疗实体对齐方法研究[J].软件工程,2025,28(5):65-68.
4刘鑫,王路,王康,刘聪,杜玉越.基于足迹矩阵的分解模型挖掘方法[J].计算机集成制造系统,2025,31(5):1817-1828.

计算机学报

2025年第5期

浏览历史

内容加载中请稍等...

基于子图邻域学习的网络视频突发事件挖掘

参考文献5

二级参考文献22

共引文献48

相关作者

相关机构

相关主题

浏览历史