多模态数据驱动的社交网络谣言传播者识别方法研究被引量：1

ldentifying Social Network Rumor Spreaders with Multi-Modal Data

导出

摘要【目的】根据多模态数据特征,从社交网络用户中识别出社交网络谣言传播者。【方法】考虑到网络谣言传播呈现多模态与用户样本不平衡的特点,首先对原始数据进行过采样处理,然后将用户属性、微博发文等传统特征与用户生成内容中的多模态信息特征深度融合;在XGBoost模型基础上构建能够广泛融合社交网络用户特征的社交网络谣言传播者识别框架,并在模型输出层嵌入SHAP值,增加算法可解释性。【结果】XGBoost模型在经过样本平衡处理的数据集上综合性能表现最优,召回率提升12.3个百分点。融合多模态信息特征的识别方法准确率可达0.912,比对照组提升2.5个百分点。【局限】多模态信息特征仅考虑文本、图片两种模态,未来可进一步结合音频、视频等模态信息拓展研究。【结论】基于多模态数据与过采样算法训练得到的识别方法,能够有效完成社交网络谣言传播者的识别任务。 [Objective]This paper aims to identify social network rumor spreaders by leveraging multi-modal data.[Methods]Given the multi-modal nature of rumor propagation and the imbalance in user sample distribution,we first applied an oversampling technique to the raw data.Then,we deeply integrated traditional user attributes and microblogging features with multi-modal information extracted from user-generated content.Third,we constructed the intelligent identification method for social network rumor spreaders,which effectively integrates diverse user features based on the XGBoost model.Additionally,SHAP values were embedded in the model's output layer to enhance algorithmic interpretability.[Results]The XGBoost model achieves optimal overall performance after sample balancing,with a 12.3%improvement in recall.The identification method incorporating multi-modal information features can attain an accuracy of 0.912,2.5%higher than the control group.[Limitations]This paper only considered text and image modalities.Future research can be expanded by incorporating audio and video data.[Conclusions]The proposed model can effectively identify social network rumor spreaders.

作者潘宏鹏刘忠轶 Pan Hongpeng;Liu Zhongyi(School of Management,People's Public Security University of China,Beijing100038,China)

机构地区中国人民公安大学公安管理学院

出处《数据分析与知识发现》北大核心 2025年第2期59-70,共12页 Data Analysis and Knowledge Discovery

基金中国人民公安大学基本科研业务费项目(项目编号:2022JKF02004) 北京社会科学基金重点项目(项目编号:22GLA011)的研究成果之一。

关键词多模态特征过采样网络谣言传播者 Multi-Modal Characteristics Over-Sampling Social Network Rumor Spreader

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1迪路阳,钟寒,施水才.网络舆情预警研究综述[J].数据分析与知识发现,2023,7(8):17-29. 被引量：15
2马广军.社交媒体时代舆论战的边界性、确定性和传播性[J].情报杂志,2023,42(8):102-106. 被引量：16
3马鸣,刘云,刘地军,白健.基于主题和预防模型的微博谣言检测[J].北京理工大学学报,2020,40(3):310-315. 被引量：11
4孙影影,贾振堂,朱昊宇.多模态深度学习综述[J].计算机工程与应用,2020,56(21):1-10. 被引量：42
5宗乾进,黄子风,沈洪洲.基于性别视角的社交媒体用户造谣传谣和举报谣言行为研究[J].现代情报,2017,37(7):25-29. 被引量：11
6刘勘,袁蕴英,刘萍.基于随机森林分类的微博机器用户识别研究[J].北京大学学报（自然科学版）,2015,51(2):289-300. 被引量：21
7刘雅辉,靳小龙,沈华伟,鲍鹏,程学旗.社交媒体中的谣言识别研究综述[J].计算机学报,2018,41(7):1536-1558. 被引量：41
8潘宏鹏,汪东,刘忠轶,李轲.考虑反讽语义识别的协同双向编码舆情评论情感分析研究[J].情报杂志,2022,41(5):99-105. 被引量：14
9冯兰萍,董陈超,徐绪堪.基于混合神经网络的突发公共卫生事件微博谣言识别研究[J].情报杂志,2022,41(12):81-88. 被引量：12
10石锴文,刘勘.突发公共卫生事件中微博谣言的识别[J].图书情报工作,2021,65(13):87-95. 被引量：19

二级参考文献144

1夏松,林荣蓉,刘勘.网络谣言敏感词库的构建研究——以新浪微博谣言为例[J].知识管理论坛,2019(5):267-275. 被引量：6
2雷震,吴玲达,雷蕾,黄炎焱.初始化类中心的增量K均值法及其在新闻事件探测中的应用[J].情报学报,2006,25(3):289-295. 被引量：25
3樊高月.美军网络中心战理论与实践[J].外国军事学术,2007,0(10):1-8. 被引量：7
4中国互联网网络信息中心.第33次中国互联网发展状况调查统计报告[R/OL].(2014-03-05)【2014-07-01].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201403/t20140305-46240.htm.
5Yardi S, Romero D, Schoenebeck G. Detecting spam in a twitter network. First Monday, 2009, 15(1): 1-13.
6Stringhini G, Kruegel C, Vigna G. Detectingspammers on social networks // Proceedings 26th Annual Computer Security Applications ference. New York: ACM, 2010:1-9 of the Con-.
7Thomas K, Grier C, Song D, et al. Suspended accounts in retrospect: an analysis of twitter spare // Proceedings of the 2011 ACM SIGCOMM Conference on Internet Measurement. New York: ACM, 2011 243-258.
8Zhang X, Zhu S, Liang W. Detecting spam and promoting campaigns in the twitter social network // Proceedings of the 2012 IEEE 12th International Conference on Data Mining. Brussels: IEEE Com- puter Society, 2012:1194-1199.
9Lee K, Eoff B D, Caverlee J. Seven months with the devils: a long-term study of content polluters on Twitter // AAAI Conference on Weblogs and Social Media (ICWSM). Barcelona, 2011 : 185-192.
10Yang C, Harkreader R C, Gu G. Die free or live hard? empirical evaluation and new design for fighting evolving twitter spammers // Recent advances in intrusion detection. Berlin: Springer, 2011:318-337.

共引文献194

1褚建勋,王晨阳.农村居民网络虚假信息甄别行为意向影响因素研究——基于河南省Y县的调查[J].中国网络传播研究,2024(1):230-256.
2顾秋阳,琚春华,鲍福光.融入用户关系强度的社交网络舆情信源发现方法[J].系统科学与数学,2020(9):1578-1596. 被引量：2
3赵智慧,周毅,李炜弘,汤朝晖,郭强,陈日高.基于深度学习多模态融合的2型糖尿病中医证素辨证模型的构建[J].世界科学技术-中医药现代化,2024,26(4):908-918. 被引量：10
4万齐斌,胡枫,周马特.面向推特平台的谣言检测综述[J].信息通信,2019,0(12):137-139. 被引量：2
5戴晓露,吴薇,黄蓓雯,吕敏.基于大数据分析的高压用户峰谷电量优化研究[J].自动化技术与应用,2019,38(1):54-56. 被引量：3
6金丹,滕洁琪.基于机器学习的微博机器用户识别研究[J].中国高新技术企业,2016(30):4-7. 被引量：2
7姜赢,何国东,郭雨宸,朱玲萱.高校区域大学生微博身份的精确识别方法[J].计算机系统应用,2017,26(1):206-211.
8张艳梅,黄莹莹,甘世杰,丁熠,马志龙.基于贝叶斯模型的微博网络水军识别算法研究[J].通信学报,2017,38(1):44-53. 被引量：42
9余以胜.基于随机森林的用户行为识别模型研究[J].电脑知识与技术,2017,13(3):156-157. 被引量：4
10张晓艺,路燕,翟惠良.基于AHP与SVM的微博机器用户检测方法[J].计算机工程,2017,34(4):171-176. 被引量：1

同被引文献9

1蒋涛,潘云辉,崔鹏.融合新闻传播模式和传播者情感偏好的虚假新闻检测研究[J].数据分析与知识发现,2024,8(8):76-84. 被引量：3
2王繁,郭军军,余正涛.融合评论的多任务联合谣言检测方法[J].计算机工程与科学,2022,44(9):1702-1710. 被引量：4
3韩雪明,贾彩燕,李轩涯,张鹏飞.传播树结构结点及路径双注意力谣言检测模型[J].计算机科学,2023,50(4):22-31. 被引量：7
4蒋保洋,但志平,董方敏,张洪志,刘致远.基于双预训练Transformer和交叉注意力的多模态谣言检测[J].国外电子测量技术,2023,42(4):149-157. 被引量：4
5凤丽洲,刘馥榕,王友卫.基于图卷积网络和注意力机制的谣言检测方法[J].数据分析与知识发现,2024,8(4):125-136. 被引量：12
6曾江峰,程征,黄泳潼,高鹏钰.融合BERT和主题模型的谣言检测方法[J].情报科学,2024,42(2):12-23. 被引量：9
7向旺,王金光,王一飞,钱胜胜.基于多模态双协同Gather Transformer网络的虚假信息检测方法[J].计算机科学,2024,51(12):242-249. 被引量：1
8蒋超,朱学芳.基于GPT-4数据增强与对比学习的多模态谣言检测研究[J].图书情报工作,2024,68(23):76-87. 被引量：11
9黄涛,肖玉芝,向洁萍,金胜,霍宣蓉.融合多层级特征表示的多领域谣言早期检测方法[J].情报杂志,2025,44(4):127-135. 被引量：2

引证文献1

1段宇锋,柏萍.大模型知识增强的多尺度图神经网络中文健康谣言识别研究[J].数据分析与知识发现,2025,9(11):41-52.

1李俊颖.色彩在园林绿化设计中的应用与方法[J].中文科技期刊数据库(全文版)工程技术,2017(11):00229-00229.
2赵欣蕊.情感元素对音乐艺术表演深度与广度的拓展研究[J].戏剧之家,2025(10):89-91.
3刘罗杰,陈健,高福利,冯云赋,徐晓丹.基于机器学习的胃间质瘤内镜手术术后出血风险预测模型的构建与验证[J].中国医学物理学杂志,2025,42(4):550-560. 被引量：1
4龙德银.汉语死亡委婉语的体认性阐释[J].长春理工大学学报(社会科学版),2025,38(1):150-155.
5李占科,许正魁,王艳宁,王昆,贾运甫,车璇,关鹏.基于可解释GWO-XGBoost的隧道挤压预测研究[J].水利水电技术(中英文),2025,56(4):82-93.
6王燕.21世纪言子研究综述[J].东吴学术,2025(2):111-123.
7苑超,丁晓森,朱雷,胡天羽,申张亮,马宏忠.基于改进VMD与Transformer的GIS局部放电信号识别[J].机械与电子,2025,43(4):27-34. 被引量：2
8郭堂辉,黄毓.民族地区巩固拓展脱贫攻坚成果同乡村振兴有效衔接研究的回顾与展望[J].智慧农业导刊,2025,5(8):97-100.

数据分析与知识发现

2025年第2期

浏览历史

内容加载中请稍等...

多模态数据驱动的社交网络谣言传播者识别方法研究被引量：1

参考文献12

二级参考文献144

共引文献194

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

多模态数据驱动的社交网络谣言传播者识别方法研究 被引量：1

参考文献12

二级参考文献144

共引文献194

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

多模态数据驱动的社交网络谣言传播者识别方法研究被引量：1