自注意力时序点过程生成模型的Wasserstein学习方法被引量：1

Wasserstein learning method for self-attention temporal point process generation model

下载PDF

导出

摘要目前学界普遍通过循环神经网络(RNN)建模强度函数来刻画时序点过程,然而此类模型不能捕捉到事件序列之间的长程依赖关系,并且强度函数具体的参数形式会限制模型的泛化能力。针对上述问题,提出一种无强度函数的注意力机制的时序点过程生成模型。该模型使用Wasserstein距离构建损失函数,便于衡量模型分布与真实分布之间的偏差,利用自注意力机制描述历史事件对当前事件的影响程度,使得模型具有可解释性且泛化能力更强。对比实验表明,在缺失强度函数先验信息的情况下,该方法比RNN类的生成模型和极大似然模型在QQ图斜率的偏差和经验强度偏差这两个指标总体上分别减少35.125%和24.200%,证实了所提模型的有效性。 At present,the academic circles generally describe the temporal point process by modeling the intensity function using recurrent neural network(RNN).However,this kind of model can’t capture the long-range dependence between event sequences,and the specific parameter form of the intensity function will limit the generalization ability of the model.In order to solve these problems,this paper proposed a temporal point process self-attention generation model without intensity function.The model used Wasserstein distance to construct the objective function,which was convenient to measure the deviation between the model distribution and the real distribution,and used the self-attention mechanism to describe the impact of historical events on current events,so that the model was interpretable and had stronger robustness.Comparative experiments show that,in the absence of prior knowledge of intensity function,the deviation of QQ graph slope and empirical intensity deviation of this method reduce 35.125%and 24.200%respectively compared with RNN generation model and maximum likelihood mo-del,which proves the effectiveness of the proposed model.

作者芦佳明李晨龙魏毅强 Lu Jiaming;Li Chenlong;Wei Yiqiang(College of Mathematics,Taiyuan University of Technology,Jinzhong Shanxi 030600,China)

机构地区太原理工大学数学学院

出处《计算机应用研究》 CSCD 北大核心 2022年第2期456-460,共5页 Application Research of Computers

基金国家自然科学基金资助项目(61901294) 山西省应用基础研究计划资助项目(201901D211105)。

关键词事件序列时序点过程 Wasserstein距离多头自注意力 event sequence temporal point process Wasserstein distance multi-head self-attention

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1段超,张婧,何彬,陈增照.融合注意力机制的深度混合推荐算法[J].计算机应用研究,2021,38(9):2624-2627. 被引量：5
2冯永,张春平,强保华,张逸扬,尚家兴.GP-WIRGAN:梯度惩罚优化的Wasserstein图像循环生成对抗网络模型[J].计算机学报,2020,43(2):190-205. 被引量：8
3江海洋,王莉.一种建模社交化点过程序列预测算法[J].中国科学技术大学学报,2019,49(2):149-158. 被引量：1
4Xiao DING,Jihao SHI,Junwen DUAN,Bing QIN,Ting LIU.Quantifying the effects of long-term news on stock markets on the basis of the multikernel Hawkes process[J].Science China(Information Sciences),2021,64(9):40-52. 被引量：4

二级参考文献8

1欧卫,欧缤忆,谢赞福,肖政宏,彭平.一种基于PageRank的微博用户影响度评估算法[J].计算机与现代化,2013(12):34-37. 被引量：5
2朱扬勇,孙婧.推荐系统研究进展[J].计算机科学与探索,2015,9(5):513-525. 被引量：78
3王坤峰,苟超,段艳杰,林懿伦,郑心湖,王飞跃.生成式对抗网络GAN的研究进展与展望[J].自动化学报,2017,43(3):321-332. 被引量：367
4黄立威,江碧涛,吕守业,刘艳博,李德毅.基于深度学习的推荐系统研究综述[J].计算机学报,2018,41(7):1619-1647. 被引量：458
5王娜,何晓明,刘志强,王文君,李霞.一种基于用户播放行为序列的个性化视频推荐策略[J].计算机学报,2020,43(1):123-135. 被引量：36
6康雁,王沛尧,李浩,李晋源,杨其越,崔国荣.注意力协同辅助变分推荐算法[J].计算机应用研究,2020,37(11):3250-3254. 被引量：3
7刘浩翰,任洪润,贺怀清.一种基于自注意力机制的组推荐方法[J].计算机应用研究,2020,37(12):3572-3577. 被引量：11
8胡朝举,郑浩.融合上下文信息的深度推荐模型[J].计算机应用研究,2021,38(4):1074-1078. 被引量：5

共引文献14

1张浩,康海燕.基于特征优化生成对抗网络的在线交易反欺诈方法研究[J].郑州大学学报（理学版）,2022,54(1):69-74. 被引量：5
2侯鑫烨,董增寿,刘鑫.基于伪标签的弱监督迁移学习模型[J].机床与液压,2021,49(24):185-189. 被引量：2
3焦爽,范亚冰,孙立群,丁小龙.基于深度细节加强网络模型的去雨方法研究[J].电脑知识与技术,2021,17(35):80-84.
4盖昊宇,张震,姚庆锋,胡贵恒.基于LoRa技术的工业洁净室环境全覆盖监控系统[J].成都工业学院学报,2022,25(2):20-23. 被引量：1
5刘岭,王聚杰,李建平.融合新闻影响力衰减的国际原油价格预测研究[J].系统工程理论与实践,2022,42(10):2710-2720. 被引量：4
6李志鹏,国雍,陈耀佛,王耀威,曾炜,谭明奎.基于数据生成的类别均衡联邦学习[J].计算机学报,2023,46(3):609-625. 被引量：8
7刘园园.基于读者兴趣挖掘的深度学习推荐模型[J].西南大学学报（自然科学版）,2023,45(4):201-209. 被引量：3
8花馨,楚振艳,项阳,赵为灿,孙雪莲.基于改进神经协同过滤模型的高校选课推荐研究[J].科技与创新,2023(20):32-34.
9张大斌,黄均杰,凌立文,胡焕玲.融合新闻影响力衰减的碳价格多元分解集成预测[J].河南科技大学学报（自然科学版）,2024,45(1):51-61. 被引量：3
10陈昊冉,洪亮.融合知识关联与时序传导的金融舆情风险预测模型[J].数据分析与知识发现,2023,7(11):1-13. 被引量：1

引证文献1

1卞玮,李晨龙,侯红卫.基于条件生成对抗网络的深度点过程二次预测[J].计算机工程,2022,48(12):127-133.

1张瑞曦,徐青山,程煜,宋菁.极端灾害下考虑动态重构的微网形成策略[J].电力工程技术,2022,41(1):56-63. 被引量：15
2马畅,张选德.基于颜色名称的彩色图像质量评价[J].液晶与显示,2022,37(1):56-65. 被引量：3
3龚云鹏,曾智勇,叶锋.基于灰度域特征增强的行人重识别方法[J].计算机应用,2021,41(12):3590-3595. 被引量：4
4姚春桂,左金友,吴吉林,陈洁,罗贤玉,蒋景正,蒋福全.“显山露水”背景下张家界永定城区建筑高度控制优化研究[J].重庆建筑,2021,20(11):8-13. 被引量：3
5陈先红,杜明曦.叙事运输理论:隐喻、模型与运用[J].南昌大学学报（人文社会科学版）,2021,52(4):78-87. 被引量：22
6周涛,鲁耀斌.基于ELM的网上用户初始信任影响因素研究[J].信息系统学报,2009,3(1):48-56. 被引量：11
7王旋,狄鹏,谢经伟.基于多源先验数据的装备测试性评估方法[J].火力与指挥控制,2021,46(11):144-148. 被引量：1
8高奎勇.基于韦布尔寿命模型的血液透析机关键性部件寿命分布的研究[J].中国医疗设备,2021,36(12):49-53. 被引量：5
9穆应素,朱涛,龚小见,田义敏,周欣,陈华国,赵超.基于HPLC法测定大鼠体内烯啶虫胺药代动力学[J].农药,2022,61(1):38-41.
10郭文强,毛玲玲,黄梓轩,肖秦琨,郭志高.改进进化算法的贝叶斯网络结构学习及其应用[J].河南科技大学学报（自然科学版）,2022,43(2):34-40. 被引量：8

计算机应用研究

2022年第2期

浏览历史

内容加载中请稍等...

自注意力时序点过程生成模型的Wasserstein学习方法被引量：1

参考文献4

二级参考文献8

共引文献14

引证文献1

相关作者

相关机构

相关主题

浏览历史

自注意力时序点过程生成模型的Wasserstein学习方法 被引量：1

参考文献4

二级参考文献8

共引文献14

引证文献1

相关作者

相关机构

相关主题

浏览历史

自注意力时序点过程生成模型的Wasserstein学习方法被引量：1