期刊文献+
共找到368篇文章
< 1 2 19 >
每页显示 20 50 100
A Fast Interactive Sequential Pattern Mining Algorithm 被引量:1
1
作者 LU Jie-Ping LIU Yue-bo +2 位作者 NI wei-wei LIU Tong-ming SUN Zhi-hui 《Wuhan University Journal of Natural Sciences》 EI CAS 2006年第1期31-36,共6页
In order to reduce the computational and spatial complexity in rerunning algorithm of sequential patterns query, this paper proposes sequential patterns based and projection database based algorithm for fast interacti... In order to reduce the computational and spatial complexity in rerunning algorithm of sequential patterns query, this paper proposes sequential patterns based and projection database based algorithm for fast interactive sequential patterns mining algorithm (FISP), in which the number of frequent items of the projection databases constructed by the correct mining which based on the previously mined sequences has been reduced. Furthermore, the algorithm's iterative running times are reduced greatly by using global-threshold. The results of experiments testify that FISP outperforms PrefixSpan in interactive mining 展开更多
关键词 data mining sequential patterns interactive mining projection database
在线阅读 下载PDF
Multilevel Pattern Mining Architecture for Automatic Network Monitoring in Heterogeneous Wireless Communication Networks 被引量:8
2
作者 Zhiguo Qu John Keeney +2 位作者 Sebastian Robitzsch Faisal Zaman Xiaojun Wang 《China Communications》 SCIE CSCD 2016年第7期108-116,共9页
The rapid development of network technology and its evolution toward heterogeneous networks has increased the demand to support automatic monitoring and the management of heterogeneous wireless communication networks.... The rapid development of network technology and its evolution toward heterogeneous networks has increased the demand to support automatic monitoring and the management of heterogeneous wireless communication networks.This paper presents a multilevel pattern mining architecture to support automatic network management by discovering interesting patterns from telecom network monitoring data.This architecture leverages and combines existing frequent itemset discovery over data streams,association rule deduction,frequent sequential pattern mining,and frequent temporal pattern mining techniques while also making use of distributed processing platforms to achieve high-volume throughput. 展开更多
关键词 automatic network monitoring sequential pattern mining episode discovery module
在线阅读 下载PDF
Analysis and Classification of Fake News Using Sequential Pattern Mining 被引量:1
3
作者 M.Zohaib Nawaz M.Saqib Nawaz +1 位作者 Philippe Fournier-Viger Yulin He 《Big Data Mining and Analytics》 EI CSCD 2024年第3期942-963,共22页
Disinformation,often known as fake news,is a major issue that has received a lot of attention lately.Many researchers have proposed effective means of detecting and addressing it.Current machine and deep learning base... Disinformation,often known as fake news,is a major issue that has received a lot of attention lately.Many researchers have proposed effective means of detecting and addressing it.Current machine and deep learning based methodologies for classification/detection of fake news are content-based,network(propagation)based,or multimodal methods that combine both textual and visual information.We introduce here a framework,called FNACSPM,based on sequential pattern mining(SPM),for fake news analysis and classification.In this framework,six publicly available datasets,containing a diverse range of fake and real news,and their combination,are first transformed into a proper format.Then,algorithms for SPM are applied to the transformed datasets to extract frequent patterns(and rules)of words,phrases,or linguistic features.The obtained patterns capture distinctive characteristics associated with fake or real news content,providing valuable insights into the underlying structures and commonalities of misinformation.Subsequently,the discovered frequent patterns are used as features for fake news classification.This framework is evaluated with eight classifiers,and their performance is assessed with various metrics.Extensive experiments were performed and obtained results show that FNACSPM outperformed other state-of-the-art approaches for fake news classification,and that it expedites the classification task with high accuracy. 展开更多
关键词 disinformation fake news sequential pattern mining(SPM) frequent patterns CLASSIFICATION
原文传递
High Utility Periodic Frequent Pattern Mining in Multiple Sequences
4
作者 Chien-Ming Chen Zhenzhou Zhang +1 位作者 Jimmy Ming-Tai Wu Kuruva Lakshmanna 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第10期733-759,共27页
Periodic patternmining has become a popular research subject in recent years;this approach involves the discoveryof frequently recurring patterns in a transaction sequence. However, previous algorithms for periodic pa... Periodic patternmining has become a popular research subject in recent years;this approach involves the discoveryof frequently recurring patterns in a transaction sequence. However, previous algorithms for periodic patternmining have ignored the utility (profit, value) of patterns. Additionally, these algorithms only identify periodicpatterns in a single sequence. However, identifying patterns of high utility that are common to a set of sequencesis more valuable. In several fields, identifying high-utility periodic frequent patterns in multiple sequences isimportant. In this study, an efficient algorithm called MHUPFPS was proposed to identify such patterns. To addressexisting problems, three new measures are defined: the utility, high support, and high-utility period sequenceratios. Further, a new upper bound, upSeqRa, and two new pruning properties were proposed. MHUPFPS usesa newly defined HUPFPS-list structure to significantly accelerate the reduction of the search space and improvethe overall performance of the algorithm. Furthermore, the proposed algorithmis evaluated using several datasets.The experimental results indicate that the algorithm is accurate and effective in filtering several non-high-utilityperiodic frequent patterns. 展开更多
关键词 Decision making frequent periodic pattern multi-sequence database sequential rules utility mining
在线阅读 下载PDF
协作论证学习中学习者角色涌现及知识建构话语模式研究 被引量:3
5
作者 刘清堂 常瑀倍 +2 位作者 张羽 苗恩慧 李小娟 《电化教育研究》 北大核心 2025年第2期72-79,共8页
协作论证学习是培养学生沟通与交流、批判性思维能力的教学方式。从关联、动态视角分析学习者角色及其知识建构话语模式,有助于全面理解协作论证学习角色涌现及其知识建构参与。研究设计专家角色脚本支持学生协作论证讨论,采集学生协作... 协作论证学习是培养学生沟通与交流、批判性思维能力的教学方式。从关联、动态视角分析学习者角色及其知识建构话语模式,有助于全面理解协作论证学习角色涌现及其知识建构参与。研究设计专家角色脚本支持学生协作论证讨论,采集学生协作论证讨论的话语数据,通过内容分析、聚类分析、认知网络分析和序列模式挖掘的方法探索学习者角色涌现及知识建构话语模式。研究发现,协作论证学习中共涌现出四类学习者角色,分别是专家—高知识建构者、专家—低知识建构者、实践者—高知识建构者和实践者—低知识建构者,同时四种角色的知识建构话语模式存在显著差异。高知识建构者表现出复杂、高阶的知识建构话语的互动,积极地为协作论证讨论贡献群体智慧。实践者—低知识建构者在论证讨论中发表观点并赞同同伴观点,但对个人观点的深入阐述或对同伴观点的批判性思考和评价不足,缺乏深层次知识贡献和同伴互动。研究发现为通过教学干预来提升群体认知提供了启示。 展开更多
关键词 协作论证学习 角色涌现 知识建构 话语模式 序列模式挖掘
在线阅读 下载PDF
一种快速的高效用序列模式挖掘算法 被引量:1
6
作者 张瑞华 韩萌 +2 位作者 何菲菲 孟凡兴 李春鹏 《燕山大学学报》 北大核心 2025年第4期349-366,共18页
高效用序列模式挖掘任务主要是从序列数据库中提取高效用子序列从而获取潜在知识。然而,序列数据的效用计算与低效用阈值产生的搜索空间组合爆炸问题使得高效用序列模式挖掘极具挑战性。针对现有的高效用序列模式挖掘算法存在的时间与... 高效用序列模式挖掘任务主要是从序列数据库中提取高效用子序列从而获取潜在知识。然而,序列数据的效用计算与低效用阈值产生的搜索空间组合爆炸问题使得高效用序列模式挖掘极具挑战性。针对现有的高效用序列模式挖掘算法存在的时间与空间消耗成本过高的问题,提出了一种紧凑的效用索引列表结构,用于存储挖掘过程中序列的效用与位置等信息,基于该结构设计了一种快速的高效用序列模式挖掘算法。为了进一步提高算法的挖掘效率,提出了一种新的序列效用计算上界,用于缩减搜索空间。在真实和合成数据集上的大量实验表明,本文设计的算法在时间、内存、搜索空间缩减和可扩展性方面均优于目前先进算法。 展开更多
关键词 模式挖掘 高效用序列模式 序列分析 效用挖掘 效用索引列表
在线阅读 下载PDF
时间权重驱动的日志模式循环迭代挖掘算法
7
作者 黄岩 罗朝彤 +5 位作者 左金虎 肖忠良 陈佳 陈晓磊 王鹏 汪卫 《计算机应用与软件》 北大核心 2025年第11期311-317,397,共8页
日志数据是运维人员监控软件系统的重要依据,自动化挖掘日志模式能够有效地帮助运维人员理解系统的行为。然而,相同任务与不同任务的日志交错会干扰日志模式的挖掘。为此,提出一种时间权重驱动的日志模式循环迭代挖掘算法TSP-Miner。该... 日志数据是运维人员监控软件系统的重要依据,自动化挖掘日志模式能够有效地帮助运维人员理解系统的行为。然而,相同任务与不同任务的日志交错会干扰日志模式的挖掘。为此,提出一种时间权重驱动的日志模式循环迭代挖掘算法TSP-Miner。该算法提取关联日志的合理时间间隔作为时间权重,准确识别日志间的关联性并挖掘日志模式,无需任务特征信息。通过循环迭代挖掘的策略,TSP-Miner持续替换日志序列中符合已有日志模式的子序列,简化其结构,即使在交错干扰下也能有效挖掘日志模式。基于真实和模拟数据集的实验结果均表明,TSP-Miner挖掘出的日志模式质量优于已有算法。 展开更多
关键词 数据挖掘 模式挖掘 日志分析 序列模式
在线阅读 下载PDF
序列模式挖掘综述
8
作者 代震龙 韩萌 +2 位作者 杨文艳 朱诗能 杨书蓉 《计算机应用》 北大核心 2025年第7期2056-2069,共14页
序列模式挖掘(SPM)旨在从数据库中发现有趣的模式或规律,从而为用户决策提供支持与指导。近年来,对SPM相关算法的研究日益深入。随着大规模数据的出现,已经提出许多适用于并行环境的序列算法。因此,对现有的串并行序列挖掘算法进行综述... 序列模式挖掘(SPM)旨在从数据库中发现有趣的模式或规律,从而为用户决策提供支持与指导。近年来,对SPM相关算法的研究日益深入。随着大规模数据的出现,已经提出许多适用于并行环境的序列算法。因此,对现有的串并行序列挖掘算法进行综述。首先,对于序列模式串行挖掘算法进行结构化的分类,即依据算法采用的数据结构将算法划分为树结构、列表结构和链式结构等,全面总结不同结构的优势与不足,并详细归纳各算法的优缺点;其次,对于序列模式并行挖掘算法,首次根据存储结构的不同特点对现有的分布式框架进行分类,分析不同分布式框架的优缺点,并依据框架对并行算法进行介绍与分析;最后,针对现有SPM算法的不足,讨论下一步的研究方向。 展开更多
关键词 序列模式挖掘 树结构 列表结构 分布式框架
在线阅读 下载PDF
在MOOCCube中发现具有效率约束的序列模式
9
作者 彭亚威 李艳红 +1 位作者 杨洋 张法 《中南民族大学学报(自然科学版)》 2025年第3期373-383,共11页
大规模开放在线课程(MOOC)平台作为在线学习的重要工具,能够捕捉丰富的学习行为数据.MOOCube作为关键的数据存储库,汇聚了来自学堂在线的48640个学习行为序列.然而,鉴于MOOC数据的复杂性,传统的序列模式挖掘(SPM)算法在处理这类数据时... 大规模开放在线课程(MOOC)平台作为在线学习的重要工具,能够捕捉丰富的学习行为数据.MOOCube作为关键的数据存储库,汇聚了来自学堂在线的48640个学习行为序列.然而,鉴于MOOC数据的复杂性,传统的序列模式挖掘(SPM)算法在处理这类数据时可能会遇到挑战,导致挖掘出大量不相关的模式.为了提升挖掘结果的有效性,提出了一种效率约束序列模式挖掘(ECSPM)方法.该方法引入了出勤性、离散性和辍学性三大关键约束,这些约束能够精准捕捉学习行为中的不同特征对序列模式挖掘的影响.值得注意的是,这些约束具有向下封闭性质,确保了它们在模式挖掘过程中的有效性.为了发现序列模式(SP),精心设计了3种算法.这些算法结合了逐级搜索空间遍历或递归投影技术,并将成本概念融入模式挖掘过程中.实验评估结果表明:本文提出的算法效果显著.ECSPM不仅显著减少了发现的模式的数量,而且其性能与经典SPM算法相当,甚至在某些方面更优. 展开更多
关键词 学习行为 序列模式挖掘 效率约束序列模式挖掘 成本
在线阅读 下载PDF
基于数据挖掘技术的计算机软件工程研究
10
作者 郝亚茹 《移动信息》 2025年第7期458-460,共3页
随着软件规模的日益增大,计算机软件工程面临着诸多挑战,而数据挖掘技术为解决这些问题提供了一种有效的途径。文中通过设计一个基于数据挖掘技术的计算机软件工程实验,对软件工程进行了分析,旨在探索软件工程中可能存在的模式、趋势和... 随着软件规模的日益增大,计算机软件工程面临着诸多挑战,而数据挖掘技术为解决这些问题提供了一种有效的途径。文中通过设计一个基于数据挖掘技术的计算机软件工程实验,对软件工程进行了分析,旨在探索软件工程中可能存在的模式、趋势和关联。该实验结果将为计算机软件工程提供了有价值的参考和启示。 展开更多
关键词 数据挖掘 聚类分析 关联规则挖掘 序列模式挖掘
在线阅读 下载PDF
From Sequential Pattern Mining to Structured Pattern Mining: A Pattern-Growth Approach 被引量:18
11
作者 Jia-WeiHan JianPei Xi-FengYan 《Journal of Computer Science & Technology》 SCIE EI CSCD 2004年第3期257-279,共23页
Sequential pattern mining is an important data mining problem with broadapplications. However, it is also a challenging problem since the mining may have to generate orexamine a combinatorially explosive number of int... Sequential pattern mining is an important data mining problem with broadapplications. However, it is also a challenging problem since the mining may have to generate orexamine a combinatorially explosive number of intermediate subsequences. Recent studies havedeveloped two major classes of sequential pattern mining methods: (1) a candidategeneration-and-test approach, represented by (ⅰ) GSP, a horizontal format-based sequential patternmining method, and (ⅱ) SPADE, a vertical format-based method; and (2) a pattern-growth method,represented by PrefixSpan and its further extensions, such as gSpan for mining structured patterns.In this study, we perform a systematic introduction and presentation of the pattern-growthmethodology and study its principles and extensions. We first introduce two interestingpattern-growth algorithms, FreeSpan and PrefixSpan, for efficient sequential pattern mining. Then weintroduce gSpan for mining structured patterns using the same methodology. Their relativeperformance in large databases is presented and analyzed. Several extensions of these methods arealso discussed in the paper, including mining multi-level, multi-dimensional patterns and miningconstraint-based patterns. 展开更多
关键词 data mining sequential pattern mining structured pattern mining SCALABILITY performance analysis
原文传递
Finding frequent trajectories by clustering and sequential pattern mining 被引量:4
12
作者 Arthur A.Shaw N.P.Gopalan 《Journal of Traffic and Transportation Engineering(English Edition)》 2014年第6期393-403,共11页
Data mining is a powerful emerging technology that helps to extract hidden information from a huge volume of historical data. This paper is concerned with finding the frequent trajectories of moving objects in spatio-... Data mining is a powerful emerging technology that helps to extract hidden information from a huge volume of historical data. This paper is concerned with finding the frequent trajectories of moving objects in spatio-temporal data by a novel method adopting the concepts of clustering and sequential pattern mining. The algorithms used logically split the trajectory span area into clusters and then apply the k-means algorithm over this clusters until the squared error minimizes. The new method applies the threshold to obtain active clusters and arranges them in descending order based on number of trajectories passing through. From these active clusters, inter cluster patterns are found by a sequential pattern mining technique. The process is repeated until all the active clusters are linked. The clusters thus linked in sequence are the frequent trajectories. A set of experiments conducted using real datasets shows that the proposed method is relatively five times better than the existing ones. A comparison is made with the results of other algorithms and their variation is analyzed by statistical methods. Further, tests of significance are conducted with ANOVA to find the efficient threshold value for the optimum plot of frequent trajectories. The results are analyzed and found to be superior than the existing ones. This approach may be of relevance in finding alternate paths in busy networks ( congestion control), finding the frequent paths of migratory birds, or even to predict the next level of pattern characteristics in case of time series data with minor alterations and finding the frequent path of balls in certain games. 展开更多
关键词 data mining frequent trajectory CLUSTERING sequential pattern mining statistical method
原文传递
MNWAP-mine:一种改进的频繁模式挖掘算法
13
作者 蒋倩倩 王逊 黄树成 《江苏科技大学学报(自然科学版)》 CAS 北大核心 2016年第1期59-64,共6页
Web访问序列模式挖掘可以发现用户与网站交互的频繁模式,进而预测未来的访问模式.针对传统WAP-mine算法的不足,文中提出一种新的MNWAP-mine算法.首先,对WAP-tree的数据结构进行改进,采用一种基于Hash表的辅助存储结构辅助序列的查找,使... Web访问序列模式挖掘可以发现用户与网站交互的频繁模式,进而预测未来的访问模式.针对传统WAP-mine算法的不足,文中提出一种新的MNWAP-mine算法.首先,对WAP-tree的数据结构进行改进,采用一种基于Hash表的辅助存储结构辅助序列的查找,使该算法节省了序列的查找时间;其次,针对WAP-mine算法在构造WAP-tree时需两次数据库完整扫描的缺点,利用第1次扫描的结果,获得只包含频繁项集的序列,在第2遍扫描数据库时仅仅扫描包含频繁项集的序列,节省了扫描时间;最后,由于WAP-mine算法会产生大量子树,而新算法采用合并频繁子节点的方法,因此,提高了挖掘频繁模式的效率.实验结果表明:与现有的算法相比,新算法具有较高的效率和性能. 展开更多
关键词 Web频繁序列模式挖掘 WAP-mine算法 MNWAP-mine算法 WAP-tree
在线阅读 下载PDF
A Fast Algorithm for Mining Sequential Patterns from Large Databases
14
作者 陈宁 陈安 +1 位作者 周龙骧 刘鲁 《Journal of Computer Science & Technology》 SCIE EI CSCD 2001年第4期359-370,共12页
Mining sequential patterns from large databases has been recognized by many researchers as an attractive task of data mining and knowledge dis- covery. Previous algorithms scan the databases for many times, which is ... Mining sequential patterns from large databases has been recognized by many researchers as an attractive task of data mining and knowledge dis- covery. Previous algorithms scan the databases for many times, which is often unendurable due to the very large amount of databases. In this paper, the authors introduce an effective algorithm for mining sequential patterns from large databases. In the algorithm, the original database is not used at all for counting the support of sequences after the first pass. Rather, a tidlist structure generated in the Previous pass is employed for the purpose based on set intersection operations, avoiding the multiple scans of the databases. 展开更多
关键词 data mining knowledge discovery sequential pattern set opera-tion
原文传递
Mapping frequent spatio-temporal wind profile patterns using multi-dimensional sequential pattern mining
15
作者 Norhakim Yusof Raul Zurita-Milla 《International Journal of Digital Earth》 SCIE EI 2017年第3期238-256,共19页
Holistic understanding of wind behaviour over space,time and height is essential for harvesting wind energy application.This study presents a novel approach for mapping frequent wind profile patterns using multidimen... Holistic understanding of wind behaviour over space,time and height is essential for harvesting wind energy application.This study presents a novel approach for mapping frequent wind profile patterns using multidimensional sequential pattern mining(MDSPM).This study is illustrated with a time series of 24 years of European Centre for Medium-Range Weather Forecasts European Reanalysis-Interim gridded(0.125°×0.125°)wind data for the Netherlands every 6 h and at six height levels.The wind data were first transformed into two spatio-temporal sequence databases(for speed and direction,respectively).Then,the Linear time Closed Itemset Miner Sequence algorithm was used to extract the multidimensional sequential patterns,which were then visualized using a 3D wind rose,a circular histogram and a geographical map.These patterns were further analysed to determine their wind shear coefficients and turbulence intensities as well as their spatial overlap with current areas with wind turbines.Our analysis identified four frequent wind profile patterns.One of them highly suitable to harvest wind energy at a height of 128 m and 68.97%of the geographical area covered by this pattern already contains wind turbines.This study shows that the proposed approach is capable of efficiently extracting meaningful patterns from complex spatio-temporal datasets. 展开更多
关键词 Spatio-temporal data mining multi-dimensional sequential pattern mining wind shear coefficient turbulence intensity wind energy
原文传递
基于情境感知和序列模式挖掘的气象学习资源推荐算法 被引量:6
16
作者 王帅 马景奕 +1 位作者 周远洋 王甫棣 《气象科技》 2024年第1期37-44,共8页
随着互联网的快速发展,气象部门职工作为学习者可以获得的学习资源得到极大丰富。信息超载导致检索合适的在线学习资源时遇到了困难;学习者在不同学习环境和序列访问模式上也有不同的学习需求。但是,现有的推荐系统,如基于内容的推荐和... 随着互联网的快速发展,气象部门职工作为学习者可以获得的学习资源得到极大丰富。信息超载导致检索合适的在线学习资源时遇到了困难;学习者在不同学习环境和序列访问模式上也有不同的学习需求。但是,现有的推荐系统,如基于内容的推荐和协同过滤,没有结合学习者的情境和序列访问模式,推荐结果准确度不高。本文提出了一种结合情境感知、序列模式挖掘和协同过滤算法的混合推荐算法来为学习者推荐学习资源。混合推荐算法中,情境感知被用来整合学习者的情境信息,如知识水平和学习目标;序列模式挖掘被用来对网络日志进行挖掘,发现学习者的序列访问模式;协同过滤被用来根据学习者的情境数据和序列访问模式为目标学习者计算预测并生成建议。实验和应用效果表明,该混合推荐算法推荐的质量和准确性方面优于其他推荐算法。 展开更多
关键词 推荐系统 混合推荐 情境感知 协同过滤 序列模式挖掘
在线阅读 下载PDF
一种有效的周期高效用序列模式增量挖掘算法 被引量:3
17
作者 荀亚玲 任姿芊 闫海博 《计算机应用研究》 CSCD 北大核心 2024年第8期2301-2308,共8页
周期高效用序列模式挖掘(PHUSPM)因其能够发现时间序列中更具实际价值的规律性模式而备受关注,但现有的PHUSPM算法难以有效地处理数据集的增量更新,且未考虑大规模数据下算法的向下闭包性和复杂性。针对该问题,提出了IncPUS-Miner算法,... 周期高效用序列模式挖掘(PHUSPM)因其能够发现时间序列中更具实际价值的规律性模式而备受关注,但现有的PHUSPM算法难以有效地处理数据集的增量更新,且未考虑大规模数据下算法的向下闭包性和复杂性。针对该问题,提出了IncPUS-Miner算法,有效地实现了周期高效用序列模式(PHUSPs)的增量挖掘。IncPUS-Miner引入了一种名为pu-tree的新型数据结构,每个树节点对应一个更新效用列表(UUL)用于存储相应序列的辅助信息,当有增量数据加入时,该结构使得项目信息能够灵活更新,从而增强了算法的动态适应性和可扩展性。此外,还提出了两种新的序列效用上界PUB和EUB,以及两种相应的剪枝策略,有效地减少了计算负担。实验结果表明,在真实数据集上,IncPUS-Miner算法可以有效地增量挖掘PHUSPs,与其他算法相比,在运行效率和内存消耗上展现出了优越的性能。 展开更多
关键词 增量挖掘 高效用序列模式 周期序列模式 序列模式挖掘
在线阅读 下载PDF
一种对比序列模式挖掘算法 被引量:2
18
作者 谢婷萱 武优西 +1 位作者 王月华 李艳 《小型微型计算机系统》 CSCD 北大核心 2024年第8期1808-1815,共8页
对比序列模式挖掘作为序列模式挖掘领域的一个重要分支,可以有效识别不同类别间差异显著的模式,并被广泛应用在序列分类、特征提取等场景中.但传统的对比序列模式挖掘仅考虑了模式在序列中是否出现,忽略了模式在序列中的重复性;并且需... 对比序列模式挖掘作为序列模式挖掘领域的一个重要分支,可以有效识别不同类别间差异显著的模式,并被广泛应用在序列分类、特征提取等场景中.但传统的对比序列模式挖掘仅考虑了模式在序列中是否出现,忽略了模式在序列中的重复性;并且需要用户预先设置间隙约束值,导致算法的灵活性较差.为了解决上述问题,本文提出一次性条件下自适应对比序列模式挖掘算法OSCP,该算法采用逆向填充策略计算模式支持度,不仅关注了模式在序列中的具体出现情况,还提高了算法的计算效率;同时采用模式连接策略以减少候选模式数量.此外,本文采用自适应间隙,无需用户预先设置间隙约束,可基于序列的实际特征计算模式的支持度.实验结果表明,OSCP算法的挖掘性能和分类效果均优于其他对比算法. 展开更多
关键词 序列模式挖掘 对比模式 候选模式生成 序列分类
在线阅读 下载PDF
一次性条件下top-k高平均效用序列模式挖掘算法 被引量:2
19
作者 杨克帅 武优西 +2 位作者 耿萌 刘靖宇 李艳 《计算机应用》 CSCD 北大核心 2024年第2期477-484,共8页
针对传统序列模式挖掘(SPM)不考虑模式重复性且忽略各项的效用(单价或利润)与模式长度对用户兴趣度影响的问题,提出一次性条件下top-k高平均效用序列模式挖掘(TOUP)算法。TOUP算法主要包括两个核心步骤:平均效用计算和候选模式生成。首... 针对传统序列模式挖掘(SPM)不考虑模式重复性且忽略各项的效用(单价或利润)与模式长度对用户兴趣度影响的问题,提出一次性条件下top-k高平均效用序列模式挖掘(TOUP)算法。TOUP算法主要包括两个核心步骤:平均效用计算和候选模式生成。首先,提出基于各项出现位置与项重复关系数组的CSP(Calculation Support of Pattern)算法计算模式支持度,从而实现模式平均效用的快速计算;其次,采用项集扩展和序列扩展生成候选模式,并提出了最大平均效用上界,基于该上界实现对候选模式的有效剪枝。在5个真实数据集和1个合成数据集上的实验结果表明,相较于TOUP-dfs和HAOP-ms算法,TOUP算法的候选模式数分别降低了38.5%~99.8%和0.9%~77.6%;运行时间分别降低了33.6%~97.1%和57.9%~97.2%。TOUP的算法性能更优,能更高效地挖掘用户感兴趣的模式。 展开更多
关键词 数据挖掘 序列模式挖掘 高平均效用 一次性条件 TOP-K
在线阅读 下载PDF
一次性条件下的三支序列模式挖掘 被引量:1
20
作者 杨仕琦 武优西 +1 位作者 耿萌 李艳 《计算机工程与科学》 CSCD 北大核心 2024年第7期1286-1295,共10页
一次性条件下的序列模式挖掘旨在从序列数据中挖掘出带有间隙约束的重复序列模式。然而,现有方法不考虑用户的兴趣度,将序列中的每个字符视作同等重要,导致许多用户不感兴趣的冗余模式被发现。为了解决这个问题,将三支决策思想引入序列... 一次性条件下的序列模式挖掘旨在从序列数据中挖掘出带有间隙约束的重复序列模式。然而,现有方法不考虑用户的兴趣度,将序列中的每个字符视作同等重要,导致许多用户不感兴趣的冗余模式被发现。为了解决这个问题,将三支决策思想引入序列模式挖掘领域,提出了一次性条件下的三支序列模式挖掘问题及其求解算法。在支持度计算方面,该算法基于深度优先搜索和回溯的策略,结合三支模式的特点以高效求解模式支持度。在候选模式生成方面,该算法采用模式连接策略缩减候选模式数量。此外,该算法还采用了并行化方案充分利用现代处理器的多核性能,提高算法的挖掘效率。最后,实验结果验证了研究一次性条件下的三支序列模式挖掘问题的意义和算法的高效性。 展开更多
关键词 序列模式挖掘 三支决策 三支序列模式 一次性 并行化算法
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部