期刊文献+
共找到368篇文章
< 1 2 19 >
每页显示 20 50 100
A Fast Interactive Sequential Pattern Mining Algorithm 被引量:1
1
作者 LU Jie-Ping LIU Yue-bo +2 位作者 NI wei-wei LIU Tong-ming SUN Zhi-hui 《Wuhan University Journal of Natural Sciences》 EI CAS 2006年第1期31-36,共6页
In order to reduce the computational and spatial complexity in rerunning algorithm of sequential patterns query, this paper proposes sequential patterns based and projection database based algorithm for fast interacti... In order to reduce the computational and spatial complexity in rerunning algorithm of sequential patterns query, this paper proposes sequential patterns based and projection database based algorithm for fast interactive sequential patterns mining algorithm (FISP), in which the number of frequent items of the projection databases constructed by the correct mining which based on the previously mined sequences has been reduced. Furthermore, the algorithm's iterative running times are reduced greatly by using global-threshold. The results of experiments testify that FISP outperforms PrefixSpan in interactive mining 展开更多
关键词 data mining sequential patterns interactive mining projection database
在线阅读 下载PDF
Multilevel Pattern Mining Architecture for Automatic Network Monitoring in Heterogeneous Wireless Communication Networks 被引量:8
2
作者 Zhiguo Qu John Keeney +2 位作者 Sebastian Robitzsch Faisal Zaman Xiaojun Wang 《China Communications》 SCIE CSCD 2016年第7期108-116,共9页
The rapid development of network technology and its evolution toward heterogeneous networks has increased the demand to support automatic monitoring and the management of heterogeneous wireless communication networks.... The rapid development of network technology and its evolution toward heterogeneous networks has increased the demand to support automatic monitoring and the management of heterogeneous wireless communication networks.This paper presents a multilevel pattern mining architecture to support automatic network management by discovering interesting patterns from telecom network monitoring data.This architecture leverages and combines existing frequent itemset discovery over data streams,association rule deduction,frequent sequential pattern mining,and frequent temporal pattern mining techniques while also making use of distributed processing platforms to achieve high-volume throughput. 展开更多
关键词 automatic network monitoring sequential pattern mining episode discovery module
在线阅读 下载PDF
High Utility Periodic Frequent Pattern Mining in Multiple Sequences
3
作者 Chien-Ming Chen Zhenzhou Zhang +1 位作者 Jimmy Ming-Tai Wu Kuruva Lakshmanna 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第10期733-759,共27页
Periodic patternmining has become a popular research subject in recent years;this approach involves the discoveryof frequently recurring patterns in a transaction sequence. However, previous algorithms for periodic pa... Periodic patternmining has become a popular research subject in recent years;this approach involves the discoveryof frequently recurring patterns in a transaction sequence. However, previous algorithms for periodic patternmining have ignored the utility (profit, value) of patterns. Additionally, these algorithms only identify periodicpatterns in a single sequence. However, identifying patterns of high utility that are common to a set of sequencesis more valuable. In several fields, identifying high-utility periodic frequent patterns in multiple sequences isimportant. In this study, an efficient algorithm called MHUPFPS was proposed to identify such patterns. To addressexisting problems, three new measures are defined: the utility, high support, and high-utility period sequenceratios. Further, a new upper bound, upSeqRa, and two new pruning properties were proposed. MHUPFPS usesa newly defined HUPFPS-list structure to significantly accelerate the reduction of the search space and improvethe overall performance of the algorithm. Furthermore, the proposed algorithmis evaluated using several datasets.The experimental results indicate that the algorithm is accurate and effective in filtering several non-high-utilityperiodic frequent patterns. 展开更多
关键词 Decision making frequent periodic pattern multi-sequence database sequential rules utility mining
在线阅读 下载PDF
协作论证学习中学习者角色涌现及知识建构话语模式研究 被引量:3
4
作者 刘清堂 常瑀倍 +2 位作者 张羽 苗恩慧 李小娟 《电化教育研究》 北大核心 2025年第2期72-79,共8页
协作论证学习是培养学生沟通与交流、批判性思维能力的教学方式。从关联、动态视角分析学习者角色及其知识建构话语模式,有助于全面理解协作论证学习角色涌现及其知识建构参与。研究设计专家角色脚本支持学生协作论证讨论,采集学生协作... 协作论证学习是培养学生沟通与交流、批判性思维能力的教学方式。从关联、动态视角分析学习者角色及其知识建构话语模式,有助于全面理解协作论证学习角色涌现及其知识建构参与。研究设计专家角色脚本支持学生协作论证讨论,采集学生协作论证讨论的话语数据,通过内容分析、聚类分析、认知网络分析和序列模式挖掘的方法探索学习者角色涌现及知识建构话语模式。研究发现,协作论证学习中共涌现出四类学习者角色,分别是专家—高知识建构者、专家—低知识建构者、实践者—高知识建构者和实践者—低知识建构者,同时四种角色的知识建构话语模式存在显著差异。高知识建构者表现出复杂、高阶的知识建构话语的互动,积极地为协作论证讨论贡献群体智慧。实践者—低知识建构者在论证讨论中发表观点并赞同同伴观点,但对个人观点的深入阐述或对同伴观点的批判性思考和评价不足,缺乏深层次知识贡献和同伴互动。研究发现为通过教学干预来提升群体认知提供了启示。 展开更多
关键词 协作论证学习 角色涌现 知识建构 话语模式 序列模式挖掘
在线阅读 下载PDF
一种快速的高效用序列模式挖掘算法 被引量:1
5
作者 张瑞华 韩萌 +2 位作者 何菲菲 孟凡兴 李春鹏 《燕山大学学报》 北大核心 2025年第4期349-366,共18页
高效用序列模式挖掘任务主要是从序列数据库中提取高效用子序列从而获取潜在知识。然而,序列数据的效用计算与低效用阈值产生的搜索空间组合爆炸问题使得高效用序列模式挖掘极具挑战性。针对现有的高效用序列模式挖掘算法存在的时间与... 高效用序列模式挖掘任务主要是从序列数据库中提取高效用子序列从而获取潜在知识。然而,序列数据的效用计算与低效用阈值产生的搜索空间组合爆炸问题使得高效用序列模式挖掘极具挑战性。针对现有的高效用序列模式挖掘算法存在的时间与空间消耗成本过高的问题,提出了一种紧凑的效用索引列表结构,用于存储挖掘过程中序列的效用与位置等信息,基于该结构设计了一种快速的高效用序列模式挖掘算法。为了进一步提高算法的挖掘效率,提出了一种新的序列效用计算上界,用于缩减搜索空间。在真实和合成数据集上的大量实验表明,本文设计的算法在时间、内存、搜索空间缩减和可扩展性方面均优于目前先进算法。 展开更多
关键词 模式挖掘 高效用序列模式 序列分析 效用挖掘 效用索引列表
在线阅读 下载PDF
时间权重驱动的日志模式循环迭代挖掘算法
6
作者 黄岩 罗朝彤 +5 位作者 左金虎 肖忠良 陈佳 陈晓磊 王鹏 汪卫 《计算机应用与软件》 北大核心 2025年第11期311-317,397,共8页
日志数据是运维人员监控软件系统的重要依据,自动化挖掘日志模式能够有效地帮助运维人员理解系统的行为。然而,相同任务与不同任务的日志交错会干扰日志模式的挖掘。为此,提出一种时间权重驱动的日志模式循环迭代挖掘算法TSP-Miner。该... 日志数据是运维人员监控软件系统的重要依据,自动化挖掘日志模式能够有效地帮助运维人员理解系统的行为。然而,相同任务与不同任务的日志交错会干扰日志模式的挖掘。为此,提出一种时间权重驱动的日志模式循环迭代挖掘算法TSP-Miner。该算法提取关联日志的合理时间间隔作为时间权重,准确识别日志间的关联性并挖掘日志模式,无需任务特征信息。通过循环迭代挖掘的策略,TSP-Miner持续替换日志序列中符合已有日志模式的子序列,简化其结构,即使在交错干扰下也能有效挖掘日志模式。基于真实和模拟数据集的实验结果均表明,TSP-Miner挖掘出的日志模式质量优于已有算法。 展开更多
关键词 数据挖掘 模式挖掘 日志分析 序列模式
在线阅读 下载PDF
序列模式挖掘综述
7
作者 代震龙 韩萌 +2 位作者 杨文艳 朱诗能 杨书蓉 《计算机应用》 北大核心 2025年第7期2056-2069,共14页
序列模式挖掘(SPM)旨在从数据库中发现有趣的模式或规律,从而为用户决策提供支持与指导。近年来,对SPM相关算法的研究日益深入。随着大规模数据的出现,已经提出许多适用于并行环境的序列算法。因此,对现有的串并行序列挖掘算法进行综述... 序列模式挖掘(SPM)旨在从数据库中发现有趣的模式或规律,从而为用户决策提供支持与指导。近年来,对SPM相关算法的研究日益深入。随着大规模数据的出现,已经提出许多适用于并行环境的序列算法。因此,对现有的串并行序列挖掘算法进行综述。首先,对于序列模式串行挖掘算法进行结构化的分类,即依据算法采用的数据结构将算法划分为树结构、列表结构和链式结构等,全面总结不同结构的优势与不足,并详细归纳各算法的优缺点;其次,对于序列模式并行挖掘算法,首次根据存储结构的不同特点对现有的分布式框架进行分类,分析不同分布式框架的优缺点,并依据框架对并行算法进行介绍与分析;最后,针对现有SPM算法的不足,讨论下一步的研究方向。 展开更多
关键词 序列模式挖掘 树结构 列表结构 分布式框架
在线阅读 下载PDF
Analysis and Classification of Fake News Using Sequential Pattern Mining 被引量:1
8
作者 M.Zohaib Nawaz M.Saqib Nawaz +1 位作者 Philippe Fournier-Viger Yulin He 《Big Data Mining and Analytics》 EI CSCD 2024年第3期942-963,共22页
Disinformation,often known as fake news,is a major issue that has received a lot of attention lately.Many researchers have proposed effective means of detecting and addressing it.Current machine and deep learning base... Disinformation,often known as fake news,is a major issue that has received a lot of attention lately.Many researchers have proposed effective means of detecting and addressing it.Current machine and deep learning based methodologies for classification/detection of fake news are content-based,network(propagation)based,or multimodal methods that combine both textual and visual information.We introduce here a framework,called FNACSPM,based on sequential pattern mining(SPM),for fake news analysis and classification.In this framework,six publicly available datasets,containing a diverse range of fake and real news,and their combination,are first transformed into a proper format.Then,algorithms for SPM are applied to the transformed datasets to extract frequent patterns(and rules)of words,phrases,or linguistic features.The obtained patterns capture distinctive characteristics associated with fake or real news content,providing valuable insights into the underlying structures and commonalities of misinformation.Subsequently,the discovered frequent patterns are used as features for fake news classification.This framework is evaluated with eight classifiers,and their performance is assessed with various metrics.Extensive experiments were performed and obtained results show that FNACSPM outperformed other state-of-the-art approaches for fake news classification,and that it expedites the classification task with high accuracy. 展开更多
关键词 disinformation fake news sequential pattern mining(spm) frequent patterns CLASSIFICATION
原文传递
在MOOCCube中发现具有效率约束的序列模式
9
作者 彭亚威 李艳红 +1 位作者 杨洋 张法 《中南民族大学学报(自然科学版)》 2025年第3期373-383,共11页
大规模开放在线课程(MOOC)平台作为在线学习的重要工具,能够捕捉丰富的学习行为数据.MOOCube作为关键的数据存储库,汇聚了来自学堂在线的48640个学习行为序列.然而,鉴于MOOC数据的复杂性,传统的序列模式挖掘(SPM)算法在处理这类数据时... 大规模开放在线课程(MOOC)平台作为在线学习的重要工具,能够捕捉丰富的学习行为数据.MOOCube作为关键的数据存储库,汇聚了来自学堂在线的48640个学习行为序列.然而,鉴于MOOC数据的复杂性,传统的序列模式挖掘(SPM)算法在处理这类数据时可能会遇到挑战,导致挖掘出大量不相关的模式.为了提升挖掘结果的有效性,提出了一种效率约束序列模式挖掘(ECSPM)方法.该方法引入了出勤性、离散性和辍学性三大关键约束,这些约束能够精准捕捉学习行为中的不同特征对序列模式挖掘的影响.值得注意的是,这些约束具有向下封闭性质,确保了它们在模式挖掘过程中的有效性.为了发现序列模式(SP),精心设计了3种算法.这些算法结合了逐级搜索空间遍历或递归投影技术,并将成本概念融入模式挖掘过程中.实验评估结果表明:本文提出的算法效果显著.ECSPM不仅显著减少了发现的模式的数量,而且其性能与经典SPM算法相当,甚至在某些方面更优. 展开更多
关键词 学习行为 序列模式挖掘 效率约束序列模式挖掘 成本
在线阅读 下载PDF
基于数据挖掘技术的计算机软件工程研究
10
作者 郝亚茹 《移动信息》 2025年第7期458-460,共3页
随着软件规模的日益增大,计算机软件工程面临着诸多挑战,而数据挖掘技术为解决这些问题提供了一种有效的途径。文中通过设计一个基于数据挖掘技术的计算机软件工程实验,对软件工程进行了分析,旨在探索软件工程中可能存在的模式、趋势和... 随着软件规模的日益增大,计算机软件工程面临着诸多挑战,而数据挖掘技术为解决这些问题提供了一种有效的途径。文中通过设计一个基于数据挖掘技术的计算机软件工程实验,对软件工程进行了分析,旨在探索软件工程中可能存在的模式、趋势和关联。该实验结果将为计算机软件工程提供了有价值的参考和启示。 展开更多
关键词 数据挖掘 聚类分析 关联规则挖掘 序列模式挖掘
在线阅读 下载PDF
本地化差分隐私下的频繁序列模式挖掘算法PrivSPM 被引量:6
11
作者 黄硕 李艳辉 曹建秋 《计算机应用》 CSCD 北大核心 2023年第7期2057-2064,共8页
序列数据中可能包含大量敏感信息,因此直接对序列数据的频繁模式进行挖掘存在泄露用户隐私信息的风险。本地化差分隐私(LDP)能够抵御具有任意背景知识的攻击者,可以对敏感信息提供更全面的保护。序列数据内在序列性和高维度的特点为LDP... 序列数据中可能包含大量敏感信息,因此直接对序列数据的频繁模式进行挖掘存在泄露用户隐私信息的风险。本地化差分隐私(LDP)能够抵御具有任意背景知识的攻击者,可以对敏感信息提供更全面的保护。序列数据内在序列性和高维度的特点为LDP应用于频繁序列模式挖掘带来了挑战。为解决这个问题,提出一种满足ε-LDP的top-k频繁序列模式挖掘算法PrivSPM。该算法结合填充和采样技术、自适应频率估计算法与频繁项预测技术来构造候选集;基于新域,利用基于指数机制的策略对用户数据进行扰动,并结合频率估计算法识别最终的频繁序列模式。理论分析证明了该算法满足ε-LDP。在3个真实数据集上的实验结果表明,PrivSPM算法在纳真率(TPR)和归一化累积排名(NCR)上明显高于对比算法,能有效提高挖掘结果的准确度。 展开更多
关键词 本地化差分隐私 隐私保护 频繁序列模式挖掘 指数机制 数据挖掘
在线阅读 下载PDF
基于情境感知和序列模式挖掘的气象学习资源推荐算法 被引量:6
12
作者 王帅 马景奕 +1 位作者 周远洋 王甫棣 《气象科技》 2024年第1期37-44,共8页
随着互联网的快速发展,气象部门职工作为学习者可以获得的学习资源得到极大丰富。信息超载导致检索合适的在线学习资源时遇到了困难;学习者在不同学习环境和序列访问模式上也有不同的学习需求。但是,现有的推荐系统,如基于内容的推荐和... 随着互联网的快速发展,气象部门职工作为学习者可以获得的学习资源得到极大丰富。信息超载导致检索合适的在线学习资源时遇到了困难;学习者在不同学习环境和序列访问模式上也有不同的学习需求。但是,现有的推荐系统,如基于内容的推荐和协同过滤,没有结合学习者的情境和序列访问模式,推荐结果准确度不高。本文提出了一种结合情境感知、序列模式挖掘和协同过滤算法的混合推荐算法来为学习者推荐学习资源。混合推荐算法中,情境感知被用来整合学习者的情境信息,如知识水平和学习目标;序列模式挖掘被用来对网络日志进行挖掘,发现学习者的序列访问模式;协同过滤被用来根据学习者的情境数据和序列访问模式为目标学习者计算预测并生成建议。实验和应用效果表明,该混合推荐算法推荐的质量和准确性方面优于其他推荐算法。 展开更多
关键词 推荐系统 混合推荐 情境感知 协同过滤 序列模式挖掘
在线阅读 下载PDF
一种有效的周期高效用序列模式增量挖掘算法 被引量:3
13
作者 荀亚玲 任姿芊 闫海博 《计算机应用研究》 CSCD 北大核心 2024年第8期2301-2308,共8页
周期高效用序列模式挖掘(PHUSPM)因其能够发现时间序列中更具实际价值的规律性模式而备受关注,但现有的PHUSPM算法难以有效地处理数据集的增量更新,且未考虑大规模数据下算法的向下闭包性和复杂性。针对该问题,提出了IncPUS-Miner算法,... 周期高效用序列模式挖掘(PHUSPM)因其能够发现时间序列中更具实际价值的规律性模式而备受关注,但现有的PHUSPM算法难以有效地处理数据集的增量更新,且未考虑大规模数据下算法的向下闭包性和复杂性。针对该问题,提出了IncPUS-Miner算法,有效地实现了周期高效用序列模式(PHUSPs)的增量挖掘。IncPUS-Miner引入了一种名为pu-tree的新型数据结构,每个树节点对应一个更新效用列表(UUL)用于存储相应序列的辅助信息,当有增量数据加入时,该结构使得项目信息能够灵活更新,从而增强了算法的动态适应性和可扩展性。此外,还提出了两种新的序列效用上界PUB和EUB,以及两种相应的剪枝策略,有效地减少了计算负担。实验结果表明,在真实数据集上,IncPUS-Miner算法可以有效地增量挖掘PHUSPs,与其他算法相比,在运行效率和内存消耗上展现出了优越的性能。 展开更多
关键词 增量挖掘 高效用序列模式 周期序列模式 序列模式挖掘
在线阅读 下载PDF
一种对比序列模式挖掘算法 被引量:2
14
作者 谢婷萱 武优西 +1 位作者 王月华 李艳 《小型微型计算机系统》 CSCD 北大核心 2024年第8期1808-1815,共8页
对比序列模式挖掘作为序列模式挖掘领域的一个重要分支,可以有效识别不同类别间差异显著的模式,并被广泛应用在序列分类、特征提取等场景中.但传统的对比序列模式挖掘仅考虑了模式在序列中是否出现,忽略了模式在序列中的重复性;并且需... 对比序列模式挖掘作为序列模式挖掘领域的一个重要分支,可以有效识别不同类别间差异显著的模式,并被广泛应用在序列分类、特征提取等场景中.但传统的对比序列模式挖掘仅考虑了模式在序列中是否出现,忽略了模式在序列中的重复性;并且需要用户预先设置间隙约束值,导致算法的灵活性较差.为了解决上述问题,本文提出一次性条件下自适应对比序列模式挖掘算法OSCP,该算法采用逆向填充策略计算模式支持度,不仅关注了模式在序列中的具体出现情况,还提高了算法的计算效率;同时采用模式连接策略以减少候选模式数量.此外,本文采用自适应间隙,无需用户预先设置间隙约束,可基于序列的实际特征计算模式的支持度.实验结果表明,OSCP算法的挖掘性能和分类效果均优于其他对比算法. 展开更多
关键词 序列模式挖掘 对比模式 候选模式生成 序列分类
在线阅读 下载PDF
一次性条件下top-k高平均效用序列模式挖掘算法 被引量:2
15
作者 杨克帅 武优西 +2 位作者 耿萌 刘靖宇 李艳 《计算机应用》 CSCD 北大核心 2024年第2期477-484,共8页
针对传统序列模式挖掘(SPM)不考虑模式重复性且忽略各项的效用(单价或利润)与模式长度对用户兴趣度影响的问题,提出一次性条件下top-k高平均效用序列模式挖掘(TOUP)算法。TOUP算法主要包括两个核心步骤:平均效用计算和候选模式生成。首... 针对传统序列模式挖掘(SPM)不考虑模式重复性且忽略各项的效用(单价或利润)与模式长度对用户兴趣度影响的问题,提出一次性条件下top-k高平均效用序列模式挖掘(TOUP)算法。TOUP算法主要包括两个核心步骤:平均效用计算和候选模式生成。首先,提出基于各项出现位置与项重复关系数组的CSP(Calculation Support of Pattern)算法计算模式支持度,从而实现模式平均效用的快速计算;其次,采用项集扩展和序列扩展生成候选模式,并提出了最大平均效用上界,基于该上界实现对候选模式的有效剪枝。在5个真实数据集和1个合成数据集上的实验结果表明,相较于TOUP-dfs和HAOP-ms算法,TOUP算法的候选模式数分别降低了38.5%~99.8%和0.9%~77.6%;运行时间分别降低了33.6%~97.1%和57.9%~97.2%。TOUP的算法性能更优,能更高效地挖掘用户感兴趣的模式。 展开更多
关键词 数据挖掘 序列模式挖掘 高平均效用 一次性条件 TOP-K
在线阅读 下载PDF
一次性条件下的三支序列模式挖掘 被引量:1
16
作者 杨仕琦 武优西 +1 位作者 耿萌 李艳 《计算机工程与科学》 CSCD 北大核心 2024年第7期1286-1295,共10页
一次性条件下的序列模式挖掘旨在从序列数据中挖掘出带有间隙约束的重复序列模式。然而,现有方法不考虑用户的兴趣度,将序列中的每个字符视作同等重要,导致许多用户不感兴趣的冗余模式被发现。为了解决这个问题,将三支决策思想引入序列... 一次性条件下的序列模式挖掘旨在从序列数据中挖掘出带有间隙约束的重复序列模式。然而,现有方法不考虑用户的兴趣度,将序列中的每个字符视作同等重要,导致许多用户不感兴趣的冗余模式被发现。为了解决这个问题,将三支决策思想引入序列模式挖掘领域,提出了一次性条件下的三支序列模式挖掘问题及其求解算法。在支持度计算方面,该算法基于深度优先搜索和回溯的策略,结合三支模式的特点以高效求解模式支持度。在候选模式生成方面,该算法采用模式连接策略缩减候选模式数量。此外,该算法还采用了并行化方案充分利用现代处理器的多核性能,提高算法的挖掘效率。最后,实验结果验证了研究一次性条件下的三支序列模式挖掘问题的意义和算法的高效性。 展开更多
关键词 序列模式挖掘 三支决策 三支序列模式 一次性 并行化算法
在线阅读 下载PDF
高效的一次性弱间隙序列模式挖掘算法
17
作者 杨鸿茜 武优西 +2 位作者 耿萌 刘靖宇 李艳 《计算机工程》 CAS CSCD 北大核心 2024年第3期60-67,共8页
间隙约束序列模式挖掘作为序列模式挖掘的一个重要分支,可以发现模式在序列中的重复出现。然而,当前研究主要针对单项序列进行挖掘,并且序列中每一项都被认为具有相同意义。为解决该问题,提出一次性弱间隙序列模式挖掘(OWP)算法,该算法... 间隙约束序列模式挖掘作为序列模式挖掘的一个重要分支,可以发现模式在序列中的重复出现。然而,当前研究主要针对单项序列进行挖掘,并且序列中每一项都被认为具有相同意义。为解决该问题,提出一次性弱间隙序列模式挖掘(OWP)算法,该算法由准备阶段、支持度计算和候选模式生成3个步骤组成。在准备阶段,建立倒排索引,并对不频繁的项进行剪枝;在支持度计算方面,利用倒排索引结构记录出现位置,避免对原始数据集的重复扫描;在候选模式生成方面,采用模式连接策略,减少冗余候选模式的生成。在项集序列和单项序列共6个真实数据集上的实验结果表明,OWP算法相比OWP-p、Ows-OWP和OWP-e算法在运行时间上分别提升了2.653、1.348、3.592倍,在内存消耗上分别减少了3.51%、0.07%、5%,说明OWP算法可以更高效地挖掘出用户感兴趣的模式。此外,OWP算法在以D1数据集为基础的6倍大小的数据集上的运行时间比D1数据集增长了3.763倍,内存消耗增长了2.310倍,运行时间和内存消耗的增加倍数均小于数据集大小的增加倍数,说明OWP算法具有良好的可扩展性。 展开更多
关键词 序列模式挖掘 项集挖掘 间隙约束 一次性条件 弱间隙约束
在线阅读 下载PDF
基于扎根理论和机器学习的隐私政策诱导同意研究 被引量:4
18
作者 陈梦蕾 罗颖嘉 朱侯 《信息资源管理学报》 CSSCI 2024年第5期75-90,共16页
从用户角度分析隐私政策的诱导同意倾向、探索诱导同意机制,有利于在帮助用户辨别不公隐私条款的同时,为监管部门规范APP隐私政策制定提供指导。研究采用扎根理论从用户视角分析隐私政策的诱导同意倾向,归纳构建隐私政策诱导同意编码体... 从用户角度分析隐私政策的诱导同意倾向、探索诱导同意机制,有利于在帮助用户辨别不公隐私条款的同时,为监管部门规范APP隐私政策制定提供指导。研究采用扎根理论从用户视角分析隐私政策的诱导同意倾向,归纳构建隐私政策诱导同意编码体系,人工标注语料后通过半监督学习训练K-BERT模型,实现隐私政策中含诱导同意倾向语句的自动化识别,并通过进一步的网络分析、序列模式挖掘探究隐私政策诱导用户同意的特征及深层规律。本研究提出的模型实现了自动化识别隐私政策诱导同意语句的目标,并通过实证分析发现,用户机会成本、隐私管理成本、模糊概念处于诱导维度关系网络的核心,其中模糊概念和推卸责任语句在隐私政策构成模式化诱导性行文中发挥重要作用,通常先后密集地出现在其他不公平语句后;儿童领域与其他领域APP隐私政策的诱导同意特征间存在显著差异,且部分领域隐私政策间存在一些共性特征,可能与其服务提供方式与商业逻辑的相似性有关。 展开更多
关键词 隐私政策 诱导同意 扎根理论 K-BERT 网络分析 序列模式挖掘
在线阅读 下载PDF
From Sequential Pattern Mining to Structured Pattern Mining: A Pattern-Growth Approach 被引量:18
19
作者 Jia-WeiHan JianPei Xi-FengYan 《Journal of Computer Science & Technology》 SCIE EI CSCD 2004年第3期257-279,共23页
Sequential pattern mining is an important data mining problem with broadapplications. However, it is also a challenging problem since the mining may have to generate orexamine a combinatorially explosive number of int... Sequential pattern mining is an important data mining problem with broadapplications. However, it is also a challenging problem since the mining may have to generate orexamine a combinatorially explosive number of intermediate subsequences. Recent studies havedeveloped two major classes of sequential pattern mining methods: (1) a candidategeneration-and-test approach, represented by (ⅰ) GSP, a horizontal format-based sequential patternmining method, and (ⅱ) SPADE, a vertical format-based method; and (2) a pattern-growth method,represented by PrefixSpan and its further extensions, such as gSpan for mining structured patterns.In this study, we perform a systematic introduction and presentation of the pattern-growthmethodology and study its principles and extensions. We first introduce two interestingpattern-growth algorithms, FreeSpan and PrefixSpan, for efficient sequential pattern mining. Then weintroduce gSpan for mining structured patterns using the same methodology. Their relativeperformance in large databases is presented and analyzed. Several extensions of these methods arealso discussed in the paper, including mining multi-level, multi-dimensional patterns and miningconstraint-based patterns. 展开更多
关键词 data mining sequential pattern mining structured pattern mining SCALABILITY performance analysis
原文传递
一种共生保序模式挖掘算法
20
作者 王珍 武优西 +1 位作者 孟玉飞 李艳 《小型微型计算机系统》 CSCD 北大核心 2024年第6期1384-1391,共8页
作为数据挖掘的一个新兴方向,研究人员在时间序列领域提出了用于挖掘相对次序相同的保序模式.尽管现有的保序模式挖掘算法可以有效地找出全部的频繁模式,但在当用户仅对某个特定的模式及其为前缀的模式较为感兴趣时,现有的挖掘算法效率... 作为数据挖掘的一个新兴方向,研究人员在时间序列领域提出了用于挖掘相对次序相同的保序模式.尽管现有的保序模式挖掘算法可以有效地找出全部的频繁模式,但在当用户仅对某个特定的模式及其为前缀的模式较为感兴趣时,现有的挖掘算法效率过于低下.为了解决上述问题,本文提出了一种共生保序模式挖掘算法,用于挖掘出以给定模式为前缀的共生保序模式.该算法包括融合准备和计算超模式的支持度两个主要部分,其中,融合准备分为4个步骤:获取模式p的后缀保序模式,计算后缀保序模式的出现,前向验证模式p的出现,后向查找所有可融合模式的出现;在计算超模式的支持度时,提出一种剪枝策略,使得候选模式的个数进一步减少.在真实数据集上,实验结果验证了本文算法的高效性. 展开更多
关键词 序列模式挖掘 时间序列 保序模式 共生模式
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部