期刊文献+
共找到89篇文章
< 1 2 5 >
每页显示 20 50 100
Web预取技术综述 被引量:19
1
作者 班志杰 古志民 金瑜 《计算机研究与发展》 EI CSCD 北大核心 2009年第2期202-210,共9页
Web预取是减少用户访问延时、提高网络服务质量的关键技术之一,近年来已成为国内外的研究热点.通过利用WWW访问的空间局部性,Web预取使缓存机制从时间局部性向空间局部性扩展.归纳了Web预取技术的分类,概括和比较了不同类别的优势和局限... Web预取是减少用户访问延时、提高网络服务质量的关键技术之一,近年来已成为国内外的研究热点.通过利用WWW访问的空间局部性,Web预取使缓存机制从时间局部性向空间局部性扩展.归纳了Web预取技术的分类,概括和比较了不同类别的优势和局限性,给出了预取模型的基本框架及每部分的主要功能,并对各种评价标准进行了详细介绍.同时,深入分析和探讨了现有的几种典型预取算法,系统地比较了这些算法的优缺点.最后从在线性、协作预取、动态流行度、划分用户会话和基于语义与基于路径相结合等方面指出了Web预取技术的研究方向. 展开更多
关键词 web预取 web缓存 预取控制 PPM 数据挖掘
在线阅读 下载PDF
Web缓存命中率与字节命中率关系 被引量:5
2
作者 石磊 叶海琴 +1 位作者 卫琳 连卫民 《计算机工程》 CAS CSCD 北大核心 2007年第13期84-86,共3页
在研究Web缓存性能时,一般考虑2个评价指标:命中率HR和字节命中率BHR。目前大多侧重于2个指标之一,或仅通过测试2个指标的数值来评价缓存替换算法优劣,没有从2个指标关系的角度来评价缓存替换算法的性能。该文讨论了Web缓存系统中命中... 在研究Web缓存性能时,一般考虑2个评价指标:命中率HR和字节命中率BHR。目前大多侧重于2个指标之一,或仅通过测试2个指标的数值来评价缓存替换算法优劣,没有从2个指标关系的角度来评价缓存替换算法的性能。该文讨论了Web缓存系统中命中率与字节命中率之间的关系,提出了一种Web缓存性能评价指标——命中比(FBR),讨论了该指标在Web缓存替换算法及Web预取性能评价中的应用,从而为度量缓存系统的性能提供参考依据。 展开更多
关键词 web缓存 web预取 命中率 字节命中率 替换算法
在线阅读 下载PDF
模糊聚类的最大树算法在Web页面分类中的应用 被引量:12
3
作者 刘琦 林怀忠 陈纯 《计算机应用研究》 CSCD 北大核心 2004年第11期286-287,共2页
通过Web日志中记录的客户对Web页面的访问情况建立Web页面的用户访问矩阵,在此基础上构造模糊相似矩阵,根据模糊相似矩阵由最大树算法进行聚类。分析和算例表明,通过模糊相似矩阵进行聚类避免了构造模糊等价矩阵的大计算量,具有简单、快... 通过Web日志中记录的客户对Web页面的访问情况建立Web页面的用户访问矩阵,在此基础上构造模糊相似矩阵,根据模糊相似矩阵由最大树算法进行聚类。分析和算例表明,通过模糊相似矩阵进行聚类避免了构造模糊等价矩阵的大计算量,具有简单、快捷,适合处理高维数据的特点。 展开更多
关键词 数据挖掘 web日志 web使用挖掘 模糊聚类 最大树法
在线阅读 下载PDF
基于蚁群算法的Web站点导航 被引量:5
4
作者 业宁 梁作鹏 董逸生 《应用科学学报》 CAS CSCD 2003年第4期357-361,共5页
提出了一种Web站点的导航方法.首先利用蚁群算法对已经存在的Web日志进行训练,构造一个有向图,该有向图的节点和边保存了网页与网页间的链接概率和用户行为规则.利用训练结果,预测访问网站的用户行为,根据其行为推荐网页,最后的测试结... 提出了一种Web站点的导航方法.首先利用蚁群算法对已经存在的Web日志进行训练,构造一个有向图,该有向图的节点和边保存了网页与网页间的链接概率和用户行为规则.利用训练结果,预测访问网站的用户行为,根据其行为推荐网页,最后的测试结果表明该方法比单纯的概率分析和关联规则具有更高的精度. 展开更多
关键词 蚁群算法 web站点导航 网页 web日志 数据挖掘 链接概率 用户行为规则 有向图
在线阅读 下载PDF
基于Web挖掘的个性化服务研究 被引量:10
5
作者 李广都 李勇 《情报理论与实践》 CSSCI 北大核心 2004年第1期72-76,54,共6页
论述了基于Web挖掘的个性化服务研究 ,提出了利用Web挖掘方法的个性化服务研究中的用户聚类、Web页面聚类、用户频繁访问路径发现算法及用户访问路径优化算法。利用这些算法得到的个性化信息可以准确把握用户兴趣模式并对Web信息资源的... 论述了基于Web挖掘的个性化服务研究 ,提出了利用Web挖掘方法的个性化服务研究中的用户聚类、Web页面聚类、用户频繁访问路径发现算法及用户访问路径优化算法。利用这些算法得到的个性化信息可以准确把握用户兴趣模式并对Web信息资源的组织方式进行有效更新 ,从而提高网络信息服务效率 ,为用户提供“一对一” 展开更多
关键词 web挖掘 网络数据挖掘 个性化服务 智能化 聚类分析 用户研究 访问路径
在线阅读 下载PDF
Web结构挖掘及其算法 被引量:10
6
作者 王艳华 张纪 《计算机工程》 CAS CSCD 北大核心 2005年第B07期125-127,共3页
随着网络和数据挖掘技术的发展,Web数据挖掘得到了较多的研究。该文从Web结构挖掘的角度出发,在分析了网络有向图的总体结构以及导航页面、目标页面和网络功能的基础上,研究了结构挖掘算法,针对Hub页面的多主题性、无关页面、无关链接... 随着网络和数据挖掘技术的发展,Web数据挖掘得到了较多的研究。该文从Web结构挖掘的角度出发,在分析了网络有向图的总体结构以及导航页面、目标页面和网络功能的基础上,研究了结构挖掘算法,针对Hub页面的多主题性、无关页面、无关链接等问题,提出了HITS算法的改进算法。 展开更多
关键词 数据挖掘 web结构挖掘 HITS算法 中枢 权威
在线阅读 下载PDF
Web日志挖掘的预处理及路径补全算法的研究 被引量:11
7
作者 王岚 翟正军 《微电子学与计算机》 CSCD 北大核心 2006年第8期113-116,共4页
Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文章详细介绍了Web日志挖掘的预处理过程。通过实例分析了预处理方法,着重分析其中的路径补全方法,并给出了路径补全的... Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文章详细介绍了Web日志挖掘的预处理过程。通过实例分析了预处理方法,着重分析其中的路径补全方法,并给出了路径补全的算法实现。 展开更多
关键词 web日志挖掘 数据预处理 路径补全 算法
在线阅读 下载PDF
Web访问序列模式挖掘算法的研究 被引量:2
8
作者 李陶深 王伟娜 陈庆峰 《计算机科学》 CSCD 北大核心 2013年第12期41-44,共4页
针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户... 针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户查找信息的质量和效率,以及对用户开展个性化的信息服务。实验和应用结果表明,提出的算法具有更好的执行效率,适用于Web日志挖掘,可用于构建智能化Web站点和解决个性化的信息服务问题。 展开更多
关键词 web访问 序列模式 数据挖掘 PREFIXSPAN算法 web日志挖掘
在线阅读 下载PDF
Web数据挖掘研究 被引量:9
9
作者 曹聪聪 康耀红 《现代电子技术》 2007年第4期92-94,97,共4页
Web数据挖掘是数据挖掘技术与Web的结合。介绍了Web数据挖掘的概念、Web数据挖掘的流程、Web数据挖掘的分类以及3类Web数据挖掘的应用问题。
关键词 数据挖掘 web挖掘 web挖掘分类 算法与应用
在线阅读 下载PDF
Web结构挖掘研究 被引量:16
10
作者 陈定权 《情报理论与实践》 CSSCI 北大核心 2003年第1期59-61,96,共4页
Superficially,the Web is believed to lack structure and organization as a whole Recent research,however,shows it’s self organized to some extent Analyses of the Web’s network of hyperlinks reveal an intricate struct... Superficially,the Web is believed to lack structure and organization as a whole Recent research,however,shows it’s self organized to some extent Analyses of the Web’s network of hyperlinks reveal an intricate structure that is proved to be valuable for organizing information,improving search methods and understanding the Web in a broader technological and social context This paper first introduces the concept and taxonomy of Web mining,then illustrates some classical algorithms,finally gives some application examples of Web structure 展开更多
关键词 web结构挖掘 web数据挖掘 应用 PAGERANK算法 HITS算法
在线阅读 下载PDF
一种基于改进的AprioriAll算法的Web路径模式挖掘 被引量:4
11
作者 司应硕 杨世平 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期172-175,共4页
对路径模式挖掘的原理做了详细的阐述,并且针对挖掘对象的特性,对AprioriAll算法中生成侯选序列的函数做了相应的改进。最后通过实例说明了改进的AprioriAll算法在路径模式挖掘中的有效性。
关键词 路径模式挖掘 web数据挖掘 大引用序列 AprioriAll算法
在线阅读 下载PDF
从Web日志中挖掘用户兴趣路径算法改进 被引量:6
12
作者 邱明虹 何跃 《计算机工程与应用》 CSCD 北大核心 2008年第26期129-131,157,共4页
引入一种挖掘用户兴趣路径的算法,并对其进行有意义的改进。算法的主要思想是:首先利用Web日志建立以引用网页URL为行、浏览网页URL为列的两个网站访问矩阵,分别采用访问次数和平均到网页中字符数的访问时间为元素值。然后,通过对矩阵... 引入一种挖掘用户兴趣路径的算法,并对其进行有意义的改进。算法的主要思想是:首先利用Web日志建立以引用网页URL为行、浏览网页URL为列的两个网站访问矩阵,分别采用访问次数和平均到网页中字符数的访问时间为元素值。然后,通过对矩阵进行路径兴趣度计算得到兴趣子路径,最后进行合并生成用户兴趣路径集。 展开更多
关键词 web数据挖掘 算法改进 用户兴趣路径
在线阅读 下载PDF
遗传算法在Web关联挖掘中的应用研究 被引量:4
13
作者 汤亚玲 崔志明 《微电子学与计算机》 CSCD 北大核心 2005年第10期4-6,11,共4页
关联规则是描述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。本文提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能... 关联规则是描述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。本文提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能弥补传统Web关联挖掘算法的不足,为Web关联挖掘提供了一种新的思路。 展开更多
关键词 数据挖掘 web关联规则 遗传算法 增量挖掘 机器学习
在线阅读 下载PDF
Web日志挖掘技术应用研究 被引量:15
14
作者 吕佳 《重庆师范大学学报(自然科学版)》 CAS 2006年第4期39-44,共6页
随着Internet的迅速发展,W eb在人们的日常生活和工作中的地位日益显著。W eb日志挖掘就是通过对W eb日志记录的挖掘,发现用户访问的W eb页面的浏览模式,从而进一步分析和研究W eb日志记录中的规律,改进W eb站点的性能和组织结构,提供... 随着Internet的迅速发展,W eb在人们的日常生活和工作中的地位日益显著。W eb日志挖掘就是通过对W eb日志记录的挖掘,发现用户访问的W eb页面的浏览模式,从而进一步分析和研究W eb日志记录中的规律,改进W eb站点的性能和组织结构,提供个性化服务。本文首先分析了W eb日志的分布和特点,再对W eb日志挖掘中的两个阶段即数据预处理和日志挖掘算法做了详细介绍,最后对W eb日志挖掘技术做了展望。 展开更多
关键词 web日志挖掘 web日志 数据预处理 日志挖掘算法
在线阅读 下载PDF
遗传算法在Web关联挖掘中的应用研究 被引量:4
15
作者 汤亚玲 崔志明 《微电子学与计算机》 CSCD 北大核心 2006年第6期126-129,共4页
关联规则是描述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。文章提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能... 关联规则是描述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。文章提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能弥补传统Web关联挖掘算法的不足,为Web关联挖掘提供了一种新的思路。 展开更多
关键词 数据挖掘 web关联规则 遗传算法 增量挖掘 机器学习
在线阅读 下载PDF
基于web数据挖掘的Apriori算法及其优化算法研究 被引量:4
16
作者 王晓静 张晋 《辽宁大学学报(自然科学版)》 CAS 2009年第4期335-337,共3页
从数据挖掘中的关联规则概念入手,介绍了关联规则挖掘中的核心算法Apriori实现过程,针对出现的瓶颈又介绍了几种Apriori算法的优化方法,最后指出了末来关联规则挖掘算法的研究方向.
关键词 web数据挖掘 关联规则 APRIORI算法
在线阅读 下载PDF
改进的遗传算法在Web使用挖掘中的应用 被引量:2
17
作者 雷亮 李善君 彭军 《计算机工程与应用》 CSCD 北大核心 2009年第8期135-137,171,共4页
Web使用挖掘是近年来Web数据挖掘中的研究热点。针对传统遗传算法在提取关联规则问题时常采用固定染色体交叉概率和染色体变异概率,容易出现早熟、收敛速度较慢的问题,提出了改进的遗传算法,并在关联规则的提取中增加了用户页面兴趣度... Web使用挖掘是近年来Web数据挖掘中的研究热点。针对传统遗传算法在提取关联规则问题时常采用固定染色体交叉概率和染色体变异概率,容易出现早熟、收敛速度较慢的问题,提出了改进的遗传算法,并在关联规则的提取中增加了用户页面兴趣度这一阈值,成功地运用到某商业网站服务器日志挖掘。实验证明,这种改进的遗传算法能够有效避免早熟收敛现象,是一种有效的方法。 展开更多
关键词 web数据挖掘 web使用挖掘 遗传算法 兴趣度
在线阅读 下载PDF
企业智能化Web商务数据挖掘引擎算法设计与实现 被引量:6
18
作者 闫建红 《计算机工程与设计》 CSCD 北大核心 2007年第4期926-928,932,共4页
针对现有的数据挖掘引擎难以满足企业不断增长的需求的问题,在传统搜索引擎的基础上提出了一种企业专用的智能化Web商务数据挖掘引擎。从总体上给出了模型框架,得出企业智能化Web商务数据挖掘引擎是一个基于多模型的系统的结论。接着分... 针对现有的数据挖掘引擎难以满足企业不断增长的需求的问题,在传统搜索引擎的基础上提出了一种企业专用的智能化Web商务数据挖掘引擎。从总体上给出了模型框架,得出企业智能化Web商务数据挖掘引擎是一个基于多模型的系统的结论。接着分别详细研究了该引擎的:Web内容挖掘、Web信息获取、客户行为挖掘3个核心模块。 展开更多
关键词 web数据挖掘 客户行为挖掘 潜在语义模型 HITS算法 遗传算法 聚类分析
在线阅读 下载PDF
Web日志挖掘的预处理过程及算法 被引量:5
19
作者 靳风荣 郑雪峰 《微型电脑应用》 2004年第6期44-45,55,共3页
随着WWW的广泛应用和Web技术的发展,数据挖掘进入一个崭新阶段。本文详细介绍了Web日志挖掘的预处理过程,通过实例分析了预处理方法,并给出了预处理过程中用户识别的算法实现。
关键词 web日志挖掘 预处理 算法 数据挖掘 数据格式 数据库
在线阅读 下载PDF
Web日志挖掘及AprioriAll算法的改进 被引量:6
20
作者 王彤 何丕廉 《天津理工大学学报》 2007年第1期13-17,共5页
阐述了利用数据挖掘技术对Web日志进行挖掘的可能性及其重要作用.通过用户维的引入,对已有的Apri-oriAll算法进行了改进,改进后的算法降低了原算法的时空复杂度,特别是在新算法中可以对Web日志数据按用户维进行切片,消除了原算法中的I/... 阐述了利用数据挖掘技术对Web日志进行挖掘的可能性及其重要作用.通过用户维的引入,对已有的Apri-oriAll算法进行了改进,改进后的算法降低了原算法的时空复杂度,特别是在新算法中可以对Web日志数据按用户维进行切片,消除了原算法中的I/O相关性.这不仅使对Web日志数据进行的挖掘活动可以分散地进行,而且使多机连网分布式挖掘成为可能,同时还可以实现对Web日志的增量挖掘和动态挖掘.此外,该改进算法的特殊意义还在于它不仅可以将所有用户看作一个整体进行挖掘,而且还可以对不同的用户个体的行为进行独立地挖掘,使挖掘出的结果能够满足对用户个性化使用的需求. 展开更多
关键词 数据挖掘 web日志 算法改进 用户维
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部