期刊文献+
共找到258篇文章
< 1 2 13 >
每页显示 20 50 100
基于分布式的web log挖掘模型 被引量:3
1
作者 罗建利 沈洁 +1 位作者 许有志 杭月芹 《计算机应用与软件》 CSCD 北大核心 2004年第9期30-32,35,共4页
本文提出了一种基于分布式weblog挖掘模型 ,并针对该模型设计了一种有效的基于分布式的挖掘算法。该算法首先在各分布式服务器上进行关联规则挖掘 ,然后将各个服务器上的挖掘结果合成。这有利于减轻网络频繁的通讯负担 ,体现并行计算、... 本文提出了一种基于分布式weblog挖掘模型 ,并针对该模型设计了一种有效的基于分布式的挖掘算法。该算法首先在各分布式服务器上进行关联规则挖掘 ,然后将各个服务器上的挖掘结果合成。这有利于减轻网络频繁的通讯负担 ,体现并行计算、异步挖掘。 展开更多
关键词 数据挖掘 关联规则 数据文件 数据转换 事务数据库 分布式服务器 web log挖掘模型
在线阅读 下载PDF
基于Weblog的模糊聚类分析 被引量:1
2
作者 谢维奇 《电脑知识与技术》 2009年第4X期3051-3053,共3页
该文使用模糊聚类的方法对Web日志进行数据挖掘,给出了模糊聚类分析在数据挖掘中应用的主要步骤,最后用实例证明了Web模糊聚类的可行性。
关键词 web日志 模糊聚类 web数据挖掘
在线阅读 下载PDF
基于Web-log的频繁浏览路径挖掘
3
作者 罗超 《信息技术》 2004年第11期4-7,共4页
利用Web日志文件,采用LossyCounting算法对用户频繁浏览路径进行挖掘。在设计中,根据频繁路径挖掘的实际情况对算法进行了优化和改进。实验表明该方法能快速准确地发现用户频繁浏览路径,且具有较好的可扩展性,适用于电子商务网站的站点... 利用Web日志文件,采用LossyCounting算法对用户频繁浏览路径进行挖掘。在设计中,根据频繁路径挖掘的实际情况对算法进行了优化和改进。实验表明该方法能快速准确地发现用户频繁浏览路径,且具有较好的可扩展性,适用于电子商务网站的站点优化和个性化服务等。 展开更多
关键词 数据挖掘 网页日志挖掘 频繁浏览路径
在线阅读 下载PDF
一种Web用户行为聚类算法 被引量:20
4
作者 业宁 李威 +1 位作者 梁作鹏 董逸生 《小型微型计算机系统》 CSCD 北大核心 2004年第7期1364-1367,共4页
提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法... 提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法过滤了小于指定阈值的相似度系数 ,大大缩小了数据规模 ,很好地解决了其他聚类算法 (如层次聚类 )在高维空间聚类时的“维数灾难”问题 ,最后的实验结果很好 . 展开更多
关键词 web日志 数据挖掘 聚类 相似度
在线阅读 下载PDF
Web日志挖掘中的数据预处理的研究 被引量:57
5
作者 陆丽娜 杨怡玲 +1 位作者 管旭东 魏恒义 《计算机工程》 EI CAS CSCD 北大核心 2000年第4期66-67,72,共3页
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的... 为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的数据预处理模型,并通过一个实例具体介绍了各过程的主要任务。 展开更多
关键词 数据挖掘 web 日志挖掘 数据预处理 数据库
在线阅读 下载PDF
Web日志挖掘中的数据预处理技术研究 被引量:62
6
作者 赵伟 何丕廉 +1 位作者 陈霞 谢振亮 《计算机应用》 CSCD 北大核心 2003年第5期62-64,67,共4页
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文中深入探讨了数据预处理环节的主要任务,并介绍这个过程中一些特殊情况的处理方法。
关键词 数据挖掘 web日志挖掘 数据预处理
在线阅读 下载PDF
Web日志挖掘中数据预处理的研究 被引量:20
7
作者 赵红玲 宋瀚涛 +1 位作者 牛振东 刘桂山 《计算机应用研究》 CSCD 北大核心 2005年第6期67-69,共3页
针对框架式页面存在的问题,对数据预处理过程进行了改进,在数据清洗和用户识别部分添加了页面过滤部分,同时对预处理过程中的页面过滤算法和用户识别策略也进行了改进。
关键词 数据挖掘 web日志挖掘 数据预处理
在线阅读 下载PDF
基于Web日志的用户访问路径提取与分析 被引量:7
8
作者 刘颖 彭赓 +2 位作者 吕本富 陈杰 梅梅 《情报学报》 CSSCI 北大核心 2009年第4期548-556,共9页
线上购物相对线下购物的一个特点是可以将用户的购物过程记录到网站的Web日志中,为研究用户网上行为特征提供必要的数据支持。本文详细介绍了对Web日志数据进行预处理的一系列步骤和方法,并以某出版社网站18天的日志数据为实证,提取出... 线上购物相对线下购物的一个特点是可以将用户的购物过程记录到网站的Web日志中,为研究用户网上行为特征提供必要的数据支持。本文详细介绍了对Web日志数据进行预处理的一系列步骤和方法,并以某出版社网站18天的日志数据为实证,提取出用户的访问路径(访问页面的先后次序),分析路径信息得到用户在不同页面之间访问的转换概率,从而定量地衡量购物流程中各步骤之间的转换率和贡献率,提炼出用户最有可能的前向转换路径和后向转换路径,以期对网站流程优化和商品促销设置提供决策支持。 展开更多
关键词 web日志 数据预处理 访问路径 转换概率
在线阅读 下载PDF
Web挖掘技术及其在网络教学评价中的应用 被引量:12
9
作者 杨清莲 周庆敏 常志玲 《南京工业大学学报(自然科学版)》 CAS 2005年第5期100-103,共4页
结合W eb日志挖掘技术和数据立方体技术应用于网络教学评价体系,以网络教学体系的W eb服务端和客户端的日志作为数据源,使用数据挖掘技术采集有用的数据进行分析抽取,建立数据库,再应用数据立方体技术、OLAP进行分析处理,得到所需的评... 结合W eb日志挖掘技术和数据立方体技术应用于网络教学评价体系,以网络教学体系的W eb服务端和客户端的日志作为数据源,使用数据挖掘技术采集有用的数据进行分析抽取,建立数据库,再应用数据立方体技术、OLAP进行分析处理,得到所需的评价结果。结果表明,此算法可以客观的评价网络教学结果。 展开更多
关键词 web挖掘 网络教学 web日志 数据立方体
在线阅读 下载PDF
Web日志挖掘中的数据预处理技术 被引量:22
10
作者 李燕 冯博琴 鲁晓锋 《计算机工程》 CAS CSCD 北大核心 2009年第22期44-46,49,共4页
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中... 数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。 展开更多
关键词 web日志挖掘 数据预处理 用户会话识别 路径补充
在线阅读 下载PDF
一种Web日志会话识别的优化方法 被引量:18
11
作者 陈子军 王鑫昱 李伟 《计算机工程》 CAS CSCD 北大核心 2007年第1期95-97,共3页
会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确。该文对此提出优化算法,并对最常用的Timeout方法识别的会话进行优化,通过实验证明会话质量得到了提高。
关键词 web日志挖掘 数据预处理 会话识别
在线阅读 下载PDF
基于蚁群算法的Web站点导航 被引量:5
12
作者 业宁 梁作鹏 董逸生 《应用科学学报》 CAS CSCD 2003年第4期357-361,共5页
提出了一种Web站点的导航方法.首先利用蚁群算法对已经存在的Web日志进行训练,构造一个有向图,该有向图的节点和边保存了网页与网页间的链接概率和用户行为规则.利用训练结果,预测访问网站的用户行为,根据其行为推荐网页,最后的测试结... 提出了一种Web站点的导航方法.首先利用蚁群算法对已经存在的Web日志进行训练,构造一个有向图,该有向图的节点和边保存了网页与网页间的链接概率和用户行为规则.利用训练结果,预测访问网站的用户行为,根据其行为推荐网页,最后的测试结果表明该方法比单纯的概率分析和关联规则具有更高的精度. 展开更多
关键词 蚁群算法 web站点导航 网页 web日志 数据挖掘 链接概率 用户行为规则 有向图
在线阅读 下载PDF
提高个性化推荐精度的定制Web日志方法 被引量:8
13
作者 苏玉召 牛晓太 赵妍 《图书与情报》 CSSCI 北大核心 2011年第5期60-64,共5页
文章通过对个性化推荐和数据建模理论研究,分析了普通的Web日志格式采集到的数据无法满足个性化用户分析、预测和推荐精度需要的局限性。提出定制Web日志数据建模的过程及方法,建立了定制Web日志模型原型。通过应用数据挖掘技术的关联... 文章通过对个性化推荐和数据建模理论研究,分析了普通的Web日志格式采集到的数据无法满足个性化用户分析、预测和推荐精度需要的局限性。提出定制Web日志数据建模的过程及方法,建立了定制Web日志模型原型。通过应用数据挖掘技术的关联分析、分类和聚类实验,实验结果表明,通过定制Web日志的方式采集的数据质量能够很好地满足发现关联规则、内容分类和用户聚类的需求,从而提高个性化推荐的精度。同时,定制的Web日志数据还具有简化数据预处理、多用途的优点。 展开更多
关键词 数据建模 定制web日志 数据挖掘 个性化推荐
在线阅读 下载PDF
基于数据仓库的Web日志挖掘技术研究 被引量:5
14
作者 席景科 张辰 谢红侠 《计算机工程与设计》 CSCD 北大核心 2007年第24期5890-5892,共3页
Web日志挖掘是目前Web挖掘研究的一个重点。针对Web日志挖掘中存在的问题,给出了基于数据仓库技术的Web日志挖掘方案,就数据预处理、数据立方体设计及数据挖掘技术的应用进行了较为深入的探讨。并以一个Web站点日志为例,详细阐述了Web... Web日志挖掘是目前Web挖掘研究的一个重点。针对Web日志挖掘中存在的问题,给出了基于数据仓库技术的Web日志挖掘方案,就数据预处理、数据立方体设计及数据挖掘技术的应用进行了较为深入的探讨。并以一个Web站点日志为例,详细阐述了Web日志数据预处理、Web日志立方体设计以及数据挖掘算法的实现过程,并实现了一个Web日志多维数据集,能够有效解决Web日志分析中的难题。 展开更多
关键词 web日志 数据仓库 数据立方体 联机分析处理 数据挖掘
在线阅读 下载PDF
基于协作过滤的Web日志数据预处理研究 被引量:9
15
作者 纪良浩 王国胤 杨勇 《重庆邮电学院学报(自然科学版)》 2006年第5期646-649,共4页
协作过滤是当今应用较为成功的个性化服务技术,Web日志可以为个性化服务技术提供重要的数据源,只要对日志数据进行高效预处理,就能提高协作过滤算法有效性和个性化服务质量。结合实际日志数据的处理,给出了基于协作过滤的Web日志数据预... 协作过滤是当今应用较为成功的个性化服务技术,Web日志可以为个性化服务技术提供重要的数据源,只要对日志数据进行高效预处理,就能提高协作过滤算法有效性和个性化服务质量。结合实际日志数据的处理,给出了基于协作过滤的Web日志数据预处理过程结构图和一种可行的数据预处理方法,该方法不仅可以提供更加干净、规则的数据源,而且在用户兴趣度量方面,弥补了以往诸多兴趣度量方法的不足,为协作过滤算法提供了更加准确的数据支持。 展开更多
关键词 个性化服务 协作过滤 web日志 数据预处理 用户兴趣
在线阅读 下载PDF
Web日志挖掘中数据预处理方法的研究 被引量:15
16
作者 李烈彪 张海鹏 周亚峰 《计算机技术与发展》 2007年第7期45-48,52,共5页
Web日志挖掘是目前网上智能信息检索和电子商务的主要研究课题之一。而数据预处理在Web日志挖掘中起着很重要的作用,直接影响日志挖掘的质量和结果。介绍了Web日志挖掘数据预处理过程,综述了国际上的研究现状,及流行的处理方法。针对预... Web日志挖掘是目前网上智能信息检索和电子商务的主要研究课题之一。而数据预处理在Web日志挖掘中起着很重要的作用,直接影响日志挖掘的质量和结果。介绍了Web日志挖掘数据预处理过程,综述了国际上的研究现状,及流行的处理方法。针对预处理步骤中的用户会话识别和路径填充进行了相应的改进。根据评估会话构造方法的标准,通过实验对给出的新方法与其他方法进行了分析比较。 展开更多
关键词 数据挖掘 web 日志挖掘 数据预处理
在线阅读 下载PDF
基于IIS和web日志的关联关系的挖掘 被引量:7
17
作者 张静 田忠和 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第8期37-39,共3页
针对隐藏在web日志的大量记录中的规律性开展研究 ,提出了一种基于微软的IIS合理构建web日志并进行数据预处理的方案 ,在此基础上运用Apriori算法挖掘用户访问的页面间的关联关系 .将数据预处理过程提前到web日志的建立过程中 ,可极大... 针对隐藏在web日志的大量记录中的规律性开展研究 ,提出了一种基于微软的IIS合理构建web日志并进行数据预处理的方案 ,在此基础上运用Apriori算法挖掘用户访问的页面间的关联关系 .将数据预处理过程提前到web日志的建立过程中 ,可极大地降低数据准备的复杂性 ;将日志数据导入关系数据库中进行净化处理 ,大幅度减少了工作量 . 展开更多
关键词 web日志 数据挖掘 关联规则 电子商务 web挖掘
在线阅读 下载PDF
Web日志挖掘中数据预处理技术的研究 被引量:19
18
作者 马瑞民 李向云 《计算机工程与设计》 CSCD 北大核心 2007年第10期2358-2360,共3页
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访... 在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访问序列直接生成事务的算法。 展开更多
关键词 web日志挖掘 数据预处理 路径补充 访问序列 访问事务
在线阅读 下载PDF
改进的Web访问日志会话识别算法 被引量:8
19
作者 严奉华 刘建平 杨凡丁 《计算机工程与设计》 CSCD 北大核心 2008年第22期5685-5687,5690,共4页
针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界... 针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界定内容页,并针对内容页,提出了一些启发式规则,突破了"参引长度法"所固有的一个会话中只包含一个内容页的瓶颈。该方法提高了会话识别的准确度,实验结果表明是有效的。 展开更多
关键词 web日志挖掘 数据预处理 会话 内容页 时间阀值 启发式规则
在线阅读 下载PDF
电子商务与Web数据挖掘 被引量:46
20
作者 邹显春 谢中 周彦晖 《计算机应用》 CSCD 北大核心 2001年第5期21-23,共3页
在电子商务中 ,运用数据挖掘技术对服务器上的日志文件等Web数据进行客户访问信息的Web数据挖掘 ,了解客户的访问行为 ,从而调整站点结构、市场策略等 ,使电子商务活动具有针对性。
关键词 电子商务 INTERNET web 数据挖掘 数据源
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部