期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
258
篇文章
<
1
2
…
13
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于分布式的web log挖掘模型
被引量:
3
1
作者
罗建利
沈洁
+1 位作者
许有志
杭月芹
《计算机应用与软件》
CSCD
北大核心
2004年第9期30-32,35,共4页
本文提出了一种基于分布式weblog挖掘模型 ,并针对该模型设计了一种有效的基于分布式的挖掘算法。该算法首先在各分布式服务器上进行关联规则挖掘 ,然后将各个服务器上的挖掘结果合成。这有利于减轻网络频繁的通讯负担 ,体现并行计算、...
本文提出了一种基于分布式weblog挖掘模型 ,并针对该模型设计了一种有效的基于分布式的挖掘算法。该算法首先在各分布式服务器上进行关联规则挖掘 ,然后将各个服务器上的挖掘结果合成。这有利于减轻网络频繁的通讯负担 ,体现并行计算、异步挖掘。
展开更多
关键词
数据挖掘
关联规则
数据文件
数据转换
事务数据库
分布式服务器
web
log
挖掘模型
在线阅读
下载PDF
职称材料
基于Weblog的模糊聚类分析
被引量:
1
2
作者
谢维奇
《电脑知识与技术》
2009年第4X期3051-3053,共3页
该文使用模糊聚类的方法对Web日志进行数据挖掘,给出了模糊聚类分析在数据挖掘中应用的主要步骤,最后用实例证明了Web模糊聚类的可行性。
关键词
web
日志
模糊聚类
web
数据挖掘
在线阅读
下载PDF
职称材料
基于Web-log的频繁浏览路径挖掘
3
作者
罗超
《信息技术》
2004年第11期4-7,共4页
利用Web日志文件,采用LossyCounting算法对用户频繁浏览路径进行挖掘。在设计中,根据频繁路径挖掘的实际情况对算法进行了优化和改进。实验表明该方法能快速准确地发现用户频繁浏览路径,且具有较好的可扩展性,适用于电子商务网站的站点...
利用Web日志文件,采用LossyCounting算法对用户频繁浏览路径进行挖掘。在设计中,根据频繁路径挖掘的实际情况对算法进行了优化和改进。实验表明该方法能快速准确地发现用户频繁浏览路径,且具有较好的可扩展性,适用于电子商务网站的站点优化和个性化服务等。
展开更多
关键词
数据挖掘
网页日志挖掘
频繁浏览路径
在线阅读
下载PDF
职称材料
一种Web用户行为聚类算法
被引量:
20
4
作者
业宁
李威
+1 位作者
梁作鹏
董逸生
《小型微型计算机系统》
CSCD
北大核心
2004年第7期1364-1367,共4页
提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法...
提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法过滤了小于指定阈值的相似度系数 ,大大缩小了数据规模 ,很好地解决了其他聚类算法 (如层次聚类 )在高维空间聚类时的“维数灾难”问题 ,最后的实验结果很好 .
展开更多
关键词
web
日志
数据挖掘
聚类
相似度
在线阅读
下载PDF
职称材料
Web日志挖掘中的数据预处理的研究
被引量:
57
5
作者
陆丽娜
杨怡玲
+1 位作者
管旭东
魏恒义
《计算机工程》
EI
CAS
CSCD
北大核心
2000年第4期66-67,72,共3页
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的...
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的数据预处理模型,并通过一个实例具体介绍了各过程的主要任务。
展开更多
关键词
数据挖掘
web
日志挖掘
数据预处理
数据库
在线阅读
下载PDF
职称材料
Web日志挖掘中的数据预处理技术研究
被引量:
62
6
作者
赵伟
何丕廉
+1 位作者
陈霞
谢振亮
《计算机应用》
CSCD
北大核心
2003年第5期62-64,67,共4页
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文中深入探讨了数据预处理环节的主要任务,并介绍这个过程中一些特殊情况的处理方法。
关键词
数据挖掘
web
日志挖掘
数据预处理
在线阅读
下载PDF
职称材料
Web日志挖掘中数据预处理的研究
被引量:
20
7
作者
赵红玲
宋瀚涛
+1 位作者
牛振东
刘桂山
《计算机应用研究》
CSCD
北大核心
2005年第6期67-69,共3页
针对框架式页面存在的问题,对数据预处理过程进行了改进,在数据清洗和用户识别部分添加了页面过滤部分,同时对预处理过程中的页面过滤算法和用户识别策略也进行了改进。
关键词
数据挖掘
web
日志挖掘
数据预处理
在线阅读
下载PDF
职称材料
基于Web日志的用户访问路径提取与分析
被引量:
7
8
作者
刘颖
彭赓
+2 位作者
吕本富
陈杰
梅梅
《情报学报》
CSSCI
北大核心
2009年第4期548-556,共9页
线上购物相对线下购物的一个特点是可以将用户的购物过程记录到网站的Web日志中,为研究用户网上行为特征提供必要的数据支持。本文详细介绍了对Web日志数据进行预处理的一系列步骤和方法,并以某出版社网站18天的日志数据为实证,提取出...
线上购物相对线下购物的一个特点是可以将用户的购物过程记录到网站的Web日志中,为研究用户网上行为特征提供必要的数据支持。本文详细介绍了对Web日志数据进行预处理的一系列步骤和方法,并以某出版社网站18天的日志数据为实证,提取出用户的访问路径(访问页面的先后次序),分析路径信息得到用户在不同页面之间访问的转换概率,从而定量地衡量购物流程中各步骤之间的转换率和贡献率,提炼出用户最有可能的前向转换路径和后向转换路径,以期对网站流程优化和商品促销设置提供决策支持。
展开更多
关键词
web
日志
数据预处理
访问路径
转换概率
在线阅读
下载PDF
职称材料
Web挖掘技术及其在网络教学评价中的应用
被引量:
12
9
作者
杨清莲
周庆敏
常志玲
《南京工业大学学报(自然科学版)》
CAS
2005年第5期100-103,共4页
结合W eb日志挖掘技术和数据立方体技术应用于网络教学评价体系,以网络教学体系的W eb服务端和客户端的日志作为数据源,使用数据挖掘技术采集有用的数据进行分析抽取,建立数据库,再应用数据立方体技术、OLAP进行分析处理,得到所需的评...
结合W eb日志挖掘技术和数据立方体技术应用于网络教学评价体系,以网络教学体系的W eb服务端和客户端的日志作为数据源,使用数据挖掘技术采集有用的数据进行分析抽取,建立数据库,再应用数据立方体技术、OLAP进行分析处理,得到所需的评价结果。结果表明,此算法可以客观的评价网络教学结果。
展开更多
关键词
web
挖掘
网络教学
web
日志
数据立方体
在线阅读
下载PDF
职称材料
Web日志挖掘中的数据预处理技术
被引量:
22
10
作者
李燕
冯博琴
鲁晓锋
《计算机工程》
CAS
CSCD
北大核心
2009年第22期44-46,49,共4页
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中...
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。
展开更多
关键词
web
日志挖掘
数据预处理
用户会话识别
路径补充
在线阅读
下载PDF
职称材料
一种Web日志会话识别的优化方法
被引量:
18
11
作者
陈子军
王鑫昱
李伟
《计算机工程》
CAS
CSCD
北大核心
2007年第1期95-97,共3页
会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确。该文对此提出优化算法,并对最常用的Timeout方法识别的会话进行优化,通过实验证明会话质量得到了提高。
关键词
web
日志挖掘
数据预处理
会话识别
在线阅读
下载PDF
职称材料
基于蚁群算法的Web站点导航
被引量:
5
12
作者
业宁
梁作鹏
董逸生
《应用科学学报》
CAS
CSCD
2003年第4期357-361,共5页
提出了一种Web站点的导航方法.首先利用蚁群算法对已经存在的Web日志进行训练,构造一个有向图,该有向图的节点和边保存了网页与网页间的链接概率和用户行为规则.利用训练结果,预测访问网站的用户行为,根据其行为推荐网页,最后的测试结...
提出了一种Web站点的导航方法.首先利用蚁群算法对已经存在的Web日志进行训练,构造一个有向图,该有向图的节点和边保存了网页与网页间的链接概率和用户行为规则.利用训练结果,预测访问网站的用户行为,根据其行为推荐网页,最后的测试结果表明该方法比单纯的概率分析和关联规则具有更高的精度.
展开更多
关键词
蚁群算法
web
站点导航
网页
web
日志
数据挖掘
链接概率
用户行为规则
有向图
在线阅读
下载PDF
职称材料
提高个性化推荐精度的定制Web日志方法
被引量:
8
13
作者
苏玉召
牛晓太
赵妍
《图书与情报》
CSSCI
北大核心
2011年第5期60-64,共5页
文章通过对个性化推荐和数据建模理论研究,分析了普通的Web日志格式采集到的数据无法满足个性化用户分析、预测和推荐精度需要的局限性。提出定制Web日志数据建模的过程及方法,建立了定制Web日志模型原型。通过应用数据挖掘技术的关联...
文章通过对个性化推荐和数据建模理论研究,分析了普通的Web日志格式采集到的数据无法满足个性化用户分析、预测和推荐精度需要的局限性。提出定制Web日志数据建模的过程及方法,建立了定制Web日志模型原型。通过应用数据挖掘技术的关联分析、分类和聚类实验,实验结果表明,通过定制Web日志的方式采集的数据质量能够很好地满足发现关联规则、内容分类和用户聚类的需求,从而提高个性化推荐的精度。同时,定制的Web日志数据还具有简化数据预处理、多用途的优点。
展开更多
关键词
数据建模
定制
web
日志
数据挖掘
个性化推荐
在线阅读
下载PDF
职称材料
基于数据仓库的Web日志挖掘技术研究
被引量:
5
14
作者
席景科
张辰
谢红侠
《计算机工程与设计》
CSCD
北大核心
2007年第24期5890-5892,共3页
Web日志挖掘是目前Web挖掘研究的一个重点。针对Web日志挖掘中存在的问题,给出了基于数据仓库技术的Web日志挖掘方案,就数据预处理、数据立方体设计及数据挖掘技术的应用进行了较为深入的探讨。并以一个Web站点日志为例,详细阐述了Web...
Web日志挖掘是目前Web挖掘研究的一个重点。针对Web日志挖掘中存在的问题,给出了基于数据仓库技术的Web日志挖掘方案,就数据预处理、数据立方体设计及数据挖掘技术的应用进行了较为深入的探讨。并以一个Web站点日志为例,详细阐述了Web日志数据预处理、Web日志立方体设计以及数据挖掘算法的实现过程,并实现了一个Web日志多维数据集,能够有效解决Web日志分析中的难题。
展开更多
关键词
web
日志
数据仓库
数据立方体
联机分析处理
数据挖掘
在线阅读
下载PDF
职称材料
基于协作过滤的Web日志数据预处理研究
被引量:
9
15
作者
纪良浩
王国胤
杨勇
《重庆邮电学院学报(自然科学版)》
2006年第5期646-649,共4页
协作过滤是当今应用较为成功的个性化服务技术,Web日志可以为个性化服务技术提供重要的数据源,只要对日志数据进行高效预处理,就能提高协作过滤算法有效性和个性化服务质量。结合实际日志数据的处理,给出了基于协作过滤的Web日志数据预...
协作过滤是当今应用较为成功的个性化服务技术,Web日志可以为个性化服务技术提供重要的数据源,只要对日志数据进行高效预处理,就能提高协作过滤算法有效性和个性化服务质量。结合实际日志数据的处理,给出了基于协作过滤的Web日志数据预处理过程结构图和一种可行的数据预处理方法,该方法不仅可以提供更加干净、规则的数据源,而且在用户兴趣度量方面,弥补了以往诸多兴趣度量方法的不足,为协作过滤算法提供了更加准确的数据支持。
展开更多
关键词
个性化服务
协作过滤
web
日志
数据预处理
用户兴趣
在线阅读
下载PDF
职称材料
Web日志挖掘中数据预处理方法的研究
被引量:
15
16
作者
李烈彪
张海鹏
周亚峰
《计算机技术与发展》
2007年第7期45-48,52,共5页
Web日志挖掘是目前网上智能信息检索和电子商务的主要研究课题之一。而数据预处理在Web日志挖掘中起着很重要的作用,直接影响日志挖掘的质量和结果。介绍了Web日志挖掘数据预处理过程,综述了国际上的研究现状,及流行的处理方法。针对预...
Web日志挖掘是目前网上智能信息检索和电子商务的主要研究课题之一。而数据预处理在Web日志挖掘中起着很重要的作用,直接影响日志挖掘的质量和结果。介绍了Web日志挖掘数据预处理过程,综述了国际上的研究现状,及流行的处理方法。针对预处理步骤中的用户会话识别和路径填充进行了相应的改进。根据评估会话构造方法的标准,通过实验对给出的新方法与其他方法进行了分析比较。
展开更多
关键词
数据挖掘
web
日志挖掘
数据预处理
在线阅读
下载PDF
职称材料
基于IIS和web日志的关联关系的挖掘
被引量:
7
17
作者
张静
田忠和
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2002年第8期37-39,共3页
针对隐藏在web日志的大量记录中的规律性开展研究 ,提出了一种基于微软的IIS合理构建web日志并进行数据预处理的方案 ,在此基础上运用Apriori算法挖掘用户访问的页面间的关联关系 .将数据预处理过程提前到web日志的建立过程中 ,可极大...
针对隐藏在web日志的大量记录中的规律性开展研究 ,提出了一种基于微软的IIS合理构建web日志并进行数据预处理的方案 ,在此基础上运用Apriori算法挖掘用户访问的页面间的关联关系 .将数据预处理过程提前到web日志的建立过程中 ,可极大地降低数据准备的复杂性 ;将日志数据导入关系数据库中进行净化处理 ,大幅度减少了工作量 .
展开更多
关键词
web
日志
数据挖掘
关联规则
电子商务
web
挖掘
在线阅读
下载PDF
职称材料
Web日志挖掘中数据预处理技术的研究
被引量:
19
18
作者
马瑞民
李向云
《计算机工程与设计》
CSCD
北大核心
2007年第10期2358-2360,共3页
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访...
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访问序列直接生成事务的算法。
展开更多
关键词
web
日志挖掘
数据预处理
路径补充
访问序列
访问事务
在线阅读
下载PDF
职称材料
改进的Web访问日志会话识别算法
被引量:
8
19
作者
严奉华
刘建平
杨凡丁
《计算机工程与设计》
CSCD
北大核心
2008年第22期5685-5687,5690,共4页
针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界...
针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界定内容页,并针对内容页,提出了一些启发式规则,突破了"参引长度法"所固有的一个会话中只包含一个内容页的瓶颈。该方法提高了会话识别的准确度,实验结果表明是有效的。
展开更多
关键词
web
日志挖掘
数据预处理
会话
内容页
时间阀值
启发式规则
在线阅读
下载PDF
职称材料
电子商务与Web数据挖掘
被引量:
46
20
作者
邹显春
谢中
周彦晖
《计算机应用》
CSCD
北大核心
2001年第5期21-23,共3页
在电子商务中 ,运用数据挖掘技术对服务器上的日志文件等Web数据进行客户访问信息的Web数据挖掘 ,了解客户的访问行为 ,从而调整站点结构、市场策略等 ,使电子商务活动具有针对性。
关键词
电子商务
INTERNET
web
数据挖掘
数据源
在线阅读
下载PDF
职称材料
题名
基于分布式的web log挖掘模型
被引量:
3
1
作者
罗建利
沈洁
许有志
杭月芹
机构
扬州大学信息工程学院计算机科学与工程系
出处
《计算机应用与软件》
CSCD
北大核心
2004年第9期30-32,35,共4页
基金
江苏省教育厅自然科学基金资助项目(0 2KJB52 0 0 1 3)
文摘
本文提出了一种基于分布式weblog挖掘模型 ,并针对该模型设计了一种有效的基于分布式的挖掘算法。该算法首先在各分布式服务器上进行关联规则挖掘 ,然后将各个服务器上的挖掘结果合成。这有利于减轻网络频繁的通讯负担 ,体现并行计算、异步挖掘。
关键词
数据挖掘
关联规则
数据文件
数据转换
事务数据库
分布式服务器
web
log
挖掘模型
Keywords
web
log
data
mining Association rules Distributed mining
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于Weblog的模糊聚类分析
被引量:
1
2
作者
谢维奇
机构
武汉理工大学计算机学院
驻马店广播电视大学
出处
《电脑知识与技术》
2009年第4X期3051-3053,共3页
文摘
该文使用模糊聚类的方法对Web日志进行数据挖掘,给出了模糊聚类分析在数据挖掘中应用的主要步骤,最后用实例证明了Web模糊聚类的可行性。
关键词
web
日志
模糊聚类
web
数据挖掘
Keywords
web
log
fuzzy clustering
web
data
mining
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于Web-log的频繁浏览路径挖掘
3
作者
罗超
机构
辽宁工程技术大学
出处
《信息技术》
2004年第11期4-7,共4页
文摘
利用Web日志文件,采用LossyCounting算法对用户频繁浏览路径进行挖掘。在设计中,根据频繁路径挖掘的实际情况对算法进行了优化和改进。实验表明该方法能快速准确地发现用户频繁浏览路径,且具有较好的可扩展性,适用于电子商务网站的站点优化和个性化服务等。
关键词
数据挖掘
网页日志挖掘
频繁浏览路径
Keywords
data
mining
web
-
log
mining
frequent browsing paths
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种Web用户行为聚类算法
被引量:
20
4
作者
业宁
李威
梁作鹏
董逸生
机构
东南大学计算机科学与工程系
南京林业大学信息学院
出处
《小型微型计算机系统》
CSCD
北大核心
2004年第7期1364-1367,共4页
基金
江苏省九五重点攻关课题 (BJ980 17-1)资助
江苏省十五高科技项目 (BJ2 0 0 10 13 )资助
校科研基金重点课题 (X0 2 -0 70 -1(Z) )资助
文摘
提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法过滤了小于指定阈值的相似度系数 ,大大缩小了数据规模 ,很好地解决了其他聚类算法 (如层次聚类 )在高维空间聚类时的“维数灾难”问题 ,最后的实验结果很好 .
关键词
web
日志
数据挖掘
聚类
相似度
Keywords
web
log
data
mining
clustering
similarity
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
Web日志挖掘中的数据预处理的研究
被引量:
57
5
作者
陆丽娜
杨怡玲
管旭东
魏恒义
机构
西安交通大学计算机科学与技术系
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2000年第4期66-67,72,共3页
文摘
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的数据预处理模型,并通过一个实例具体介绍了各过程的主要任务。
关键词
数据挖掘
web
日志挖掘
数据预处理
数据库
Keywords
data
mining
web
log
mining
data
preparation
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
Web日志挖掘中的数据预处理技术研究
被引量:
62
6
作者
赵伟
何丕廉
陈霞
谢振亮
机构
天津大学计算机科学与技术系
出处
《计算机应用》
CSCD
北大核心
2003年第5期62-64,67,共4页
基金
天津市科技发展计划项目 (0 2 3 1 0 0 51 1 )
文摘
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文中深入探讨了数据预处理环节的主要任务,并介绍这个过程中一些特殊情况的处理方法。
关键词
数据挖掘
web
日志挖掘
数据预处理
Keywords
data
mining
web
log
mining
data
preprocessing
分类号
TP311.138 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
Web日志挖掘中数据预处理的研究
被引量:
20
7
作者
赵红玲
宋瀚涛
牛振东
刘桂山
机构
北京理工大学计算机系
北京理工大学软件学院
出处
《计算机应用研究》
CSCD
北大核心
2005年第6期67-69,共3页
基金
霍英东教育基金会高等院校青年教师基金资助项目(91101)
文摘
针对框架式页面存在的问题,对数据预处理过程进行了改进,在数据清洗和用户识别部分添加了页面过滤部分,同时对预处理过程中的页面过滤算法和用户识别策略也进行了改进。
关键词
数据挖掘
web
日志挖掘
数据预处理
Keywords
data
Mining
web
log
data
Preprocessing
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于Web日志的用户访问路径提取与分析
被引量:
7
8
作者
刘颖
彭赓
吕本富
陈杰
梅梅
机构
中国科学院研究生院管理学院
中国科学院成都文献情报中心
出处
《情报学报》
CSSCI
北大核心
2009年第4期548-556,共9页
基金
国家自然科学基金资助项目(批准号70772103)
中国科学院院长基金资助项目(批准号065001J)
文摘
线上购物相对线下购物的一个特点是可以将用户的购物过程记录到网站的Web日志中,为研究用户网上行为特征提供必要的数据支持。本文详细介绍了对Web日志数据进行预处理的一系列步骤和方法,并以某出版社网站18天的日志数据为实证,提取出用户的访问路径(访问页面的先后次序),分析路径信息得到用户在不同页面之间访问的转换概率,从而定量地衡量购物流程中各步骤之间的转换率和贡献率,提炼出用户最有可能的前向转换路径和后向转换路径,以期对网站流程优化和商品促销设置提供决策支持。
关键词
web
日志
数据预处理
访问路径
转换概率
Keywords
web
log
data
preprocessing
visit path
transit probability
分类号
F716 [经济管理—产业经济]
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
Web挖掘技术及其在网络教学评价中的应用
被引量:
12
9
作者
杨清莲
周庆敏
常志玲
机构
南京工业大学信息科学与工程学院
出处
《南京工业大学学报(自然科学版)》
CAS
2005年第5期100-103,共4页
文摘
结合W eb日志挖掘技术和数据立方体技术应用于网络教学评价体系,以网络教学体系的W eb服务端和客户端的日志作为数据源,使用数据挖掘技术采集有用的数据进行分析抽取,建立数据库,再应用数据立方体技术、OLAP进行分析处理,得到所需的评价结果。结果表明,此算法可以客观的评价网络教学结果。
关键词
web
挖掘
网络教学
web
日志
数据立方体
Keywords
web
mining
network teaching
web
log
data
-cube
分类号
TP274.2 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
Web日志挖掘中的数据预处理技术
被引量:
22
10
作者
李燕
冯博琴
鲁晓锋
机构
西安交通大学电子与信息工程学院
西安理工大学计算机科学与工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第22期44-46,49,共4页
基金
国家"863"计划基金资助项目(2008AA01Z131)
文摘
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。
关键词
web
日志挖掘
数据预处理
用户会话识别
路径补充
Keywords
web
log
mining
data
preprocessing
user-session identification
path completion
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种Web日志会话识别的优化方法
被引量:
18
11
作者
陈子军
王鑫昱
李伟
机构
燕山大学信息学院计算机科学与工程系
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第1期95-97,共3页
基金
燕山大学博士基金资助项目
文摘
会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确。该文对此提出优化算法,并对最常用的Timeout方法识别的会话进行优化,通过实验证明会话质量得到了提高。
关键词
web
日志挖掘
数据预处理
会话识别
Keywords
web
log
mining
data
preprocessing
Sessions reconstruction
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于蚁群算法的Web站点导航
被引量:
5
12
作者
业宁
梁作鹏
董逸生
机构
东南大学计算机科学与工程系
出处
《应用科学学报》
CAS
CSCD
2003年第4期357-361,共5页
基金
江苏省九五重点攻关课题(BJ980171)
江苏省十五高科技(BJ2001013)
校科研基金(X020701(Z))资助项目
文摘
提出了一种Web站点的导航方法.首先利用蚁群算法对已经存在的Web日志进行训练,构造一个有向图,该有向图的节点和边保存了网页与网页间的链接概率和用户行为规则.利用训练结果,预测访问网站的用户行为,根据其行为推荐网页,最后的测试结果表明该方法比单纯的概率分析和关联规则具有更高的精度.
关键词
蚁群算法
web
站点导航
网页
web
日志
数据挖掘
链接概率
用户行为规则
有向图
Keywords
web
navigation
ant colony algorithm
web
log
data
mining
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
提高个性化推荐精度的定制Web日志方法
被引量:
8
13
作者
苏玉召
牛晓太
赵妍
机构
中科院国家科学图书馆
郑州航空工业管理学院
出处
《图书与情报》
CSSCI
北大核心
2011年第5期60-64,共5页
文摘
文章通过对个性化推荐和数据建模理论研究,分析了普通的Web日志格式采集到的数据无法满足个性化用户分析、预测和推荐精度需要的局限性。提出定制Web日志数据建模的过程及方法,建立了定制Web日志模型原型。通过应用数据挖掘技术的关联分析、分类和聚类实验,实验结果表明,通过定制Web日志的方式采集的数据质量能够很好地满足发现关联规则、内容分类和用户聚类的需求,从而提高个性化推荐的精度。同时,定制的Web日志数据还具有简化数据预处理、多用途的优点。
关键词
数据建模
定制
web
日志
数据挖掘
个性化推荐
Keywords
data
modeling
customized
web
log
data
mining
personalization recommending
分类号
G250.72 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
基于数据仓库的Web日志挖掘技术研究
被引量:
5
14
作者
席景科
张辰
谢红侠
机构
中国矿业大学 计算机科学与技术学院
出处
《计算机工程与设计》
CSCD
北大核心
2007年第24期5890-5892,共3页
基金
中国矿业大学青年科研基金项目(OD4554)
文摘
Web日志挖掘是目前Web挖掘研究的一个重点。针对Web日志挖掘中存在的问题,给出了基于数据仓库技术的Web日志挖掘方案,就数据预处理、数据立方体设计及数据挖掘技术的应用进行了较为深入的探讨。并以一个Web站点日志为例,详细阐述了Web日志数据预处理、Web日志立方体设计以及数据挖掘算法的实现过程,并实现了一个Web日志多维数据集,能够有效解决Web日志分析中的难题。
关键词
web
日志
数据仓库
数据立方体
联机分析处理
数据挖掘
Keywords
web
log
data
warehousing
data
cube
OLAP
data
mining
分类号
TP311.132 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于协作过滤的Web日志数据预处理研究
被引量:
9
15
作者
纪良浩
王国胤
杨勇
机构
重庆邮电大学计算机科学与技术研究所
出处
《重庆邮电学院学报(自然科学版)》
2006年第5期646-649,共4页
基金
重庆市自然科学基金重点资助项目(2005BA2003)
文摘
协作过滤是当今应用较为成功的个性化服务技术,Web日志可以为个性化服务技术提供重要的数据源,只要对日志数据进行高效预处理,就能提高协作过滤算法有效性和个性化服务质量。结合实际日志数据的处理,给出了基于协作过滤的Web日志数据预处理过程结构图和一种可行的数据预处理方法,该方法不仅可以提供更加干净、规则的数据源,而且在用户兴趣度量方面,弥补了以往诸多兴趣度量方法的不足,为协作过滤算法提供了更加准确的数据支持。
关键词
个性化服务
协作过滤
web
日志
数据预处理
用户兴趣
Keywords
personalized service
collaborative filtering
web
log
data
preprocessing
user's interests
分类号
TP274 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
Web日志挖掘中数据预处理方法的研究
被引量:
15
16
作者
李烈彪
张海鹏
周亚峰
机构
重庆大学计算机学院
出处
《计算机技术与发展》
2007年第7期45-48,52,共5页
文摘
Web日志挖掘是目前网上智能信息检索和电子商务的主要研究课题之一。而数据预处理在Web日志挖掘中起着很重要的作用,直接影响日志挖掘的质量和结果。介绍了Web日志挖掘数据预处理过程,综述了国际上的研究现状,及流行的处理方法。针对预处理步骤中的用户会话识别和路径填充进行了相应的改进。根据评估会话构造方法的标准,通过实验对给出的新方法与其他方法进行了分析比较。
关键词
数据挖掘
web
日志挖掘
数据预处理
Keywords
data
mining
web
log
mining
data
preprocessing
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于IIS和web日志的关联关系的挖掘
被引量:
7
17
作者
张静
田忠和
机构
华中科技大学控制科学与工程系
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2002年第8期37-39,共3页
文摘
针对隐藏在web日志的大量记录中的规律性开展研究 ,提出了一种基于微软的IIS合理构建web日志并进行数据预处理的方案 ,在此基础上运用Apriori算法挖掘用户访问的页面间的关联关系 .将数据预处理过程提前到web日志的建立过程中 ,可极大地降低数据准备的复杂性 ;将日志数据导入关系数据库中进行净化处理 ,大幅度减少了工作量 .
关键词
web
日志
数据挖掘
关联规则
电子商务
web
挖掘
Keywords
web
log
data
mining
association rules
electronic business
web
mining
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
Web日志挖掘中数据预处理技术的研究
被引量:
19
18
作者
马瑞民
李向云
机构
大庆石油学院计算机与信息技术学院
出处
《计算机工程与设计》
CSCD
北大核心
2007年第10期2358-2360,共3页
文摘
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访问序列直接生成事务的算法。
关键词
web
日志挖掘
数据预处理
路径补充
访问序列
访问事务
Keywords
web
log
mining
data
preprocessing
path completion
accessed session
accessed transaction
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
改进的Web访问日志会话识别算法
被引量:
8
19
作者
严奉华
刘建平
杨凡丁
机构
浙江理工大学信息电子学院
出处
《计算机工程与设计》
CSCD
北大核心
2008年第22期5685-5687,5690,共4页
文摘
针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界定内容页,并针对内容页,提出了一些启发式规则,突破了"参引长度法"所固有的一个会话中只包含一个内容页的瓶颈。该方法提高了会话识别的准确度,实验结果表明是有效的。
关键词
web
日志挖掘
数据预处理
会话
内容页
时间阀值
启发式规则
Keywords
web
log
mining
data
preprocessing
session
content page
time threshold
heuristics rule
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
电子商务与Web数据挖掘
被引量:
46
20
作者
邹显春
谢中
周彦晖
机构
西南师范大学计算机与信息科学学院
出处
《计算机应用》
CSCD
北大核心
2001年第5期21-23,共3页
文摘
在电子商务中 ,运用数据挖掘技术对服务器上的日志文件等Web数据进行客户访问信息的Web数据挖掘 ,了解客户的访问行为 ,从而调整站点结构、市场策略等 ,使电子商务活动具有针对性。
关键词
电子商务
INTERNET
web
数据挖掘
数据源
Keywords
electronic commerce
web
data
mining
server
log
file
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于分布式的web log挖掘模型
罗建利
沈洁
许有志
杭月芹
《计算机应用与软件》
CSCD
北大核心
2004
3
在线阅读
下载PDF
职称材料
2
基于Weblog的模糊聚类分析
谢维奇
《电脑知识与技术》
2009
1
在线阅读
下载PDF
职称材料
3
基于Web-log的频繁浏览路径挖掘
罗超
《信息技术》
2004
0
在线阅读
下载PDF
职称材料
4
一种Web用户行为聚类算法
业宁
李威
梁作鹏
董逸生
《小型微型计算机系统》
CSCD
北大核心
2004
20
在线阅读
下载PDF
职称材料
5
Web日志挖掘中的数据预处理的研究
陆丽娜
杨怡玲
管旭东
魏恒义
《计算机工程》
EI
CAS
CSCD
北大核心
2000
57
在线阅读
下载PDF
职称材料
6
Web日志挖掘中的数据预处理技术研究
赵伟
何丕廉
陈霞
谢振亮
《计算机应用》
CSCD
北大核心
2003
62
在线阅读
下载PDF
职称材料
7
Web日志挖掘中数据预处理的研究
赵红玲
宋瀚涛
牛振东
刘桂山
《计算机应用研究》
CSCD
北大核心
2005
20
在线阅读
下载PDF
职称材料
8
基于Web日志的用户访问路径提取与分析
刘颖
彭赓
吕本富
陈杰
梅梅
《情报学报》
CSSCI
北大核心
2009
7
在线阅读
下载PDF
职称材料
9
Web挖掘技术及其在网络教学评价中的应用
杨清莲
周庆敏
常志玲
《南京工业大学学报(自然科学版)》
CAS
2005
12
在线阅读
下载PDF
职称材料
10
Web日志挖掘中的数据预处理技术
李燕
冯博琴
鲁晓锋
《计算机工程》
CAS
CSCD
北大核心
2009
22
在线阅读
下载PDF
职称材料
11
一种Web日志会话识别的优化方法
陈子军
王鑫昱
李伟
《计算机工程》
CAS
CSCD
北大核心
2007
18
在线阅读
下载PDF
职称材料
12
基于蚁群算法的Web站点导航
业宁
梁作鹏
董逸生
《应用科学学报》
CAS
CSCD
2003
5
在线阅读
下载PDF
职称材料
13
提高个性化推荐精度的定制Web日志方法
苏玉召
牛晓太
赵妍
《图书与情报》
CSSCI
北大核心
2011
8
在线阅读
下载PDF
职称材料
14
基于数据仓库的Web日志挖掘技术研究
席景科
张辰
谢红侠
《计算机工程与设计》
CSCD
北大核心
2007
5
在线阅读
下载PDF
职称材料
15
基于协作过滤的Web日志数据预处理研究
纪良浩
王国胤
杨勇
《重庆邮电学院学报(自然科学版)》
2006
9
在线阅读
下载PDF
职称材料
16
Web日志挖掘中数据预处理方法的研究
李烈彪
张海鹏
周亚峰
《计算机技术与发展》
2007
15
在线阅读
下载PDF
职称材料
17
基于IIS和web日志的关联关系的挖掘
张静
田忠和
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2002
7
在线阅读
下载PDF
职称材料
18
Web日志挖掘中数据预处理技术的研究
马瑞民
李向云
《计算机工程与设计》
CSCD
北大核心
2007
19
在线阅读
下载PDF
职称材料
19
改进的Web访问日志会话识别算法
严奉华
刘建平
杨凡丁
《计算机工程与设计》
CSCD
北大核心
2008
8
在线阅读
下载PDF
职称材料
20
电子商务与Web数据挖掘
邹显春
谢中
周彦晖
《计算机应用》
CSCD
北大核心
2001
46
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
13
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部