期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
9
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Web日志预处理中优化的会话识别方法
被引量:
11
1
作者
方元康
胡学钢
夏启寿
《计算机工程》
CAS
CSCD
北大核心
2009年第7期49-51,共3页
针对Web日志数据预处理中会话识别这一重要环节,提出一种优化的会话识别算法。在用户识别后,通过过滤框架页面大幅度减少实验产生的有效页面数,为每个页面设置访问时间阈值,并根据页面重要程度对该阈值进行调整,页面的重要性由页面内容...
针对Web日志数据预处理中会话识别这一重要环节,提出一种优化的会话识别算法。在用户识别后,通过过滤框架页面大幅度减少实验产生的有效页面数,为每个页面设置访问时间阈值,并根据页面重要程度对该阈值进行调整,页面的重要性由页面内容及站点结构确定。实验数据显示,与对所有页面使用单一的先验阈值进行会话识别的方法相比较,该方法得到了真实性更强的会话集。
展开更多
关键词
web
挖掘
数据预处理
阈值
frame
页面
会话识别
在线阅读
下载PDF
职称材料
改进的Web访问日志会话识别算法
被引量:
8
2
作者
严奉华
刘建平
杨凡丁
《计算机工程与设计》
CSCD
北大核心
2008年第22期5685-5687,5690,共4页
针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界...
针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界定内容页,并针对内容页,提出了一些启发式规则,突破了"参引长度法"所固有的一个会话中只包含一个内容页的瓶颈。该方法提高了会话识别的准确度,实验结果表明是有效的。
展开更多
关键词
web
日志挖掘
数据预处理
会话
内容页
时间阀值
启发式规则
在线阅读
下载PDF
职称材料
改进的Web日志数据预处理技术
被引量:
3
3
作者
方元康
胡学钢
+1 位作者
夏启寿
朱勇
《计算机工程》
CAS
CSCD
北大核心
2009年第10期73-74,77,共3页
介绍Web日志挖掘预处理过程中一些特殊情况的处理方法,在会话识别阶段给出一种基于过滤框架网页与会话重组相结合的会话识别方法,在会话识别之前进行框架网页的过滤,根据传统的会话识别方法构造初始会话集,使用会话重组算法对初始会话...
介绍Web日志挖掘预处理过程中一些特殊情况的处理方法,在会话识别阶段给出一种基于过滤框架网页与会话重组相结合的会话识别方法,在会话识别之前进行框架网页的过滤,根据传统的会话识别方法构造初始会话集,使用会话重组算法对初始会话集进行优化。实验结果显示,该方法提高了会话识别的质量。
展开更多
关键词
web
日志挖掘
数据预处理
frame
页面
会话识别
在线阅读
下载PDF
职称材料
一种改进的Web日志会话识别方法
被引量:
7
4
作者
方元康
胡学钢
夏启寿
《计算机技术与发展》
2008年第11期214-216,共3页
会话识别是Web日志挖掘中的数据预处理中的一个重要步骤。文中提出了一种改进的会话识别方法。首先,在用户识别后,进行框架页面的过滤,从而大大地减少了实验产生的有效页面,然后为页面设置访问时间阈值,并根据页面内容及站点结构确定的...
会话识别是Web日志挖掘中的数据预处理中的一个重要步骤。文中提出了一种改进的会话识别方法。首先,在用户识别后,进行框架页面的过滤,从而大大地减少了实验产生的有效页面,然后为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整。通过实验证明,相对于传统的对所有页面使用单一的先验阈值进行会话识别的方法,该方法所得到的会话集更具有真实性。
展开更多
关键词
web
挖掘
数据预处理
阈值
frame
页面
会话识别
在线阅读
下载PDF
职称材料
Web日志挖掘中数据预处理技术研究
被引量:
2
5
作者
方元康
胡学钢
夏启寿
《安庆师范学院学报(自然科学版)》
2008年第3期107-110,113,共5页
Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页...
Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页与页面访问时间阈值相结合的会话识别方法,实验数据验证说明该方法可以显著地提高Web日志挖掘结果的兴趣性。
展开更多
关键词
web
挖掘
数据预处理
阈值
frame
页面
会话识别
在线阅读
下载PDF
职称材料
web日志挖掘中会话识别方法
被引量:
1
6
作者
袁艺
陈海光
《上海师范大学学报(自然科学版)》
2016年第5期593-598,共6页
通过对传统web会话识别方法分析和比较,改进了目前最常用的基于时间阈值会话识别方法,提出了一种基于动态阈值会话识别方法,该算法采用动态计算会话中请求记录间的平均时间间隔和动态计算会话中页面的平均大小相结合的方法,根据用户和...
通过对传统web会话识别方法分析和比较,改进了目前最常用的基于时间阈值会话识别方法,提出了一种基于动态阈值会话识别方法,该算法采用动态计算会话中请求记录间的平均时间间隔和动态计算会话中页面的平均大小相结合的方法,根据用户和网页的特点动态调整阈值,相对于传统单一的先验阈值,该方法可以根据不同的用户访问不同的页面生成动态的阈值,充分运用用户和网页信息.经过实验验证,该方法可以识别出更多的用户会话,且识别会话的准确率和查全率也比传统算法更高.
展开更多
关键词
web
挖掘
会话识别
时间阈值
数据预处理
在线阅读
下载PDF
职称材料
基于框架网页与页面阈值的会话识别算法
7
作者
方元康
胡学钢
+1 位作者
夏启寿
朱勇
《计算机应用与软件》
CSCD
2009年第1期18-19,27,共3页
会话识别是Web日志预处理过程中的一个重要环节,针对传统会话识别的不足,提出一种改进的会话识别算法。在识别出具体的用户之后,过滤大量的框架网页;然后根据每个页面的内容及网站结构,构造出相对合理的页面访问时间阈值,并以此阈值来...
会话识别是Web日志预处理过程中的一个重要环节,针对传统会话识别的不足,提出一种改进的会话识别算法。在识别出具体的用户之后,过滤大量的框架网页;然后根据每个页面的内容及网站结构,构造出相对合理的页面访问时间阈值,并以此阈值来进行用户的会话识别。最后通过实验数据,与几种传统的会话识别方法进行了比较,表明该算法更为合理有效。
展开更多
关键词
web
挖掘
数据预处理
阈值
frame
页面
会话识别
在线阅读
下载PDF
职称材料
改进的页面与时间阈值的会话识别法
被引量:
1
8
作者
郑立山
滕少华
《计算机应用与软件》
CSCD
北大核心
2012年第10期197-199,275,共4页
会话识别是Web日志挖掘的基础,提高会话的识别率能为后续模式的挖掘提供准确可靠的数据,已有许多研究集中于此。在常用的计算时间阈值识别方法的基础上,提出一种改进的基于URL页面类型、页面信息量和停留时间的平均阈值识别方法。针对...
会话识别是Web日志挖掘的基础,提高会话的识别率能为后续模式的挖掘提供准确可靠的数据,已有许多研究集中于此。在常用的计算时间阈值识别方法的基础上,提出一种改进的基于URL页面类型、页面信息量和停留时间的平均阈值识别方法。针对不同的URL页面类型采用不同的阈值计算方法,并设置时间阈值。相对于已有的对所有用户访问页面使用单一的先验阈值和现有动态阈值计算,该方法能够更真实地反映用户会话的情况,且识别的准确率有了较大提高。
展开更多
关键词
web
日志挖掘
数据预处理
用户会话识别
动态阈值
在线阅读
下载PDF
职称材料
改进的页面与时间阈值的会话识别法
9
作者
郑立山
滕少华
《江西师范大学学报(自然科学版)》
CAS
北大核心
2012年第4期395-398,共4页
在常用的计算时间阈值识别方法的基础上,提出了一种改进的基于URL页面类型、页面信息量和访问时间的平均阈值识别方法.针对不同的页面类型采用不同的阈值计算方法设置时间阈值,相对于已有的对所有用户页面使用单一的先验阈值和现有动态...
在常用的计算时间阈值识别方法的基础上,提出了一种改进的基于URL页面类型、页面信息量和访问时间的平均阈值识别方法.针对不同的页面类型采用不同的阈值计算方法设置时间阈值,相对于已有的对所有用户页面使用单一的先验阈值和现有动态阈值计算,该方法能够更真实地反映用户会话的情况,且识别的准确率有了较大提高.
展开更多
关键词
web
日志挖掘
数据预处理
用户会话识别
动态阈值
在线阅读
下载PDF
职称材料
题名
Web日志预处理中优化的会话识别方法
被引量:
11
1
作者
方元康
胡学钢
夏启寿
机构
合肥工业大学计算机与信息学院
池州学院计算机中心
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第7期49-51,共3页
基金
国家自然科学基金资助项目(050504F)
池州学院自然科学基金资助项目(XK0829)
文摘
针对Web日志数据预处理中会话识别这一重要环节,提出一种优化的会话识别算法。在用户识别后,通过过滤框架页面大幅度减少实验产生的有效页面数,为每个页面设置访问时间阈值,并根据页面重要程度对该阈值进行调整,页面的重要性由页面内容及站点结构确定。实验数据显示,与对所有页面使用单一的先验阈值进行会话识别的方法相比较,该方法得到了真实性更强的会话集。
关键词
web
挖掘
数据预处理
阈值
frame
页面
会话识别
Keywords
web
mining
data
preprocessing
threshold
frame
page
session
identification
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
改进的Web访问日志会话识别算法
被引量:
8
2
作者
严奉华
刘建平
杨凡丁
机构
浙江理工大学信息电子学院
出处
《计算机工程与设计》
CSCD
北大核心
2008年第22期5685-5687,5690,共4页
文摘
针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界定内容页,并针对内容页,提出了一些启发式规则,突破了"参引长度法"所固有的一个会话中只包含一个内容页的瓶颈。该方法提高了会话识别的准确度,实验结果表明是有效的。
关键词
web
日志挖掘
数据预处理
会话
内容页
时间阀值
启发式规则
Keywords
web
log
mining
data
preprocessing
session
content
page
time
threshold
heuristics rule
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
改进的Web日志数据预处理技术
被引量:
3
3
作者
方元康
胡学钢
夏启寿
朱勇
机构
池州学院计算机中心
合肥工业大学计算机与信息学院
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第10期73-74,77,共3页
基金
国家自然科学基金资助项目(050504F)
安徽省教育厅自然科学基金资助项目(XK0829,KJ2008B45ZC)
池州学院自然科学基金资助项目(2007XJ015)
文摘
介绍Web日志挖掘预处理过程中一些特殊情况的处理方法,在会话识别阶段给出一种基于过滤框架网页与会话重组相结合的会话识别方法,在会话识别之前进行框架网页的过滤,根据传统的会话识别方法构造初始会话集,使用会话重组算法对初始会话集进行优化。实验结果显示,该方法提高了会话识别的质量。
关键词
web
日志挖掘
数据预处理
frame
页面
会话识别
Keywords
web
log
mining
data
preprocessing
frame
page
session
identification
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种改进的Web日志会话识别方法
被引量:
7
4
作者
方元康
胡学钢
夏启寿
机构
合肥工业大学计算机信息学院
池州学院计算机中心
出处
《计算机技术与发展》
2008年第11期214-216,共3页
基金
安徽省自然科学基金项目(KJ2008B116)
池州学院自然科学基金项目(XK0829)
文摘
会话识别是Web日志挖掘中的数据预处理中的一个重要步骤。文中提出了一种改进的会话识别方法。首先,在用户识别后,进行框架页面的过滤,从而大大地减少了实验产生的有效页面,然后为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整。通过实验证明,相对于传统的对所有页面使用单一的先验阈值进行会话识别的方法,该方法所得到的会话集更具有真实性。
关键词
web
挖掘
数据预处理
阈值
frame
页面
会话识别
Keywords
web
mining
data
preprocessing
threshold
frame
page
session
ident ification
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
Web日志挖掘中数据预处理技术研究
被引量:
2
5
作者
方元康
胡学钢
夏启寿
机构
合肥工业大学计算机信息学院
池州学院计算机中心
出处
《安庆师范学院学报(自然科学版)》
2008年第3期107-110,113,共5页
基金
安徽省教育厅自然科学基金资助(XK0829)
池州学院自然科学基金资助(2007XJ015)
文摘
Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页与页面访问时间阈值相结合的会话识别方法,实验数据验证说明该方法可以显著地提高Web日志挖掘结果的兴趣性。
关键词
web
挖掘
数据预处理
阈值
frame
页面
会话识别
Keywords
web
mining
data
preprocessing
threshold
frame
page
session
reconstruction
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
web日志挖掘中会话识别方法
被引量:
1
6
作者
袁艺
陈海光
机构
上海师范大学信息与机电工程学院
出处
《上海师范大学学报(自然科学版)》
2016年第5期593-598,共6页
文摘
通过对传统web会话识别方法分析和比较,改进了目前最常用的基于时间阈值会话识别方法,提出了一种基于动态阈值会话识别方法,该算法采用动态计算会话中请求记录间的平均时间间隔和动态计算会话中页面的平均大小相结合的方法,根据用户和网页的特点动态调整阈值,相对于传统单一的先验阈值,该方法可以根据不同的用户访问不同的页面生成动态的阈值,充分运用用户和网页信息.经过实验验证,该方法可以识别出更多的用户会话,且识别会话的准确率和查全率也比传统算法更高.
关键词
web
挖掘
会话识别
时间阈值
数据预处理
Keywords
web
mining
session
identification
threshold
data
preprocessing
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于框架网页与页面阈值的会话识别算法
7
作者
方元康
胡学钢
夏启寿
朱勇
机构
池州学院计算机中心
合肥工业大学计算机与信息学院
出处
《计算机应用与软件》
CSCD
2009年第1期18-19,27,共3页
基金
国家自然科学基金项目(050504F)
安徽省教育厅自然科学基金项目(XK0829)
安徽省教育厅自然科学基金项目(KJ2008B45ZC)
文摘
会话识别是Web日志预处理过程中的一个重要环节,针对传统会话识别的不足,提出一种改进的会话识别算法。在识别出具体的用户之后,过滤大量的框架网页;然后根据每个页面的内容及网站结构,构造出相对合理的页面访问时间阈值,并以此阈值来进行用户的会话识别。最后通过实验数据,与几种传统的会话识别方法进行了比较,表明该算法更为合理有效。
关键词
web
挖掘
数据预处理
阈值
frame
页面
会话识别
Keywords
web mining data preprocessing threshold frame page session identification
分类号
TP274.2 [自动化与计算机技术—检测技术与自动化装置]
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
改进的页面与时间阈值的会话识别法
被引量:
1
8
作者
郑立山
滕少华
机构
广东工业大学计算机学院
出处
《计算机应用与软件》
CSCD
北大核心
2012年第10期197-199,275,共4页
基金
广东省自然科学基金项目(06021484
9151009001000007)
文摘
会话识别是Web日志挖掘的基础,提高会话的识别率能为后续模式的挖掘提供准确可靠的数据,已有许多研究集中于此。在常用的计算时间阈值识别方法的基础上,提出一种改进的基于URL页面类型、页面信息量和停留时间的平均阈值识别方法。针对不同的URL页面类型采用不同的阈值计算方法,并设置时间阈值。相对于已有的对所有用户访问页面使用单一的先验阈值和现有动态阈值计算,该方法能够更真实地反映用户会话的情况,且识别的准确率有了较大提高。
关键词
web
日志挖掘
数据预处理
用户会话识别
动态阈值
Keywords
web
log
mining
data
preprocessing
User
session
identification
Dynamic
threshold
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
改进的页面与时间阈值的会话识别法
9
作者
郑立山
滕少华
机构
广东工业大学计算机学院
出处
《江西师范大学学报(自然科学版)》
CAS
北大核心
2012年第4期395-398,共4页
基金
广东省自然科学基金(06021484
9151009001000007)
教育部重点实验室开放基金(110411)资助项目
文摘
在常用的计算时间阈值识别方法的基础上,提出了一种改进的基于URL页面类型、页面信息量和访问时间的平均阈值识别方法.针对不同的页面类型采用不同的阈值计算方法设置时间阈值,相对于已有的对所有用户页面使用单一的先验阈值和现有动态阈值计算,该方法能够更真实地反映用户会话的情况,且识别的准确率有了较大提高.
关键词
web
日志挖掘
数据预处理
用户会话识别
动态阈值
Keywords
web
mining
data
preprocessing
user
session
identification
dynamic
threshold
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Web日志预处理中优化的会话识别方法
方元康
胡学钢
夏启寿
《计算机工程》
CAS
CSCD
北大核心
2009
11
在线阅读
下载PDF
职称材料
2
改进的Web访问日志会话识别算法
严奉华
刘建平
杨凡丁
《计算机工程与设计》
CSCD
北大核心
2008
8
在线阅读
下载PDF
职称材料
3
改进的Web日志数据预处理技术
方元康
胡学钢
夏启寿
朱勇
《计算机工程》
CAS
CSCD
北大核心
2009
3
在线阅读
下载PDF
职称材料
4
一种改进的Web日志会话识别方法
方元康
胡学钢
夏启寿
《计算机技术与发展》
2008
7
在线阅读
下载PDF
职称材料
5
Web日志挖掘中数据预处理技术研究
方元康
胡学钢
夏启寿
《安庆师范学院学报(自然科学版)》
2008
2
在线阅读
下载PDF
职称材料
6
web日志挖掘中会话识别方法
袁艺
陈海光
《上海师范大学学报(自然科学版)》
2016
1
在线阅读
下载PDF
职称材料
7
基于框架网页与页面阈值的会话识别算法
方元康
胡学钢
夏启寿
朱勇
《计算机应用与软件》
CSCD
2009
0
在线阅读
下载PDF
职称材料
8
改进的页面与时间阈值的会话识别法
郑立山
滕少华
《计算机应用与软件》
CSCD
北大核心
2012
1
在线阅读
下载PDF
职称材料
9
改进的页面与时间阈值的会话识别法
郑立山
滕少华
《江西师范大学学报(自然科学版)》
CAS
北大核心
2012
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部