期刊文献+

一种改进的Web日志会话识别方法 被引量:7

An Improved Method for Transaction Session Identification in Web Usage Mining
在线阅读 下载PDF
导出
摘要 会话识别是Web日志挖掘中的数据预处理中的一个重要步骤。文中提出了一种改进的会话识别方法。首先,在用户识别后,进行框架页面的过滤,从而大大地减少了实验产生的有效页面,然后为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整。通过实验证明,相对于传统的对所有页面使用单一的先验阈值进行会话识别的方法,该方法所得到的会话集更具有真实性。 Session identification is an important step in data preproce^ing of web log mining, an access intervals- based improvement was carried out of transaction session identification in web usage mining. After identifying users, effective web pages in experiment are reduced greatly by filtering frame pages, and the access time threshold was adjusted by the web contents and site's structure on this condition. Compared to the traditional method that defines a uniform a threshold for all web pages experimentally, the approach presented can decide the access time threshold more accurately. Algorithm enhancing the quality of transaction session is proved by experiments.
出处 《计算机技术与发展》 2008年第11期214-216,共3页 Computer Technology and Development
基金 安徽省自然科学基金项目(KJ2008B116) 池州学院自然科学基金项目(XK0829)
关键词 WEB挖掘 数据预处理 阈值 Frame页面 会话识别 Web mining data preprocessing threshold frame page session ident ification
  • 相关文献

参考文献3

二级参考文献15

  • 1杨怡玲,管旭东,尤晋元.IMPROVING THE INTERESTINGNESS OF WEB USAGE MINING[J].Journal of Shanghai Jiaotong university(Science),2002,7(1):15-22. 被引量:1
  • 2Han J,Data Mining:Concepts and Techniques,2000年
  • 3Wang K,Proc of VLDB'97,1999年,363页
  • 4Zaiane O R,Proc Int Workshop Web Information and Data Management(WIDM'98),1998年,9页
  • 5Mobasher B,Tech Rep:TR96 0 5 0,1996年
  • 6Zaiane O R,Proc KDD'95,1995年,331页
  • 7Han Jiawei,Kamber M.Data Mining[M].Beijing:Higher Education Press,2000.
  • 8Serivastava J,Cooley R,Deshpande M,et al.Web Usage Mining:Discovery and Applications of Usage Patterns from Web Data[J].ACM SIGKDD Explorations,2000,1 (2):12-23.
  • 9Spiliopoulou M,Mobasher B,Berendt B,et al.A framework for the evaluation of session reconstruction heuristics in Web usage analysis[J].Informs Journal on Coumputing,2003,15(5):171-179.
  • 10Baglioni M,Ferrara U,Romei A,et al.Preprocessing and mining Weblog data for Web personalization[C]//Proceedings of 8th Natl' conf of the Italian Association for Artificial Intelligence.Pisa,Italy:[s.n.],2003.

共引文献372

同被引文献30

引证文献7

二级引证文献16

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部