期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于URL主题的查询分类方法 被引量:14
1
作者 张宇 宋巍 +1 位作者 刘挺 李生 《计算机研究与发展》 EI CSCD 北大核心 2012年第6期1298-1305,共8页
互联网上很多资源蕴含人类群体智慧.分类网站目录人工地对网站按照主题进行组织.基于网站目录中具有主题标注的URL设计URL主题分类器,结合伪相关反馈技术以及搜索引擎查询日志,提出了自动、快速、有效的查询主题分类方法.具体地,方法为... 互联网上很多资源蕴含人类群体智慧.分类网站目录人工地对网站按照主题进行组织.基于网站目录中具有主题标注的URL设计URL主题分类器,结合伪相关反馈技术以及搜索引擎查询日志,提出了自动、快速、有效的查询主题分类方法.具体地,方法为2种策略的结合.策略1通过计算搜索结果中URL的主题分布预测查询主题,策略2基于查询日志点击关系,利用具有主题标注的URL,对查询进行标注获取数据并训练统计分类器预测查询主题.实验表明,方法可获得比当前最好算法更好的准确率,更好的在线处理效率并且可基于查询日志自动获取训练数据,具有良好的可扩展性. 展开更多
关键词 查询分类 url分类 查询日志 伪相关反馈 统计学习
在线阅读 下载PDF
一种基于Web日志的Web用户群体和URL聚类算法
2
作者 宁建飞 《海南大学学报(自然科学版)》 CAS 2012年第4期354-359,共6页
通过处理和研究Web日志,得到多数用户感兴趣的页面URL和具有相近访问爱好的用户群体,对站点的结构是否适合用户作出判断并进行相应的调整,从而实现对用户的个性化服务.
关键词 WEB日志 用户聚类 站点url聚类
在线阅读 下载PDF
Web日志挖掘中的用户识别算法 被引量:11
3
作者 肖慧 王立华 《计算机系统应用》 2011年第5期223-226,共4页
介绍了现有的用户识别算法,针对用户识别目前存在的问题提出了IASR(IP,Agent,Session and Referrer)用户识别算法。该算法采用重写URL的用户跟踪技术,引入会话(Session)来识别用户,能够高效准确地识别访问同一代理服务器的不同用户,很... 介绍了现有的用户识别算法,针对用户识别目前存在的问题提出了IASR(IP,Agent,Session and Referrer)用户识别算法。该算法采用重写URL的用户跟踪技术,引入会话(Session)来识别用户,能够高效准确地识别访问同一代理服务器的不同用户,很好地解决同一用户直接从浏览器地址输入URL信息访问站点造成的"多用户问题"。最后,对用户识别算法的发展趋势进行了展望。 展开更多
关键词 用户识别 重写url 会话机制 WEB日志挖掘
在线阅读 下载PDF
一种数字校园日志获取模型及实现方法 被引量:1
4
作者 康金辉 《计算机与数字工程》 2009年第4期178-181,共4页
获得校园网访问日志的传统方法是利用镜像端口捕获数据包后根据协议解析获得,其特征是大量的数据包被集中处理,对硬件的要求较高,串接于主干的日志硬件系统可能引起潜在的网络运行故障。提出具有典型的C/S结构的呈分布处理特征的设计方... 获得校园网访问日志的传统方法是利用镜像端口捕获数据包后根据协议解析获得,其特征是大量的数据包被集中处理,对硬件的要求较高,串接于主干的日志硬件系统可能引起潜在的网络运行故障。提出具有典型的C/S结构的呈分布处理特征的设计方法。该方法首先基于数字签名技术配合校园网登录系统在客户端下载安装具有能获得访问日志的软件,之后,基于非混杂模式捕获数据包直接提取日志经简单清洗后基于UDP协议发往日志服务器并进行处理。最后给出了系统实现方法。 展开更多
关键词 数字校园 日志 url HTTP协议
在线阅读 下载PDF
基于大数据平台的网络日志机器行为分析 被引量:6
5
作者 陈涵 张仰森 +2 位作者 何梓源 祁浩家 黄改娟 《计算机工程与设计》 北大核心 2023年第7期2232-2241,共10页
为从海量日志中分析并提取可能存在的机器行为日志,应用概率统计和K-means算法对网络日志进行分析,提出基于多阶段层次化判别的ChenRF模型,共包含两部分内容,分别为基于特征规则和阈值匹配的机器行为判定模型与基于Bi-LSTMAttention的... 为从海量日志中分析并提取可能存在的机器行为日志,应用概率统计和K-means算法对网络日志进行分析,提出基于多阶段层次化判别的ChenRF模型,共包含两部分内容,分别为基于特征规则和阈值匹配的机器行为判定模型与基于Bi-LSTMAttention的机器行为识别模型。应用Spark批处理框架,对所提模型进行算法实现,构建以一小时为单位的分布式网络日志批处理分析平台。在1万和千万级别规模的数据上,对构建的大数据日志分析处理平台进行测试,验证了所提模型的有效性。 展开更多
关键词 网络日志 超文本传输协议 机器行为识别 数据分析与挖掘 深度学习 分布式存储技术 大数据计算技术
在线阅读 下载PDF
潜在狄利克雷分配模型在网络日志的应用
6
作者 许两有 许珠香 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第4期455-458,共4页
近年来,基于Web日志的数据挖掘技术逐渐成为理论研究和商业应用中的热点问题,而其中Web用户分类又是挖掘领域中最重要的研究主题之一.对Web用户分类能够发现用户之间相似的用户行为,从而针对具体用户群设置对应的服务项目.根据用户的历... 近年来,基于Web日志的数据挖掘技术逐渐成为理论研究和商业应用中的热点问题,而其中Web用户分类又是挖掘领域中最重要的研究主题之一.对Web用户分类能够发现用户之间相似的用户行为,从而针对具体用户群设置对应的服务项目.根据用户的历史访问网页地址(URL)信息,提出了基于加权潜在狄利克雷分配(LDA)模型的用户分类方法,将用户划分到不同的主题群体,实验表明,这种方法能达到很好的分类效果. 展开更多
关键词 WEB日志 潜在狄利克雷分配(LDA)模型 url 分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部