期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于字符串相似度的URL聚类方法研究
1
作者 刘翼 田亮亮 +2 位作者 高明 李凯茵 叶倩 《现代电子技术》 北大核心 2025年第11期84-88,共5页
内容分发网络(CDN)被用于解决网络访问负荷过载的问题。然而,同一网络服务可能包含多个域名,导致网页主题分类结果精确度和检索效率降低。文中提出一种基于字符串相似度算法的URL聚类方法,首先,获取校园网络7×24 h的真实流量数据,... 内容分发网络(CDN)被用于解决网络访问负荷过载的问题。然而,同一网络服务可能包含多个域名,导致网页主题分类结果精确度和检索效率降低。文中提出一种基于字符串相似度算法的URL聚类方法,首先,获取校园网络7×24 h的真实流量数据,利用协议分析抽取特征信息,转化为数据集;其次,进行数据清洗与处理,去除缺省字段和错误字段,将相同数据条目集成;最后,采用字符串相似度算法计算URL之间的距离作为聚类算法的特征,并采用K-means聚类算法划分相似URL,达到将多个不同域名分类到相同网络服务的目的。实验通过对5种不同方法进行比较发现,Levenshtein算法的平均轮廓系数达到了91.4%,较其他方法平均提高12%,能够有效应对精确度降低和检索效率低下的问题。 展开更多
关键词 数据聚类 字符串相似度 轮廓系数法 协议分析 K-MEANS url CDN Levenshtein算法
在线阅读 下载PDF
分布式爬虫系统中URL去重的设计与实现 被引量:2
2
作者 陈宇伦 周奎 《现代信息科技》 2019年第11期105-106,110,共3页
目前全球URL总数在350亿以上,在满足时效性的前提下,越来越多地选择采用分布式爬虫技术,它可以快速高效地从Web中获取有价值的数据。基于Redis数据库设计一种相关去重协议,实现URL去重,有利于提高分布式系统的稳定性和高效性,以及保持... 目前全球URL总数在350亿以上,在满足时效性的前提下,越来越多地选择采用分布式爬虫技术,它可以快速高效地从Web中获取有价值的数据。基于Redis数据库设计一种相关去重协议,实现URL去重,有利于提高分布式系统的稳定性和高效性,以及保持整个系统对URL去重的一致性。 展开更多
关键词 分布式爬虫系统 url去重 url去重协议
在线阅读 下载PDF
通用Web跨域认证构架研究与实现 被引量:10
3
作者 张红旗 杨智 +2 位作者 王霞 沈昌祥 张斌 《计算机应用研究》 CSCD 北大核心 2009年第5期1796-1798,1818,共4页
分析了目前主要的Web跨域认证技术特点和不足,设计了一种新的基于URL重定向的Web跨域认证构架,给出了典型协议实现并进行了安全性分析。它对信息系统改动极少,且不易受NAT网关和防火墙的限制,具有良好的应用前景。
关键词 跨域认证 认证构架 地址重定向 认证协议 形式化分析密码协议
在线阅读 下载PDF
基于Asterisk的呼叫中心弹屏模块设计与实现 被引量:2
4
作者 涂继辉 杨彬 《长江大学学报(自科版)(上旬)》 CAS 2014年第9期47-50,60,共5页
为了解决目前基于Asterisk呼叫中心的弹屏技术效率不高、集成不方便的问题,利用Asterisk的模块化的架构思想和URL协议原理,设计了一种新的客户资料弹屏方式,该方式是直接在Asterisk中嵌入弹屏的服务端模块,客户端分布在席的终端机上,通... 为了解决目前基于Asterisk呼叫中心的弹屏技术效率不高、集成不方便的问题,利用Asterisk的模块化的架构思想和URL协议原理,设计了一种新的客户资料弹屏方式,该方式是直接在Asterisk中嵌入弹屏的服务端模块,客户端分布在席的终端机上,通过URL方式启动。该弹屏模块不仅稳定性好、效率高,而且容易集成于Web平台中。经过测试,该模块相对目前通用弹屏技术性能稳定、可靠性高,为呼叫中心系统更好的为客户服务具有重要的意义。 展开更多
关键词 ASTERISK 呼叫中心 弹屏模块 模块化 url协议原理
在线阅读 下载PDF
基于大数据平台的网络日志机器行为分析 被引量:6
5
作者 陈涵 张仰森 +2 位作者 何梓源 祁浩家 黄改娟 《计算机工程与设计》 北大核心 2023年第7期2232-2241,共10页
为从海量日志中分析并提取可能存在的机器行为日志,应用概率统计和K-means算法对网络日志进行分析,提出基于多阶段层次化判别的ChenRF模型,共包含两部分内容,分别为基于特征规则和阈值匹配的机器行为判定模型与基于Bi-LSTMAttention的... 为从海量日志中分析并提取可能存在的机器行为日志,应用概率统计和K-means算法对网络日志进行分析,提出基于多阶段层次化判别的ChenRF模型,共包含两部分内容,分别为基于特征规则和阈值匹配的机器行为判定模型与基于Bi-LSTMAttention的机器行为识别模型。应用Spark批处理框架,对所提模型进行算法实现,构建以一小时为单位的分布式网络日志批处理分析平台。在1万和千万级别规模的数据上,对构建的大数据日志分析处理平台进行测试,验证了所提模型的有效性。 展开更多
关键词 网络日志 超文本传输协议 机器行为识别 数据分析与挖掘 深度学习 分布式存储技术 大数据计算技术
在线阅读 下载PDF
HTTP协议及其发展 被引量:1
6
作者 林炜 蔺永华 《电脑学习》 1999年第1期2-3,共2页
HTTP(超文本传输协议)是浏览器与Web服务器共同遵守的协议。本文详细介绍了HTTP协议的消息格式、工作原理及客户机服务器间的互连方式。
关键词 代理服务器 HTTP协议 WEB INTERNET网
在线阅读 下载PDF
企业CIMS与Internet/Intranet的集成接口
7
作者 郝宏宇 李雁春 郑寅 《自动化技术与应用》 2002年第5期29-31,39,共4页
本文从CIMS应用的角度出发 ,阐述了Internet/Intranet技术在制造业企业中的作用 ,结合CIMS应用集成平台的研究 ,介绍了集成平台Internet/Intranet接口技术的设计特点 ,给出了Internet/Intranet应用系统的客户服务器 (Client/Server)体... 本文从CIMS应用的角度出发 ,阐述了Internet/Intranet技术在制造业企业中的作用 ,结合CIMS应用集成平台的研究 ,介绍了集成平台Internet/Intranet接口技术的设计特点 ,给出了Internet/Intranet应用系统的客户服务器 (Client/Server)体系结构 ;描述了CIMS应用集成平台Internet/Intranet应用系统的设计与实现模型 ,该研究的最终目的是使企业的计算机应用系统与Inter 展开更多
关键词 企业 CIMS INTERNET INTRANET 集成接口
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部