期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
Topic PageRank——一种基于主题的搜索引擎 被引量:8
1
作者 姜鑫维 赵岳松 《计算机技术与发展》 2007年第5期238-241,共4页
通过研究传统的超链分析算法PageRank及其改进算法Hilltop和TSPR的不足,提出了一种新的改进的方法Topic PageRank。这种算法是对每一个页面进行页面分类,然后根据分类的结果分别对每一个主题进行页面等级计算,因此,每一个页面对不同的... 通过研究传统的超链分析算法PageRank及其改进算法Hilltop和TSPR的不足,提出了一种新的改进的方法Topic PageRank。这种算法是对每一个页面进行页面分类,然后根据分类的结果分别对每一个主题进行页面等级计算,因此,每一个页面对不同的主题将呈现出不同的页面等级得分,能更加准确地反映出页面的重要性。 展开更多
关键词 pagerank Hilltop TSPR topic pagerank页面分类
在线阅读 下载PDF
基于PageRank与Bagging的主题爬虫研究 被引量:11
2
作者 张翔 周明全 +1 位作者 李智杰 董丽丽 《计算机工程与设计》 CSCD 北大核心 2010年第14期3309-3312,共4页
为克服主题爬虫主题漂移现象,提高搜索引擎的查准率和查全率,提出了一个基于PageRank算法与Bagging算法的主题爬虫设计方法。将主题爬虫系统分为爬虫爬行模块和主题相关性分析模块。利用一种改进的PageRank算法改善了爬虫的搜索策略,进... 为克服主题爬虫主题漂移现象,提高搜索引擎的查准率和查全率,提出了一个基于PageRank算法与Bagging算法的主题爬虫设计方法。将主题爬虫系统分为爬虫爬行模块和主题相关性分析模块。利用一种改进的PageRank算法改善了爬虫的搜索策略,进行网页遍历与抓取。用向量空间模型表示网页主题,使用Bagging算法构造网页主题分类器进行主题相关性分析,过滤与主题无关网页。实验结果表明,该方法在网页抓取的性能上和主题网页的查准率上都取得较好的效果。 展开更多
关键词 主题爬虫 搜索策略 主题相关性 pagerank BAGGING
在线阅读 下载PDF
基于主题相似度模型的TS-PageRank算法 被引量:23
3
作者 黄德才 戚华春 钱能 《小型微型计算机系统》 CSCD 北大核心 2007年第3期510-514,共5页
PageRank算法是著名搜索引擎Google的核心算法,但存在主题漂移的问题,致使搜索结果中存在过多与查询主题无关的网页.在分析PageRank算法及其有关改进算法的基础上,提出了基于虚拟文档的主题相似度模型和基于主题相似度模型的TS-PageRan... PageRank算法是著名搜索引擎Google的核心算法,但存在主题漂移的问题,致使搜索结果中存在过多与查询主题无关的网页.在分析PageRank算法及其有关改进算法的基础上,提出了基于虚拟文档的主题相似度模型和基于主题相似度模型的TS-PageRank算法框架.只要选择不同的相似度计算模型,就可以得到不同的TS-PageRank算法,形成一个网页排序算法簇.理论分析和数值仿真实验表明,该算法在不需要额外文本信息,也不增加算法时空复杂度的情况下,就能极大地减少主题漂移现象,从而提高查询效率和质量. 展开更多
关键词 链接分析 主题相似度 pagerank算法
在线阅读 下载PDF
PageRank算法研究综述 被引量:48
4
作者 李稚楹 杨武 谢治军 《计算机科学》 CSCD 北大核心 2011年第B10期185-188,共4页
网页排序是搜索引擎的关键技术之一。介绍了著名的PageRank算法,针对其存在主题漂移、偏重旧网页等不足,分析了各种改进算法的基本思想和技术特点,希望为以后的研究工作提供基础性支持。
关键词 pagerank 主题漂移 偏重旧网页
在线阅读 下载PDF
基于概率的PageRank改进算法 被引量:4
5
作者 林泓 刘朋 +1 位作者 李晶晶 龙振海 《武汉理工大学学报》 CAS CSCD 北大核心 2009年第3期81-83,共3页
通过研究和分析传统的PageRank算法及其不足,在基于用户点击网页内的各个链接的概率是不均等的情况下,提出一种基于概率的PageRank改进算法,该算法可以用于领域搜索引擎的主题相关度预测,可以有效地避免主题漂移现象。
关键词 搜索引擎 pagerank 主题漂移 概率
原文传递
改进的PageRank在Web信息搜集中的应用 被引量:12
6
作者 秦拯 张玲 李娜 《计算机研究与发展》 EI CSCD 北大核心 2006年第6期1044-1049,共6页
PageRank是一种用于网页排序的算法,它利用网页间的相互引用关系评价网页的重要性·但由于它对每条出链赋予相同的权值,忽略了网页与主题的相关性,容易造成主题漂移现象·在分析了几种PageRank算法基础上,提出了一种新的基于主... PageRank是一种用于网页排序的算法,它利用网页间的相互引用关系评价网页的重要性·但由于它对每条出链赋予相同的权值,忽略了网页与主题的相关性,容易造成主题漂移现象·在分析了几种PageRank算法基础上,提出了一种新的基于主题分块的PageRank算法·该算法按照网页结构对网页进行分块,依照各块与主题的相关性大小对块中的链接传递不同的PageRank值,并能根据已访问的链接对块进行相关性反馈·实验表明,所提出的算法能较好地改进搜索结果的精确度· 展开更多
关键词 pagerank算法 主题分块 Web信息搜集
在线阅读 下载PDF
基于主题特征和时间因子的改进PageRank算法 被引量:21
7
作者 段淮川 胡平 《计算机工程与设计》 CSCD 北大核心 2010年第4期866-868,共3页
经典PageRank算法单纯地考虑到对网页的链接结构进行分析,而不能考虑到网页在搜索主题方面的相关性和权威性,以及用户对新旧网页的依赖程度的不同。针对经典PageRank算法存在的上述缺陷,综合网页的主题特征和时间特征两个因素,提出了一... 经典PageRank算法单纯地考虑到对网页的链接结构进行分析,而不能考虑到网页在搜索主题方面的相关性和权威性,以及用户对新旧网页的依赖程度的不同。针对经典PageRank算法存在的上述缺陷,综合网页的主题特征和时间特征两个因素,提出了一种改进的PageRank算法WTPR(weighted topic PageRank)。该算法通过网页链接分析和内容分析来解决网页的权威程度和相关程度,通过时间因子实现PageRank值随时间的变动而浮动。仿真结果表明,改进后的算法与PageRank算法相比获得了更好的效果。 展开更多
关键词 主题特征 时间因子 pagerank 相关性分析 链接
在线阅读 下载PDF
基于主题相关性和链接权重的PageRank算法 被引量:4
8
作者 杨格兰 涂立 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第S1期300-303,共4页
在基于链接分析的排序算法PageRank分析基础上,提出了一种基于主题相关性和链接权重的Page-Rank改进算法.该方法首先随机选取任一链出页面,通过主题相关性评价算法获得改进的PageRank值,并重新排序.实验结果显示该算法提高了查询速度、... 在基于链接分析的排序算法PageRank分析基础上,提出了一种基于主题相关性和链接权重的Page-Rank改进算法.该方法首先随机选取任一链出页面,通过主题相关性评价算法获得改进的PageRank值,并重新排序.实验结果显示该算法提高了查询速度、查询准确率,并且算法具有良好的稳定性和可扩展性. 展开更多
关键词 万维网 WEB信息搜索 主题权重 pagerank算法 链接权重 排序
原文传递
用户差别化和主题敏感的PageRank算法 被引量:2
9
作者 马海波 杨楠 于新兴 《大连交通大学学报》 CAS 2013年第4期116-120,共5页
为了通过相同的查询词,可以返回满足不同用户需求的搜索结果,使搜索结果的排序因人而不同,将用户进行差别化对待,依据不同用户的不同兴趣爱好、个性的特点、不同的需求等,借助改进后的主题敏感的PageRank算法,调整网页排序的结果.用户... 为了通过相同的查询词,可以返回满足不同用户需求的搜索结果,使搜索结果的排序因人而不同,将用户进行差别化对待,依据不同用户的不同兴趣爱好、个性的特点、不同的需求等,借助改进后的主题敏感的PageRank算法,调整网页排序的结果.用户差别化和主题敏感的PageRank算法在一定程度上解决了PageRank算法存在的主题漂移问题,并且针对主题敏感的PageRank算法进行改进,使其具有主题扩展性、减少算法的在线计算时间,在查询过程中提供更快的响应速度.最终用户差别化和主题敏感的PageRank算法可以提高用户对网页排序算法和搜索引擎响应速度的满意程度,并且提高网页排序的准确程度. 展开更多
关键词 pagerank 主题敏感 网页排序 用户需求
在线阅读 下载PDF
基于锚文本相似度的PageRank改进算法 被引量:14
10
作者 王钟斐 王彪 《计算机工程》 CAS CSCD 北大核心 2010年第24期258-260,共3页
分析搜索引擎Google的PageRank算法,给出其存在的3个问题及针对这3个问题提出的改进。结合锚文本相似度提出一种改进的PageRank算法,利用Nutch对传统PageRank算法和改进后的PageRank算法进行实验分析与比较。实验结果表明,改进的PageRan... 分析搜索引擎Google的PageRank算法,给出其存在的3个问题及针对这3个问题提出的改进。结合锚文本相似度提出一种改进的PageRank算法,利用Nutch对传统PageRank算法和改进后的PageRank算法进行实验分析与比较。实验结果表明,改进的PageRank算法提高了搜索结果的查准率,有利于减少主题漂移现象。 展开更多
关键词 pagerank算法 锚文本 相似度 主题漂移
在线阅读 下载PDF
PageRank算法中主题漂移的研究 被引量:13
11
作者 高琪 张永平 《微计算机信息》 2010年第9期117-119,89,共4页
pagerank算法仅根据网页的pagerank值对搜索结果进行排序,一个网页的pagerank值越高,其位置越靠前,这使得pagerank算法无法区分搜索结果中与主题相关的权威网页和与主题无关的权威网页。也正因此在使用pagerank算法时往往会发生主题漂... pagerank算法仅根据网页的pagerank值对搜索结果进行排序,一个网页的pagerank值越高,其位置越靠前,这使得pagerank算法无法区分搜索结果中与主题相关的权威网页和与主题无关的权威网页。也正因此在使用pagerank算法时往往会发生主题漂移现象。产生这一问题的原因有两个,一是pagerank对网页权值平均分配,二是pagerank与查询主题的无关性。本文从这二方面入手,采用tf-idf算法计算主题的相关权重,提出了与查询主题相关的query-basedpagerank算法,有效地解决了原算法中的主题漂移问题。 展开更多
关键词 pagerank 主题漂移 主题敏感 页面排序 搜索引擎
在线阅读 下载PDF
基于用户兴趣与主题相关的PageRank算法改进研究 被引量:14
12
作者 王冲 纪仙慧 《计算机科学》 CSCD 北大核心 2016年第3期275-278,312,共5页
针对传统的PageRank算法存在主题漂移、忽略用户兴趣等不足,提出一种基于用户兴趣与主题相关的PageRank改进算法——ITPR。为了更好地提高用户搜索质量,利用网页浏览时间与页面篇幅共同构建用户兴趣度因子,用线性拟合月点击量的方法预... 针对传统的PageRank算法存在主题漂移、忽略用户兴趣等不足,提出一种基于用户兴趣与主题相关的PageRank改进算法——ITPR。为了更好地提高用户搜索质量,利用网页浏览时间与页面篇幅共同构建用户兴趣度因子,用线性拟合月点击量的方法预测用户兴趣度的升降,同时结合网页内容引入主题相关度因子,共同对网页PR值进行适当的修正,使其分配更为合理。仿真实验结果表明,在相同的实验环境下,改进的PageRank算法提升了网页排序质量、查准率以及用户搜索满意度。 展开更多
关键词 pagerank 用户兴趣 线性拟合 兴趣度预测 主题相关度
在线阅读 下载PDF
基于主题分割与PageRank算法的文本主题抽取 被引量:2
13
作者 段晓丽 王宇 《现代图书情报技术》 CSSCI 北大核心 2010年第12期34-39,共6页
针对主题句抽取时完整性差的问题,在对文本进行主题分割的基础上,为每个主题包构建句子关系图,并采用基于图的PageRank算法对关系图中的句子排序,选取权重大的句子作为每个主题包的主题句。实验表明,该算法抽取的主题句对全文有很好的... 针对主题句抽取时完整性差的问题,在对文本进行主题分割的基础上,为每个主题包构建句子关系图,并采用基于图的PageRank算法对关系图中的句子排序,选取权重大的句子作为每个主题包的主题句。实验表明,该算法抽取的主题句对全文有很好的覆盖率。 展开更多
关键词 主题句抽取 主题分割 句子关系图 pagerank算法
原文传递
基于页面分块模型的PageRank算法研究 被引量:4
14
作者 白似雪 刘华斌 《南昌大学学报(工科版)》 CAS 2008年第2期179-183,共5页
提出了一个基于页面分块重要性模型的PageRank改进算法。该算法考虑同一页面内属于不同分块的出链接有着不同的重要性,故对不同分块的出链接赋予相应的权重,从而更合理、更公正、更有效地计算页面的PageRank值。与以往的PageRank算法及... 提出了一个基于页面分块重要性模型的PageRank改进算法。该算法考虑同一页面内属于不同分块的出链接有着不同的重要性,故对不同分块的出链接赋予相应的权重,从而更合理、更公正、更有效地计算页面的PageRank值。与以往的PageRank算法及其改进算法相比,该算法以基于视觉特征的页面分块算法为核心,更好地反映了网页的特性,符合了用户的使用习惯,具有良好的效果。 展开更多
关键词 pagerank 页面分块重要性模型 链接分析 主题漂移 支持向量机
在线阅读 下载PDF
PageRank算法研究 被引量:1
15
作者 张敏 李锋 《微计算机信息》 2011年第8期143-144,136,共3页
简要分析了PageRank算法的思想及其不足,对国内外研究工作者的改进算法进行了分类,比较了它们的优缺点。对未来的研究方向进行了展望,给出了若干值得研究的问题。
关键词 信息检索 pagerank算法 时效性 主题漂移 潜在语义模型(LSM)
在线阅读 下载PDF
融合反馈信息与内容相关度的PageRank改进算法 被引量:9
16
作者 郭庆宝 贾代平 《计算机工程与设计》 CSCD 北大核心 2011年第12期4071-4074,共4页
为了提高网页排序算法的效率,提高搜索引擎的检索质量,提出了融合反馈信息与内容相关度的PageRank改进算法。利用向量空间模型计算网页之间的主题相关性,得到网页的主题相关度权值。通过对网页被点击次数进行统计分析,得到网页点击量的... 为了提高网页排序算法的效率,提高搜索引擎的检索质量,提出了融合反馈信息与内容相关度的PageRank改进算法。利用向量空间模型计算网页之间的主题相关性,得到网页的主题相关度权值。通过对网页被点击次数进行统计分析,得到网页点击量的增量权值。将这两个权值结合共同影响网页的PR(PageRank)值分配。通过仿真实验得到运用该算法后的实验结果,与其它算法的实验结果进行了比较,验证了该算法优于其它算法。 展开更多
关键词 网页级别 主题相关性 用户主观行为 点击量 爬取
在线阅读 下载PDF
一种融合PageRank的协同过滤帖子推荐方法 被引量:1
17
作者 曹阳 刘松 +3 位作者 郭剑毅 余正涛 周枫 毛存礼 《中国科学技术大学学报》 CAS CSCD 北大核心 2014年第7期576-581,共6页
针对贴吧用户面临严重的信息过载问题,提出一种基于用户信息的协同过滤帖子推荐方法.分析帖子推荐的属性特点后,首先利用一个融合了用户评论行为的PageRank算法去判断参与一个帖子讨论中各用户的重要性,主要考虑各用户之间的回复关系以... 针对贴吧用户面临严重的信息过载问题,提出一种基于用户信息的协同过滤帖子推荐方法.分析帖子推荐的属性特点后,首先利用一个融合了用户评论行为的PageRank算法去判断参与一个帖子讨论中各用户的重要性,主要考虑各用户之间的回复关系以及各用户之间回复的时间关系;然后把PageRank得分高的用户作为聚类中心进行k-means聚类;最后把帖子中聚类得到的用户与推荐系统使用者通过协同过滤算法计算相似度,并结合用户的PageRank得分,选择与用户相关度较高的帖子作为推荐结果.实验结果表明,该模型比现在使用的热门帖子推荐有着更好的表现. 展开更多
关键词 帖子推荐 pagerank 协同过滤 百度贴吧
在线阅读 下载PDF
基于主题聚焦模型的PageRank改进算法 被引量:2
18
作者 温泉 丁祥武 《计算机应用与软件》 CSCD 2011年第3期173-175,共3页
通过研究传统的超链接分析算法PageRank及其改进算法TSPR(topic-sensitive PageRank)和MP-PageRank的不足,提出了一种新的改进方法,基于主题聚焦模型的PageRank算法。这种算法研究用户查询行为,建立主题聚焦模型,较好地解决了PageRank... 通过研究传统的超链接分析算法PageRank及其改进算法TSPR(topic-sensitive PageRank)和MP-PageRank的不足,提出了一种新的改进方法,基于主题聚焦模型的PageRank算法。这种算法研究用户查询行为,建立主题聚焦模型,较好地解决了PageRank主题漂移问题以及其他改进算法依赖查询上下文的缺点。更加准确地反映出页面的重要性,提供更高质量的查询结果集。 展开更多
关键词 pagerank TSPR MP-pagerank 主题聚焦 主题漂移
在线阅读 下载PDF
语义相似的PageRank改进算法 被引量:2
19
作者 何明 周军 李树友 《计算机工程与应用》 CSCD 北大核心 2009年第27期140-142,共3页
PageRank算法是一种用于网页排序的算法,它利用网页间的相互引用关系评价网页的重要性。但由于它只考虑网页与网页之间的链接结构,忽略了网页与主题的相关性,容易造成主题漂移现象。在分析了原PageRank算法基础上,给出了一种基于语义相... PageRank算法是一种用于网页排序的算法,它利用网页间的相互引用关系评价网页的重要性。但由于它只考虑网页与网页之间的链接结构,忽略了网页与主题的相关性,容易造成主题漂移现象。在分析了原PageRank算法基础上,给出了一种基于语义相似度的PageRank改进算法。该算法能够按照网页结构和网页主要内容计算出网页的PageRank值,既不会增加算法的时空复杂度,又极大地减少了"主题漂移"现象,从而提高查询效率和质量。 展开更多
关键词 pagerank算法 主题漂移 语义相似度
在线阅读 下载PDF
基于PageRank和Node2vec的研究热点与集群发现——以国际深度学习研究领域为例 被引量:11
20
作者 霍朝光 魏瑞斌 张斌 《情报杂志》 CSSCI 北大核心 2020年第8期174-179,153,共7页
[目的/意义]为有效挖掘领域研究热点与集群,规避单纯基于频次统计的热点排序方法所存在的弊端,以及基于高频关键词共词网络集群发现方法所带来的偏差。[方法/过程]提出利用无向加权PagaRank算法进行研究热点排序,综合考量关键词之间共... [目的/意义]为有效挖掘领域研究热点与集群,规避单纯基于频次统计的热点排序方法所存在的弊端,以及基于高频关键词共词网络集群发现方法所带来的偏差。[方法/过程]提出利用无向加权PagaRank算法进行研究热点排序,综合考量关键词之间共现的数量和质量,同时强调全部关键词共词网络的重要性,综合Node2vec表示学习和t-SNE聚类算法对全部关键词进行集群发现,以国际深度学习领域研究文献为例,分别进行热点排序和集群发现。[结果/结论]研究表明PageRank算法不仅能够区分频次统计算法无法区分的排名,而且从整体网络结构衡量研究热点,综合考量共现的数量和质量,使排序结果更为准确;整合Node2vec和t-SNE算法进行研究集群发现,可有效改善单纯利用高频关键词进行集群发现的不足,避免在有限的关联密切的高频关键词之间强制分门别类;综合热点和集群发现方法,可在凸显热点的基础上描述集群细节,有效揭示集群脉络。 展开更多
关键词 深度学习 热点排序 集群发现 Node2vec pagerank
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部