期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合LDA与TextRank的关键词抽取研究
被引量:
70
1
作者
顾益军
夏天
《现代图书情报技术》
CSSCI
北大核心
2014年第7期41-47,共7页
【目的】通过将单一文档内部的结构信息和文档整体的主题信息融合到一起进行关键词抽取。【方法】利用LDA对文档集进行主题建模和候选关键词的主题影响力计算,进而对TextRank算法进行改进,将候选关键词的重要性按照主题影响力和邻接关...
【目的】通过将单一文档内部的结构信息和文档整体的主题信息融合到一起进行关键词抽取。【方法】利用LDA对文档集进行主题建模和候选关键词的主题影响力计算,进而对TextRank算法进行改进,将候选关键词的重要性按照主题影响力和邻接关系进行非均匀传递,并构建新的概率转移矩阵用于词图迭代计算和关键词抽取。【结果】实现LDA与TextRank的有效融合,当数据集呈现较强的主题分布时,可以显著改善关键词抽取效果。【局限】融合方法需要进行代价较高的多文档主题分析。【结论】关键词既与文档本身相关,也与文档所在的文档集合相关,二者结合是改进关键词抽取结果的有效途径。
展开更多
关键词
关键词抽取
lda
textrank
图模型
原文传递
基于Word2Vec和TextRank的时政类新闻关键词抽取方法研究
被引量:
14
2
作者
刘奇飞
沈炜域
《情报探索》
2018年第6期22-27,共6页
[目的/意义]旨在为时政类新闻关键词抽取提供参考。[方法/过程]基于融合Word2Vec和TextRank算法,在研究时政类新闻文本特征基础上,利用政治重点词库修订文本词语的初始权重,结合上下文关系确定词语之间的连接关系,并基于Word2Vec模型构...
[目的/意义]旨在为时政类新闻关键词抽取提供参考。[方法/过程]基于融合Word2Vec和TextRank算法,在研究时政类新闻文本特征基础上,利用政治重点词库修订文本词语的初始权重,结合上下文关系确定词语之间的连接关系,并基于Word2Vec模型构建概率转移矩阵,提出改进的Word2Vec和TextRank算法。[结果/结论 ]运用改进的Word2Vec和TextRank算法对时政类新闻关键词进行抽取,其准确率、召回率和F值均优于传统TextRank算法及普通的融合Word2Vec和TextRank算法,抽取效果更好。
展开更多
关键词
时政新闻
关键词抽取
textrank
算法
word
2Vec模型
词图
在线阅读
下载PDF
职称材料
词语位置加权TextRank的关键词抽取研究
被引量:
77
3
作者
夏天
《现代图书情报技术》
CSSCI
北大核心
2013年第9期30-34,共5页
把关键词抽取问题看作是构成文档词语的重要性排序问题,基于TextRank基本思想,构建候选关键词图,引入覆盖影响力、位置影响力和频度影响力用于计算词语之间的影响力概率转移矩阵,通过迭代法实现候选关键词分值计算,并挑选前N个作为关键...
把关键词抽取问题看作是构成文档词语的重要性排序问题,基于TextRank基本思想,构建候选关键词图,引入覆盖影响力、位置影响力和频度影响力用于计算词语之间的影响力概率转移矩阵,通过迭代法实现候选关键词分值计算,并挑选前N个作为关键词抽取结果。实验结果表明,对词语位置加权的TextRank方法优于传统的TextRank方法和基于LDA主题模型的关键词抽取方法。
展开更多
关键词
关键词抽取
词排序
textrank
图模型
lda
原文传递
基于复杂网络词节点移除的关键词抽取方法
被引量:
1
4
作者
王安
顾益军
+1 位作者
李坤明
李文政
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2019年第11期35-42,共8页
【目的】将词节点移除融入TextRank算法,提升中文文本关键词抽取效果。【方法】提出中文关键词抽取改进算法RemoveRank。通过引入词节点移除的方式,交替进行排序步骤与移除步骤,综合考虑词图的复杂网络结构特性,将移除队列作为词节点排...
【目的】将词节点移除融入TextRank算法,提升中文文本关键词抽取效果。【方法】提出中文关键词抽取改进算法RemoveRank。通过引入词节点移除的方式,交替进行排序步骤与移除步骤,综合考虑词图的复杂网络结构特性,将移除队列作为词节点排序结果,实现关键词的抽取。【结果】利用南方周末网络带关键词标注数据集进行实验评估,实验结果表明,引入词节点移除的方式优于传统算法,在关键词抽取数量分别取3,5,7时,其F值相比TextRank方法分别提高4%,6%,5%。【局限】构建词图时只考虑词节点是否连通,尚未考虑词节点连边的权重。【结论】在合适的滑动窗口取值下,RemoveRank算法可以有效地完成关键词抽取工作。
展开更多
关键词
关键词抽取
textrank
图模型
词语节点
子图划分
原文传递
题名
融合LDA与TextRank的关键词抽取研究
被引量:
70
1
作者
顾益军
夏天
机构
中国人民公安大学网络安全保卫学院
中国人民大学数据工程与知识工程教育部重点实验室
中国人民大学信息资源管理学院
出处
《现代图书情报技术》
CSSCI
北大核心
2014年第7期41-47,共7页
基金
国家社会科学基金项目"Web2.0环境下的网络舆情采集与分析"(项目编号:09CTQ027)
北京高等学校青年英才计划项目"基于链接和主题分析的微博社区挖掘研究"(项目编号:YETP0215)的研究成果之一
文摘
【目的】通过将单一文档内部的结构信息和文档整体的主题信息融合到一起进行关键词抽取。【方法】利用LDA对文档集进行主题建模和候选关键词的主题影响力计算,进而对TextRank算法进行改进,将候选关键词的重要性按照主题影响力和邻接关系进行非均匀传递,并构建新的概率转移矩阵用于词图迭代计算和关键词抽取。【结果】实现LDA与TextRank的有效融合,当数据集呈现较强的主题分布时,可以显著改善关键词抽取效果。【局限】融合方法需要进行代价较高的多文档主题分析。【结论】关键词既与文档本身相关,也与文档所在的文档集合相关,二者结合是改进关键词抽取结果的有效途径。
关键词
关键词抽取
lda
textrank
图模型
Keywords
keyword
extraction
lda
textrank
graph
model
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于Word2Vec和TextRank的时政类新闻关键词抽取方法研究
被引量:
14
2
作者
刘奇飞
沈炜域
机构
中国人民公安大学信息技术与网络安全学院
出处
《情报探索》
2018年第6期22-27,共6页
文摘
[目的/意义]旨在为时政类新闻关键词抽取提供参考。[方法/过程]基于融合Word2Vec和TextRank算法,在研究时政类新闻文本特征基础上,利用政治重点词库修订文本词语的初始权重,结合上下文关系确定词语之间的连接关系,并基于Word2Vec模型构建概率转移矩阵,提出改进的Word2Vec和TextRank算法。[结果/结论 ]运用改进的Word2Vec和TextRank算法对时政类新闻关键词进行抽取,其准确率、召回率和F值均优于传统TextRank算法及普通的融合Word2Vec和TextRank算法,抽取效果更好。
关键词
时政新闻
关键词抽取
textrank
算法
word
2Vec模型
词图
Keywords
political news
keyword
extraction
textrank
algorithm
word
2Vec
model
word
graph
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
词语位置加权TextRank的关键词抽取研究
被引量:
77
3
作者
夏天
机构
中国人民大学数据工程与知识工程教育部重点实验室
中国人民大学信息资源管理学院
出处
《现代图书情报技术》
CSSCI
北大核心
2013年第9期30-34,共5页
基金
国家社会科学基金项目"Web2.0环境下的网络舆情采集与分析"(项目编号:09CTQ027)
国家社会科学基金重大项目"云计算环境下的信息资源集成与服务研究"(项目编号:12&ZD220)的研究成果之一
文摘
把关键词抽取问题看作是构成文档词语的重要性排序问题,基于TextRank基本思想,构建候选关键词图,引入覆盖影响力、位置影响力和频度影响力用于计算词语之间的影响力概率转移矩阵,通过迭代法实现候选关键词分值计算,并挑选前N个作为关键词抽取结果。实验结果表明,对词语位置加权的TextRank方法优于传统的TextRank方法和基于LDA主题模型的关键词抽取方法。
关键词
关键词抽取
词排序
textrank
图模型
lda
Keywords
keyword extraction word rank textrank graph model lda
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于复杂网络词节点移除的关键词抽取方法
被引量:
1
4
作者
王安
顾益军
李坤明
李文政
机构
中国人民公安大学信息技术与网络安全学院
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2019年第11期35-42,共8页
基金
国家重点研发计划项目(项目编号:2017YFC0820100)的研究成果之一
文摘
【目的】将词节点移除融入TextRank算法,提升中文文本关键词抽取效果。【方法】提出中文关键词抽取改进算法RemoveRank。通过引入词节点移除的方式,交替进行排序步骤与移除步骤,综合考虑词图的复杂网络结构特性,将移除队列作为词节点排序结果,实现关键词的抽取。【结果】利用南方周末网络带关键词标注数据集进行实验评估,实验结果表明,引入词节点移除的方式优于传统算法,在关键词抽取数量分别取3,5,7时,其F值相比TextRank方法分别提高4%,6%,5%。【局限】构建词图时只考虑词节点是否连通,尚未考虑词节点连边的权重。【结论】在合适的滑动窗口取值下,RemoveRank算法可以有效地完成关键词抽取工作。
关键词
关键词抽取
textrank
图模型
词语节点
子图划分
Keywords
keyword
extraction
textrank
graph
model
word
Node
Sub-
graph
Partitioning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
融合LDA与TextRank的关键词抽取研究
顾益军
夏天
《现代图书情报技术》
CSSCI
北大核心
2014
70
原文传递
2
基于Word2Vec和TextRank的时政类新闻关键词抽取方法研究
刘奇飞
沈炜域
《情报探索》
2018
14
在线阅读
下载PDF
职称材料
3
词语位置加权TextRank的关键词抽取研究
夏天
《现代图书情报技术》
CSSCI
北大核心
2013
77
原文传递
4
基于复杂网络词节点移除的关键词抽取方法
王安
顾益军
李坤明
李文政
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2019
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部