期刊文献+
共找到218篇文章
< 1 2 11 >
每页显示 20 50 100
基于TextRank和自注意力的长文档无监督抽取式摘要
1
作者 邢玲 程兵 闫强 《计算机应用与软件》 北大核心 2025年第3期274-283,共10页
针对中文长文档自动文本摘要问题,提出将TextRank与自注意力相融合的两种模型:TRAI和TRAO。TRAI将基于统计共现字数得到的句子相似性同基于自注意力得到的句子相关性进行加权求和,作为TextRank边的权重参与迭代计算,对句子进行打分。TRA... 针对中文长文档自动文本摘要问题,提出将TextRank与自注意力相融合的两种模型:TRAI和TRAO。TRAI将基于统计共现字数得到的句子相似性同基于自注意力得到的句子相关性进行加权求和,作为TextRank边的权重参与迭代计算,对句子进行打分。TRAO利用TextRank对句子打分;利用自注意力重新表示每个句子融合整个文档信息的分布式向量,在此基础上计算句子间余弦相似度,作为TextRank边的权重参与迭代计算,给句子打分;将两种得分加权求和作为句子最终得分。两种模型均根据得分对句子进行排序得到候选摘要。为去除摘要冗余性,利用最大边界相关法(Maximal Marginal Relevance,MMR)在候选摘要中选取摘要句子。将提出的两种模型在构建的长文档上进行实验,与TextRank方法相比,所提方法在ROUGE评价指标上有显著提高。 展开更多
关键词 中文长文本摘要 textrank 自注意力机制 分布式向量表示 语义信息 融合文档信息
在线阅读 下载PDF
基于语义特征和TextRank算法的科研成果论文中文文本关键词提取方法
2
作者 张世超 王建宾 孟浩 《华南地震》 2025年第3期188-194,共7页
为准确提取科研成果论文中文文本关键词,并准确排列,研究基于语义特征和TextRank算法的科研成果论文中文文本关键词提取方法。基于语义特征的科研成果论文中文文本候选关键词筛选方法,在Word2Vec工具中,将中文文本转换为词向量,作为论... 为准确提取科研成果论文中文文本关键词,并准确排列,研究基于语义特征和TextRank算法的科研成果论文中文文本关键词提取方法。基于语义特征的科研成果论文中文文本候选关键词筛选方法,在Word2Vec工具中,将中文文本转换为词向量,作为论文中文文本语义特征;将语义特征输入卷积神经网络中,以分类的方式,提取属于候选关键词类型的语义特征,将其所属文本词语作为候选关键词;通过基于TextRank算法的科研成果论文中文文本关键词提取方法,在候选关键词中,以候选关键词的平均信息熵、词性、位置三种特征,为关键词提取指标,构建提取关键词的图模型,运算候选关键词综合权重,以从大到小的方式排列候选关键词,将排名靠前的候选关键词,作为最终提取的关键词,完成科研成果论文中文文本关键词提取。经测试,此方法可提高科研成果论文中文文本关键词提取精度、提高关键词排名准确性。 展开更多
关键词 语义特征 textrank算法 科研成果论文 中文文本 关键词提取 卷积神经网络
在线阅读 下载PDF
TextRank-BERT-LDA短文本主题挖掘模型
3
作者 胡琴 《电脑知识与技术》 2025年第16期18-22,共5页
传统LDA(Latent Dirichlet Allocation,潜在狄利克雷分配)主题模型在处理商品评论短文本时,由于特征稀疏和主题混杂问题,表现不佳。文章提出了一种新型短文本主题模型TextRank-BERT-LDA。该模型利用TextRank算法提取商品属性相关关键词... 传统LDA(Latent Dirichlet Allocation,潜在狄利克雷分配)主题模型在处理商品评论短文本时,由于特征稀疏和主题混杂问题,表现不佳。文章提出了一种新型短文本主题模型TextRank-BERT-LDA。该模型利用TextRank算法提取商品属性相关关键词并分割评论,有效解决了主题混杂问题;通过BERT(Bidirectional Encoder Representations from Transformers,基于双向Transformer的预训练语言模型)计算句子间的相似性并进行聚类,扩充短文本的特征表示。实验结果表明,TextRank-BERT-LDA模型在处理商品评论文本时,困惑度更低,性能优于传统LDA模型。 展开更多
关键词 BERT LDA textrank 聚类 主题模型 短文本
在线阅读 下载PDF
基于改进TextRank的科技文本关键词抽取方法 被引量:6
4
作者 杨冬菊 胡成富 《计算机应用》 CSCD 北大核心 2024年第6期1720-1726,共7页
针对科技文本关键词抽取任务中抽取出现次数少但能较好表达文本主旨的词语效果差的问题,提出一种基于改进TextRank的关键词抽取方法。首先,利用词语的词频-逆文档频率(TF-IDF)统计特征和位置特征优化共现图中词语间的概率转移矩阵,通过... 针对科技文本关键词抽取任务中抽取出现次数少但能较好表达文本主旨的词语效果差的问题,提出一种基于改进TextRank的关键词抽取方法。首先,利用词语的词频-逆文档频率(TF-IDF)统计特征和位置特征优化共现图中词语间的概率转移矩阵,通过迭代计算得到词语的初始得分;然后,利用K-Core(K-Core decomposition)算法挖掘KCore子图得到词语的层级特征,利用平均信息熵特征衡量词语的主题表征能力;最后,在词语初始得分的基础上融合层级特征和平均信息熵特征,从而确定关键词。实验结果表明,在公开数据集上,与TextRank方法和OTextRank(Optimized TextRank)方法相比,所提方法在抽取不同关键词数量的实验中,F1均值分别提高了6.5和3.3个百分点;在科技服务项目数据集上,与TextRank方法和OTextRank方法相比,所提方法在抽取不同关键词数量的实验中,F1均值分别提高了7.4和3.2个百分点。实验结果验证了所提方法抽取出现频率低但较好表达文本主旨关键词的有效性。 展开更多
关键词 科技文本 关键词抽取 textrank K-Core图 平均信息熵
在线阅读 下载PDF
基于Transformer-TextRank-PGN的文本摘要模型
5
作者 吴广硕 樊重俊 陶国庆 《计算机与数字工程》 2024年第12期3681-3685,3749,共6页
任务中存在编码器端对文本语义信息理解不足,解码器端生成单词不可控的问题,提出了一种Transformer-Text Rank-PGN文本摘要模型,该模型同时保留了生成式摘要和抽取式摘要的优点。在模型编码器端引入Text Rank算法增强编码器学习文本语... 任务中存在编码器端对文本语义信息理解不足,解码器端生成单词不可控的问题,提出了一种Transformer-Text Rank-PGN文本摘要模型,该模型同时保留了生成式摘要和抽取式摘要的优点。在模型编码器端引入Text Rank算法增强编码器学习文本语义信息的能力,解码器端引入指针网络指向原文中抽取单词,使用抽取单词概率分布和解码器生成单词的概率分布共同影响最终生成词,使模型可以复现出原文细节和生成OOV词汇。经过在NLPCC文本摘要数据集上的实验结果表明,该模型所生成摘要的准确性和可读性更接近于数据集中所给出的标准摘要。 展开更多
关键词 生成式摘要 抽取式摘要 TRANSFORMER textrank 指针网络
在线阅读 下载PDF
基于改进TextRank的抽取式自动文本摘要生成方法
6
作者 梁高鹏 徐鲁强 《计算机与数字工程》 2024年第12期3643-3648,共6页
模型TextRank在抽取式自动文摘方法中的表现相对较好,但其在初始文本质量和节点权重得分计算等环节,仍有较大的调整提升空间。针对此情况,提出了一种新的调整方法。结合自动文摘的实际应用环境与文本在文学方面的表达特点,通过在文本预... 模型TextRank在抽取式自动文摘方法中的表现相对较好,但其在初始文本质量和节点权重得分计算等环节,仍有较大的调整提升空间。针对此情况,提出了一种新的调整方法。结合自动文摘的实际应用环境与文本在文学方面的表达特点,通过在文本预处理阶段增加预排序流程来突出表现文本的主旨观点,减少语义重复内容,提升输入文本的质量。通过对相似度计算公式的调整,在最后的节点得分公式中将词频、与标题相似度、段间位置等因素按照特定的比例加入到权重系数中参与得分计算来优化整个计算流程。最终的实验结果表明,调整后的模型在各方面的得分情况要优于原模型,生成的摘要质量更高,更接近于人工生成的摘要。 展开更多
关键词 抽取式 自动文本摘要 textrank 预排序 权重得分
在线阅读 下载PDF
基于改进TextRank的关键词抽取算法 被引量:14
7
作者 张莉婧 李业丽 +2 位作者 曾庆涛 雷嘉丽 杨鹏 《北京印刷学院学报》 2016年第4期51-55,共5页
为了解决TextRank算法的初始权值问题,提高关键词的抽取质量,在TextRank算法的基础上,引入了G1赋权法对TF-IDF算法的词语位置、词语长度和词性等3个属性赋予不同的权重,设计并实现了综合权重法的关键词抽取算法——TextRank-CM算法。将T... 为了解决TextRank算法的初始权值问题,提高关键词的抽取质量,在TextRank算法的基础上,引入了G1赋权法对TF-IDF算法的词语位置、词语长度和词性等3个属性赋予不同的权重,设计并实现了综合权重法的关键词抽取算法——TextRank-CM算法。将TextRank-CM算法、TextRank+TF-IDF算法和TextRank算法分别应用于中文关键词的抽取,结果表明:TextRank-CM算法在中文关键词抽取中的准确率和召回率明显优于另两种算法。 展开更多
关键词 textrank-CM算法 textrank算法 G1赋权法 关键词抽取
在线阅读 下载PDF
TextRank在多模态教学资源关键词提取中应用
8
作者 李章民 杨明月 《福建电脑》 2024年第11期25-30,共6页
为提高多模态教学资源的利用率,本文提出一种利用TextRank算法提取多模态教学资源关键词的方法。首先从非文本模态中提取合适的特征,将其转化为可以计算的文本单元,然后采用TextRank算法将多模态教学资源进行归类,并利用三方工具把多模... 为提高多模态教学资源的利用率,本文提出一种利用TextRank算法提取多模态教学资源关键词的方法。首先从非文本模态中提取合适的特征,将其转化为可以计算的文本单元,然后采用TextRank算法将多模态教学资源进行归类,并利用三方工具把多模态资源转化为文本资源。实验结果表明,TextRank算法能有效地从多模态教学资源中提取关键词,具有较高的有效性和准确性。 展开更多
关键词 多模态教学资源 textrank算法 关键词提取
在线阅读 下载PDF
Tag-TextRank:一种基于Tag的网页关键词抽取方法 被引量:58
9
作者 李鹏 王斌 +2 位作者 石志伟 崔雅超 李恒训 《计算机研究与发展》 EI CSCD 北大核心 2012年第11期2344-2351,共8页
关键词抽取是从文本中抽取代表性关键词的过程,在文本处理领域中具有重要的应用价值.利用一种近年来受到广泛关注的新的信息源——社会化标签(tag)——来提高网页关键词抽取的质量.通过对Tag数据进行统计分析,发现用户往往对多个在话题... 关键词抽取是从文本中抽取代表性关键词的过程,在文本处理领域中具有重要的应用价值.利用一种近年来受到广泛关注的新的信息源——社会化标签(tag)——来提高网页关键词抽取的质量.通过对Tag数据进行统计分析,发现用户往往对多个在话题上相关的网页使用同样的标签词,一个特定的文档可以通过其标注信息找到相关文档.在此基础上,提出了利用Tag进行关键词抽取的框架,并给出了一种具体的实现方法Tag-TextRank.该方法在TextRank基础上,通过目标文档中的每个Tag引入相关文档来估计词项图的边权重并计算得到词项的重要度,最后将不同Tag下的词项权重计算结果进行融合.在公开语料上的实验表明,Tag-TextRank在各项评价指标上均优于经典的关键词抽取方法TextRank,并具有很好的推广性. 展开更多
关键词 社会化标注 标签 关键词抽取 网页关键词抽取 textrank
在线阅读 下载PDF
融合多特征的TextRank关键词抽取方法 被引量:33
10
作者 李航 唐超兰 +1 位作者 杨贤 沈婉婷 《情报杂志》 CSSCI 北大核心 2017年第8期183-187,共5页
[目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档... [目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档集整体的重要性的关键词抽取方法。[方法/过程]首先,根据词语的平均信息熵特征计算词语对文档集整体的重要性,利用词语的词性、位置特征计算词语对单文档中的重要性。然后,通过神经网络训练的方式优化三个特征的权重分配实现特征的融合。最后,利用三个特征计算得到词语的综合权值来改进TextRank模型词汇节点的初始权重以及概率转移矩阵,再通过迭代法实现关键词的抽取。[结果 /结论]该研究方法结合了文档集整体信息和单文档自身信息,其关键词提取的准确率较传统TextRank方法、TFIDF-TextRank方法有了明显的提高。 展开更多
关键词 textrank算法 关键词抽取 神经网络 平均信息熵
在线阅读 下载PDF
基于加权TextRank的新闻关键事件主题句提取 被引量:11
11
作者 蒲梅 周枫 +2 位作者 周晶晶 严馨 周兰江 《计算机工程》 CAS CSCD 北大核心 2017年第8期219-224,共6页
为了在大量的新闻中快速找到自己感兴趣的内容,提出在单文档中基于加权TextRank算法提取主题句的方法,以得到新闻关键事件信息。通过计算新闻文本句子关键词的互信息值,对新闻报道进行事件句和非事件句的分类,过滤出非事件句。基于TextR... 为了在大量的新闻中快速找到自己感兴趣的内容,提出在单文档中基于加权TextRank算法提取主题句的方法,以得到新闻关键事件信息。通过计算新闻文本句子关键词的互信息值,对新闻报道进行事件句和非事件句的分类,过滤出非事件句。基于TextRank算法的思想,构建一个事件句有向图,引入句子位置、句子相似度和关键词覆盖频率3个影响因子,以此计算句子之间的影响权重,利用TextRank模型对图中的每个点计算权重,并选取排序最靠前的句子作为关键事件的主题句。实验结果表明,该方法的抽取效果优于基于词频-逆文档概率和新闻标题的主题句抽取方法。 展开更多
关键词 textrank算法 句子相似度 关键事件 主题句提取 影响权重
在线阅读 下载PDF
基于改进的TextRank的自动摘要提取方法 被引量:42
12
作者 余珊珊 苏锦钿 李鹏飞 《计算机科学》 CSCD 北大核心 2016年第6期240-247,共8页
经典的TextRank算法在文档的自动摘要提取时往往只考虑了句子节点间的相似性,而忽略了文档的篇章结构及句子的上下文信息。针对这些问题,结合中文文本的结构特点,提出一种改进后的iTextRank算法,通过将标题、段落、特殊句子、句子位置... 经典的TextRank算法在文档的自动摘要提取时往往只考虑了句子节点间的相似性,而忽略了文档的篇章结构及句子的上下文信息。针对这些问题,结合中文文本的结构特点,提出一种改进后的iTextRank算法,通过将标题、段落、特殊句子、句子位置和长度等信息引入到TextRank网络图的构造中,给出改进后的句子相似度计算方法及权重调整因子,并将其应用于中文文本的自动摘要提取,同时分析了算法的时间复杂度。最后,实验证明iTextRank比经典的TextRank方法具有更高的准确率和更低的召回率。 展开更多
关键词 中文文本 自动摘要提取 textrank 篇章结构 无监督学习方法
在线阅读 下载PDF
基于TextRank和簇过滤的林业文本关键信息抽取研究 被引量:16
13
作者 陈志泊 李钰曼 +3 位作者 许福 冯国明 师栋瑜 崔晓晖 《农业机械学报》 EI CAS CSCD 北大核心 2020年第5期207-214,172,共9页
目前,获取林业文本关键信息存在2个问题:关键信息获取主要从关键词角度考虑,忽略了词语的信息类型;网络上的林业文本没有统一的记述结构,词语信息类型提取困难。为此,本文提出了基于改进TextRank和簇过滤的林业文本关键信息抽取方法,以... 目前,获取林业文本关键信息存在2个问题:关键信息获取主要从关键词角度考虑,忽略了词语的信息类型;网络上的林业文本没有统一的记述结构,词语信息类型提取困难。为此,本文提出了基于改进TextRank和簇过滤的林业文本关键信息抽取方法,以“关键词+信息类型”两部分表示文本关键信息。首先,抽取关键词并进行Word2Vec向量化,然后通过构建融合词语特征值、边权值的图模型对TextRank进行改进,对经迭代收敛得到的稳定图进行归并聚类形成簇;然后,设计簇品质评价公式进行簇过滤,再次应用TextRank形成最终簇集合;最后,对簇进行信息类型标注。对于测试文本,通过比较关键词向量和簇心向量的距离获得词语的信息类型,将信息类型与关键词结合得到文本的关键信息。基于2000篇与林业政策新闻相关的林业文本进行实验,最终簇集合的紧密度为0.9680,间隔度为0.0572,综合评价指标为0.8871;对其中400篇文本进行关键词人工标注,将本文关键词抽取方法与TextRank、TF IDF等6种算法进行比较,结果表明,本文方法在MRR、Bpref、准确率和综合评价指标上均获得了较好的效果,说明本文方法在提取林业文本关键词方面具有优势。 展开更多
关键词 林业文本 关键词抽取 textrank 簇过滤 信息类型
在线阅读 下载PDF
基于万有引力改进的TextRank关键词提取算法 被引量:7
14
作者 孙福权 张静静 +2 位作者 刘冰玉 姜玉山 多允慧 《计算机应用与软件》 北大核心 2020年第7期216-220,295,共6页
为了提高文本关键词提取的准确性,提出基于万有引力改进的TextRank关键词提取算法GtextRank。利用万有引力模型对词语在文档中的主题影响力、词语间距离和词语间共现频率进行有效融合,构建新的TextRank转移概率实现关键词的提取。实验... 为了提高文本关键词提取的准确性,提出基于万有引力改进的TextRank关键词提取算法GtextRank。利用万有引力模型对词语在文档中的主题影响力、词语间距离和词语间共现频率进行有效融合,构建新的TextRank转移概率实现关键词的提取。实验结果表明,与传统关键词提取方法相比,该算法具有显著的优越性,能够完成对关键词的相对正确的提取;同时考虑了文本中词语的语义关系和主题影响度,可以提高关键词的提取精度。 展开更多
关键词 关键词 主题影响度 词向量 textrank 万有引力
在线阅读 下载PDF
融合LDA与TextRank的关键词抽取研究 被引量:70
15
作者 顾益军 夏天 《现代图书情报技术》 CSSCI 北大核心 2014年第7期41-47,共7页
【目的】通过将单一文档内部的结构信息和文档整体的主题信息融合到一起进行关键词抽取。【方法】利用LDA对文档集进行主题建模和候选关键词的主题影响力计算,进而对TextRank算法进行改进,将候选关键词的重要性按照主题影响力和邻接关... 【目的】通过将单一文档内部的结构信息和文档整体的主题信息融合到一起进行关键词抽取。【方法】利用LDA对文档集进行主题建模和候选关键词的主题影响力计算,进而对TextRank算法进行改进,将候选关键词的重要性按照主题影响力和邻接关系进行非均匀传递,并构建新的概率转移矩阵用于词图迭代计算和关键词抽取。【结果】实现LDA与TextRank的有效融合,当数据集呈现较强的主题分布时,可以显著改善关键词抽取效果。【局限】融合方法需要进行代价较高的多文档主题分析。【结论】关键词既与文档本身相关,也与文档所在的文档集合相关,二者结合是改进关键词抽取结果的有效途径。 展开更多
关键词 关键词抽取 LDA textrank 图模型
原文传递
基于加权TextRank的中文自动文本摘要 被引量:22
16
作者 黄波 刘传才 《计算机应用研究》 CSCD 北大核心 2020年第2期407-410,共4页
现有中文自动文本摘要方法主要是利用文本自身信息,其缺陷是不能充分利用词语之间的语义相关等信息。鉴于此,提出了一种改进的中文文本摘要方法。此方法将外部语料库信息用词向量的形式融入到TextRank算法中,通过TextRank与word2vec的结... 现有中文自动文本摘要方法主要是利用文本自身信息,其缺陷是不能充分利用词语之间的语义相关等信息。鉴于此,提出了一种改进的中文文本摘要方法。此方法将外部语料库信息用词向量的形式融入到TextRank算法中,通过TextRank与word2vec的结合,把句子中每个词语映射到高维词库形成句向量。充分考虑了句子之间的相似度、关键词的覆盖率和句子与标题的相似度等因素,以此计算句子之间的影响权重,并选取排序最靠前的句子重新排序作为文本的摘要。实验结果表明,此方法在本数据集中取得了较好的效果,自动提取中文摘要的效果比原方法好。 展开更多
关键词 文本摘要 textrank 词向量 句子相似度
在线阅读 下载PDF
基于情感分析与TextRank的负面在线评论关键词抽取 被引量:21
17
作者 庞庆华 董显蔚 +1 位作者 周斌 付眸 《情报科学》 CSSCI 北大核心 2022年第5期111-117,共7页
【目的/意义】负面在线评论已成为商家重要的经营决策信息,对了解客户消费满意度、改善产品和服务质量具有重要意义。【方法/过程】该文将情感分析和关键词抽取相结合,提出一种基于BiGRU-CNN和TextRank的在线评论负面关键词抽取方法,即... 【目的/意义】负面在线评论已成为商家重要的经营决策信息,对了解客户消费满意度、改善产品和服务质量具有重要意义。【方法/过程】该文将情感分析和关键词抽取相结合,提出一种基于BiGRU-CNN和TextRank的在线评论负面关键词抽取方法,即首先对在线评论文本数据进行清洗,然后构建BiGRU-CNN情感分类模型对在线评论进行情感分析,最后采取TextRank方法抽取情感分析得到的负面评论中的关键词。利用这种方法,对十个产品与服务类别的6万余条消费者在线评论文本数据进行实证分析。【结果/结论】实验结果表明,该方法能准确判别客户负面在线评论情感倾向,F1值达92.41%,并且负面在线评论关键词抽取结果能较好帮助商家完善产品质量和服务。【创新/局限】提出一种结合双向GRU和CNN结合的情感分类模型,在此基础上基于TextRank方法抽取情感分析得到的负面评论中的关键词,进一步提升模型对于在线评论情感分析的准确性。 展开更多
关键词 负面评论 情感分析 textrank 深度学习 模型构建 关键词抽取
原文传递
融合Word2vec与TextRank的关键词抽取研究 被引量:69
18
作者 宁建飞 刘降珍 《现代图书情报技术》 CSSCI 2016年第6期20-27,共8页
【目的】通过融合单个文档内部结构信息和文档整体的词向量关系进行关键词抽取。【方法】利用Word2vec将文档集中所有词汇进行向量表征,并且通过词向量计算词汇之间的相似度,进而对Text Rank算法进行改进,将候选关键词的权重按照词汇之... 【目的】通过融合单个文档内部结构信息和文档整体的词向量关系进行关键词抽取。【方法】利用Word2vec将文档集中所有词汇进行向量表征,并且通过词向量计算词汇之间的相似度,进而对Text Rank算法进行改进,将候选关键词的权重按照词汇之间的相似度和邻接关系进行非均匀分配,并构建对应的概率转移矩阵用于词汇图模型的迭代计算以及关键词抽取。【结果】实现Word2vec与Text Rank的有效融合,且当训练文档集词汇分布合理时,关键词抽取效果较明显。【局限】需要进行成本较高的文档集训练,获取词向量以及词关系矩阵。【结论】文档集中的词关系有助于修正单文档内部的词关系,提升单文档的关键词抽取准确性。 展开更多
关键词 抽取 Word2vec textrank 图模型 词向量
原文传递
词向量聚类加权TextRank的关键词抽取 被引量:61
19
作者 夏天 《数据分析与知识发现》 CSSCI CSCD 2017年第2期28-34,共7页
【目的】将维基百科蕴涵的世界知识以词向量方式融入TextRank模型,改进单文档关键词抽取效果。【方法】利用Word2Vec模型基于维基百科中文数据,生成词向量模型,对TextRank词图节点的词向量进行聚类以调整簇内节点的投票重要性,结合节点... 【目的】将维基百科蕴涵的世界知识以词向量方式融入TextRank模型,改进单文档关键词抽取效果。【方法】利用Word2Vec模型基于维基百科中文数据,生成词向量模型,对TextRank词图节点的词向量进行聚类以调整簇内节点的投票重要性,结合节点的覆盖和位置因素,计算节点之间的随机跳转概率,生成转移矩阵,最终通过迭代计算获得节点的重要性得分,选取前TopN个词语生成关键词。【结果】当TopN≤7时,词向量聚类加权方法均优于对比方法;TopN=3时,F值取得最大值,比先前最优结果增量提升了3.374%;TopN>7时,结果与位置加权法相似。【局限】聚类分析使得计算开销变高。【结论】词向量聚类加权能够改善关键词抽取效果。 展开更多
关键词 关键词抽取 词向量 textrank Word2Vec
原文传递
基于主题的SE-TextRank情感摘要方法 被引量:8
20
作者 刘志明 于波 +3 位作者 欧阳纯萍 余颖 阳小华 翟云 《情报工程》 2017年第3期97-104,共8页
技术的目的是以简洁的形式准确表达文章的核心情感内容。为解决不同的文档结构及内容特征等问题对摘要结果的影响,提出了一种基于主题的SE-TextRank情感摘要方法。通过LDA模型自动获取收敛后的文本主题,利用余弦距离算法进行主题句子分... 技术的目的是以简洁的形式准确表达文章的核心情感内容。为解决不同的文档结构及内容特征等问题对摘要结果的影响,提出了一种基于主题的SE-TextRank情感摘要方法。通过LDA模型自动获取收敛后的文本主题,利用余弦距离算法进行主题句子分组,使用传统多特征融合以及SE-TextRank情感摘要算法对组内中心句抽取,最终获取目的摘要。实验表明,采用此方法能够更为高效的获取新闻文本摘要结果。 展开更多
关键词 文本摘要 LDA模型 余弦距离 SE-textrank 特征融合
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部