期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于LDA与Word2vec主题模型的草畜平衡研究主题演化与热点主题识别
1
作者 王延敏 张爱儒 《草业科学》 北大核心 2026年第2期334-349,共16页
为深入了解草畜平衡相关研究的现状及发展趋势,客观反映草畜平衡研究主题演化过程,本研究运用隐含狄利克雷分布(LDA)与Word2vec主题模型对2005-2024年CNKI数据库中草畜平衡相关文本数据进行建模、主题演化分析和热点主题识别。研究发现:... 为深入了解草畜平衡相关研究的现状及发展趋势,客观反映草畜平衡研究主题演化过程,本研究运用隐含狄利克雷分布(LDA)与Word2vec主题模型对2005-2024年CNKI数据库中草畜平衡相关文本数据进行建模、主题演化分析和热点主题识别。研究发现:1)LDA+Word2vec模型能够更精准地识别草畜平衡领域4个时间阶段(2005-2010年、2011-2015年、2016-2020年和2021-2024年)的主题演化路径和9个热点主题。2)在对草畜平衡研究主题演化历程的分析中,4个时间阶段的第4阶段展现出最强的演化能力。基于对4个阶段主题的归纳分类得到三大主要类别,并在此基础上梳理出三大类别主题间的核心演化路径。3)通过综合考量主题强度、主题影响力及主题关注度等指标,本研究揭示了草畜平衡领域在不同阶段的热点主题,并发现这些热点主题之间具有较强的关联性。 展开更多
关键词 草畜平衡 lda+word2vec主题模型 主题识别 主题演化 主题强度 热点主题 文献计量
在线阅读 下载PDF
基于LDA-Word2vec的人工智能技术主题演化与热点主题识别
2
作者 王向前 高润凤 李慧宗 《九江学院学报(自然科学版)》 2025年第2期19-31,共13页
为识别人工智能关键技术,深入研究人工智能技术发展态势,有助于国家和企业及时把握人工智能发展动向,本文以人工智能领域中2009—2023年的专利文献为基础,融合运用LDA模型和Word2vec词向量技术,从主题强度和内容双重维度系统考察技术主... 为识别人工智能关键技术,深入研究人工智能技术发展态势,有助于国家和企业及时把握人工智能发展动向,本文以人工智能领域中2009—2023年的专利文献为基础,融合运用LDA模型和Word2vec词向量技术,从主题强度和内容双重维度系统考察技术主题的动态演变过程,同时构建主题热度、新颖度、影响力指标识别人工智能阶段性的热点主题。研究结果表明:①结合LDA主题建模能力和Word2vec语义处理能力能够有效提升技术主题识别精度,直观呈现人工智能领域细粒度技术主题的演化规律与特征;②人工智能领域的技术主题主要分为核心算法与技术基础、感知与交互技术、自然语言与语义理解、数据处理与安全、智能应用与自动化5大类范畴,且主题之间的关联和互动日益紧密;③通过对设计的指标进行综合评估,可以较好识别2009—2014年、2015—2019年和2020—2023年3个不同阶段的热点技术主题。 展开更多
关键词 人工智能 lda模型 主题识别 word2vec 主题演化 热点技术主题
在线阅读 下载PDF
基于word2vec和LDA的文本主题 被引量:7
3
作者 徐守坤 周佳 +1 位作者 李宁 石林 《计算机工程与设计》 北大核心 2018年第9期2764-2769,共6页
将word2vec和LDA算法相结合,对文本主题进行提取研究。通过已有的分词工具实现文本分词,提取文本中的词汇;对语料库依据LDA主题模型进行建模,提取主题相关词汇作为初始主题词集;依据word2vec模型提取与初始主题词集语义相似的词汇,将初... 将word2vec和LDA算法相结合,对文本主题进行提取研究。通过已有的分词工具实现文本分词,提取文本中的词汇;对语料库依据LDA主题模型进行建模,提取主题相关词汇作为初始主题词集;依据word2vec模型提取与初始主题词集语义相似的词汇,将初始主题词汇之间的相似度和向量邻接关系按照权重不同重新分配,改进Gibbs抽样,对LDA进行改进,提高主题挖掘的准确性和稳定性。实验结果表明,当训练语料分布合理时,经过LDA和word2vec的有效结合,主题词抽取效果有所提高,验证了该方法的可行性。 展开更多
关键词 自然语言处理 lda模型 主题挖掘 word2vec模型 GIBBS抽样
在线阅读 下载PDF
结合LDA与Word2vec的文本语义增强方法 被引量:30
4
作者 唐焕玲 卫红敏 +2 位作者 王育林 朱辉 窦全胜 《计算机工程与应用》 CSCD 北大核心 2022年第13期135-145,共11页
文本的语义表示是自然语言处理和机器学习领域的研究难点,针对目前文本表示中的语义缺失问题,基于LDA主题模型和Word2vec模型,提出一种新的文本语义增强方法Sem2vec(semantic to vector)模型。该模型利用LDA主题模型获得单词的主题分布... 文本的语义表示是自然语言处理和机器学习领域的研究难点,针对目前文本表示中的语义缺失问题,基于LDA主题模型和Word2vec模型,提出一种新的文本语义增强方法Sem2vec(semantic to vector)模型。该模型利用LDA主题模型获得单词的主题分布,计算单词与其上下文词的主题相似度,作为主题语义信息融入到词向量中,代替one-hot向量输入至Sem2vec模型,在最大化对数似然目标函数约束下,训练Sem2vec模型的最优参数,最终输出增强的语义词向量表示,并进一步得到文本的语义增强表示。在不同数据集上的实验结果表明,相比其他经典模型,Sem2vec模型的语义词向量之间的语义相似度计算更为准确。另外,根据Sem2vec模型得到的文本语义向量,在多种文本分类算法上的分类结果,较其他经典模型可以提升0.58%~3.5%,同时也提升了时间性能。 展开更多
关键词 lda主题模型 word2vec模型 语义词向量 语义相似度 文本分类
在线阅读 下载PDF
基于Word2Vec和LDA主题模型的中国省级五年规划“文化政策”文本研究 被引量:4
5
作者 高娜 东梅 《网络安全与数据治理》 2024年第7期47-55,共9页
运用Word2Vec和LDA相结合的主题模型分析技术,对我国31个省份三个时期五年规划文本中文化政策部分进行主题识别,从时间和空间两个维度进行“文化政策”主题挖掘和演化分析。研究发现,“文化政策”主题在发展趋势、重点转移、政策导向、... 运用Word2Vec和LDA相结合的主题模型分析技术,对我国31个省份三个时期五年规划文本中文化政策部分进行主题识别,从时间和空间两个维度进行“文化政策”主题挖掘和演化分析。研究发现,“文化政策”主题在发展趋势、重点转移、政策导向、技术应用等方面随时间推移呈现不同演化趋势;四大区域受经济发展水平、文化资源禀赋、政策导向影响,在企业角色强调程度、地区特色旅游发展以及国家级项目和竞争力方面存在地域差异。 展开更多
关键词 lda主题模型 word2vec 五年规划 文化政策 文本分析
在线阅读 下载PDF
基于Huffman-LDA和Weight-Word2vec的文本表示模型研究 被引量:5
6
作者 黄春雨 胡迪 +1 位作者 邱宁佳 孙爽滋 《长春理工大学学报(自然科学版)》 2020年第1期89-96,132,共9页
LDA是对主题到文档的全局结构建模,但其特征中缺少文档内部的局部词之间的关系,只能获得稀疏特征。Word2vec是一种基于上下文预测目标词的词嵌入模型,然而,基于这种方法只能以局部信息表示文档特征,缺乏全局信息。LDA和Word2vec的文本... LDA是对主题到文档的全局结构建模,但其特征中缺少文档内部的局部词之间的关系,只能获得稀疏特征。Word2vec是一种基于上下文预测目标词的词嵌入模型,然而,基于这种方法只能以局部信息表示文档特征,缺乏全局信息。LDA和Word2vec的文本表示模型是基于主题向量和文档向量计算新的特征表示文本,但直接计算所得的稀疏主题特征与基于词向量的文档特征的距离,缺乏特征的一致性。本文提出了Huffman-LDA和Weight-Word2vec的文本表示模型,首先,使用LDA模型得到主题向量后构建主题哈夫曼树,再运用梯度上升方法更新主题向量,新的主题向量包含不同主题词之间的关系,求得的特征不再具有稀疏性;然后,使用LDA主题向量与主题矩阵中词的主题特性计算词权重更新Word2vec的词向量,使得词向量包含主题词之间的关系进而表示文档向量;最后,通过主题向量和文档向量的欧式距离得到具有强分类特征的文本表示。实验结果表明,该方法可获得更强的文本表示特征,有效提高文档分类精度。 展开更多
关键词 主题模型 词嵌入 文本表示 Huffman-lda Weight-word2vec
在线阅读 下载PDF
基于Word2Vec和LDA主题模型的Web服务聚类方法 被引量:13
7
作者 肖巧翔 曹步清 +2 位作者 张祥平 刘建勋 李晏新闻 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第12期2979-2985,共7页
为高效地发现满足用户需求的Web服务,针对Web服务的描述文本较短、缺乏足够有效信息的问题,提出一种基于Word2Vec和LDA主题模型的Web服务聚类方法。该方法首先将Wikipedia语料库作为扩充源,使用word2vec对Web服务描述文档内容进行扩充,... 为高效地发现满足用户需求的Web服务,针对Web服务的描述文本较短、缺乏足够有效信息的问题,提出一种基于Word2Vec和LDA主题模型的Web服务聚类方法。该方法首先将Wikipedia语料库作为扩充源,使用word2vec对Web服务描述文档内容进行扩充,再将扩充后的描述文档利用主题模型进行特征建模,将短文本主题建模转化为长文本主题建模,更准确地实现服务内容主题表达,最后根据文档的主题分布矩阵寻找相似的服务并完成聚类,使用从ProgrammableWeb收集的真实数据进行实验。研究结果表明:本文方法与TFIDF-K,LDA,WT-LDA和LDA-K方法相比,F分别提高419.74%,20.11%,15.60%和27.80%,利用扩充后的Web服务的描述文档进行聚类的方法能够有效提高Web服务聚类的效果。 展开更多
关键词 WEB服务 word2vec lda主题模型 K-MEANS算法 Web服务聚类
在线阅读 下载PDF
基于CiteSpace、Word2vec和LDA主题模型的国内技术接受模型领域研究现状和演化分析 被引量:2
8
作者 冯靖 章胜平 +1 位作者 宋志刚 肖镇江 《情报探索》 2023年第11期125-134,共10页
[目的/意义]旨在梳理国内技术接受模型领域研究成果,总结国内学术界在技术接受模型领域研究热点,同时对研究主题的演化进行分析,为技术接受模型后续研究提供借鉴和参考。[方法/过程]采用CiteSpace、Word2vec和LDA主题模型,首先对在知网... [目的/意义]旨在梳理国内技术接受模型领域研究成果,总结国内学术界在技术接受模型领域研究热点,同时对研究主题的演化进行分析,为技术接受模型后续研究提供借鉴和参考。[方法/过程]采用CiteSpace、Word2vec和LDA主题模型,首先对在知网上检索的文章进行清理与信息采集,导出相应的Refworks文件。然后借助于软件CiteSpace,从作者、机构、关键词等方面,对技术接受模型研究进行可视化分析,再通过Word2vec和LDA主题模型对文献摘要进行分析,总结得出技术接受模型研究的热点主题及主题演化。[结果/结论]研究发现,技术接受模型依然是解决新技术的采纳和持续使用的重要方法,但要考虑多因素影响,增强其扩展性和适应性,重视用户体验和情感因素。 展开更多
关键词 技术接受模型 CITESPACE word2vec lda主题模型 演化分析
在线阅读 下载PDF
基于word2vec与LDA主题模型的技术相似性可视化研究 被引量:41
9
作者 席笑文 郭颖 +1 位作者 宋欣娜 王瑾 《情报学报》 CSSCI CSCD 北大核心 2021年第9期974-983,共10页
技术相似性是企业、组织或国家进行技术情报分析的重要内容,能为其识别潜在竞争关系和合作伙伴提供准确、有效的信息支持。本文针对传统LDA(latent Dirichlet allocation)主题模型忽略专利文本上下文间语义关联的问题,提出了基于word2ve... 技术相似性是企业、组织或国家进行技术情报分析的重要内容,能为其识别潜在竞争关系和合作伙伴提供准确、有效的信息支持。本文针对传统LDA(latent Dirichlet allocation)主题模型忽略专利文本上下文间语义关联的问题,提出了基于word2vec和LDA主题模型的技术相似性可视化研究方法。首先,基于word2vec模型学习特征词在专利文档集合中的上下文语境信息;其次,基于LDA主题模型构建专利权人-专利-技术主题三层概率分布,并将两者融合生成“词粒度”层面的主题向量、专利文档向量及专利权人向量;再次,利用向量相似性指标计算专利权人间的语义相似度,并在此基础上构建能够直观反映专利权人与技术主题关系的二模网络;最后,以NEDD(nano enabled drug delivery)领域为例进行实证研究,证明了该模型在技术相似性测度分析中具有较好的效果。 展开更多
关键词 word2vec lda主题模型 技术相似性测度
在线阅读 下载PDF
基于LDA-Word2vec的图书情报领域机器学习研究主题演化与热点主题识别 被引量:47
10
作者 胡泽文 韩雅蓉 王梦雅 《现代情报》 CSSCI 北大核心 2024年第4期154-167,共14页
[目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以... [目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以图书情报领域中2011—2022年Web of Science数据库中的机器学习研究论文为例,融合LDA和Word2vec方法进行主题建模和主题演化分析,引入主题强度、主题影响力、主题关注度与主题新颖性指标识别热点主题与新兴热点主题。[结果/结论]研究结果表明,(1)Word2vec语义处理能力与LDA主题演化能力的结合能够更加准确地识别研究主题,直观展示研究主题的分阶段演化规律;(2)图书情报领域的机器学习研究主题主要分为自然语言处理与文本分析、数据挖掘与分析、信息与知识服务三大类范畴。各类主题之间的关联性较强,且具有主题关联演化特征;(3)设计的主题强度、主题影响力和主题关注度指标及综合指标能够较好地识别出2011—2014年、2015—2018年和2019—2022年3个不同周期阶段的热点主题。 展开更多
关键词 机器学习 lda模型 word2vec 主题演化 热点主题 主题影响力 主题关注度
在线阅读 下载PDF
基于LDA-TF-IDF和Word2vec文档表示 被引量:4
11
作者 彭俊利 王少泫 +1 位作者 陆正球 李兴远 《浙江纺织服装职业技术学院学报》 2023年第2期91-96,共6页
针对自然语言处理中传统文档表示方法上下文语义信息不全,干扰词多等问题,提出了一种基于LDA-TFIDF和Word2vec的文档表示方法。首先对数据集进行分词、去停用词等预处理;其次,利用LDA主题模型和TF-IDF抽取文档中具有表征性的特征词,并... 针对自然语言处理中传统文档表示方法上下文语义信息不全,干扰词多等问题,提出了一种基于LDA-TFIDF和Word2vec的文档表示方法。首先对数据集进行分词、去停用词等预处理;其次,利用LDA主题模型和TF-IDF抽取文档中具有表征性的特征词,并计算对应权重;最后,应用数据集训练Word2vec模型获取词向量,并将抽取的特征词权重融入Word2vec词向量构建文档语义向量。通过分类任务对该方法进行验证,实验结果表明,与已有方法相比该方法在垃圾短信数据集上表现效果更佳,验证了方法的有效性。 展开更多
关键词 lda主题模型 TF-IDF word2vec 文档表示
在线阅读 下载PDF
基于LDA-加权Word2Vec组合的机器学习情感分类模型研究
12
作者 陈登建 杜飞霞 +2 位作者 吴瑞雪 杨秀璋 夏换 《现代计算机》 2022年第18期16-22,共7页
为解决社交媒体用户发布评论文本过长,导致情感倾向不明确,情感特征分布离散,传统情感分类模型缺乏上下文语义分析,提取情感特征不准确,分类精准率较低的难题,提出一种主题模型与词向量组合特征(LDA-Word2Vec)的情感分类模型。通过LDA... 为解决社交媒体用户发布评论文本过长,导致情感倾向不明确,情感特征分布离散,传统情感分类模型缺乏上下文语义分析,提取情感特征不准确,分类精准率较低的难题,提出一种主题模型与词向量组合特征(LDA-Word2Vec)的情感分类模型。通过LDA主题模型对长评论文本进行特征提取,构建所有主题下的特征词库;借助特征词库构建长评论的LDA特征表达;利用CBOW训练得到特征表达后文本的词向量表示,使用TF-IDF对词向量进行加权并融合语义特征,再构建机器学习模型对长评论文本进行情感分类的方法,研究了机器学习情感分类模型。实验结果表明:相较于传统的文本特征表示方法,本文提出的LDA-Word2Vec组合特征的方法,在情感分类的准确率与召回率的表现上都更加优秀。可见本文的模型能够进一步挖掘文本的情感特征,具有一定学术意义和现实意义。 展开更多
关键词 lda主题挖掘 word2vec模型 机器学习 情感分类
在线阅读 下载PDF
基于LDA2Vec-BERT的新兴技术主题多维指标识别与演化分析研究——以颠覆性技术领域:区块链为例 被引量:29
13
作者 胡泽文 王梦雅 韩雅蓉 《现代情报》 CSSCI 北大核心 2024年第9期42-58,共17页
[目的/意义]挖掘并可视化全球性颠覆性技术:区块链领域发明专利文献中隐含的细粒度新兴和热点技术主题及其演化差异,能够为领域从业者、科技政策制定者、管理部门和科技研发人员提供参考和借鉴。[方法/过程]以全球区块链领域的专利文献... [目的/意义]挖掘并可视化全球性颠覆性技术:区块链领域发明专利文献中隐含的细粒度新兴和热点技术主题及其演化差异,能够为领域从业者、科技政策制定者、管理部门和科技研发人员提供参考和借鉴。[方法/过程]以全球区块链领域的专利文献为基础,按时序划分不同的时间切片,综合运用LDA主题模型、Word2vec词向量模型和BERT语言模型构建区块链领域技术主题挖掘模型,同时通过构建识别新兴和热点技术主题的四维指标:主题热度,主题族群,主题技术性和主题新颖度,识别出区块链领域细粒度新兴和热点技术主题,并结合主题演化模型,对新兴和热点技术主题差异进行演化分析。[结果/结论]研究发现,LDA2Vec-BERT主题识别与演化模型能够基于区块链领域海量专利文献标题和摘要识别出领域的新兴技术主题和热点技术主题,并直观清晰展示出区块链领域细粒度技术主题的演化趋势和特征,发现区块链技术形成从构架研究到应用研究的发展趋势。通过模型结果对比可以发现,识别结果科学合理,且模型的精准率、召回率、F1值均高于其他识别模型,证明构建的集成模型能有效识别颠覆性技术领域细粒度新兴和热点主题。 展开更多
关键词 区块链专利 lda主题模型 word2vec模型 BERT模型 新兴技术主题 热点技术主题 主题识别 主题演化
在线阅读 下载PDF
基于LDA和BiGRU的文本分类 被引量:3
14
作者 冼广铭 王鲁栋 +2 位作者 曾碧卿 梅灏洋 陶睿 《计算机技术与发展》 2022年第4期15-20,共6页
文本分类是自然语言处理的基础任务,文本中的特征稀疏性和提取特征所用的神经网络影响后续的分类效果。针对文本中的特征信息不足以及传统模型上下文依赖关系方面不足的问题,提出经过TF-IDF加权的词向量和LDA主题模型相融合,利用双向门... 文本分类是自然语言处理的基础任务,文本中的特征稀疏性和提取特征所用的神经网络影响后续的分类效果。针对文本中的特征信息不足以及传统模型上下文依赖关系方面不足的问题,提出经过TF-IDF加权的词向量和LDA主题模型相融合,利用双向门控循环神经网络层(BiGRU)充分提取文本深度信息特征的分类方法。该方法主要使用的数据集是天池比赛新闻文本分类数据集,首先用Word2vec和LDA模型分别在语料库中训练词向量,Word2vec经过TF-IDF进行加权所得的词向量再与LDA训练的经过最大主题概率扩展的词向量进行简单拼接,拼接后得到文本矩阵,将文本矩阵输入到BiGRU神经网络中,分别从前后两个反方向提取文本深层次信息的特征向量,最后使用softmax函数进行多分类,根据输出的概率判断所属的类别。与现有的常用文本分类模型相比,准确率、F1值等评价指标都有了较高的提升。 展开更多
关键词 lda主题模型 BiGRU word2vec 深度学习 文本分类
在线阅读 下载PDF
基于主题模型和词向量融合的微博文本主题聚类研究 被引量:28
15
作者 颜端武 梅喜瑞 +1 位作者 杨雄飞 朱鹏 《现代情报》 CSSCI 2021年第10期67-74,共8页
[目的/意义]针对微博短文本数据存在的高维稀疏和上下文语义缺失等问题,提出一种融合主题模型和词向量的文本特征表达方式,以期提高微博主题聚类的效果。[方法/过程]以新浪微博为数据源,结合LDA文档—主题分布特征和加权Word2Vec词向量... [目的/意义]针对微博短文本数据存在的高维稀疏和上下文语义缺失等问题,提出一种融合主题模型和词向量的文本特征表达方式,以期提高微博主题聚类的效果。[方法/过程]以新浪微博为数据源,结合LDA文档—主题分布特征和加权Word2Vec词向量特征构建微博短文本的融合特征,基于K-means算法进行主题聚类,并与单一特征聚类、标准LDA主题模型的实验结果进行对比,根据F1值评估主题聚类方法的优劣。[结果/结论]相较于其他方法,融合特征主题聚类模型表现最佳,其F1值达到83.7%。实验表明,融合特征能够更加全面、准确地描述文本的语义信息,能更有效地表征微博文本。 展开更多
关键词 微博主题聚类 lda主题模型 word2vec 特征融合 K-MEANS
在线阅读 下载PDF
基于改进SVM的中文专利文本分类比较研究 被引量:4
16
作者 杨超宇 陈雯君 耿显亚 《武汉理工大学学报(信息与管理工程版)》 2023年第2期292-298,303,共8页
为深入挖掘中文专利文本特征,使专利类别划分更清晰、技术联系更紧密。首先,从专利信息平台爬取智能家居领域专利,构建智能家居专利信息语料库并进行分词与去停用词处理;其次,通过TF-IDF-LDA和均值Word2Vec两种自然语言处理算法,分别对... 为深入挖掘中文专利文本特征,使专利类别划分更清晰、技术联系更紧密。首先,从专利信息平台爬取智能家居领域专利,构建智能家居专利信息语料库并进行分词与去停用词处理;其次,通过TF-IDF-LDA和均值Word2Vec两种自然语言处理算法,分别对语料库中的文本信息向量化并输出结果,绘制词云图展示筛选出的具有文档代表性的词语;最后,引入SVM进行文本分类并将两组平行实验的分类结果进行对比分析选出最优模型。通过样本上采样解决数据分布不均问题,进一步提升专利分类的准确率。结果表明:均值Word2Vec准确率为97.15%,而LDA准确率为86.91%,经过采样优化后的均值Word2Vec模型准确率为98.51%。为中文专利文本再分类提供新思路,有助于深入挖掘关键共现技术,促进国家产学研一体化发展。 展开更多
关键词 lda主题模型 均值word2vec 支持向量机 产学研 中文专利分类
在线阅读 下载PDF
基于情感主题的音乐分类研究
17
作者 张宏 阮泽楠 《软件导刊》 2019年第7期15-18,共4页
为确定歌词隐含的情感主题对音乐分类的作用,在传统主题模型中融入情感、语义元素,定义基于情感主题的音乐分类标准并进行音乐分类。结合文本情感词典、Word2vec词向量空间,将主题模型的基础主题进一步归类为情感主题,并通过爬取网易云... 为确定歌词隐含的情感主题对音乐分类的作用,在传统主题模型中融入情感、语义元素,定义基于情感主题的音乐分类标准并进行音乐分类。结合文本情感词典、Word2vec词向量空间,将主题模型的基础主题进一步归类为情感主题,并通过爬取网易云音乐歌曲信息进行模型训练及测试。实验证明,该模型具有较好的分类效果,对音乐情感分类平均准确率达到80%。 展开更多
关键词 音乐分类 情感分析 主题模型 word2vec lda
在线阅读 下载PDF
融合结构数据和语义的专利技术主题识别研究——以非小细胞肺癌治疗领域为例 被引量:1
18
作者 沈漫竹 于慧娴 +1 位作者 李倩 袁红梅 《科技管理研究》 CSSCI 北大核心 2022年第13期131-137,共7页
针对专利技术主题识别方法存在缺少语义语境、可解释性弱和主题界定模糊等问题,提出一种融合专利结构数据和文本语义的技术主题识别分析方法。该方法以专利IPC作为结构数据改进纯文本主题建模,获取由IPC和专家分类意见指导的主题词向量... 针对专利技术主题识别方法存在缺少语义语境、可解释性弱和主题界定模糊等问题,提出一种融合专利结构数据和文本语义的技术主题识别分析方法。该方法以专利IPC作为结构数据改进纯文本主题建模,获取由IPC和专家分类意见指导的主题词向量,并使用word2vec模型获取专利文本语义词向量,将二者结果进行向量拼接,进而获得易于解释的精准技术主题,满足细粒度分析要求。最后,以非小细胞肺癌治疗领域作为实证研究,证实该方法的科学性、有效性和实用性。 展开更多
关键词 主题模型 IPC-lda word2vec 向量拼接 非小细胞肺癌
在线阅读 下载PDF
融合情绪特征和主题演化的新冠疫苗舆情分析
19
作者 王凤姣 钟诗琦 +1 位作者 叶莉莉 谢清 《图书情报研究》 2024年第2期91-99,共9页
[目的/意义]开展新冠疫苗网络舆情实证分析,探寻新冠疫苗所引起网民情绪变化的多维度演化过程和规律,为政府等部门在发生重大突发传染病时动员疫苗接种和引导情绪工作提供理论指导和智力支持。[方法/过程]使用情绪词典、Word2vec词向量... [目的/意义]开展新冠疫苗网络舆情实证分析,探寻新冠疫苗所引起网民情绪变化的多维度演化过程和规律,为政府等部门在发生重大突发传染病时动员疫苗接种和引导情绪工作提供理论指导和智力支持。[方法/过程]使用情绪词典、Word2vec词向量模型、LDA主题模型等方法探究网民的新冠疫苗情感走势、主题演化及两者间的关系。[结果/结论]网民对新冠疫苗的情绪变化与内容主题演化过程基本吻合,但主题内容讨论和网民情感倾向各阶段表现不同;网民情绪与事件主题均受外部信息的影响,事件主题促使网民情绪发生转变,网民情绪的表达反过来推进主题发展,二者共同推动着舆情的走向。 展开更多
关键词 情感分析 word2vec lda主题模型 新冠疫苗
在线阅读 下载PDF
英文作文跑题智能化检测技术及应用
20
作者 刘娜 《微型电脑应用》 2021年第9期182-184,共3页
现有的英文作文辅助评分系统大多缺乏有效的跑题检测手段,为此提出并设计了一种英文作文跑题智能化检测技术,利用LDA模型获取作文的主题信息并通过Word2vec训练模型得到准确表达词义的词向量,基于二者的综合作用效果定位跑题的文档。对... 现有的英文作文辅助评分系统大多缺乏有效的跑题检测手段,为此提出并设计了一种英文作文跑题智能化检测技术,利用LDA模型获取作文的主题信息并通过Word2vec训练模型得到准确表达词义的词向量,基于二者的综合作用效果定位跑题的文档。对比实验结果表明,所提出的算法,综合评价指标F值为91.2%,具有非常好的跑题检测能力,对于英语教学能够发挥优异的辅助功能。 展开更多
关键词 智能化检测 作文评分系统 lda主题模型 word2vec模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部