期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
基于LDA与Word2vec主题模型的草畜平衡研究主题演化与热点主题识别
1
作者 王延敏 张爱儒 《草业科学》 北大核心 2026年第2期334-349,共16页
为深入了解草畜平衡相关研究的现状及发展趋势,客观反映草畜平衡研究主题演化过程,本研究运用隐含狄利克雷分布(LDA)与Word2vec主题模型对2005-2024年CNKI数据库中草畜平衡相关文本数据进行建模、主题演化分析和热点主题识别。研究发现:... 为深入了解草畜平衡相关研究的现状及发展趋势,客观反映草畜平衡研究主题演化过程,本研究运用隐含狄利克雷分布(LDA)与Word2vec主题模型对2005-2024年CNKI数据库中草畜平衡相关文本数据进行建模、主题演化分析和热点主题识别。研究发现:1)LDA+Word2vec模型能够更精准地识别草畜平衡领域4个时间阶段(2005-2010年、2011-2015年、2016-2020年和2021-2024年)的主题演化路径和9个热点主题。2)在对草畜平衡研究主题演化历程的分析中,4个时间阶段的第4阶段展现出最强的演化能力。基于对4个阶段主题的归纳分类得到三大主要类别,并在此基础上梳理出三大类别主题间的核心演化路径。3)通过综合考量主题强度、主题影响力及主题关注度等指标,本研究揭示了草畜平衡领域在不同阶段的热点主题,并发现这些热点主题之间具有较强的关联性。 展开更多
关键词 草畜平衡 LDA+word2vec主题模型 主题识别 主题演化 主题强度 热点主题 文献计量
在线阅读 下载PDF
基于LDA-Word2vec的冷链物流政策的央地协同量化分析
2
作者 甘卫华 凌耀琛 +1 位作者 吴素浓 熊奥诗 《兰州交通大学学报》 2025年第4期9-20,共12页
自2008年以来,为推动冷链物流健康快速发展,国家及各省市出台了一系列冷链物流政策,这些政策的效果直接影响各地冷链物流的投资热度和运营质量。基于政策工具理论,以中央和地方(下文简称“央地”)出台的冷链物流政策作为研究对象,引入LD... 自2008年以来,为推动冷链物流健康快速发展,国家及各省市出台了一系列冷链物流政策,这些政策的效果直接影响各地冷链物流的投资热度和运营质量。基于政策工具理论,以中央和地方(下文简称“央地”)出台的冷链物流政策作为研究对象,引入LDA主题模型和Word2vec词嵌入算法,进行政策文本的主题归纳分析、地域性差异分析、时序差异分析和央地协同性分析。研究结果表明:1) 2008-2023年研究期内,冷链物流政策主要聚焦“冷链物流行业的标准化”、“专项支持资金打造农产品冷链物流体系”、“多策并举落地冷链物流项目”、“构建绿色高效冷链供应链新模式”等四个主题;2)研究期内,冷链物流规范性政策文本具有时序阶段性特征,可分为萌芽期、增长期和稳健期,且各阶段主题强度不同,保证冷链物流的均衡发展;3)冷链物流规范性政策文本具有区域多样性,各地区对冷链侧重点存在差异,因地制宜制定冷链物流政策;4)华东城市群的冷链物流政策的央地协同性高于其他地区,且政策主题较为丰富,不仅响应中央政策要求,也适应各地区发展。 展开更多
关键词 冷链物流 政策协同 LDA主题模型 word2vec词嵌入算法
在线阅读 下载PDF
基于LDA-Word2vec的人工智能技术主题演化与热点主题识别
3
作者 王向前 高润凤 李慧宗 《九江学院学报(自然科学版)》 2025年第2期19-31,共13页
为识别人工智能关键技术,深入研究人工智能技术发展态势,有助于国家和企业及时把握人工智能发展动向,本文以人工智能领域中2009—2023年的专利文献为基础,融合运用LDA模型和Word2vec词向量技术,从主题强度和内容双重维度系统考察技术主... 为识别人工智能关键技术,深入研究人工智能技术发展态势,有助于国家和企业及时把握人工智能发展动向,本文以人工智能领域中2009—2023年的专利文献为基础,融合运用LDA模型和Word2vec词向量技术,从主题强度和内容双重维度系统考察技术主题的动态演变过程,同时构建主题热度、新颖度、影响力指标识别人工智能阶段性的热点主题。研究结果表明:①结合LDA主题建模能力和Word2vec语义处理能力能够有效提升技术主题识别精度,直观呈现人工智能领域细粒度技术主题的演化规律与特征;②人工智能领域的技术主题主要分为核心算法与技术基础、感知与交互技术、自然语言与语义理解、数据处理与安全、智能应用与自动化5大类范畴,且主题之间的关联和互动日益紧密;③通过对设计的指标进行综合评估,可以较好识别2009—2014年、2015—2019年和2020—2023年3个不同阶段的热点技术主题。 展开更多
关键词 人工智能 LDA模型 主题识别 word2vec 主题演化 热点技术主题
在线阅读 下载PDF
结合LDA与Word2vec的文本语义增强方法 被引量:30
4
作者 唐焕玲 卫红敏 +2 位作者 王育林 朱辉 窦全胜 《计算机工程与应用》 CSCD 北大核心 2022年第13期135-145,共11页
文本的语义表示是自然语言处理和机器学习领域的研究难点,针对目前文本表示中的语义缺失问题,基于LDA主题模型和Word2vec模型,提出一种新的文本语义增强方法Sem2vec(semantic to vector)模型。该模型利用LDA主题模型获得单词的主题分布... 文本的语义表示是自然语言处理和机器学习领域的研究难点,针对目前文本表示中的语义缺失问题,基于LDA主题模型和Word2vec模型,提出一种新的文本语义增强方法Sem2vec(semantic to vector)模型。该模型利用LDA主题模型获得单词的主题分布,计算单词与其上下文词的主题相似度,作为主题语义信息融入到词向量中,代替one-hot向量输入至Sem2vec模型,在最大化对数似然目标函数约束下,训练Sem2vec模型的最优参数,最终输出增强的语义词向量表示,并进一步得到文本的语义增强表示。在不同数据集上的实验结果表明,相比其他经典模型,Sem2vec模型的语义词向量之间的语义相似度计算更为准确。另外,根据Sem2vec模型得到的文本语义向量,在多种文本分类算法上的分类结果,较其他经典模型可以提升0.58%~3.5%,同时也提升了时间性能。 展开更多
关键词 LDA主题模型 word2vec模型 语义词向量 语义相似度 文本分类
在线阅读 下载PDF
基于LDA和Word2Vec模型的学位论文评阅意见主题挖掘与分析 被引量:9
5
作者 王孟 苏进城 陈志德 《福建师范大学学报(自然科学版)》 CAS 北大核心 2024年第5期41-51,共11页
选取某高校部分硕士学位论文评阅意见为研究对象,使用自然语言处理和机器学习技术进行自动化的硕士学位论文评阅意见主题挖掘与分析。首先,采用LDA(latent dirichlet allocation)模型对评阅数据进行主题建模,提取文本中的潜在主题,并将... 选取某高校部分硕士学位论文评阅意见为研究对象,使用自然语言处理和机器学习技术进行自动化的硕士学位论文评阅意见主题挖掘与分析。首先,采用LDA(latent dirichlet allocation)模型对评阅数据进行主题建模,提取文本中的潜在主题,并将评阅意见转化为主题分布向量;其次,结合Word2Vec模型将评阅意见的关键词转化为向量表达;最后,采用TextRank方法提取关键词,以揭示评阅专家的关注核心主题。实验结果表明,所提方法能为高校管理人员提供切实有效的分析工具,有助于他们更好地分析总结评阅意见,同时也为硕士研究生撰写高质量学位论文提供有益借鉴。 展开更多
关键词 硕士学位论文 自然语言处理 LDA模型 word2Vec模型 TextRank方法
在线阅读 下载PDF
基于word2vec和LDA的文本主题 被引量:7
6
作者 徐守坤 周佳 +1 位作者 李宁 石林 《计算机工程与设计》 北大核心 2018年第9期2764-2769,共6页
将word2vec和LDA算法相结合,对文本主题进行提取研究。通过已有的分词工具实现文本分词,提取文本中的词汇;对语料库依据LDA主题模型进行建模,提取主题相关词汇作为初始主题词集;依据word2vec模型提取与初始主题词集语义相似的词汇,将初... 将word2vec和LDA算法相结合,对文本主题进行提取研究。通过已有的分词工具实现文本分词,提取文本中的词汇;对语料库依据LDA主题模型进行建模,提取主题相关词汇作为初始主题词集;依据word2vec模型提取与初始主题词集语义相似的词汇,将初始主题词汇之间的相似度和向量邻接关系按照权重不同重新分配,改进Gibbs抽样,对LDA进行改进,提高主题挖掘的准确性和稳定性。实验结果表明,当训练语料分布合理时,经过LDA和word2vec的有效结合,主题词抽取效果有所提高,验证了该方法的可行性。 展开更多
关键词 自然语言处理 LDA模型 主题挖掘 word2vec模型 GIBBS抽样
在线阅读 下载PDF
基于Word2Vec和LDA主题模型的中国省级五年规划“文化政策”文本研究 被引量:4
7
作者 高娜 东梅 《网络安全与数据治理》 2024年第7期47-55,共9页
运用Word2Vec和LDA相结合的主题模型分析技术,对我国31个省份三个时期五年规划文本中文化政策部分进行主题识别,从时间和空间两个维度进行“文化政策”主题挖掘和演化分析。研究发现,“文化政策”主题在发展趋势、重点转移、政策导向、... 运用Word2Vec和LDA相结合的主题模型分析技术,对我国31个省份三个时期五年规划文本中文化政策部分进行主题识别,从时间和空间两个维度进行“文化政策”主题挖掘和演化分析。研究发现,“文化政策”主题在发展趋势、重点转移、政策导向、技术应用等方面随时间推移呈现不同演化趋势;四大区域受经济发展水平、文化资源禀赋、政策导向影响,在企业角色强调程度、地区特色旅游发展以及国家级项目和竞争力方面存在地域差异。 展开更多
关键词 LDA主题模型 word2Vec 五年规划 文化政策 文本分析
在线阅读 下载PDF
基于Huffman-LDA和Weight-Word2vec的文本表示模型研究 被引量:5
8
作者 黄春雨 胡迪 +1 位作者 邱宁佳 孙爽滋 《长春理工大学学报(自然科学版)》 2020年第1期89-96,132,共9页
LDA是对主题到文档的全局结构建模,但其特征中缺少文档内部的局部词之间的关系,只能获得稀疏特征。Word2vec是一种基于上下文预测目标词的词嵌入模型,然而,基于这种方法只能以局部信息表示文档特征,缺乏全局信息。LDA和Word2vec的文本... LDA是对主题到文档的全局结构建模,但其特征中缺少文档内部的局部词之间的关系,只能获得稀疏特征。Word2vec是一种基于上下文预测目标词的词嵌入模型,然而,基于这种方法只能以局部信息表示文档特征,缺乏全局信息。LDA和Word2vec的文本表示模型是基于主题向量和文档向量计算新的特征表示文本,但直接计算所得的稀疏主题特征与基于词向量的文档特征的距离,缺乏特征的一致性。本文提出了Huffman-LDA和Weight-Word2vec的文本表示模型,首先,使用LDA模型得到主题向量后构建主题哈夫曼树,再运用梯度上升方法更新主题向量,新的主题向量包含不同主题词之间的关系,求得的特征不再具有稀疏性;然后,使用LDA主题向量与主题矩阵中词的主题特性计算词权重更新Word2vec的词向量,使得词向量包含主题词之间的关系进而表示文档向量;最后,通过主题向量和文档向量的欧式距离得到具有强分类特征的文本表示。实验结果表明,该方法可获得更强的文本表示特征,有效提高文档分类精度。 展开更多
关键词 主题模型 词嵌入 文本表示 Huffman-LDA Weight-word2vec
在线阅读 下载PDF
基于Word2Vec和LDA主题模型的Web服务聚类方法 被引量:13
9
作者 肖巧翔 曹步清 +2 位作者 张祥平 刘建勋 李晏新闻 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第12期2979-2985,共7页
为高效地发现满足用户需求的Web服务,针对Web服务的描述文本较短、缺乏足够有效信息的问题,提出一种基于Word2Vec和LDA主题模型的Web服务聚类方法。该方法首先将Wikipedia语料库作为扩充源,使用word2vec对Web服务描述文档内容进行扩充,... 为高效地发现满足用户需求的Web服务,针对Web服务的描述文本较短、缺乏足够有效信息的问题,提出一种基于Word2Vec和LDA主题模型的Web服务聚类方法。该方法首先将Wikipedia语料库作为扩充源,使用word2vec对Web服务描述文档内容进行扩充,再将扩充后的描述文档利用主题模型进行特征建模,将短文本主题建模转化为长文本主题建模,更准确地实现服务内容主题表达,最后根据文档的主题分布矩阵寻找相似的服务并完成聚类,使用从ProgrammableWeb收集的真实数据进行实验。研究结果表明:本文方法与TFIDF-K,LDA,WT-LDA和LDA-K方法相比,F分别提高419.74%,20.11%,15.60%和27.80%,利用扩充后的Web服务的描述文档进行聚类的方法能够有效提高Web服务聚类的效果。 展开更多
关键词 WEB服务 word2Vec LDA主题模型 K-MEANS算法 Web服务聚类
在线阅读 下载PDF
基于CiteSpace、Word2vec和LDA主题模型的国内技术接受模型领域研究现状和演化分析 被引量:2
10
作者 冯靖 章胜平 +1 位作者 宋志刚 肖镇江 《情报探索》 2023年第11期125-134,共10页
[目的/意义]旨在梳理国内技术接受模型领域研究成果,总结国内学术界在技术接受模型领域研究热点,同时对研究主题的演化进行分析,为技术接受模型后续研究提供借鉴和参考。[方法/过程]采用CiteSpace、Word2vec和LDA主题模型,首先对在知网... [目的/意义]旨在梳理国内技术接受模型领域研究成果,总结国内学术界在技术接受模型领域研究热点,同时对研究主题的演化进行分析,为技术接受模型后续研究提供借鉴和参考。[方法/过程]采用CiteSpace、Word2vec和LDA主题模型,首先对在知网上检索的文章进行清理与信息采集,导出相应的Refworks文件。然后借助于软件CiteSpace,从作者、机构、关键词等方面,对技术接受模型研究进行可视化分析,再通过Word2vec和LDA主题模型对文献摘要进行分析,总结得出技术接受模型研究的热点主题及主题演化。[结果/结论]研究发现,技术接受模型依然是解决新技术的采纳和持续使用的重要方法,但要考虑多因素影响,增强其扩展性和适应性,重视用户体验和情感因素。 展开更多
关键词 技术接受模型 CITESPACE word2vec LDA主题模型 演化分析
在线阅读 下载PDF
基于Word2Vec和改进注意力机制AlexNet-2的文本分类方法 被引量:15
11
作者 钟桂凤 庞雄文 隋栋 《计算机科学》 CSCD 北大核心 2022年第4期288-293,共6页
为了提高文本分类的准确性和运行效率,提出一种Word2Vec文本表征和改进注意力机制AlexNet-2的文本分类方法。首先,利用Word2Vec对文本词特征进行嵌入表示,并训练词向量,将文本表示成分布式向量的形式;然后,利用改进的AlexNet-2对长距离... 为了提高文本分类的准确性和运行效率,提出一种Word2Vec文本表征和改进注意力机制AlexNet-2的文本分类方法。首先,利用Word2Vec对文本词特征进行嵌入表示,并训练词向量,将文本表示成分布式向量的形式;然后,利用改进的AlexNet-2对长距离词相依性进行有效编码,同时对模型添加注意力机制,以高效学习目标词的上下文嵌入语义,并根据词向量的输入与最终预测结果的相关性,进行词权重的调整。实验在3个公开数据集中进行评估,分析了大量样本标注和少量样本标注的情形。实验结果表明,与已有的优秀方法相比,所提方法可以明显提高文本分类的性能和运行效率。 展开更多
关键词 文本分类 注意力机制 AlexNet-2模型 上下文嵌入 词相依性
在线阅读 下载PDF
基于word2vec与LDA主题模型的技术相似性可视化研究 被引量:41
12
作者 席笑文 郭颖 +1 位作者 宋欣娜 王瑾 《情报学报》 CSSCI CSCD 北大核心 2021年第9期974-983,共10页
技术相似性是企业、组织或国家进行技术情报分析的重要内容,能为其识别潜在竞争关系和合作伙伴提供准确、有效的信息支持。本文针对传统LDA(latent Dirichlet allocation)主题模型忽略专利文本上下文间语义关联的问题,提出了基于word2ve... 技术相似性是企业、组织或国家进行技术情报分析的重要内容,能为其识别潜在竞争关系和合作伙伴提供准确、有效的信息支持。本文针对传统LDA(latent Dirichlet allocation)主题模型忽略专利文本上下文间语义关联的问题,提出了基于word2vec和LDA主题模型的技术相似性可视化研究方法。首先,基于word2vec模型学习特征词在专利文档集合中的上下文语境信息;其次,基于LDA主题模型构建专利权人-专利-技术主题三层概率分布,并将两者融合生成“词粒度”层面的主题向量、专利文档向量及专利权人向量;再次,利用向量相似性指标计算专利权人间的语义相似度,并在此基础上构建能够直观反映专利权人与技术主题关系的二模网络;最后,以NEDD(nano enabled drug delivery)领域为例进行实证研究,证明了该模型在技术相似性测度分析中具有较好的效果。 展开更多
关键词 word2vec LDA主题模型 技术相似性测度
在线阅读 下载PDF
基于LDA-Word2vec的图书情报领域机器学习研究主题演化与热点主题识别 被引量:47
13
作者 胡泽文 韩雅蓉 王梦雅 《现代情报》 CSSCI 北大核心 2024年第4期154-167,共14页
[目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以... [目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以图书情报领域中2011—2022年Web of Science数据库中的机器学习研究论文为例,融合LDA和Word2vec方法进行主题建模和主题演化分析,引入主题强度、主题影响力、主题关注度与主题新颖性指标识别热点主题与新兴热点主题。[结果/结论]研究结果表明,(1)Word2vec语义处理能力与LDA主题演化能力的结合能够更加准确地识别研究主题,直观展示研究主题的分阶段演化规律;(2)图书情报领域的机器学习研究主题主要分为自然语言处理与文本分析、数据挖掘与分析、信息与知识服务三大类范畴。各类主题之间的关联性较强,且具有主题关联演化特征;(3)设计的主题强度、主题影响力和主题关注度指标及综合指标能够较好地识别出2011—2014年、2015—2018年和2019—2022年3个不同周期阶段的热点主题。 展开更多
关键词 机器学习 LDA模型 word2vec 主题演化 热点主题 主题影响力 主题关注度
在线阅读 下载PDF
基于LDA-TF-IDF和Word2vec文档表示 被引量:4
14
作者 彭俊利 王少泫 +1 位作者 陆正球 李兴远 《浙江纺织服装职业技术学院学报》 2023年第2期91-96,共6页
针对自然语言处理中传统文档表示方法上下文语义信息不全,干扰词多等问题,提出了一种基于LDA-TFIDF和Word2vec的文档表示方法。首先对数据集进行分词、去停用词等预处理;其次,利用LDA主题模型和TF-IDF抽取文档中具有表征性的特征词,并... 针对自然语言处理中传统文档表示方法上下文语义信息不全,干扰词多等问题,提出了一种基于LDA-TFIDF和Word2vec的文档表示方法。首先对数据集进行分词、去停用词等预处理;其次,利用LDA主题模型和TF-IDF抽取文档中具有表征性的特征词,并计算对应权重;最后,应用数据集训练Word2vec模型获取词向量,并将抽取的特征词权重融入Word2vec词向量构建文档语义向量。通过分类任务对该方法进行验证,实验结果表明,与已有方法相比该方法在垃圾短信数据集上表现效果更佳,验证了方法的有效性。 展开更多
关键词 LDA主题模型 TF-IDF word2vec 文档表示
在线阅读 下载PDF
基于LDA-加权Word2Vec组合的机器学习情感分类模型研究
15
作者 陈登建 杜飞霞 +2 位作者 吴瑞雪 杨秀璋 夏换 《现代计算机》 2022年第18期16-22,共7页
为解决社交媒体用户发布评论文本过长,导致情感倾向不明确,情感特征分布离散,传统情感分类模型缺乏上下文语义分析,提取情感特征不准确,分类精准率较低的难题,提出一种主题模型与词向量组合特征(LDA-Word2Vec)的情感分类模型。通过LDA... 为解决社交媒体用户发布评论文本过长,导致情感倾向不明确,情感特征分布离散,传统情感分类模型缺乏上下文语义分析,提取情感特征不准确,分类精准率较低的难题,提出一种主题模型与词向量组合特征(LDA-Word2Vec)的情感分类模型。通过LDA主题模型对长评论文本进行特征提取,构建所有主题下的特征词库;借助特征词库构建长评论的LDA特征表达;利用CBOW训练得到特征表达后文本的词向量表示,使用TF-IDF对词向量进行加权并融合语义特征,再构建机器学习模型对长评论文本进行情感分类的方法,研究了机器学习情感分类模型。实验结果表明:相较于传统的文本特征表示方法,本文提出的LDA-Word2Vec组合特征的方法,在情感分类的准确率与召回率的表现上都更加优秀。可见本文的模型能够进一步挖掘文本的情感特征,具有一定学术意义和现实意义。 展开更多
关键词 LDA主题挖掘 word2Vec模型 机器学习 情感分类
在线阅读 下载PDF
Enhancing Multi-Class Cyberbullying Classification with Hybrid Feature Extraction and Transformer-Based Models
16
作者 Suliman Mohamed Fati Mohammed A.Mahdi +4 位作者 Mohamed A.G.Hazber Shahanawaj Ahamad Sawsan A.Saad Mohammed Gamal Ragab Mohammed Al-Shalabi 《Computer Modeling in Engineering & Sciences》 2025年第5期2109-2131,共23页
Cyberbullying on social media poses significant psychological risks,yet most detection systems over-simplify the task by focusing on binary classification,ignoring nuanced categories like passive-aggressive remarks or... Cyberbullying on social media poses significant psychological risks,yet most detection systems over-simplify the task by focusing on binary classification,ignoring nuanced categories like passive-aggressive remarks or indirect slurs.To address this gap,we propose a hybrid framework combining Term Frequency-Inverse Document Frequency(TF-IDF),word-to-vector(Word2Vec),and Bidirectional Encoder Representations from Transformers(BERT)based models for multi-class cyberbullying detection.Our approach integrates TF-IDF for lexical specificity and Word2Vec for semantic relationships,fused with BERT’s contextual embeddings to capture syntactic and semantic complexities.We evaluate the framework on a publicly available dataset of 47,000 annotated social media posts across five cyberbullying categories:age,ethnicity,gender,religion,and indirect aggression.Among BERT variants tested,BERT Base Un-Cased achieved the highest performance with 93%accuracy(standard deviation across±1%5-fold cross-validation)and an average AUC of 0.96,outperforming standalone TF-IDF(78%)and Word2Vec(82%)models.Notably,it achieved near-perfect AUC scores(0.99)for age and ethnicity-based bullying.A comparative analysis with state-of-the-art benchmarks,including Generative Pre-trained Transformer 2(GPT-2)and Text-to-Text Transfer Transformer(T5)models highlights BERT’s superiority in handling ambiguous language.This work advances cyberbullying detection by demonstrating how hybrid feature extraction and transformer models improve multi-class classification,offering a scalable solution for moderating nuanced harmful content. 展开更多
关键词 Cyberbullying classification multi-class classification BERT models machine learning TF-IDF word2Vec social media analysis transformer models
在线阅读 下载PDF
基于LDA2Vec-BERT的新兴技术主题多维指标识别与演化分析研究——以颠覆性技术领域:区块链为例 被引量:29
17
作者 胡泽文 王梦雅 韩雅蓉 《现代情报》 CSSCI 北大核心 2024年第9期42-58,共17页
[目的/意义]挖掘并可视化全球性颠覆性技术:区块链领域发明专利文献中隐含的细粒度新兴和热点技术主题及其演化差异,能够为领域从业者、科技政策制定者、管理部门和科技研发人员提供参考和借鉴。[方法/过程]以全球区块链领域的专利文献... [目的/意义]挖掘并可视化全球性颠覆性技术:区块链领域发明专利文献中隐含的细粒度新兴和热点技术主题及其演化差异,能够为领域从业者、科技政策制定者、管理部门和科技研发人员提供参考和借鉴。[方法/过程]以全球区块链领域的专利文献为基础,按时序划分不同的时间切片,综合运用LDA主题模型、Word2vec词向量模型和BERT语言模型构建区块链领域技术主题挖掘模型,同时通过构建识别新兴和热点技术主题的四维指标:主题热度,主题族群,主题技术性和主题新颖度,识别出区块链领域细粒度新兴和热点技术主题,并结合主题演化模型,对新兴和热点技术主题差异进行演化分析。[结果/结论]研究发现,LDA2Vec-BERT主题识别与演化模型能够基于区块链领域海量专利文献标题和摘要识别出领域的新兴技术主题和热点技术主题,并直观清晰展示出区块链领域细粒度技术主题的演化趋势和特征,发现区块链技术形成从构架研究到应用研究的发展趋势。通过模型结果对比可以发现,识别结果科学合理,且模型的精准率、召回率、F1值均高于其他识别模型,证明构建的集成模型能有效识别颠覆性技术领域细粒度新兴和热点主题。 展开更多
关键词 区块链专利 LDA主题模型 word2vec模型 BERT模型 新兴技术主题 热点技术主题 主题识别 主题演化
在线阅读 下载PDF
战略性新兴产业政策与技术主题演化路径识别分析——以新能源汽车产业为例 被引量:17
18
作者 冉从敬 程凡 李旺 《情报科学》 北大核心 2025年第1期147-160,共14页
【目的/意义】构建战略性新兴产业政策-技术主题演化路径识别方法,为产业政策的制定与优化、技术的布局与发展提供重要参考。【方法/过程】以新能源汽车产业政策与专利文本为数据集,综合运用LDA模型和Word2Vec算法提取政策与技术主题,... 【目的/意义】构建战略性新兴产业政策-技术主题演化路径识别方法,为产业政策的制定与优化、技术的布局与发展提供重要参考。【方法/过程】以新能源汽车产业政策与专利文本为数据集,综合运用LDA模型和Word2Vec算法提取政策与技术主题,并通过相似度计算的方式识别产业政策与技术的演化脉络及互动关系。【结果/结论】政策关注点从早期的示范推广转向了重点技术研发和产业链全方位完善,技术研究逐渐向电池效能挖掘、充电基础设施智能化和动力系统性能提升等方向深化。政策与技术研究之间形成了协同推动关系,但需提高在智能化、氢能、混合动力方向的技术研究匹配度,与政策导向保持紧密协同,以提升产业整体韧性与安全水平。【创新/局限】本文对产业政策与技术发展互动演化关系进行了有效探索,可为产业政策完善与技术布局优化提供新视角,局限在于需要纳入更多数据源进行多维度分析,并进一步优化主题模型。 展开更多
关键词 产业政策与技术 LDA模型 word2Vec 演化路径 互动演化
原文传递
文本数据驱动下尾部风险影响因素动态识别与测度——基于我国金融机构的实证研究
19
作者 刘超 钱存 《管理工程学报》 北大核心 2025年第6期16-34,共19页
挖掘和提取文本数据中的潜在风险驱动信息,提升金融行业的风险识别效率是提高金融监管质效的重要途径。本文的研究将文本主题分析技术与多元统计方法相结合,提出文本数据驱动下的尾部风险影响因素动态识别与测度框架,以期从金融风险文... 挖掘和提取文本数据中的潜在风险驱动信息,提升金融行业的风险识别效率是提高金融监管质效的重要途径。本文的研究将文本主题分析技术与多元统计方法相结合,提出文本数据驱动下的尾部风险影响因素动态识别与测度框架,以期从金融风险文本中识别出金融机构的潜在风险因素并测度其影响程度,对结构化数据进行信息补充,为风险管理提供决策支持。本文以上市公司定期报告与机构分析师报告为文本数据源,采用LDA模型与Word2Vec模型的混合算法识别潜在风险因素,并针对风险因素的高维共线性特征,结合LASSO模型来验证和测度长期与短期影响因素的边际贡献。本文选取2001年至2022年我国上市金融机构的相关数据开展实证研究。研究结果表明,相较于仅包含结构化数据的分析框架,文本信息为尾部风险的影响因素识别补充了额外的信息价值,为尾部风险防范提供前瞻性的参考依据。静态分析表明,该框架能够识别出文本信息中金融机构经营过程中存在的长期风险因素,且不同风险因素的边际贡献存在异质性,即当尾部风险升高时风险文本主题因素的边际贡献更高,解释力度更强。动态模型分析表明,该框架能够识别出短期的潜在风险因素,且对尾部风险的敏感性更高。该框架为金融风险管理提供了“文本数据驱动”的新思路。 展开更多
关键词 文本驱动决策 尾部风险 LDA模型 word2Vec模型 LASSO模型
在线阅读 下载PDF
美国智库生物安全研究:主题、演进与启示 被引量:2
20
作者 谢宇恒 李程 李春雷 《世界科技研究与发展》 2025年第3期372-388,共17页
研究美国智库21世纪以来生物安全研究主题与演进趋势,有助于推动我国生物安全智库与安全话语体系建设、完善我国生物安全保护与治理体系。本文基于LDA-Word2vec模型,以美国国防与国家安全领域六家主流智库研究产出为样本,以美国历届总... 研究美国智库21世纪以来生物安全研究主题与演进趋势,有助于推动我国生物安全智库与安全话语体系建设、完善我国生物安全保护与治理体系。本文基于LDA-Word2vec模型,以美国国防与国家安全领域六家主流智库研究产出为样本,以美国历届总统任期作为阶段划分依据,进行主题识别与演进分析发现,在形成主题框架基础之上,美国智库对于生物安全研究演进过程包括主题兴起与体系建构、战略发展与实践深化、技术创新与国际合作三大演进阶段以及公共卫生、生物监测与防御等领域在内的八条路径。基于此,建议我国加强国内生物安全智库建设,贡献中国智慧;推动生物安全风险防控前移,加强科技嵌入;积极参与国际生物安全治理,增强国际话语权;关注生物科技新兴发展领域,深化跨学科交流。 展开更多
关键词 生物安全 美国智库 LDA模型 word2vec 主题演进 生物监测与防御
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部