期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于LDA2Vec模型的国际区域合作标准化政策扩散研究 被引量:2
1
作者 方放 赵罗衣 《科研管理》 北大核心 2025年第5期142-151,共10页
标准是国际区域合作实现互联互通的坚实技术支撑和重要机制保障,标准化政策提供了标准化工作的规划部署与制度支持。本研究基于政策扩散理论,运用LDA2Vec模型对国家和省级层面的“一带一路”标准化政策文本进行深度挖掘,系统揭示我国国... 标准是国际区域合作实现互联互通的坚实技术支撑和重要机制保障,标准化政策提供了标准化工作的规划部署与制度支持。本研究基于政策扩散理论,运用LDA2Vec模型对国家和省级层面的“一带一路”标准化政策文本进行深度挖掘,系统揭示我国国际区域合作标准化政策扩散的内在逻辑和具有特色的政策模式和特征。研究发现:(1)针对层级政策导向维度,国家政策呈现综合性特点,而地区政策逐级传递、因地制宜,地域异质性明显。(2)针对时间演化维度,“一带一路”标准化政策发展可分为政策动员、拓展和调整三个阶段,并呈现出R型增长态势;同时政策主题演进包含传承、衍生和集成三种类型,而且具有交织融合的特点。(3)层级政策扩散受到纵向强制性扩散、央地互动和横向地方内部因素、学习与模仿机制影响,而路径依赖和社会学习机制是驱动政策随时间演化跨阶段扩散的内在逻辑。本研究丰富了政策扩散理论和国际区域合作标准化政策的相关研究,希冀为推动国际区域合作的高质量发展以及助力全球治理新方案供给提供政策决策体系制定和实施参考。 展开更多
关键词 lda2vec 国际区域合作 标准化政策 政策导向 政策扩散
原文传递
我国智慧旅游政策的外部结构、工具特征与演进理路——基于LDA2Vec与政策工具的研究
2
作者 彭雷霆 黄延 《旅游学刊》 北大核心 2025年第8期147-161,共15页
随着数字技术与旅游业深度融合发展,智慧旅游已然成为旅游高质量发展的新动能。文章通过构建“外部结构-工具使用-演进理路”三维分析框架,运用政策工具法、LDA2Vec机器学习等方法,对2001—2023年间中央层面84份智慧旅游政策进行全面系... 随着数字技术与旅游业深度融合发展,智慧旅游已然成为旅游高质量发展的新动能。文章通过构建“外部结构-工具使用-演进理路”三维分析框架,运用政策工具法、LDA2Vec机器学习等方法,对2001—2023年间中央层面84份智慧旅游政策进行全面系统的历时纵向和剖面横向分析。研究发现:1)我国智慧旅游政策大致可划分为萌芽起步期、快速发展期与深化完善期,发文主体存在“主导-核心-参与”层级结构,合作网络由松散单一型转向紧密多主体型;2)政策工具从供给面、环境面转向需求面,需求型政策工具使用较为欠缺,且各工具内部的组合搭配不均;3)政策主题由信息化服务推进-数字化业态发展-智慧化生态建设依次演进,“人工智能+”与产业生态系统建设是未来政策制定的主要着力点。基于此,要进一步推进我国智慧旅游发展,可从增强部门统筹协调、优化政策工具结构、以系统思维支持产业生态建设、营造释放旅游数据要素潜能的制度环境等方面完善智慧旅游政策支持体系。 展开更多
关键词 智慧旅游政策 外部结构 政策工具 演进理路 lda2vec
在线阅读 下载PDF
基于LDA2vec的各国北极战略主题倾向演变研究
3
作者 李振福 郭晓宇 齐芯莉 《智库理论与实践》 北大核心 2025年第5期105-116,共12页
[目的/意义]分析各国北极战略政策主题倾向的演变,不仅能为全面了解北极地区局势和未来发展动向提供有益参考,还对我国了解北极变化、参与北极事务建设具有重要意义。[方法/过程]本文采用LDA2vec模型对2008—2023年17个国家和组织发布... [目的/意义]分析各国北极战略政策主题倾向的演变,不仅能为全面了解北极地区局势和未来发展动向提供有益参考,还对我国了解北极变化、参与北极事务建设具有重要意义。[方法/过程]本文采用LDA2vec模型对2008—2023年17个国家和组织发布的北极政策相关文件进行主题建模,并结合定性分析的方法探究各国的北极战略政策主题在历史进程中的演变。[结果/结论]研究发现,16年间各国北极战略政策的战略视角趋向全球性,其中可持续发展理念一以贯之,呈现跳跃式、跨领域性和综合性的特点,以非传统安全为代表的多维度安全威胁应对政策不断加强。同时,国际合作成为推动北极治理机制创新的关键力量,表现为跨领域合作机制的涌现和多边共治格局的强化,北极战略透明度不断提升。在此背景下,中国应当发挥大国智慧,深化可持续发展战略,提高北极事务的参与能力,增强在北极地区的安全能力建设。 展开更多
关键词 北极 北极战略 文本挖掘 lda2vec 演化分析
在线阅读 下载PDF
基于LDA2vec的数字图书馆信息资源共享研究
4
作者 王芳 《长江信息通信》 2025年第8期123-125,共3页
数字图书馆信息资源自身主题构成多元,导致直接匹配共享请求时,反馈准确性低。对此,开展基于LDA2vec的数字图书馆信息资源共享研究。利用word2vec词向量在特定窗口大小训练原始数字图书馆信息资源文档,输出文本字符串形式信息资源;利用... 数字图书馆信息资源自身主题构成多元,导致直接匹配共享请求时,反馈准确性低。对此,开展基于LDA2vec的数字图书馆信息资源共享研究。利用word2vec词向量在特定窗口大小训练原始数字图书馆信息资源文档,输出文本字符串形式信息资源;利用LDA输出包含主题document向量,求和计算得到转化后的信息资源。在数据共享请求的属性集中搜索与转化资源包含主题一致的属性,利用拉格朗日插值算法计算满足条件共享请求属性拟合阈值信息,输出多项式形式共享请求反馈结果。在结果中,设计方法在对测试样本信息资源向量化转化基础上,对共享请求反馈输出结果完整性高于88.0%,准确性在高于92.0%。 展开更多
关键词 lda2vec 数字图书馆 信息资源共享 word2vec LDA 拉格朗日插值算法
在线阅读 下载PDF
基于T-LDA2vec的高校图书馆三全育人主题挖掘及其育人职能和路径
5
作者 王智迪 《科技和产业》 2024年第23期301-308,共8页
为分析高校图书馆在三全育人方面的作用和发展,特别聚焦于知识传播、文化建设、心理健康和政治教育等多重职能,采用T-LDA2vec模型,对2017—2023年相关文献进行分析。识别出高校图书馆在育人职能方面的关键主题,并跟踪这些主题的演变趋势... 为分析高校图书馆在三全育人方面的作用和发展,特别聚焦于知识传播、文化建设、心理健康和政治教育等多重职能,采用T-LDA2vec模型,对2017—2023年相关文献进行分析。识别出高校图书馆在育人职能方面的关键主题,并跟踪这些主题的演变趋势,从而全面理解其发展轨迹。研究结果表明,高校图书馆不仅在传统的教育领域发挥着重要作用,还在新兴领域,如红色文化传承和跨学科合作方面展现出创新潜力。在数字化和信息化背景下,高校图书馆新型育人功能尤为重要,对进一步发展和提升育人路径具有重要意义。 展开更多
关键词 高校图书馆 三全育人 T-lda2vec 主题识别 主题演化
在线阅读 下载PDF
基于LDA2Vec的政策文本主题挖掘与结构化解析框架研究 被引量:31
6
作者 胡吉明 钱玮 +1 位作者 李雨薇 文鹏 《情报科学》 CSSCI 北大核心 2021年第10期11-17,共7页
【目的/意义】本文以主题为核心,从外部属性和内容属性两个视角展开政策文本结构化解析,直观反映政策核心内涵,挖掘政策文本语义,为政策内容解读提供新模式。【方法/过程】利用LDA2Vec主题模型实现基于上下文的政策文本主题识别,同时借... 【目的/意义】本文以主题为核心,从外部属性和内容属性两个视角展开政策文本结构化解析,直观反映政策核心内涵,挖掘政策文本语义,为政策内容解读提供新模式。【方法/过程】利用LDA2Vec主题模型实现基于上下文的政策文本主题识别,同时借助位置和语法规律提取外部属性,以此构建政策文本结构化解析的描述框架。【结果/结论】"互联网+"政策文本解读的实证分析发现,本文所提框架有助于直观展现政策要素,有效揭示政策文本主题分布,以及进行大规模政策领域文本的批量分析和解读。【创新/局限】通过结构化解析框架展现政策文本的形式化特征和主题性特征,帮助政策相关群体把握政策制定的特点和侧重点,目前深层次内容解读有待进一步研究。 展开更多
关键词 政策文本 结构解析 lda2vec 主题识别 文本挖掘
原文传递
基于LDA2Vec联合训练的热点主题识别方法 被引量:3
7
作者 薛涛 郭莹 胡伟华 《西安工程大学学报》 CAS 2021年第4期95-101,共7页
针对传统的主题模型算法没有充分利用词间语义关系和上下文语境而导致主题语义一致性、可解释性差的问题,给出一种基于LDA2Vec主题模型联合训练的热点主题识别方法——NS-LDA2Vec方法。该方法通过扩展Skip-gram模型,将初始化后的文档向... 针对传统的主题模型算法没有充分利用词间语义关系和上下文语境而导致主题语义一致性、可解释性差的问题,给出一种基于LDA2Vec主题模型联合训练的热点主题识别方法——NS-LDA2Vec方法。该方法通过扩展Skip-gram模型,将初始化后的文档向量和枢轴词向量联合训练,以获得上下文向量,然后利用该向量来预测中枢词的上下文单词,从而将主题信息嵌入到词表示和文档表示中,使得预测过程中负采样损失和Dirichlet似然项总和最小化,产生可解释性更好的文本表示。结果表明:所提方法取得的F1值最高可达到0.898,在热点主题分类任务上,相比传统的LDA主题模型,主题相关度提升了约9%,能够有效提升主题识别任务的效果。 展开更多
关键词 lda2vec 文档向量 词向量 主题模型 热点主题识别
在线阅读 下载PDF
基于LDA2vec模型老年人主观幸福感主题时序演化分析
8
作者 陈婉铭 刘媛华 《运筹与模糊学》 2025年第4期85-97,共13页
关注老年人的主观幸福感在积极应对老龄化方面具有重要意义。本文采用LDA2vec主题模型对中国知网数据库中老年人主观幸福感领域文章进行主题挖掘,运用TF-IDF算法、LDA模型结合Word2vec词向量模型,从时间维度上深入挖掘老年人幸福感的核... 关注老年人的主观幸福感在积极应对老龄化方面具有重要意义。本文采用LDA2vec主题模型对中国知网数据库中老年人主观幸福感领域文章进行主题挖掘,运用TF-IDF算法、LDA模型结合Word2vec词向量模型,从时间维度上深入挖掘老年人幸福感的核心主题及其演变路径,得到“养老模式与社会演化的关系”、“社会关系与偏远地区老年人”、“跨文化视角下的老年人幸福感”和“健康与数字老龄化”四个主题。通过计算主题热度,得到近五年的主题热度趋势结果。同时在时间维度上讨论了各主题的拐点时间和首次发文时间,并可视化三个时间窗口上主题演化情况,直观呈现了老年人主观幸福感文章的主题结构和演化趋势。从研究热点看,“心理健康”与“社会支持”是该领域的重要研究主题。从整体上看,主题间的交叉融合不断发展,研究的主题逐渐多样化。 展开更多
关键词 lda2vec模型 主题挖掘 时序主题演化 老年人主观幸福感
在线阅读 下载PDF
数字乡村政策的主题挖掘及注意力配置——基于LDA2Vec和ATM模型的分析
9
作者 李云新 陈果 《信息技术与管理应用》 2024年第4期22-37,99,共17页
探索数字乡村政策细分领域及注意力配置规律,有助于理解政府推动数字乡村建设的工作重心和思路,进而为促进数字乡村长效发展提供助益。本文基于中央和省级政府颁布的56份数字乡村政策文本,运用LDA模型识别数字乡村政策主题,进而通过构... 探索数字乡村政策细分领域及注意力配置规律,有助于理解政府推动数字乡村建设的工作重心和思路,进而为促进数字乡村长效发展提供助益。本文基于中央和省级政府颁布的56份数字乡村政策文本,运用LDA模型识别数字乡村政策主题,进而通过构建融合LDA主题模型与Word2Vec的LDA2Vec模型来分析政策注意力配置及其变化态势,并运用ATM模型分析政策注意力配置的主体差异。发现数字乡村政策主题覆盖农业农村大数据开发应用等六个领域;政策注意力配置显著聚焦于数字技术在农业领域的推广和应用且呈现持续上升态势,技术赋能乡村治理与社会效益提升的注意力配置则较为有限;中央政府在数字乡村各领域的注意力配置较为均衡,而省级政府则具有明显的“技术”倾向;不同党政部门的注意力配置呈现出差异化协同的特征。 展开更多
关键词 数字乡村 政府注意力配置 LDA模型 lda2vec模型 ATM模型
在线阅读 下载PDF
国家冰雪体育旅游目的地游客感知意象对目的地网络传播效果的fsQCA分析
10
作者 燕阳 李斌 《山东体育学院学报》 北大核心 2025年第2期109-118,共10页
该研究以我国46个旅游目的地中的90个冰雪体育旅游目的地为样本,运用LDA2vec模型对游客网络评论文本进行条件变量挖掘,并以权威传播指数作为结果变量,旨在探讨不同地理区域中冰雪体育旅游目的地游客感知意象对网络传播效果的fsQCA影响... 该研究以我国46个旅游目的地中的90个冰雪体育旅游目的地为样本,运用LDA2vec模型对游客网络评论文本进行条件变量挖掘,并以权威传播指数作为结果变量,旨在探讨不同地理区域中冰雪体育旅游目的地游客感知意象对网络传播效果的fsQCA影响。研究认为:(1)国家冰雪体育旅游目的地游客感知意象包含度假服务感知、交通服务水平、特色体验打卡、服务管理能力、萌新滑雪体验、劣质服务印象、滑雪服务水准、冰雪游历趣味、经济出行体验和魅力地理景观共10个条件变量,且各条件变量以组态形式影响目的地的网络传播效果。(2)东北地区包含6条高传播效果组态,总体呈现出差异化的区域发展特征;华北地区的高传播效果组态为2条,均以度假服务感知为共同的核心条件;中部地区的高传播效果组态为2条,均以经济出行体验为共同的核心条件;西北地区也包含6条高传播效果组态,其中滑雪服务水准为绝大部分组态的核心条件,研究结论在经过稳健性检验后依旧成立。基于此,提出应强化东北地区冰雪体育旅游的一体化建设、完善华北地区冰雪体育旅游的系统化设计、扩大中部地区冰雪体育旅游的经济性优势、注重西北地区冰雪体育旅游的层次化发展的针对性建议。 展开更多
关键词 冰雪体育旅游 旅游目的地 滑雪 游客感知意象 网络传播效果 lda2vec模型
在线阅读 下载PDF
基于LDA2Vec和残差网络的跨媒体融合方法研究 被引量:3
11
作者 钟庆虹 乔晓东 +1 位作者 张运良 翁梦娟 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第10期78-88,共11页
【目的】在跨媒体融合机制的理论基础上,优化特征提取以解决异构数据间的语义鸿沟问题。【方法】基于LDA2Vec和ResNet V2模型分别对文本和图片两种媒体形式进行特征提取,通过语义关联匹配将异构的文本图片特征信息映射到一致性表达空间... 【目的】在跨媒体融合机制的理论基础上,优化特征提取以解决异构数据间的语义鸿沟问题。【方法】基于LDA2Vec和ResNet V2模型分别对文本和图片两种媒体形式进行特征提取,通过语义关联匹配将异构的文本图片特征信息映射到一致性表达空间中,完成检索。【结果】相比使用LDA和SIFT算法进行特征提取的跨媒体融合实验,本文方法将文本、图片相互检索的MAP值提高到0.454。【局限】跨媒体数据集的训练集数量不够导致特征训练效果有限;仅考虑优化特征提取方法对跨媒体融合实验效果的提升有限。【结论】本文所提方法能够改善跨媒体融合的实验效果,从跨媒体融合过程入手,为跨媒体融合研究提供了新的研究思路。 展开更多
关键词 跨媒体数据 特征提取 lda2vec 残差网络 语义关联
原文传递
考虑消费者体验型产品特征偏好的评论排序研究
12
作者 吕钰菁 陈磊 《管理科学与工程》 2024年第1期1-12,共12页
在线评论能够降低消费者在体验型产品购买决策中的感知风险,但评论信息过载对高效的搜索构成了挑战。由于体验型产品具有个性化的特点,消费者对评论信息的需求因产品特征偏好而异,这一问题在现有研究中尚未得到充分阐述。研究通过LDA2Ve... 在线评论能够降低消费者在体验型产品购买决策中的感知风险,但评论信息过载对高效的搜索构成了挑战。由于体验型产品具有个性化的特点,消费者对评论信息的需求因产品特征偏好而异,这一问题在现有研究中尚未得到充分阐述。研究通过LDA2Vec、LCR等方法,构建消费者类模型及基于类的评论有用性预测模型,从而实现评论个性化排序。实验结果证实了个性化排序模型在提高评论感知有用性上的有效性,其在评论相关性、完整性、信息诊断性、消费者满意度等方面都显著优于有用性投票排序机制。本研究为如何识别体验型产品特征,并通过消费者体验型产品特征偏好解决体验型产品评论排序提供了具体的方法,更为通过评论个性化排序缓解评论信息过载问题提供了理论见解、模型成果和经验证据。 展开更多
关键词 评论排序 体验型产品特征 lda2vec LCR
在线阅读 下载PDF
后疫情时代公众信息需求与公共图书馆信息服务策略研究 被引量:6
13
作者 刘泽 单轸 邵波 《情报科学》 CSSCI 北大核心 2023年第7期179-188,共10页
【目的/意义】公众在社交媒体平台上对公共图书馆的态度与反应能够揭示公众对公共图书馆信息需求的特征与规律,对此展开研究,以期构建后疫情时代公共图书馆信息服务策略。【方法/过程】以新浪微博为例,以公众新浪微博数据为研究对象。... 【目的/意义】公众在社交媒体平台上对公共图书馆的态度与反应能够揭示公众对公共图书馆信息需求的特征与规律,对此展开研究,以期构建后疫情时代公共图书馆信息服务策略。【方法/过程】以新浪微博为例,以公众新浪微博数据为研究对象。首先对微博舆情进行阶段性划分。其次利用LDA2vec主题模型从微博文本数据中挖掘公众信息需求主题。接着从需求主题和时间维度揭示不同阶段下公众信息需求特征与需求强度,探讨其时间演变规律。最终根据公众信息需求,提出后疫情时代公共图书馆信息服务策略。【结果/结论】后疫情时代下公众信息需求主要围绕环境、思想、情感与行为四个方面,并从这四个方面对公共图书馆未来的信息服务工作提出建议。【创新/局限】通过分析公众对公共图书馆的信息需求与时间演化规律,构建公共图书馆信息服务策略,未来研究需扩大研究样本,使研究结论更具普适性。 展开更多
关键词 lda2vec主题模型 后疫情时代 信息服务 社交媒体平台 公共图书馆
原文传递
基于论文-专利的石墨烯领域硬科技创新技术主题识别研究 被引量:5
14
作者 张楠 赵辉 《高技术通讯》 CAS 2021年第8期892-900,共9页
硬科技创新是原创性高精尖科技和实体经济的结合,对我国未来创新驱动发展起着巨大推动作用,有助于形成核心竞争力。识别硬科技创新主题在情报学领域仍是一个新课题,对其有效识别将有助于引导社会投资,及早挖掘新的经济增长点。本文以石... 硬科技创新是原创性高精尖科技和实体经济的结合,对我国未来创新驱动发展起着巨大推动作用,有助于形成核心竞争力。识别硬科技创新主题在情报学领域仍是一个新课题,对其有效识别将有助于引导社会投资,及早挖掘新的经济增长点。本文以石墨烯领域为研究样本,结合学术型发明人的论文和专利,基于LDA2Vec主题模型和K-means聚类算法进行硬科技创新候选技术主题挖掘;通过发文强度、时序性分析筛选主题,根据学术型发明人主题关注度、高校及科研院所主题关注度、基金投资强度构建三维评价模型,筛选出最有可能成为硬科技创新的技术主题。结果表明,石墨烯电池等7个技术主题最有可能成为石墨烯领域内硬科技创新主题,为后续相关研究提供思路。 展开更多
关键词 硬科技 lda2vec 学术型发明人 石墨烯
在线阅读 下载PDF
数字经济时代客户通信需求的分析与演化
15
作者 王荫鹏 倪静 《建模与仿真》 2025年第1期1187-1199,共13页
本文通过对2022~2024年移动通信领域客户投诉数据的深入分析,探讨了客户诉求的演变趋势和主题演化路径。利用Lda2vec模型和余弦相似度计算,通过LDAvis交互式可视化系统研究发现客户投诉的焦点从具体的技术问题,如设备使用和户线中断,转... 本文通过对2022~2024年移动通信领域客户投诉数据的深入分析,探讨了客户诉求的演变趋势和主题演化路径。利用Lda2vec模型和余弦相似度计算,通过LDAvis交互式可视化系统研究发现客户投诉的焦点从具体的技术问题,如设备使用和户线中断,转向了服务层面的问题,最终关注于上网质量这一宏观议题。文章分析了活动服务、户线中断和设备帮助三大主题的投诉数据,揭示了用户需求的变化和技术进步的推动作用。研究结果表明,随着数字经济的发展和家庭办公、在线教育的普及,用户对网络稳定性和上网体验的期望不断提升。同时,用户对服务的透明度、真实性和费用透明度的要求也越来越高。服务提供商面临的挑战在于如何适应这些变化,提供更高质量的服务,同时也面临着通过更好地理解和满足用户需求来提升用户满意度和忠诚度的机遇。 展开更多
关键词 lda2vec 主题挖掘 主题演化 客户投诉 中国通信
在线阅读 下载PDF
基于语义分析的政府开放数据平台隐私政策量化评价研究 被引量:10
16
作者 陈美 曹语嫣 《图书情报工作》 CSSCI 北大核心 2024年第1期65-76,共12页
[目的/意义]在政府开放数据持续推进的过程中,如何确保个人隐私的安全性成为重要课题。系统梳理政府开放数据平台隐私政策,为推动政府开放数据和隐私保护的平衡发展提供参考和借鉴。[方法/过程]以15个省级政府开放数据平台隐私政策(211... [目的/意义]在政府开放数据持续推进的过程中,如何确保个人隐私的安全性成为重要课题。系统梳理政府开放数据平台隐私政策,为推动政府开放数据和隐私保护的平衡发展提供参考和借鉴。[方法/过程]以15个省级政府开放数据平台隐私政策(211条政策细则)为研究样本,综合运用LDA2Vce主题模型、命名实体识别以及PMC指数模型,从“政策主题—政策客体—政策效力”3个维度对各省政府开放数据平台隐私政策进行系统性梳理和量化评价。[结果/结论]我国政府数据开放平台隐私政策存在政策主题有待细化、政策客体参与失衡、政策效力仍需提升等问题,并提出相应的对策建议。 展开更多
关键词 开放政府数据 隐私保护 lda2vec主题模型 命名实体识别 PMC指数模型
原文传递
城市画像视角下的社会公众情感演化研究 被引量:5
17
作者 叶光辉 曾杰妍 +1 位作者 胡婧岚 毕崇武 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第4期15-26,共12页
【目的】为及时掌握城市动态、引导公众舆论、识别与预测城市潜在问题,构建城市画像视角下的公众情感演化模型。【方法】通过LDA2Vec提取时间窗口下的城市主题;采用基于词典的情感分析方法细粒度划分城市主题的情感类别,并计算各个城市... 【目的】为及时掌握城市动态、引导公众舆论、识别与预测城市潜在问题,构建城市画像视角下的公众情感演化模型。【方法】通过LDA2Vec提取时间窗口下的城市主题;采用基于词典的情感分析方法细粒度划分城市主题的情感类别,并计算各个城市主题的情感强度;最后利用TF-IDF算法追踪时间序列下引起公众情感演化的城市事件,并构建ARMA模型预测公众情感趋势。【结果】本文模型中"好"的情感强度预测准确率达97%,"恶"的情感强度预测准确率达90%,证明了模型的可行性。【局限】未将突发事件作为影响因素加入公众情感演化模型。【结论】本文方法能够有效识别和判断引起公众情感极性发生变化的城市事件,并具有较高的情感强度预测准确性。 展开更多
关键词 城市画像 情感演化 lda2vec 舆情监控
原文传递
多源数据环境下科研热点识别方法研究 被引量:30
18
作者 裘惠麟 邵波 《图书情报工作》 CSSCI 北大核心 2020年第5期78-88,共11页
[目的/意义]在科学研究中,从不同来源的科技文献中识别挖掘科研热点对于开展科研工作具有指导意义。旨在通过本研究提出的模型方法,快速准确地识别蕴含在多源文本中的热点主题,为科研创新提供支撑服务。[方法/过程]提出一种基于LDA2vec... [目的/意义]在科学研究中,从不同来源的科技文献中识别挖掘科研热点对于开展科研工作具有指导意义。旨在通过本研究提出的模型方法,快速准确地识别蕴含在多源文本中的热点主题,为科研创新提供支撑服务。[方法/过程]提出一种基于LDA2vec模型的多源文本下科研热点识别的方法并针对科研热点识别构建模型,该方法融合LDA主题模型对隐含语义挖掘的优势和Word2Vec词向量模型对于上下文关系把握的优势。以机器学习领域的科技文献为例,利用模型困惑度和主题一致性两个指标对LDA2vec的在本领域应用的可行性和有效性进行验证,并与LDA的主题提取效果进行对比。[结果/结论]实验结果表明,提出的方法在面对多源数据情况下,进行科研热点识别挖掘是可行的,且在一定程度上有效果的提升,对利用单一数据源进行主题分析的不足进行补充,对多数据源融合的实践应用进行丰富。 展开更多
关键词 主题模型 lda2vec 科研热点 LDA Word2vec 多源数据融合
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部