期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于LDA2Vec联合训练的热点主题识别方法 被引量:3
1
作者 薛涛 郭莹 胡伟华 《西安工程大学学报》 CAS 2021年第4期95-101,共7页
针对传统的主题模型算法没有充分利用词间语义关系和上下文语境而导致主题语义一致性、可解释性差的问题,给出一种基于LDA2Vec主题模型联合训练的热点主题识别方法——NS-LDA2Vec方法。该方法通过扩展Skip-gram模型,将初始化后的文档向... 针对传统的主题模型算法没有充分利用词间语义关系和上下文语境而导致主题语义一致性、可解释性差的问题,给出一种基于LDA2Vec主题模型联合训练的热点主题识别方法——NS-LDA2Vec方法。该方法通过扩展Skip-gram模型,将初始化后的文档向量和枢轴词向量联合训练,以获得上下文向量,然后利用该向量来预测中枢词的上下文单词,从而将主题信息嵌入到词表示和文档表示中,使得预测过程中负采样损失和Dirichlet似然项总和最小化,产生可解释性更好的文本表示。结果表明:所提方法取得的F1值最高可达到0.898,在热点主题分类任务上,相比传统的LDA主题模型,主题相关度提升了约9%,能够有效提升主题识别任务的效果。 展开更多
关键词 lda2vec 文档向量 词向量 主题模型 热点主题识别
在线阅读 下载PDF
基于LDA2vec模型老年人主观幸福感主题时序演化分析
2
作者 陈婉铭 刘媛华 《运筹与模糊学》 2025年第4期85-97,共13页
关注老年人的主观幸福感在积极应对老龄化方面具有重要意义。本文采用LDA2vec主题模型对中国知网数据库中老年人主观幸福感领域文章进行主题挖掘,运用TF-IDF算法、LDA模型结合Word2vec词向量模型,从时间维度上深入挖掘老年人幸福感的核... 关注老年人的主观幸福感在积极应对老龄化方面具有重要意义。本文采用LDA2vec主题模型对中国知网数据库中老年人主观幸福感领域文章进行主题挖掘,运用TF-IDF算法、LDA模型结合Word2vec词向量模型,从时间维度上深入挖掘老年人幸福感的核心主题及其演变路径,得到“养老模式与社会演化的关系”、“社会关系与偏远地区老年人”、“跨文化视角下的老年人幸福感”和“健康与数字老龄化”四个主题。通过计算主题热度,得到近五年的主题热度趋势结果。同时在时间维度上讨论了各主题的拐点时间和首次发文时间,并可视化三个时间窗口上主题演化情况,直观呈现了老年人主观幸福感文章的主题结构和演化趋势。从研究热点看,“心理健康”与“社会支持”是该领域的重要研究主题。从整体上看,主题间的交叉融合不断发展,研究的主题逐渐多样化。 展开更多
关键词 lda2vec模型 主题挖掘 时序主题演化 老年人主观幸福感
在线阅读 下载PDF
基于语义分析的政府开放数据平台隐私政策量化评价研究 被引量:10
3
作者 陈美 曹语嫣 《图书情报工作》 CSSCI 北大核心 2024年第1期65-76,共12页
[目的/意义]在政府开放数据持续推进的过程中,如何确保个人隐私的安全性成为重要课题。系统梳理政府开放数据平台隐私政策,为推动政府开放数据和隐私保护的平衡发展提供参考和借鉴。[方法/过程]以15个省级政府开放数据平台隐私政策(211... [目的/意义]在政府开放数据持续推进的过程中,如何确保个人隐私的安全性成为重要课题。系统梳理政府开放数据平台隐私政策,为推动政府开放数据和隐私保护的平衡发展提供参考和借鉴。[方法/过程]以15个省级政府开放数据平台隐私政策(211条政策细则)为研究样本,综合运用LDA2Vce主题模型、命名实体识别以及PMC指数模型,从“政策主题—政策客体—政策效力”3个维度对各省政府开放数据平台隐私政策进行系统性梳理和量化评价。[结果/结论]我国政府数据开放平台隐私政策存在政策主题有待细化、政策客体参与失衡、政策效力仍需提升等问题,并提出相应的对策建议。 展开更多
关键词 开放政府数据 隐私保护 lda2vec主题模型 命名实体识别 PMC指数模型
原文传递
多源数据环境下科研热点识别方法研究 被引量:30
4
作者 裘惠麟 邵波 《图书情报工作》 CSSCI 北大核心 2020年第5期78-88,共11页
[目的/意义]在科学研究中,从不同来源的科技文献中识别挖掘科研热点对于开展科研工作具有指导意义。旨在通过本研究提出的模型方法,快速准确地识别蕴含在多源文本中的热点主题,为科研创新提供支撑服务。[方法/过程]提出一种基于LDA2vec... [目的/意义]在科学研究中,从不同来源的科技文献中识别挖掘科研热点对于开展科研工作具有指导意义。旨在通过本研究提出的模型方法,快速准确地识别蕴含在多源文本中的热点主题,为科研创新提供支撑服务。[方法/过程]提出一种基于LDA2vec模型的多源文本下科研热点识别的方法并针对科研热点识别构建模型,该方法融合LDA主题模型对隐含语义挖掘的优势和Word2Vec词向量模型对于上下文关系把握的优势。以机器学习领域的科技文献为例,利用模型困惑度和主题一致性两个指标对LDA2vec的在本领域应用的可行性和有效性进行验证,并与LDA的主题提取效果进行对比。[结果/结论]实验结果表明,提出的方法在面对多源数据情况下,进行科研热点识别挖掘是可行的,且在一定程度上有效果的提升,对利用单一数据源进行主题分析的不足进行补充,对多数据源融合的实践应用进行丰富。 展开更多
关键词 主题模型 lda2vec 科研热点 LDA Word2vec 多源数据融合
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部