期刊文献+
共找到89篇文章
< 1 2 5 >
每页显示 20 50 100
基于LDA模型的红山文化研究主题及演化分析 被引量:1
1
作者 薛伟莲 肖琳 《情报探索》 2025年第1期96-104,共9页
[目的/意义]红山文化是研究中华文明起源的重要线索,分析红山文化的研究主题及演化趋势,为相关学者对红山文化的后续研究提供参考。[方法/过程]运用LDA主题模型对国内红山文化的学术论文摘要进行主题挖掘,总结红山文化的研究主题,分析... [目的/意义]红山文化是研究中华文明起源的重要线索,分析红山文化的研究主题及演化趋势,为相关学者对红山文化的后续研究提供参考。[方法/过程]运用LDA主题模型对国内红山文化的学术论文摘要进行主题挖掘,总结红山文化的研究主题,分析每个研究主题的演化趋势。[结果/结论]国内红山文化的研究大致可分为5个研究主题:红山玉文化、红山文化旅游资源开发与建设、牛河梁遗址考古研究、新石器时期考古研究、中华文明起源研究。通过分析主题演化趋势得出:目前,学者们对红山文化旅游资源开发与建设较为关注。最后,结合5个研究主题及演化趋势为红山文化遗址的发展提出建议。 展开更多
关键词 红山文化 lda主题模型 主题挖掘 主题演化
在线阅读 下载PDF
生育友好视域下我国托育政策的时空嬗变特征与优化向度——基于31省397份政策文本的LDA主题建模
2
作者 洪秀敏 吕阳 《人口与经济》 北大核心 2025年第6期59-72,共14页
作为构建生育友好型社会的重要民生举措,0—3岁婴幼儿托育服务的高质量发展已成为国家战略布局的核心议题,既关乎千万家庭的切身福祉,也是保障人口长期均衡发展的关键政策着力点。研究基于供给型、环境型与需求型政策工具的分析框架,综... 作为构建生育友好型社会的重要民生举措,0—3岁婴幼儿托育服务的高质量发展已成为国家战略布局的核心议题,既关乎千万家庭的切身福祉,也是保障人口长期均衡发展的关键政策着力点。研究基于供给型、环境型与需求型政策工具的分析框架,综合运用内容分析法和LDA主题模型,对2019—2024年我国31个省份相继发布的397份地方托育政策文本进行系统梳理与主题挖掘,识别其演化路径,并在生育友好的视角下深入探讨我国托育政策的时空嬗变特征与未来优化向度。研究发现:我国托育政策发展在时序演变上历经框架初建与普惠启动期(2019—2020年)、供给扩容与体系深化期(2021—2022年)以及质量引领与多元探索期(2023—2024年)三大阶段。在空间分布上则进一步呈现政策工具结构不均,生育需求工具短缺迟滞;区域政策分化明显,东西托育政策侧重显著;生育友好导向趋于明确,供需协同机制亟待补强等显著特征。因此,为加快构建生育友好型社会,推动托育服务体系实现从有到优、从广覆盖到高质量的全面升级,未来我国托育政策发展须进一步优化政策工具结构,强化生育支持引领作用;追踪政策演化趋势,构建生育友好普惠体系;精准匹配供需关系,推进区域优质均衡发展。 展开更多
关键词 托育政策 政策工具 lda主题建模 时空嬗变 优化向度
在线阅读 下载PDF
基于LDA-Word2vec的人工智能技术主题演化与热点主题识别
3
作者 王向前 高润凤 李慧宗 《九江学院学报(自然科学版)》 2025年第2期19-31,共13页
为识别人工智能关键技术,深入研究人工智能技术发展态势,有助于国家和企业及时把握人工智能发展动向,本文以人工智能领域中2009—2023年的专利文献为基础,融合运用LDA模型和Word2vec词向量技术,从主题强度和内容双重维度系统考察技术主... 为识别人工智能关键技术,深入研究人工智能技术发展态势,有助于国家和企业及时把握人工智能发展动向,本文以人工智能领域中2009—2023年的专利文献为基础,融合运用LDA模型和Word2vec词向量技术,从主题强度和内容双重维度系统考察技术主题的动态演变过程,同时构建主题热度、新颖度、影响力指标识别人工智能阶段性的热点主题。研究结果表明:①结合LDA主题建模能力和Word2vec语义处理能力能够有效提升技术主题识别精度,直观呈现人工智能领域细粒度技术主题的演化规律与特征;②人工智能领域的技术主题主要分为核心算法与技术基础、感知与交互技术、自然语言与语义理解、数据处理与安全、智能应用与自动化5大类范畴,且主题之间的关联和互动日益紧密;③通过对设计的指标进行综合评估,可以较好识别2009—2014年、2015—2019年和2020—2023年3个不同阶段的热点技术主题。 展开更多
关键词 人工智能 lda模型 主题识别 Word2vec 主题演化 热点技术主题
在线阅读 下载PDF
Overview of Trends in Global Single Cell Research Based on Bibliometric Analysis and LDA Model(2009–2019) 被引量:2
4
作者 Tian Jiang Xiaoping Liu +2 位作者 Chao Zhang Chuanhao Yin Huizhou Liu 《Journal of Data and Information Science》 CSCD 2021年第2期163-178,共16页
Purpose:This article aims to describe the global research profile and the development trends of single cell research from the perspective of bibliometric analysis and semantic mining.Design/methodology/approach:The li... Purpose:This article aims to describe the global research profile and the development trends of single cell research from the perspective of bibliometric analysis and semantic mining.Design/methodology/approach:The literatures on single cell research were extracted from Clarivate Analytic’s Web of Science Core Collection between 2009 and 2019.Firstly,bibliometric analyses were performed with Thomson Data Analyzer(TDA).Secondly,topic identification and evolution trends of single cell research was conducted through the LDA topic model.Thirdly,taking the post-discretized method which is used for topic evolution analysis for reference,the topics were also be dispersed to countries to detect the spatial distribution.Findings:The publication of single cell research shows significantly increasing tendency in the last decade.The topics of single cell research field can be divided into three categories,which respectively refers to single cell research methods,mechanism of biological process,and clinical application of single cell technologies.The different trends of these categories indicate that technological innovation drives the development of applied research.The continuous and rapid growth of the topic strength in the field of cancer diagnosis and treatment indicates that this research topic has received extensive attention in recent years.The topic distributions of some countries are relatively balanced,while for the other countries,several topics show significant superiority.Research limitations:The analyzed data of this study only contain those were included in the Web of Science Core Collection.Practical implications:This study provides insights into the research progress regarding single cell field and identifies the most concerned topics which reflect potential opportunities and challenges.The national topic distribution analysis based on the post-discretized analysis method extends topic analysis from time dimension to space dimension.Originality/value:This paper combines bibliometric analysis and LDA model to analyze the evolution trends of single cell research field.The method of extending post-discretized analysis from time dimension to space dimension is distinctive and insightful. 展开更多
关键词 lda model topic evolution Bibliometric analysis Post-discretized Singlecell
在线阅读 下载PDF
基于TC-LDA模型的电信网络诈骗案件主题挖掘与演化 被引量:1
5
作者 许根玮 冯文刚 《情报杂志》 北大核心 2025年第10期86-96,共11页
[研究目的]在电信网络诈骗案件频发且手段不断升级的背景下,探索电信网络诈骗案件的主题聚类及演化趋势,旨在为政府高效、精准决策提供科学支持。[研究方法]基于某发达省份近两年全量电信网络诈骗案件数据,构建TC-LDA模型,挖掘电信网络... [研究目的]在电信网络诈骗案件频发且手段不断升级的背景下,探索电信网络诈骗案件的主题聚类及演化趋势,旨在为政府高效、精准决策提供科学支持。[研究方法]基于某发达省份近两年全量电信网络诈骗案件数据,构建TC-LDA模型,挖掘电信网络诈骗案件的主题特征并揭示其演化趋势,为政府部门电信网络诈骗提出针对性治理策略。[研究结果/结论]现有电信网络诈骗案件具有14类主题特征,可以进一步归纳为4个主题类别;已有案件表现出发展化、科技化、集中化的演化趋势。并针对结果提出了加强治理、提升科技化、推广集中化打击模式和建立反诈更新机制的对策,为提升我国电信网络诈骗防范治理能力提供了思路。 展开更多
关键词 电信网络诈骗 TC-lda模型 打击治理 主题挖掘 演化分析
在线阅读 下载PDF
基于LDA模型的跑鞋用户评论主题挖掘和演化分析 被引量:2
6
作者 强威 罗向东 张哲滔 《北京服装学院学报(自然科学版)》 2025年第1期27-35,共9页
跑鞋因其舒适性和多样性,已成为大众运动的热门选择,为了对跑鞋产品差异化竞争、市场策略制定和用户生态建设提供解决方案,本研究采用python环境下的潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)模型,对2016—2023年京东平台10... 跑鞋因其舒适性和多样性,已成为大众运动的热门选择,为了对跑鞋产品差异化竞争、市场策略制定和用户生态建设提供解决方案,本研究采用python环境下的潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)模型,对2016—2023年京东平台10万条跑鞋用户评论文本做了主题挖掘与演化分析。通过主题关键词分布、关键词聚类热图、主题地域分布和主题演化探讨跑鞋产品市场存在的问题,并针对结果提出对策建议。研究发现,国产跑鞋在功能性设计方面有待提高,产品尚未形成多样性使用场景,消费者对跑鞋评论尚未形成体系。未来需重点从建立跑鞋功能与用户群体匹配系统、打造具有地域性特征的跑鞋产品、创建企业用户交互式跑鞋社群论坛3个方面着手,以优化产品研发和市场服务策略。 展开更多
关键词 跑鞋 用户评论 lda模型 主题挖掘 主题演化
原文传递
基于LDA的我国国家安全研究演化趋势分析 被引量:1
7
作者 李子豪 王欣 《情报探索》 2025年第8期58-66,共9页
[目的/意义]揭示2014-2024年我国国家安全研究的研究热点和主题演化规律,为优化学科发展提供数据支撑。[方法/过程]基于CNKI文献摘要数据,运用LDA主题模型进行分阶段建模分析,利用文本挖掘提取多维度主题特征。采用主题强度计算和相似... [目的/意义]揭示2014-2024年我国国家安全研究的研究热点和主题演化规律,为优化学科发展提供数据支撑。[方法/过程]基于CNKI文献摘要数据,运用LDA主题模型进行分阶段建模分析,利用文本挖掘提取多维度主题特征。采用主题强度计算和相似度矩阵识别核心领域演化路径,最终通过桑基图实现跨阶段主题关联可视化。[结果/结论]国家安全研究领域呈现“传统安全-非传统安全-细分议题”三阶拓展路径;“总体国家安全观”促进多学科理论整合,形成交叉研究范式;研究视野向以人类命运共同体为核心的全球治理转型;政策驱动下构建“立法引领-理论创新”协同机制,新兴领域研究持续深化。 展开更多
关键词 国家安全 lda主题模型 主题演化 总体国家安全观
在线阅读 下载PDF
基于LDA模型的用户画像领域主题识别与演化分析
8
作者 申媛媛 鲁联 《情报探索》 2025年第6期105-113,共9页
[目的/意义]基于用户画像的智慧信息服务能够满足不同行业的需求,通过探讨用户画像领域的研究主题和发展演化,为主题后续的深入研究和实践服务提供参考和借鉴。[方法/过程]运用LDA模型进行主题分析,根据熵权法计算出各主题的综合热度,... [目的/意义]基于用户画像的智慧信息服务能够满足不同行业的需求,通过探讨用户画像领域的研究主题和发展演化,为主题后续的深入研究和实践服务提供参考和借鉴。[方法/过程]运用LDA模型进行主题分析,根据熵权法计算出各主题的综合热度,识别我国用户画像领域的新兴热点主题;基于各个发展阶段的词云图和主题相似度,探究主题的演化趋势和路径。[结果/结论]国内用户画像领域主要分为8个主题,其中用户体验、图书馆应用、社交网络传播、新媒体运营为新兴热点主题;研究分为3个发展阶段,不同主题之间联系紧密,研究内容也更加深入和细化,具有关联演化特征。 展开更多
关键词 用户画像 lda模型 主题热点 演化分析
在线阅读 下载PDF
基于LDA主题模型的我国职业教育研究主题演进分析
9
作者 程淑佳 刘琳琳 夏昉 《职业技术教育》 北大核心 2025年第36期64-71,共8页
系统分析研究主题的演进有利于厘清学科发展脉络与动态规律。基于2016-2024年北大核心与CSSCI收录的相关文献,运用LDA主题模型对我国职业教育研究的主题演进进行分析,结果显示:“十三五”期间职业教育研究热点集中于职教体系建构、技术... 系统分析研究主题的演进有利于厘清学科发展脉络与动态规律。基于2016-2024年北大核心与CSSCI收录的相关文献,运用LDA主题模型对我国职业教育研究的主题演进进行分析,结果显示:“十三五”期间职业教育研究热点集中于职教体系建构、技术技能人才和职教制度创新三大主题;而“十四五”期间研究重点转向数字化赋能、就业岗位需求和职普融通等前沿议题。研究发现,职教体系建构和就业岗位需求分别在前后两个时期占据主导地位,体现了职业教育研究从体系完善向质量与效能转型的发展脉络。主题演进特征表明:政策与制度推进、经济社会发展与产业转型和研究方法的创新等共同促进了主题的演进,并践行了“存史、资政、预警、引导”的职业教育研究职能。但也存在政策响应性强、理论构建薄弱、前瞻性不足等问题。基于此,未来职业教育研究应增加对基本问题的关注,夯实理论体系的底层逻辑;强化战略预判,构建引领未来的研究议程;促进持续深耕,推动知识的系统积累;推进方法创新,增强研究的科学性与实效性。 展开更多
关键词 lda主题模型 职业教育 主题演进 职教研究
在线阅读 下载PDF
基于OLDA的热点话题演化跟踪模型 被引量:18
10
作者 陈兴蜀 高悦 +3 位作者 江浩 杜敏 王海舟 何建云 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第5期130-136,共7页
为了发现论坛数据中感兴趣的话题并对话题进行演化跟踪,文中首先利用潜在狄利克雷分配(LDA)模型将文本由词汇空间降维到主题空间,然后采用聚类算法在主题空间对文本集进行聚类,并利用文中提出的热点话题检测方法得出热点话题.基于发现... 为了发现论坛数据中感兴趣的话题并对话题进行演化跟踪,文中首先利用潜在狄利克雷分配(LDA)模型将文本由词汇空间降维到主题空间,然后采用聚类算法在主题空间对文本集进行聚类,并利用文中提出的热点话题检测方法得出热点话题.基于发现的热点话题,文中提出了基于在线LDA(OLDA)话题模型的论坛热点话题演化跟踪模型(HTOLDA),该模型只选择热点话题进行先验传递,并通过设置同一话题相邻时间片的语义距离来判断话题的状态.实验结果表明,HTOLDA模型对各个时间片的论坛数据集的建模能力优于OLDA模型,并能够有效地对论坛中的热点话题进行演化跟踪. 展开更多
关键词 文本处理 lda话题模型 话题演化 话题跟踪 HTOlda话题模型
在线阅读 下载PDF
一种基于LDA的在线主题演化挖掘模型 被引量:37
11
作者 崔凯 周斌 +1 位作者 贾焰 梁政 《计算机科学》 CSCD 北大核心 2010年第11期156-159,193,共5页
基于文本内容的隐含语义分析建立在线主题演化计算模型,通过追踪不同时间片内主题的变化趋势进行主题演化分析。将Latent Dirichlet Allocation(LDA)模型扩展到在线文本流,建立并实现了在线LDA模型;利用前一时间片的后验概率影响当前时... 基于文本内容的隐含语义分析建立在线主题演化计算模型,通过追踪不同时间片内主题的变化趋势进行主题演化分析。将Latent Dirichlet Allocation(LDA)模型扩展到在线文本流,建立并实现了在线LDA模型;利用前一时间片的后验概率影响当前时间片的先验概率来维持主题间的连续性;根据改进的增量Gibbs算法进行推理,获取主题-词和文档-主题的概率分布,利用Kullback Leibler(KL)相对熵来衡量主题之间的相似度,从而发现主题演化中的"主题遗传"和"主题变异"。实验结果表明,该模型能从互联网语料中找出主题的演化趋势,具有良好的效果。 展开更多
关键词 主题模型 lda 演化 舆情
在线阅读 下载PDF
基于LDA-HMM的专利技术主题演化趋势分析——以船用柴油机技术为例 被引量:54
12
作者 陈伟 林超然 +1 位作者 李金秋 杨早立 《情报学报》 CSSCI CSCD 北大核心 2018年第7期732-741,共10页
如何在专利数据海洋中挖掘技术主题的研究现状、识别具有潜力的研发热点,对企业和国家来说都是至关重要的战略议题。针对目前技术主题演化趋势预测研究中存在的不足:技术创新过程中随机特征的忽视、人工分类的缺陷以及专业术语难以识别... 如何在专利数据海洋中挖掘技术主题的研究现状、识别具有潜力的研发热点,对企业和国家来说都是至关重要的战略议题。针对目前技术主题演化趋势预测研究中存在的不足:技术创新过程中随机特征的忽视、人工分类的缺陷以及专业术语难以识别等问题,本研究提出一种组合方法,首先使用维特比(Viterbi)算法识别专利文献中的专业术语,其次利用机器学习中的隐含狄利克雷分布(LDA)算法捕捉专利文献中潜在的技术主题聚类,分析各时期技术主题的分布特征和演变规律,然后结合包含双重随机过程的隐马尔可夫模型(HMM)对未来技术趋势进行定量预测,最后以船用柴油机技术为例,应用上述组合方法分析船用柴油机技术的主题分布、演化规律及未来趋势。对比实验显示本文方法具有有效性和实用价值。 展开更多
关键词 主题模型 隐含狄利克雷分布 隐马尔可夫过程 技术演化
在线阅读 下载PDF
Contrastive analysis in China and abroad on the Evolution of hot topics in the field of digital library based on LDA model 被引量:1
13
作者 Chunhui Tan Mengyuan Xiong 《Data Science and Informetrics》 2021年第2期110-130,共21页
Revealing and comparing the evolution process of hot topics in the field of Digital Library in China and abroad.[Methods]:Taking data in the field of Digital Library from core journals in CKNI and Web of Science from ... Revealing and comparing the evolution process of hot topics in the field of Digital Library in China and abroad.[Methods]:Taking data in the field of Digital Library from core journals in CKNI and Web of Science from 1990 s to 2020,topics are extracted by LDA model and hot topics are selected based on life cycle theory.Topic evolution paths are generated to contrast evolution of hot topics between home and abroad which are grouped into dimensions of technology and application.It fails to analyze the lagging performance and reasons of research hot topics in the field of Digital Library at home and abroad.In technological dimension of Digital Library,the research content in China lags behind that at abroad.In terms of application dimension,Chinese application tends to focus on social sciences,while application at abroad tends to focus on natural sciences.The evolution of overall research focus is U-shaped,which gradually shifted from technological research to application research,and now turn back to technological dimension.Nowadays,there are also many emerging topics combined with big data technology. 展开更多
关键词 lda model topic Life cycle topic evolution Digital Library Hot topic
原文传递
基于LDA模型的科技期刊主题演化研究 被引量:78
14
作者 李湘东 张娇 袁满 《情报杂志》 CSSCI 北大核心 2014年第7期115-121,共7页
提出一种基于LDA(Latent Dirichlet Allocation)潜在语义模型、全面研究科技期刊主题演化过程的方法。该方法根据科技期刊的特点引入时间因素,使用困惑度确定最优主题数目,通过LDA主题提取结果及JS散度,实现主题在强度和内容两方面的演... 提出一种基于LDA(Latent Dirichlet Allocation)潜在语义模型、全面研究科技期刊主题演化过程的方法。该方法根据科技期刊的特点引入时间因素,使用困惑度确定最优主题数目,通过LDA主题提取结果及JS散度,实现主题在强度和内容两方面的演化研究,并对不同时间窗口的主题稳定性做出相应分析。实验结果表明该方法可以较好地分析某一特定科技期刊的主题随时间的强度演化规律以及主题内容的演化趋势。 展开更多
关键词 lda模型 科技期刊 主题演化 主题稳定性
在线阅读 下载PDF
基于改进的在线LDA模型的主题演化分析 被引量:15
15
作者 何建云 陈兴蜀 +1 位作者 杜敏 江浩 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第2期547-553,共7页
为了解决OLDA模型中的主题混合和新主题不能及时发现的问题,基于OLDA模型提出一种改进的在线LDA模型(improved online LDA,IOLDA)。该模型根据主题强度为每个主题设置不同的遗传度,提出一种新的主题强度度量方法,根据文档-主题分布的集... 为了解决OLDA模型中的主题混合和新主题不能及时发现的问题,基于OLDA模型提出一种改进的在线LDA模型(improved online LDA,IOLDA)。该模型根据主题强度为每个主题设置不同的遗传度,提出一种新的主题强度度量方法,根据文档-主题分布的集中程度为文档设置不同的权值,该方法可以有效降低宽泛主题的强度得分;利用模型主题对齐的特点,采用Jensen-Shannon距离横向计算话题间的关联。实验结果表明:本文提出的方法能够有效地在线分析主题的演化。 展开更多
关键词 主题演化 主题遗传 主题强度 lda模型
在线阅读 下载PDF
基于LDA模型的国家间知识流动分析 被引量:11
16
作者 宋凯 李秀霞 +2 位作者 赵思喆 史盛楠 高丹 《情报杂志》 CSSCI 北大核心 2017年第6期55-60,共6页
[目的/意义]知识流动能推动一个国家的知识创新,通过中国与其他国家间的知识流动模式与流动过程中主题演变的研究,对深入理解国家间的知识流动过程具有重要意义。[方法/过程]将国家间知识转移和知识转化的过程作为国家间知识流动的完整... [目的/意义]知识流动能推动一个国家的知识创新,通过中国与其他国家间的知识流动模式与流动过程中主题演变的研究,对深入理解国家间的知识流动过程具有重要意义。[方法/过程]将国家间知识转移和知识转化的过程作为国家间知识流动的完整过程,以Web of Science为数据来源,依据其学科类别划分标准,以Information Science&Library Science(以下简称为ISLS)为例,利用LDA模型进行主题提取,分析中国对其他国家的知识转移和知识转化,以及知识转移和知识转化后的主题分布。[结果/结论]中国对其他国家的知识转移主要集中在7个主题;对美国的知识转移主要集中在5个主题;对韩国的知识转移主要集中在4个主题;美国和韩国的知识转化分别集中在3个主题,美国的研究主题更侧重个人隐私保护、文献计量、知识共享与企业创新,而韩国的研究主题更侧重信息鸿沟、网络计量、情报技术融合与创新。 展开更多
关键词 知识转移 知识转化 知识流动 lda模型 主题演变
在线阅读 下载PDF
基于LDA模型和话题过滤的研究主题演化分析 被引量:29
17
作者 李保利 杨星 《小型微型计算机系统》 CSCD 北大核心 2012年第12期2738-2743,共6页
针对目前科学技术文献数量激增、难以从总体上分析把握的现状,提出一种从科技文献中获得研究主题特征词并展现其演化趋势的方法.该方法先利用LDA(Latent Dirichlet Allocation)模型对不同时间片内的话题进行自动抽取,得到不同数量的话题... 针对目前科学技术文献数量激增、难以从总体上分析把握的现状,提出一种从科技文献中获得研究主题特征词并展现其演化趋势的方法.该方法先利用LDA(Latent Dirichlet Allocation)模型对不同时间片内的话题进行自动抽取,得到不同数量的话题.然后,通过话题过滤剔除意义有限的话题,并借助简单启发式规则选择种子话题.最后,再利用语义相关度将相邻时间片内内容相近的种子话题联系起来,以得到研究主题的演化趋势.实验结果表明,在不对话题生成进行人工干预的前提下,本文方法较真实地描述了研究主题强度和内容随时间的演化趋势,避免了无意义话题对研究主题演化的负面影响. 展开更多
关键词 lda模型 主题演化 种子话题 话题过滤 加权线性组合
在线阅读 下载PDF
基于LDA主题特征的自动文摘方法 被引量:24
18
作者 张明慧 王红玲 周国栋 《计算机应用与软件》 CSCD 2011年第10期20-22,46,共4页
近年来概率主题模型受到了研究者的广泛关注,LDA(Latent Dirichlet Allocation)模型是主题模型中具有代表性的概率生成模型之一,它能够检测文本的隐含主题。提出一个基于LDA模型的主题特征,该特征计算文档的主题分布与句子主题分布的距... 近年来概率主题模型受到了研究者的广泛关注,LDA(Latent Dirichlet Allocation)模型是主题模型中具有代表性的概率生成模型之一,它能够检测文本的隐含主题。提出一个基于LDA模型的主题特征,该特征计算文档的主题分布与句子主题分布的距离。结合传统多文档自动文摘中的常用特征,计算句子权重,最终根据句子的分值抽取句子形成摘要。实验结果证明,加入LDA模型的主题特征后,自动文摘的性能得到了显著的提高。 展开更多
关键词 自动文摘 lda 主题模型 多文档
在线阅读 下载PDF
基于LDA模型的研究领域热点及趋势分析 被引量:14
19
作者 杨星 李保利 金明举 《计算机技术与发展》 2012年第10期66-69,74,共5页
随着研究的不断深入以及信息传播手段的进步,与某个研究领域相关的科学文献越来越多,也越来越容易得到,然而要阅读和分析这些数以千计的文献,仅凭人力已经难于实现对该领域研究重点、研究热点以及趋势进行全面系统地分析。鉴于此,提出... 随着研究的不断深入以及信息传播手段的进步,与某个研究领域相关的科学文献越来越多,也越来越容易得到,然而要阅读和分析这些数以千计的文献,仅凭人力已经难于实现对该领域研究重点、研究热点以及趋势进行全面系统地分析。鉴于此,提出一种基于LDA模型对某研究领域在一定时期内的热点及趋势进行自动识别的方法。该方法利用Gibbs抽样计算模型参数,获取领域热点主题以及热点词语,通过按时间后离散的主题演化方法分析热点主题在时间轴上的强度演化。以中文信息处理领域为例,通过对《中文信息学报》2001—2010十年间发表的学术论文进行分析,自动获取中文信息处理领域十年内的研究热点以及热点主题在时间轴上的演化趋势。实验结果初步证明了该方法的有效性。 展开更多
关键词 研究热点 lda模型 GIBBS抽样 主题数目 主题演化
在线阅读 下载PDF
基于LDA模型的新闻话题的演化 被引量:29
20
作者 楚克明 李芳 《计算机应用与软件》 CSCD 2011年第4期4-7,26,共5页
新闻话题及演化的研究可以帮助人们快速了解和获取新闻内容。提出了一种挖掘新闻话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化。首先应用LDA(Latent Dirichlet Allocation Model)对不同时间段的文集进行话题的自动抽取,... 新闻话题及演化的研究可以帮助人们快速了解和获取新闻内容。提出了一种挖掘新闻话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化。首先应用LDA(Latent Dirichlet Allocation Model)对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;计算相邻时间段中任意两个话题的分布距离实现话题的关联。实验结果证明该方法不但可以描述同一个话题随时间的演化过程,还可以描述话题内容随时间的变化,反映了话题(或子话题)之间多对多的演化关系。 展开更多
关键词 潜在狄利克雷分配模型 话题关联 话题演化
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部