期刊文献+
共找到116篇文章
< 1 2 6 >
每页显示 20 50 100
基于LDA模型的红山文化研究主题及演化分析 被引量:1
1
作者 薛伟莲 肖琳 《情报探索》 2025年第1期96-104,共9页
[目的/意义]红山文化是研究中华文明起源的重要线索,分析红山文化的研究主题及演化趋势,为相关学者对红山文化的后续研究提供参考。[方法/过程]运用LDA主题模型对国内红山文化的学术论文摘要进行主题挖掘,总结红山文化的研究主题,分析... [目的/意义]红山文化是研究中华文明起源的重要线索,分析红山文化的研究主题及演化趋势,为相关学者对红山文化的后续研究提供参考。[方法/过程]运用LDA主题模型对国内红山文化的学术论文摘要进行主题挖掘,总结红山文化的研究主题,分析每个研究主题的演化趋势。[结果/结论]国内红山文化的研究大致可分为5个研究主题:红山玉文化、红山文化旅游资源开发与建设、牛河梁遗址考古研究、新石器时期考古研究、中华文明起源研究。通过分析主题演化趋势得出:目前,学者们对红山文化旅游资源开发与建设较为关注。最后,结合5个研究主题及演化趋势为红山文化遗址的发展提出建议。 展开更多
关键词 红山文化 lda主题模型 主题挖掘 主题演化
在线阅读 下载PDF
生育友好视域下我国托育政策的时空嬗变特征与优化向度——基于31省397份政策文本的LDA主题建模
2
作者 洪秀敏 吕阳 《人口与经济》 北大核心 2025年第6期59-72,共14页
作为构建生育友好型社会的重要民生举措,0—3岁婴幼儿托育服务的高质量发展已成为国家战略布局的核心议题,既关乎千万家庭的切身福祉,也是保障人口长期均衡发展的关键政策着力点。研究基于供给型、环境型与需求型政策工具的分析框架,综... 作为构建生育友好型社会的重要民生举措,0—3岁婴幼儿托育服务的高质量发展已成为国家战略布局的核心议题,既关乎千万家庭的切身福祉,也是保障人口长期均衡发展的关键政策着力点。研究基于供给型、环境型与需求型政策工具的分析框架,综合运用内容分析法和LDA主题模型,对2019—2024年我国31个省份相继发布的397份地方托育政策文本进行系统梳理与主题挖掘,识别其演化路径,并在生育友好的视角下深入探讨我国托育政策的时空嬗变特征与未来优化向度。研究发现:我国托育政策发展在时序演变上历经框架初建与普惠启动期(2019—2020年)、供给扩容与体系深化期(2021—2022年)以及质量引领与多元探索期(2023—2024年)三大阶段。在空间分布上则进一步呈现政策工具结构不均,生育需求工具短缺迟滞;区域政策分化明显,东西托育政策侧重显著;生育友好导向趋于明确,供需协同机制亟待补强等显著特征。因此,为加快构建生育友好型社会,推动托育服务体系实现从有到优、从广覆盖到高质量的全面升级,未来我国托育政策发展须进一步优化政策工具结构,强化生育支持引领作用;追踪政策演化趋势,构建生育友好普惠体系;精准匹配供需关系,推进区域优质均衡发展。 展开更多
关键词 托育政策 政策工具 lda主题建模 时空嬗变 优化向度
在线阅读 下载PDF
基于LDA-Word2vec的人工智能技术主题演化与热点主题识别
3
作者 王向前 高润凤 李慧宗 《九江学院学报(自然科学版)》 2025年第2期19-31,共13页
为识别人工智能关键技术,深入研究人工智能技术发展态势,有助于国家和企业及时把握人工智能发展动向,本文以人工智能领域中2009—2023年的专利文献为基础,融合运用LDA模型和Word2vec词向量技术,从主题强度和内容双重维度系统考察技术主... 为识别人工智能关键技术,深入研究人工智能技术发展态势,有助于国家和企业及时把握人工智能发展动向,本文以人工智能领域中2009—2023年的专利文献为基础,融合运用LDA模型和Word2vec词向量技术,从主题强度和内容双重维度系统考察技术主题的动态演变过程,同时构建主题热度、新颖度、影响力指标识别人工智能阶段性的热点主题。研究结果表明:①结合LDA主题建模能力和Word2vec语义处理能力能够有效提升技术主题识别精度,直观呈现人工智能领域细粒度技术主题的演化规律与特征;②人工智能领域的技术主题主要分为核心算法与技术基础、感知与交互技术、自然语言与语义理解、数据处理与安全、智能应用与自动化5大类范畴,且主题之间的关联和互动日益紧密;③通过对设计的指标进行综合评估,可以较好识别2009—2014年、2015—2019年和2020—2023年3个不同阶段的热点技术主题。 展开更多
关键词 人工智能 lda模型 主题识别 Word2vec 主题演化 热点技术主题
在线阅读 下载PDF
基于TC-LDA模型的电信网络诈骗案件主题挖掘与演化 被引量:1
4
作者 许根玮 冯文刚 《情报杂志》 北大核心 2025年第10期86-96,共11页
[研究目的]在电信网络诈骗案件频发且手段不断升级的背景下,探索电信网络诈骗案件的主题聚类及演化趋势,旨在为政府高效、精准决策提供科学支持。[研究方法]基于某发达省份近两年全量电信网络诈骗案件数据,构建TC-LDA模型,挖掘电信网络... [研究目的]在电信网络诈骗案件频发且手段不断升级的背景下,探索电信网络诈骗案件的主题聚类及演化趋势,旨在为政府高效、精准决策提供科学支持。[研究方法]基于某发达省份近两年全量电信网络诈骗案件数据,构建TC-LDA模型,挖掘电信网络诈骗案件的主题特征并揭示其演化趋势,为政府部门电信网络诈骗提出针对性治理策略。[研究结果/结论]现有电信网络诈骗案件具有14类主题特征,可以进一步归纳为4个主题类别;已有案件表现出发展化、科技化、集中化的演化趋势。并针对结果提出了加强治理、提升科技化、推广集中化打击模式和建立反诈更新机制的对策,为提升我国电信网络诈骗防范治理能力提供了思路。 展开更多
关键词 电信网络诈骗 TC-lda模型 打击治理 主题挖掘 演化分析
在线阅读 下载PDF
基于LDA模型的跑鞋用户评论主题挖掘和演化分析 被引量:2
5
作者 强威 罗向东 张哲滔 《北京服装学院学报(自然科学版)》 2025年第1期27-35,共9页
跑鞋因其舒适性和多样性,已成为大众运动的热门选择,为了对跑鞋产品差异化竞争、市场策略制定和用户生态建设提供解决方案,本研究采用python环境下的潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)模型,对2016—2023年京东平台10... 跑鞋因其舒适性和多样性,已成为大众运动的热门选择,为了对跑鞋产品差异化竞争、市场策略制定和用户生态建设提供解决方案,本研究采用python环境下的潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)模型,对2016—2023年京东平台10万条跑鞋用户评论文本做了主题挖掘与演化分析。通过主题关键词分布、关键词聚类热图、主题地域分布和主题演化探讨跑鞋产品市场存在的问题,并针对结果提出对策建议。研究发现,国产跑鞋在功能性设计方面有待提高,产品尚未形成多样性使用场景,消费者对跑鞋评论尚未形成体系。未来需重点从建立跑鞋功能与用户群体匹配系统、打造具有地域性特征的跑鞋产品、创建企业用户交互式跑鞋社群论坛3个方面着手,以优化产品研发和市场服务策略。 展开更多
关键词 跑鞋 用户评论 lda模型 主题挖掘 主题演化
原文传递
基于LDA的我国国家安全研究演化趋势分析 被引量:1
6
作者 李子豪 王欣 《情报探索》 2025年第8期58-66,共9页
[目的/意义]揭示2014-2024年我国国家安全研究的研究热点和主题演化规律,为优化学科发展提供数据支撑。[方法/过程]基于CNKI文献摘要数据,运用LDA主题模型进行分阶段建模分析,利用文本挖掘提取多维度主题特征。采用主题强度计算和相似... [目的/意义]揭示2014-2024年我国国家安全研究的研究热点和主题演化规律,为优化学科发展提供数据支撑。[方法/过程]基于CNKI文献摘要数据,运用LDA主题模型进行分阶段建模分析,利用文本挖掘提取多维度主题特征。采用主题强度计算和相似度矩阵识别核心领域演化路径,最终通过桑基图实现跨阶段主题关联可视化。[结果/结论]国家安全研究领域呈现“传统安全-非传统安全-细分议题”三阶拓展路径;“总体国家安全观”促进多学科理论整合,形成交叉研究范式;研究视野向以人类命运共同体为核心的全球治理转型;政策驱动下构建“立法引领-理论创新”协同机制,新兴领域研究持续深化。 展开更多
关键词 国家安全 lda主题模型 主题演化 总体国家安全观
在线阅读 下载PDF
基于LDA模型的用户画像领域主题识别与演化分析
7
作者 申媛媛 鲁联 《情报探索》 2025年第6期105-113,共9页
[目的/意义]基于用户画像的智慧信息服务能够满足不同行业的需求,通过探讨用户画像领域的研究主题和发展演化,为主题后续的深入研究和实践服务提供参考和借鉴。[方法/过程]运用LDA模型进行主题分析,根据熵权法计算出各主题的综合热度,... [目的/意义]基于用户画像的智慧信息服务能够满足不同行业的需求,通过探讨用户画像领域的研究主题和发展演化,为主题后续的深入研究和实践服务提供参考和借鉴。[方法/过程]运用LDA模型进行主题分析,根据熵权法计算出各主题的综合热度,识别我国用户画像领域的新兴热点主题;基于各个发展阶段的词云图和主题相似度,探究主题的演化趋势和路径。[结果/结论]国内用户画像领域主要分为8个主题,其中用户体验、图书馆应用、社交网络传播、新媒体运营为新兴热点主题;研究分为3个发展阶段,不同主题之间联系紧密,研究内容也更加深入和细化,具有关联演化特征。 展开更多
关键词 用户画像 lda模型 主题热点 演化分析
在线阅读 下载PDF
基于LDA主题模型的我国职业教育研究主题演进分析
8
作者 程淑佳 刘琳琳 夏昉 《职业技术教育》 北大核心 2025年第36期64-71,共8页
系统分析研究主题的演进有利于厘清学科发展脉络与动态规律。基于2016-2024年北大核心与CSSCI收录的相关文献,运用LDA主题模型对我国职业教育研究的主题演进进行分析,结果显示:“十三五”期间职业教育研究热点集中于职教体系建构、技术... 系统分析研究主题的演进有利于厘清学科发展脉络与动态规律。基于2016-2024年北大核心与CSSCI收录的相关文献,运用LDA主题模型对我国职业教育研究的主题演进进行分析,结果显示:“十三五”期间职业教育研究热点集中于职教体系建构、技术技能人才和职教制度创新三大主题;而“十四五”期间研究重点转向数字化赋能、就业岗位需求和职普融通等前沿议题。研究发现,职教体系建构和就业岗位需求分别在前后两个时期占据主导地位,体现了职业教育研究从体系完善向质量与效能转型的发展脉络。主题演进特征表明:政策与制度推进、经济社会发展与产业转型和研究方法的创新等共同促进了主题的演进,并践行了“存史、资政、预警、引导”的职业教育研究职能。但也存在政策响应性强、理论构建薄弱、前瞻性不足等问题。基于此,未来职业教育研究应增加对基本问题的关注,夯实理论体系的底层逻辑;强化战略预判,构建引领未来的研究议程;促进持续深耕,推动知识的系统积累;推进方法创新,增强研究的科学性与实效性。 展开更多
关键词 lda主题模型 职业教育 主题演进 职教研究
在线阅读 下载PDF
基于OLDA的热点话题演化跟踪模型 被引量:18
9
作者 陈兴蜀 高悦 +3 位作者 江浩 杜敏 王海舟 何建云 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第5期130-136,共7页
为了发现论坛数据中感兴趣的话题并对话题进行演化跟踪,文中首先利用潜在狄利克雷分配(LDA)模型将文本由词汇空间降维到主题空间,然后采用聚类算法在主题空间对文本集进行聚类,并利用文中提出的热点话题检测方法得出热点话题.基于发现... 为了发现论坛数据中感兴趣的话题并对话题进行演化跟踪,文中首先利用潜在狄利克雷分配(LDA)模型将文本由词汇空间降维到主题空间,然后采用聚类算法在主题空间对文本集进行聚类,并利用文中提出的热点话题检测方法得出热点话题.基于发现的热点话题,文中提出了基于在线LDA(OLDA)话题模型的论坛热点话题演化跟踪模型(HTOLDA),该模型只选择热点话题进行先验传递,并通过设置同一话题相邻时间片的语义距离来判断话题的状态.实验结果表明,HTOLDA模型对各个时间片的论坛数据集的建模能力优于OLDA模型,并能够有效地对论坛中的热点话题进行演化跟踪. 展开更多
关键词 文本处理 lda话题模型 话题演化 话题跟踪 HTOlda话题模型
在线阅读 下载PDF
基于LDA模型的科技期刊主题演化研究 被引量:78
10
作者 李湘东 张娇 袁满 《情报杂志》 CSSCI 北大核心 2014年第7期115-121,共7页
提出一种基于LDA(Latent Dirichlet Allocation)潜在语义模型、全面研究科技期刊主题演化过程的方法。该方法根据科技期刊的特点引入时间因素,使用困惑度确定最优主题数目,通过LDA主题提取结果及JS散度,实现主题在强度和内容两方面的演... 提出一种基于LDA(Latent Dirichlet Allocation)潜在语义模型、全面研究科技期刊主题演化过程的方法。该方法根据科技期刊的特点引入时间因素,使用困惑度确定最优主题数目,通过LDA主题提取结果及JS散度,实现主题在强度和内容两方面的演化研究,并对不同时间窗口的主题稳定性做出相应分析。实验结果表明该方法可以较好地分析某一特定科技期刊的主题随时间的强度演化规律以及主题内容的演化趋势。 展开更多
关键词 lda模型 科技期刊 主题演化 主题稳定性
在线阅读 下载PDF
一种基于LDA的在线主题演化挖掘模型 被引量:37
11
作者 崔凯 周斌 +1 位作者 贾焰 梁政 《计算机科学》 CSCD 北大核心 2010年第11期156-159,193,共5页
基于文本内容的隐含语义分析建立在线主题演化计算模型,通过追踪不同时间片内主题的变化趋势进行主题演化分析。将Latent Dirichlet Allocation(LDA)模型扩展到在线文本流,建立并实现了在线LDA模型;利用前一时间片的后验概率影响当前时... 基于文本内容的隐含语义分析建立在线主题演化计算模型,通过追踪不同时间片内主题的变化趋势进行主题演化分析。将Latent Dirichlet Allocation(LDA)模型扩展到在线文本流,建立并实现了在线LDA模型;利用前一时间片的后验概率影响当前时间片的先验概率来维持主题间的连续性;根据改进的增量Gibbs算法进行推理,获取主题-词和文档-主题的概率分布,利用Kullback Leibler(KL)相对熵来衡量主题之间的相似度,从而发现主题演化中的"主题遗传"和"主题变异"。实验结果表明,该模型能从互联网语料中找出主题的演化趋势,具有良好的效果。 展开更多
关键词 主题模型 lda 演化 舆情
在线阅读 下载PDF
基于LDA-HMM的专利技术主题演化趋势分析——以船用柴油机技术为例 被引量:54
12
作者 陈伟 林超然 +1 位作者 李金秋 杨早立 《情报学报》 CSSCI CSCD 北大核心 2018年第7期732-741,共10页
如何在专利数据海洋中挖掘技术主题的研究现状、识别具有潜力的研发热点,对企业和国家来说都是至关重要的战略议题。针对目前技术主题演化趋势预测研究中存在的不足:技术创新过程中随机特征的忽视、人工分类的缺陷以及专业术语难以识别... 如何在专利数据海洋中挖掘技术主题的研究现状、识别具有潜力的研发热点,对企业和国家来说都是至关重要的战略议题。针对目前技术主题演化趋势预测研究中存在的不足:技术创新过程中随机特征的忽视、人工分类的缺陷以及专业术语难以识别等问题,本研究提出一种组合方法,首先使用维特比(Viterbi)算法识别专利文献中的专业术语,其次利用机器学习中的隐含狄利克雷分布(LDA)算法捕捉专利文献中潜在的技术主题聚类,分析各时期技术主题的分布特征和演变规律,然后结合包含双重随机过程的隐马尔可夫模型(HMM)对未来技术趋势进行定量预测,最后以船用柴油机技术为例,应用上述组合方法分析船用柴油机技术的主题分布、演化规律及未来趋势。对比实验显示本文方法具有有效性和实用价值。 展开更多
关键词 主题模型 隐含狄利克雷分布 隐马尔可夫过程 技术演化
在线阅读 下载PDF
Contrastive analysis in China and abroad on the Evolution of hot topics in the field of digital library based on LDA model 被引量:1
13
作者 Chunhui Tan Mengyuan Xiong 《Data Science and Informetrics》 2021年第2期110-130,共21页
Revealing and comparing the evolution process of hot topics in the field of Digital Library in China and abroad.[Methods]:Taking data in the field of Digital Library from core journals in CKNI and Web of Science from ... Revealing and comparing the evolution process of hot topics in the field of Digital Library in China and abroad.[Methods]:Taking data in the field of Digital Library from core journals in CKNI and Web of Science from 1990 s to 2020,topics are extracted by LDA model and hot topics are selected based on life cycle theory.Topic evolution paths are generated to contrast evolution of hot topics between home and abroad which are grouped into dimensions of technology and application.It fails to analyze the lagging performance and reasons of research hot topics in the field of Digital Library at home and abroad.In technological dimension of Digital Library,the research content in China lags behind that at abroad.In terms of application dimension,Chinese application tends to focus on social sciences,while application at abroad tends to focus on natural sciences.The evolution of overall research focus is U-shaped,which gradually shifted from technological research to application research,and now turn back to technological dimension.Nowadays,there are also many emerging topics combined with big data technology. 展开更多
关键词 lda Model topic Life cycle topic evolution Digital Library Hot topic
原文传递
基于改进的在线LDA模型的主题演化分析 被引量:15
14
作者 何建云 陈兴蜀 +1 位作者 杜敏 江浩 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第2期547-553,共7页
为了解决OLDA模型中的主题混合和新主题不能及时发现的问题,基于OLDA模型提出一种改进的在线LDA模型(improved online LDA,IOLDA)。该模型根据主题强度为每个主题设置不同的遗传度,提出一种新的主题强度度量方法,根据文档-主题分布的集... 为了解决OLDA模型中的主题混合和新主题不能及时发现的问题,基于OLDA模型提出一种改进的在线LDA模型(improved online LDA,IOLDA)。该模型根据主题强度为每个主题设置不同的遗传度,提出一种新的主题强度度量方法,根据文档-主题分布的集中程度为文档设置不同的权值,该方法可以有效降低宽泛主题的强度得分;利用模型主题对齐的特点,采用Jensen-Shannon距离横向计算话题间的关联。实验结果表明:本文提出的方法能够有效地在线分析主题的演化。 展开更多
关键词 主题演化 主题遗传 主题强度 lda模型
在线阅读 下载PDF
基于LDA主题模型和生命周期理论的科学文献主题挖掘 被引量:58
15
作者 关鹏 王曰芬 《情报学报》 CSSCI 北大核心 2015年第3期286-299,共14页
科学文献主题挖掘可以帮助科研人员快速准确的捕捉学科主题的脉络结构,跟踪主题演化发展,并对学科发展趋势做出预测。本文将LDA(Latent Dirichlet Allocation,潜在狄利克雷分配)主题模型与科学文献生命周期理论结合起来,提出一种... 科学文献主题挖掘可以帮助科研人员快速准确的捕捉学科主题的脉络结构,跟踪主题演化发展,并对学科发展趋势做出预测。本文将LDA(Latent Dirichlet Allocation,潜在狄利克雷分配)主题模型与科学文献生命周期理论结合起来,提出一种挖掘学科领域生命周期语义信息的方法。为了体现学科领域研究主题的动态语义信息,将科学文献按照时间特征划分,利用文献信息增长规律刻画学科领域生命周期,在此基础上,实现学科生命周期不同阶段、不同层次的主题抽取和主题演化。在由国内新能源领域的科学文献构成的语料库上的实验结果表明,该方法能够监测和追踪新能源研究热点和发展态势,能够为科学研究和科技政策制定提供决策支持。 展开更多
关键词 lda 生命周期 理论主题 抽取主题 演化新能源
在线阅读 下载PDF
基于LDA模型和话题过滤的研究主题演化分析 被引量:29
16
作者 李保利 杨星 《小型微型计算机系统》 CSCD 北大核心 2012年第12期2738-2743,共6页
针对目前科学技术文献数量激增、难以从总体上分析把握的现状,提出一种从科技文献中获得研究主题特征词并展现其演化趋势的方法.该方法先利用LDA(Latent Dirichlet Allocation)模型对不同时间片内的话题进行自动抽取,得到不同数量的话题... 针对目前科学技术文献数量激增、难以从总体上分析把握的现状,提出一种从科技文献中获得研究主题特征词并展现其演化趋势的方法.该方法先利用LDA(Latent Dirichlet Allocation)模型对不同时间片内的话题进行自动抽取,得到不同数量的话题.然后,通过话题过滤剔除意义有限的话题,并借助简单启发式规则选择种子话题.最后,再利用语义相关度将相邻时间片内内容相近的种子话题联系起来,以得到研究主题的演化趋势.实验结果表明,在不对话题生成进行人工干预的前提下,本文方法较真实地描述了研究主题强度和内容随时间的演化趋势,避免了无意义话题对研究主题演化的负面影响. 展开更多
关键词 lda模型 主题演化 种子话题 话题过滤 加权线性组合
在线阅读 下载PDF
基于LDA模型的国家间知识流动分析 被引量:11
17
作者 宋凯 李秀霞 +2 位作者 赵思喆 史盛楠 高丹 《情报杂志》 CSSCI 北大核心 2017年第6期55-60,共6页
[目的/意义]知识流动能推动一个国家的知识创新,通过中国与其他国家间的知识流动模式与流动过程中主题演变的研究,对深入理解国家间的知识流动过程具有重要意义。[方法/过程]将国家间知识转移和知识转化的过程作为国家间知识流动的完整... [目的/意义]知识流动能推动一个国家的知识创新,通过中国与其他国家间的知识流动模式与流动过程中主题演变的研究,对深入理解国家间的知识流动过程具有重要意义。[方法/过程]将国家间知识转移和知识转化的过程作为国家间知识流动的完整过程,以Web of Science为数据来源,依据其学科类别划分标准,以Information Science&Library Science(以下简称为ISLS)为例,利用LDA模型进行主题提取,分析中国对其他国家的知识转移和知识转化,以及知识转移和知识转化后的主题分布。[结果/结论]中国对其他国家的知识转移主要集中在7个主题;对美国的知识转移主要集中在5个主题;对韩国的知识转移主要集中在4个主题;美国和韩国的知识转化分别集中在3个主题,美国的研究主题更侧重个人隐私保护、文献计量、知识共享与企业创新,而韩国的研究主题更侧重信息鸿沟、网络计量、情报技术融合与创新。 展开更多
关键词 知识转移 知识转化 知识流动 lda模型 主题演变
在线阅读 下载PDF
基于LDA话题关联的话题演化 被引量:20
18
作者 楚克明 李芳 《上海交通大学学报》 EI CAS CSCD 北大核心 2010年第11期1496-1500,共5页
话题演化可以帮助人们快速获取信息和了解趋势.提出了一种挖掘话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化.对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;计算相邻时间段中任意2个话题的分布距... 话题演化可以帮助人们快速获取信息和了解趋势.提出了一种挖掘话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化.对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;计算相邻时间段中任意2个话题的分布距离和话题的特征向量相似度实现话题的关联.实验结果证明,该方法不但可以描述同一个话题随时间的强度变化,还可以描述新话题的产生,旧话题的消失以及话题内容随时间的演化. 展开更多
关键词 话题探测 话题关联 话题演化 潜在狄里特里分配
在线阅读 下载PDF
基于LDA的众筹项目在线评论主题动态演化分析 被引量:16
19
作者 王伟 高宁 +1 位作者 徐玉婷 王洪伟 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第10期103-123,共21页
【目的】揭示文本作者对项目的关注点以及态度变化,深入分析众筹项目在线评论主题动态演化规律。【方法】采用来自Kickstarter的6 537个科技类项目的 497 936条在线评论为语料,使用LDA进行建模,分析在线融资项目评论主题的演化过程,并... 【目的】揭示文本作者对项目的关注点以及态度变化,深入分析众筹项目在线评论主题动态演化规律。【方法】采用来自Kickstarter的6 537个科技类项目的 497 936条在线评论为语料,使用LDA进行建模,分析在线融资项目评论主题的演化过程,并使用余弦相似度得到主题状态的演化模式。【结果】融资初期在线评论聚焦于项目基本信息;融资中期聚焦于投资回报以及产品信息;融资末期聚焦于回报邮寄等。融资成功项目从项目信息描述、产品特征等过渡到等待产品以及产品到达等主题;融资失败项目主题逐渐演化为未来重启、项目前景。【局限】没有区分项目类别,未来需要尝试分析不同项目类别之间的差异。另外,仅聚焦于基于回报的众筹模式,而没有考虑其他众筹模式,如股权众筹、教育众筹等也是未来的研究方向。【结论】得到了众筹项目评论的主题强度、内容演化和状态演化,为众筹参与各方提供了丰富启示。 展开更多
关键词 众筹 在线评论 lda 主题演化 主题强度
原文传递
基于LDA模型的研究领域热点及趋势分析 被引量:14
20
作者 杨星 李保利 金明举 《计算机技术与发展》 2012年第10期66-69,74,共5页
随着研究的不断深入以及信息传播手段的进步,与某个研究领域相关的科学文献越来越多,也越来越容易得到,然而要阅读和分析这些数以千计的文献,仅凭人力已经难于实现对该领域研究重点、研究热点以及趋势进行全面系统地分析。鉴于此,提出... 随着研究的不断深入以及信息传播手段的进步,与某个研究领域相关的科学文献越来越多,也越来越容易得到,然而要阅读和分析这些数以千计的文献,仅凭人力已经难于实现对该领域研究重点、研究热点以及趋势进行全面系统地分析。鉴于此,提出一种基于LDA模型对某研究领域在一定时期内的热点及趋势进行自动识别的方法。该方法利用Gibbs抽样计算模型参数,获取领域热点主题以及热点词语,通过按时间后离散的主题演化方法分析热点主题在时间轴上的强度演化。以中文信息处理领域为例,通过对《中文信息学报》2001—2010十年间发表的学术论文进行分析,自动获取中文信息处理领域十年内的研究热点以及热点主题在时间轴上的演化趋势。实验结果初步证明了该方法的有效性。 展开更多
关键词 研究热点 lda模型 GIBBS抽样 主题数目 主题演化
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部