期刊文献+
共找到159篇文章
< 1 2 8 >
每页显示 20 50 100
基于传播图主题解耦的微博谣言集成式检测方法
1
作者 徐建民 王淇 张雄涛 《计算机应用研究》 北大核心 2026年第1期43-52,共10页
近期的微博谣言检测研究虽通过结合结构化信息学习微博传播过程来增强微博表示,却忽略了微博传播过程在不同主题中的差异,致使微博传播过程学习不准确,进而影响检测效果。针对上述问题,提出了一种基于传播图主题解耦的微博谣言集成式检... 近期的微博谣言检测研究虽通过结合结构化信息学习微博传播过程来增强微博表示,却忽略了微博传播过程在不同主题中的差异,致使微博传播过程学习不准确,进而影响检测效果。针对上述问题,提出了一种基于传播图主题解耦的微博谣言集成式检测方法。首先,依据微博的转发关系构建微博传播图,并基于文本内容和用户信息进行传播图初始化;其次,采用变分自编码器主题模型对微博传播图进行主题解耦,并引入自注意力图池化对微博传播图进行学习,以生成主题层面的微博传播图表示;最后,设计层次化集成机制从局部和全局两个层次对微博谣言进行集成式检测。实验采用公开的微博数据集对所提方法的有效性和合理性进行验证。相较于BiGCN、MGLAN、FGCN等主流基准方法,所提方法在准确率、召回率和F 1值三项指标上均有显著提升。实验结果验证了该方法在谣言检测任务中的有效性。 展开更多
关键词 微博谣言 传播图 主题解耦 图表示学习 集成式检测
在线阅读 下载PDF
一种基于Context Graph主题爬行算法的改进
2
作者 高庆芳 蒲宝卿 包蕾 《首都师范大学学报(自然科学版)》 2021年第3期12-16,共5页
为了解决传统的基于上下文图形爬行模型爬取效率低、特征词提取不精确的问题,本文采用了在现有的技术支持上,融入机器学习算法的思想,设计并实现了一种改进的基于主题的爬虫算法,结果表明该算法是有效的.
关键词 搜索引擎 Contextgraph主题 爬虫 特征权重
在线阅读 下载PDF
我国大语言模型的研究进展:基于知识图谱的研究主题识别 被引量:2
3
作者 潘辉 《情报探索》 2025年第3期123-134,共12页
[目的/意义]聚焦我国大语言模型研究领域,开展热点主题识别和研究进展分析,以期为大语言模型领域的理论研究和应用发展提供学理依据及实践指导。[方法/过程]采用信息计量法和内容分析法构建大语言模型研究领域的国内研究主题知识图谱,... [目的/意义]聚焦我国大语言模型研究领域,开展热点主题识别和研究进展分析,以期为大语言模型领域的理论研究和应用发展提供学理依据及实践指导。[方法/过程]采用信息计量法和内容分析法构建大语言模型研究领域的国内研究主题知识图谱,探索大语言模型相关研究的国内研究进展和发展趋势。[结果/结论]我国大语言模型研究领域主要涵盖大模型理论及技术、大语言模型赋能信息处理及服务、生成式AI应用场景及其风险治理、ChatGPT逻辑生成及实践进路、通用人工智能发展前景及法律规制5个研究主题,主要侧重于理论研究,从顶层设计上考量大语言模型发展的中国模式,并朝着理论与实践融合的精细化研究路径发展。针对研究方向存在的不足,从关注通用理论研究、加强多模态交互方法探索、强化中文模型类人性3个方向提出我国大语言模型领域的研究展望。 展开更多
关键词 大语言模型 主题识别 知识图谱 ChatGPT LLM
在线阅读 下载PDF
网络舆情演化多维特征及其可视化分析
4
作者 邱泽国 尹玉琛 +1 位作者 陈云豪 王天宇 《哈尔滨商业大学学报(自然科学版)》 2025年第3期376-384,共9页
从多维视角分析网络舆情的演化特征,对监管部门及时有效解决网民诉求、针对性治理舆情具有重要意义.基于舆情文本内容、话题参与用户和事件逻辑关系,从主题、用户和事理三个维度构建网络舆情演化多维特征分析模型,使用Python、neo4j和Ge... 从多维视角分析网络舆情的演化特征,对监管部门及时有效解决网民诉求、针对性治理舆情具有重要意义.基于舆情文本内容、话题参与用户和事件逻辑关系,从主题、用户和事理三个维度构建网络舆情演化多维特征分析模型,使用Python、neo4j和Gephi等工具对微博热点事件“郑州120延误救治”进行舆情演化研究,通过构建舆情主题挖掘模型、用户主题图谱和事理图谱并进行实证研究,归纳总结网络舆情传播与演化的多维特征.结果表明,本文构建的网络舆情演化多维特征模型能够深度探究网民关注的话题焦点,发现舆情传播过程中的重点引导与管控对象,明确舆情事件传播中的逻辑关系,对于监管部门把握事件全貌、追溯事件源头和厘清事件传播路径具有一定参考价值. 展开更多
关键词 网络舆情 演化分析 主题挖掘 知识图谱
在线阅读 下载PDF
我国图情领域经典阅读研究进展:基于知识图谱的主题识别与趋势分析
5
作者 潘辉 《晋图学刊》 2025年第4期67-79,共13页
文章采用信息计量法与内容分析法探索了我国图情领域经典阅读研究的热点主题与演化路径。研究结果表明,我国图情领域经典阅读研究主要围绕“内涵与价值”“书目构建”“行为分析”“推广方法”“分众推广服务”五个研究主题展开,呈现出... 文章采用信息计量法与内容分析法探索了我国图情领域经典阅读研究的热点主题与演化路径。研究结果表明,我国图情领域经典阅读研究主要围绕“内涵与价值”“书目构建”“行为分析”“推广方法”“分众推广服务”五个研究主题展开,呈现出“注重发掘时代价值”“内涵不断夯实”“方法论持续创新”“研究范式逐步凝练”这四个演化路径特征。最后,文章从加强内涵体系建设、关注新技术赋能、探索全民经典阅读模式三个方面提出了研究展望。 展开更多
关键词 经典阅读 图情领域 知识图谱 主题识别 趋势分析
在线阅读 下载PDF
基于技术距离测度的产业高价值专利识别研究
6
作者 冉从敬 蒋云龙 +2 位作者 李旺 贾志轩 程凡 《情报学报》 北大核心 2025年第12期1503-1522,共20页
高价值专利识别是抢占产业全球战略高地、推动产业持续高效健康发展的重要课题,可为产业关键核心技术的挖掘提供重要线索。本文从专利技术距离测度视角出发,在进行主题聚类提取领域上位类主题基础上,提出一种基于主题知识贡献距离与主... 高价值专利识别是抢占产业全球战略高地、推动产业持续高效健康发展的重要课题,可为产业关键核心技术的挖掘提供重要线索。本文从专利技术距离测度视角出发,在进行主题聚类提取领域上位类主题基础上,提出一种基于主题知识贡献距离与主题联系程度双维影响下的高价值专利识别方法。在主题知识贡献距离维度上,构建专利间分层专利引用网络,计算各专利与主题的持续知识贡献值,基于知识贡献时间序列计算主题间的动态时间规整(dynamic time warping,DTW)距离,形成主题知识贡献距离矩阵;在主题联系程度维度上,构建主题与专利二分图网络,结合专利共现频率与引用关系强度进行初始强度与全局逻辑计算,形成主题联系程度矩阵。融合双维度矩阵构建专利技术距离矩阵,基于技术距离矩阵进行各专利的绝对技术距离计算,选取阈值范围内的高绝对技术距离专利作为领域内高技术价值的专利。经验证数据集检验,本文方法的精准率达到0.8218,F1指标达到0.8014。基于此,对“生成式人工智能”领域专利进行实证,识别出产业内具有较高价值的专利1437件,并发现识别出的高价值专利集具有较高的转让比例,转让比例达58.59%。本文基于技术本质的视角对专利间的技术差距进行量化,打破了以往仅从外部特征或简单统计数据判断专利价值的局限性,提升了识别的准确性;同时,提出双维度的技术距离影响机理,进一步提升了识别的可解释性。 展开更多
关键词 高价值专利识别 技术距离 主题聚类 专利引用网络 二分图网络
在线阅读 下载PDF
融合输出关联和聚类图谱的突发舆情衍生主题发现 被引量:1
7
作者 王润周 张新生 《情报理论与实践》 北大核心 2025年第8期135-148,共14页
[目的/意义]通过在海量舆情数据中准确识别衍生话题,可解释性地挖掘衍生主题的演化过程,从而有效发掘危险话题,实现有针对性的舆论管控。[方法/过程]结合深度学习和复杂网络方法构建Graph-BERTopic主题模型。首先,通过加强模型的输出关... [目的/意义]通过在海量舆情数据中准确识别衍生话题,可解释性地挖掘衍生主题的演化过程,从而有效发掘危险话题,实现有针对性的舆论管控。[方法/过程]结合深度学习和复杂网络方法构建Graph-BERTopic主题模型。首先,通过加强模型的输出关联性显著提高主题聚类性能;其次,基于语义相似度将主题嵌入向量构建聚类图谱;最后,采用社区发现检测图谱中的衍生主题,采用最短路径算法捕捉主题间的演化关系。[结果/结论]对收集的“东航MU5735飞机失事”数据集进行实验验证,其聚类性能与多种基准模型相比取得最优性能,NPMI、TD分别达到0.187、0.873。通过聚类图谱划分的衍生主题结构的质量函数达到0.831。所构建的模型能够从大规模文本中精准挖掘衍生主题,可解释性地捕捉舆情主题之间的演变过程。 展开更多
关键词 网络舆情 输出关联 衍生主题发现 聚类图谱
原文传递
基于双向图注意力网络的潜在热点话题谣言检测 被引量:2
8
作者 李劭 蒋方婷 +1 位作者 杨鑫岩 梁刚 《计算机科学》 北大核心 2025年第3期277-286,共10页
现有社交网络谣言检测方法大多将社交网络中的单个帖子视为检测目标,存在因数据量不足而导致的检测冷启动问题,影响检测性能。另外,现有方法没有对海量社交网络信息中与检测无关的信息进行过滤,导致检测时延较长,性能较差。在分析谣言... 现有社交网络谣言检测方法大多将社交网络中的单个帖子视为检测目标,存在因数据量不足而导致的检测冷启动问题,影响检测性能。另外,现有方法没有对海量社交网络信息中与检测无关的信息进行过滤,导致检测时延较长,性能较差。在分析谣言的传播特征时,现有方法大多侧重于谣言传播过程中的静态特征,难以充分利用节点间的动态关系对复杂的传播过程进行表征,导致性能提升存在瓶颈。针对以上问题,文中提出了一种基于潜在热点话题和图注意力神经网络的谣言检测方法,该方法采用神经主题模型和潜在热点话题发现模型进行话题级别的谣言检测以克服冷启动问题,并设计了一个基于双向图注意力神经网络的检测模型TPC-BiGAT,分析谣言话题传播过程中的动态特征以进行谣言真实性检测。在3个公开数据集上进行了多次实验证明,该方法在准确率上较现有方法取得了3%~5%的显著提升,验证了所提方法的有效性。 展开更多
关键词 谣言检测 社交网络 潜在热点话题 图神经网络 主题聚类
在线阅读 下载PDF
结合主题图卷积神经网络与提示学习的短文本分类模型
9
作者 徐仁楷 李艳婷 潘尔顺 《机械设计与研究》 北大核心 2025年第5期235-242,共8页
短文本由于其长度较短,常见的分类模型难以提取其中有效的文本结构和语义信息,导致模型性能下降。针对这一问题,提出了一种结合主题信息的图卷积神经网络与提示学习的短文本分类模型TGCNPL。该模型通过基于伪文档的主题建模(PTM)挖掘文... 短文本由于其长度较短,常见的分类模型难以提取其中有效的文本结构和语义信息,导致模型性能下降。针对这一问题,提出了一种结合主题信息的图卷积神经网络与提示学习的短文本分类模型TGCNPL。该模型通过基于伪文档的主题建模(PTM)挖掘文本的潜在主题结构,并将这些主题信息融入图卷积神经网络中,以实现对文本全局结构特征的提取。同时,将PTM得到的主题信息与提示学习方法相结合,弥补短文本语义稀疏的问题,并利用预训练语言模型提取完善后的文本语义特征。最后,结合将通过图卷积神经网络获得的结构信息和预训练语言模型提取的语义信息,建立分类模型。在四个英文短文本数据集上的多次实验结果表明,TGCNPL模型相比基线模型具有更优越的分类性能。 展开更多
关键词 短文本分类 主题建模 图卷积神经网络 提示学习 预训练语言模型
原文传递
基于端到端图表示学习的新兴主题预测方法研究
10
作者 郭思成 梁镇涛 陈传夫 《情报理论与实践》 北大核心 2025年第11期169-179,共11页
[目的/意义]在科技创新驱动的背景下,准确预测新兴主题有助于把握未来科技发展趋势,对指引研究方向、优化产业布局具有重要价值。[方法/过程]针对新兴主题的产生与专利分类共现间的逻辑一致性,将新兴主题预测任务迁移至链路预测场景,设... [目的/意义]在科技创新驱动的背景下,准确预测新兴主题有助于把握未来科技发展趋势,对指引研究方向、优化产业布局具有重要价值。[方法/过程]针对新兴主题的产生与专利分类共现间的逻辑一致性,将新兴主题预测任务迁移至链路预测场景,设计了一种端到端的图表示学习新兴主题预测框架,并以基因工程领域专利数据对预测效果进行了验证。[结果/结论]实验结果表明,该方法能够捕捉未来新兴主题,拥有较好的稳健性和泛化能力。预测结果具备科学性,可以成为辅助新兴主题预测的有效方法路径。 展开更多
关键词 新兴主题预测 图表示学习 专利分类共现网络 链路预测
原文传递
“中文+专业”知识图谱的构建及应用前景——以“中文+土木工程”为例 被引量:2
11
作者 肖锐 侯尚余 张邝弋 《云南师范大学学报(对外汉语教学与研究版)》 2025年第1期63-74,共12页
当前“中文+专业”教育需求迅猛增长,如何高效地利用中文组织、检索并应用专业内的教学资源,已成为实现个性化精准教学亟待解决的挑战。以“中文+土木工程”为例,借助知识图谱对专业内容进行知识组织与可视化展示,能有效提升信息检索效... 当前“中文+专业”教育需求迅猛增长,如何高效地利用中文组织、检索并应用专业内的教学资源,已成为实现个性化精准教学亟待解决的挑战。以“中文+土木工程”为例,借助知识图谱对专业内容进行知识组织与可视化展示,能有效提升信息检索效率、促进跨领域知识的理解与应用。研究提出新的知识图谱构建路径:首先,分别基于LDA模型、BERT-LDA模型以及BERTopic模型对“中文+土木工程”文本内容进行主题建模;其次,基于Silhouette主题轮廓指数计算不同主题建模方法的聚类质量,以确定主题聚类最优的方案;然后,通过依存句法分析对“中文+土木工程”文本聚类结果进行语义三元组抽取,从而构建了“中文+土木工程”文本知识模型,共形成11大类的29549组实体以及31470组关系,为搭建适应“中文+土木工程”领域特点的知识图谱语义架构奠定了坚实基础;最后,利用Neo4j图数据库及本体编辑工具对“中文+土木工程”的知识本体进行构建与存储,并用Cypher查询语言进行知识建模。经理论构型与实际验证,本研究完整构建了基于主题聚类的“中文+土木工程”知识图谱,不仅为相关领域的研究人员提供了丰富的数据资源和强大的知识检索,而且该技术路径还具备良好的迁移性,对推动“中文+专业”交叉学科的发展具有重要意义。 展开更多
关键词 中文+专业 中文+土木工程 主题建模 知识图谱 教学资源
在线阅读 下载PDF
基于CiteSpace的八段锦国内外研究热点及发展趋势研究
12
作者 冯子龙 全浙平 《运动科学与健康研究》 2025年第4期45-53,共9页
目的:了解国内外八段锦的研究现状、关键点和发展趋势,为该领域的研究提供参考。方法:基于CNKI和Web of Science数据库,用CiteSpace软件对2014~2024年八段锦相关文献的年发文数、作者、机构、关键词、集群图谱、时间框架视图、发展趋势... 目的:了解国内外八段锦的研究现状、关键点和发展趋势,为该领域的研究提供参考。方法:基于CNKI和Web of Science数据库,用CiteSpace软件对2014~2024年八段锦相关文献的年发文数、作者、机构、关键词、集群图谱、时间框架视图、发展趋势与前沿进行可视化分析。结果:纳入中文文献1106篇,英文文献224篇,年发表量总体呈上升趋势。在作者与机构合作方面,国外略好于国内。健康促进、生活质量、健康、老年人、抑郁、焦虑是国内外该领域较多的研究主题。结论:国内外研究主题逐渐从八段锦的健康促进转向疾病干预的临床疗效研究。八段锦的应用从强身健体逐渐发展到疾病康复治疗。八段锦促进健康生活、干预疾病康复以及联合治疗提高生活质量等成为发展趋势。 展开更多
关键词 八段锦 网络知识图谱 热点主题 CITESPACE 健康促进
在线阅读 下载PDF
肿节风知识图谱构建与研究热点探析
13
作者 蔡关庆 卢晓南 +4 位作者 严小军 刘慧珍 李平安 卢婷 尚广彬 《华西药学杂志》 北大核心 2025年第5期570-576,共7页
肿节风为传统祛风湿药,常用于治疗肿瘤、血液病及免疫系统疾病等。现运用文献计量学方法对肿节风及相关研究进行可视化分析,揭示肿节风的研究动态,构建其知识图谱,挖掘科学热点,为后续的研究和应用提供参考。
关键词 肿节风 文献计量学 可视化分析 知识图谱 发展趋势 科学热点 化学成分 药理作用
原文传递
融合主题模型的图卷积神经网络知识图谱实体对齐
14
作者 李腾腾 杨光 《计算机系统应用》 2025年第4期207-217,共11页
实体对齐技术旨在识别并匹配不同知识图谱中指代同一实体的项,对于知识图谱的融合具有至关重要的作用,其在知识补全、社交网络分析等多个领域已经展现出广泛的应用潜力与显著的实用价值.随着基于知识表征学习的实体对齐方法的不断演进,... 实体对齐技术旨在识别并匹配不同知识图谱中指代同一实体的项,对于知识图谱的融合具有至关重要的作用,其在知识补全、社交网络分析等多个领域已经展现出广泛的应用潜力与显著的实用价值.随着基于知识表征学习的实体对齐方法的不断演进,研究者们开始探索利用实体之间的多种信息维度来计算相似度,从而评估源实体与目标实体之间的相似性.尽管如此,实体的部分属性信息在目前已有的方法中仍未得到充分利用,尤其是实体属性中的主题信息,通过主题模型能够识别出实体间更为显著的语义联系.针对这一研究,以实体属性的主题信息为核心,提出了一种实体对齐框架EAGT(knowledge graph entity alignment via graph convolutional network with biterm topic model),通过实体主题结合图卷积神经网络进行实体对齐.为了验证所提方法的有效性,在开源的数据集上进行了实验,结果表明,EAGT在大多数情况下均实现了性能提升. 展开更多
关键词 知识图谱 实体对齐 主题模型 图卷积神经网络
在线阅读 下载PDF
数字人民币研究的特征、路径及热点——基于Citespace的可视化分析
15
作者 李沅 王子 《中国商论》 2025年第22期123-127,共5页
随着数字人民币试点应用的全面推进,数字人民币在重塑支付体系、优化货币政策传导及促进数字经济发展中的战略价值日益凸显。本文基于中国知网(CNKI)2019—2025年359篇文献,运用CiteSpace可视化工具,从作者合作、机构共现、关键词聚类... 随着数字人民币试点应用的全面推进,数字人民币在重塑支付体系、优化货币政策传导及促进数字经济发展中的战略价值日益凸显。本文基于中国知网(CNKI)2019—2025年359篇文献,运用CiteSpace可视化工具,从作者合作、机构共现、关键词聚类等维度系统分析数字人民币研究的特征与趋势。研究发现:数字人民币研究热点集中于“货币政策”“数字经济”“金融科技”三大主题,其中“货币政策”中介中心性最高(0.37),凸显其理论融合潜力;学者与机构间合作密度低(网络密度0.0031),说明未形成稳定研究网络。本文通过探索数字人民币领域的知识演化路径与结构短板,旨在为跨学科协作提供理论支撑,同时也为政策制定者与学术界协同创新提供有益参考。 展开更多
关键词 数字人民币 热点主题 知识图谱 CITESPACE 可视化分析
在线阅读 下载PDF
面向知识体系构建的术语提取技术研究
16
作者 张岐坦 尹明辉 刘伟强 《计算机与网络》 2025年第2期142-148,共7页
术语作为知识体系的基本单元,其提取的准确率和效率直接影响到文本分析挖掘、知识图谱构建和智能信息推荐等智能应用的效果。系统总结了术语提取技术的发展现状,深入讨论了有监督、无监督、基于深度学习和基于大语言模型在内的多种术语... 术语作为知识体系的基本单元,其提取的准确率和效率直接影响到文本分析挖掘、知识图谱构建和智能信息推荐等智能应用的效果。系统总结了术语提取技术的发展现状,深入讨论了有监督、无监督、基于深度学习和基于大语言模型在内的多种术语提取方法,详细说明了面向知识体系构建的术语提取应用流程。对各种术语提取技术进行了总结与分析,说明了各自的优缺点和局限性,对术语提取技术的未来发展进行了展望和预测。 展开更多
关键词 术语提取 统计特征 词图模型 主题模型 深度学习 大语言模型 知识体系
在线阅读 下载PDF
自动关键词抽取研究综述 被引量:100
17
作者 赵京胜 朱巧明 +1 位作者 周国栋 张丽 《软件学报》 EI CSCD 北大核心 2017年第9期2431-2449,共19页
自动关键词抽取是从文本或文本集合中自动抽取主题性或重要性的词或短语,是文本检索、文本摘要等许多文本挖掘任务的基础性和必要性的工作.探讨了关键词和自动关键词抽取的内涵,从语言学、认知科学、复杂性科学、心理学和社会科学等多... 自动关键词抽取是从文本或文本集合中自动抽取主题性或重要性的词或短语,是文本检索、文本摘要等许多文本挖掘任务的基础性和必要性的工作.探讨了关键词和自动关键词抽取的内涵,从语言学、认知科学、复杂性科学、心理学和社会科学等多个方面研究了自动关键词抽取的理论基础.从宏观、中观和微观角度,回顾和分析了自动关键词抽取的发展、技术和方法.针对目前广泛应用的自动关键词抽取方法,包括统计法、基于主题的方法、基于网络图的方法等,总结了其关键技术和研究进展.对自动关键词抽取的评价方式进行了分析,对自动关键词抽取面临的挑战和研究趋势进行了预测. 展开更多
关键词 自动关键词抽取 机器学习 统计 主题 语言网络图
在线阅读 下载PDF
基于知识图谱的微博主题演变路径研究 被引量:15
18
作者 黄微 卢国强 赵旭 《情报理论与实践》 CSSCI 北大核心 2022年第3期173-181,共9页
为了更好地对微博舆情传播进行实时监管,维护微博舆情的良性运转,打造晴朗的微博舆情网络空间,文章结合微博运行机制,通过爬取微博数据,应用知识图谱的理论与方法,构建微博主题识别知识图谱以及微博主题演变知识图谱,进而发现微博主题... 为了更好地对微博舆情传播进行实时监管,维护微博舆情的良性运转,打造晴朗的微博舆情网络空间,文章结合微博运行机制,通过爬取微博数据,应用知识图谱的理论与方法,构建微博主题识别知识图谱以及微博主题演变知识图谱,进而发现微博主题演变路径,揭示了微博舆情传播中的主题演变情况以及发生演变的动态变化过程。 展开更多
关键词 微博舆情 微博主题 主题演变路径 知识图谱 实证研究
原文传递
基于LDA模型的微博话题发现技术研究 被引量:10
19
作者 李凤岭 朱保平 《计算机应用与软件》 CSCD 北大核心 2014年第10期24-26,66,共4页
微博中存在着数以亿计的用户,这些用户每天发布大量的信息。这些海量的微博信息给热点话题发现提出了严峻的挑战。应用LDA(Latent Dirichlet Allocation)模型对微博中隐含的话题进行建模,利用话题间的共享词汇将话题构成一个无向加权图... 微博中存在着数以亿计的用户,这些用户每天发布大量的信息。这些海量的微博信息给热点话题发现提出了严峻的挑战。应用LDA(Latent Dirichlet Allocation)模型对微博中隐含的话题进行建模,利用话题间的共享词汇将话题构成一个无向加权图,并通过PageRank算法将话题进行排名。实验结果表明,排名后返回给用户的话题的准确性明显高于未排名的结果。 展开更多
关键词 微博 话题 排名 LDA模型
在线阅读 下载PDF
基于概率主题建模的新闻文本可视化综述 被引量:10
20
作者 汤斯亮 程璐 +2 位作者 邵健 吴飞 鲁伟明 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2015年第5期771-782,共12页
伴随着信息技术的发展,传统纸质新闻逐渐向新媒体新闻转变.与此同时,近年来数据挖掘和自然语言处理等技术得到了极大的发展,使得对新闻所蕴含丰富语义和主题进行深度挖掘成为可能.然而,信息的超载使得主题可视化成为一个新的挑战,即如... 伴随着信息技术的发展,传统纸质新闻逐渐向新媒体新闻转变.与此同时,近年来数据挖掘和自然语言处理等技术得到了极大的发展,使得对新闻所蕴含丰富语义和主题进行深度挖掘成为可能.然而,信息的超载使得主题可视化成为一个新的挑战,即如何以更好的方式来呈现海量互联网文本所蕴含的主题.隐形语义分析(LDA)是近年来兴起的主题建模方法,被当前学术界认为是主流的主题建模技术.文中首先介绍以LDA为主的文本概率主题建模技术及其发展,讨论了新闻主题建模特点;随后概括对比新闻主题可视化的若干方法,并对其进行分类,分析不同方法的适用性和局限性;最后对新闻主题可视化进行总结和展望. 展开更多
关键词 概率图模型 主题建模 可视化
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部