期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
数智化赋能视角下公共图书馆用户反馈挖掘与服务优化策略研究——基于BERT-LDA混合方法分析
1
作者 廖灵辰 郑静 钟一珂 《信息与管理研究》 2025年第2期51-63,共13页
作为公共文化服务体系的核心载体,公共图书馆在用户需求导向的发展理念下面临着服务精准化与反馈机制科学化的双重挑战。针对当前用户需求识别维度单一、反馈数据利用不足等现实问题,本研究创新性地构建了融合BERT预训练模型和LDA主题... 作为公共文化服务体系的核心载体,公共图书馆在用户需求导向的发展理念下面临着服务精准化与反馈机制科学化的双重挑战。针对当前用户需求识别维度单一、反馈数据利用不足等现实问题,本研究创新性地构建了融合BERT预训练模型和LDA主题建模的混合分析框架。通过Python网络爬虫系统获取互联网本地生活平台的用户评论语料库,应用BERT进行细粒度情感分析,定量解析用户满意度空间分布特征及地域差异。在此基础上,引入情感分层的双通道LDA主题分析框架,从31484条有效评论中系统解构用户需求特征与情感动因。实证研究表明:(1)用户总体对图书馆服务持积极态度,呈现出东部包括港澳台、中部地区略高,西部、东北地区稍低的特点;(2)正向评价聚焦于基础设施智能化、文化资源丰富度及数字服务创新性等维度;(3)负面意见多集中于空间规划合理性、服务响应时效性等层面。基于此,本文提出针对性的优化路径,旨在为完善数智化背景下公共图书馆的用户反馈机制和智慧化转型提供数据支持,推动公共文化机构服务的可持续优化。 展开更多
关键词 公共图书馆 在线评论 bert-lda 情感分析 需求识别
在线阅读 下载PDF
基于BERT-LDA集成模型的地理研究主题提取方法:以小微湿地为例
2
作者 陈文君 周陈新 +4 位作者 Tom Lotz 封宇乾 朱明宇 陈旻 贺斌 《地球信息科学学报》 北大核心 2025年第10期2482-2497,共16页
【目的】地理学研究,尤其是对新兴地理概念的研究,受限于学科固有的复杂性以及多元研究视角,不同研究主体在认知取向和关注重点上常常存在差异,进而导致概念表述呈现多样化与异质性,影响领域知识的有效检索与系统整合。以文本主题模型... 【目的】地理学研究,尤其是对新兴地理概念的研究,受限于学科固有的复杂性以及多元研究视角,不同研究主体在认知取向和关注重点上常常存在差异,进而导致概念表述呈现多样化与异质性,影响领域知识的有效检索与系统整合。以文本主题模型为代表的地理研究主题提取方法为解决上述问题提供了关键技术路径,然而现有模型在语义解析与表达过程中存在可解释性不足的问题,呈现出“黑箱”特征,限制了该方法的实际应用。【方法】本研究以具有多学科交叉特征的“小微湿地”概念为例,提出一种基于BERT-LDA集成模型的地理研究主题提取方法。该方法融合BERT模型在长文本语义理解方面的优势与LDA模型在主题可解释性方面的能力,从大量期刊论文中提取并揭示小微湿地的研究主题及其内在关联,并通过构建论文检索规则,促进领域知识的深化与拓展。【结果】将论文中词语的高维语义特征向量有效嵌入低维主题空间,并在关键词主题影响力的计算过程中,引入特征融合调节因子,能够提升文本主题模型的语义解析与表达能力,克服现有模型的“黑箱”局限性。同时,所提出的模型迭代运行方式,能够逐步提升输出主题的区分度和代表性,并优化关键词在对应主题语义空间中的分布结构。基于万方数据库检索的2012—2022年出版的4606篇中文期刊论文,集成模型识别出“湿地污染净化”“城市湿地公园”“池塘水产养殖”是小微湿地的三大研究主题,进一步提取并构建由“植物”“去除”“污水”“微生物”“城市”“景观”等11个关键词构成的112条论文检索规则,实现在不依赖具体术语和命名的条件下,对领域相关论文的有效检索。【结论】在地理学综合性与交叉性的研究背景下,本文提出的方法能够从知识工程角度,有效整合因术语多样化和命名异质性而造成的分散化的领域知识,为提升学术知识挖掘方法的可解释性提供可行路径。同时,研究成果对小微湿地的保护与管理实践具有一定参考价值。 展开更多
关键词 文献研究主题 文本主题模型 术语多样性 小微湿地 BERT LDA 论文检索规则
原文传递
基于BERT-LDA的国外LIS领域学科交叉研究演化分析与前沿主题识别 被引量:5
3
作者 袁毅 孟盈 《数字图书馆论坛》 CSSCI 2024年第9期1-15,共15页
识别学科交叉研究的前沿主题,并对演化趋势进行分析,有助于揭示学科交叉融合的方向,为未来创新性、突破性研究提供参考。首先,基于引文视角构建测度论文学科交叉性的指标,识别具有学科交叉性的研究论文;其次,通过BERT-LDA模型识别研究主... 识别学科交叉研究的前沿主题,并对演化趋势进行分析,有助于揭示学科交叉融合的方向,为未来创新性、突破性研究提供参考。首先,基于引文视角构建测度论文学科交叉性的指标,识别具有学科交叉性的研究论文;其次,通过BERT-LDA模型识别研究主题,利用余弦相似度计算主题之间的相似度,构建主题演化路径;最后,基于新颖度、增长性、关注度、影响力构建前沿主题识别指标体系,识别具有前沿性的学科交叉研究主题。以图书情报学(Library and Information Science,LIS)为例展开研究,研究结果显示,2004—2023年该学科领域的交叉研究主题呈现出逐渐细化和深入的特点,主要集中在信息挖掘与知识发现、互联网信息行为、医疗信息学3个方面;现阶段学科交叉研究前沿主题为医疗数据模型、舆情治理与情感分析、机器学习与深度学习;基于信息技术的研究方法和其在不同领域的应用研究具有良好的应用前景,有可能成为未来LIS领域的核心研究主题。 展开更多
关键词 研究前沿 主题演化 学科交叉 bert-lda 主题识别 图书情报学 信息科学 图书馆学
在线阅读 下载PDF
基于BERT-LDA模型的新冠肺炎疫情网络舆情演化仿真 被引量:29
4
作者 庄穆妮 李勇 +3 位作者 谭旭 毛太田 蓝凯城 邢立宁 《系统仿真学报》 CAS CSCD 北大核心 2021年第1期24-36,共13页
构建大规模网络舆情演化仿真模型,对新冠疫情武汉重灾区与全国其他地区采取差异化的应急管理和舆情疏导具有指导价值。为实现主题细粒度的舆情情感演化仿真,将LDA(Latent Dirichlet Allocation)主题模型与BERT(Bidirectional Encoder Re... 构建大规模网络舆情演化仿真模型,对新冠疫情武汉重灾区与全国其他地区采取差异化的应急管理和舆情疏导具有指导价值。为实现主题细粒度的舆情情感演化仿真,将LDA(Latent Dirichlet Allocation)主题模型与BERT(Bidirectional Encoder Representations from Transformers)词向量深度融合,优化主题向量助力文本主题聚类;同时,在改进BERT预训练任务的基础上,叠加深度预训练任务,以提高模型在情感分类中的精确度。结果表明:在主题向量训练过程中,改进的BERT-LDA模型较原始LDA模型NPMI(Normalized Pointwise Mutual Information)值提升0.357;在疫情事件情感分类任务上,AUC(Area Under the Curve)值超过了99.6%,证明其能够有效运用于大规模网络舆情演化仿真。 展开更多
关键词 新冠肺炎疫情 bert-lda模型 舆情演化仿真 差异性比较
原文传递
基于BERT-LDA和K-means聚类的绘画作品价值评估指标体系构建
5
作者 李天义 刘勤明 《软件工程》 2024年第1期68-73,共6页
针对目前绘画领域缺乏标准的价值评估指标体系,提出了基于BERT-LDA和K-means聚类的绘画作品价值要素挖掘方法。运用超平面法对绘画文献进行了停用词筛选,基于BERT-LDA模型构建了包含文本语义信息的融合特征向量,运用K-means算法对融合... 针对目前绘画领域缺乏标准的价值评估指标体系,提出了基于BERT-LDA和K-means聚类的绘画作品价值要素挖掘方法。运用超平面法对绘画文献进行了停用词筛选,基于BERT-LDA模型构建了包含文本语义信息的融合特征向量,运用K-means算法对融合特征向量进行降维可视化,随之构建了绘画作品价值评估指标体系。结果表明,基于BERT-LDA模型和K-means算法识别的主题及主题词相比传统LDA模型的查准率、查全率和F值分别提升了28.5%、10%和21.5%。通过随机森林等算法对指标体系进行验证,验证了构建的绘画作品价值评估指标体系的科学性。 展开更多
关键词 bert-lda 融合特征向量 K-MEANS聚类 绘画 指标体系
在线阅读 下载PDF
基于BERT-LDA模型的短文本主题挖掘 被引量:3
6
作者 张震 汤鲲 邱秀连 《计算机与数字工程》 2023年第9期2098-2102,共5页
传统的主题模型在对短文本建模时,会由于词汇稀疏导致模型效果不好。论文针对短文本数据特征,提出了BERT-LDA主题挖掘模型(Short Text Topic Mining Based on BERT and LDA),该算法通过使用预训练BERT模型提取文本语义特征,再通过K-mean... 传统的主题模型在对短文本建模时,会由于词汇稀疏导致模型效果不好。论文针对短文本数据特征,提出了BERT-LDA主题挖掘模型(Short Text Topic Mining Based on BERT and LDA),该算法通过使用预训练BERT模型提取文本语义特征,再通过K-means聚类算法将短文本聚合成长文本再进行主题建模,从而扩充单条文本包含的语义特征,有效降低了词汇稀疏性,从而提升模型效果。通过在实际数据上进行对比实验证明,与LDA和BTM模型相比,该算法能够取得更低的困惑度。 展开更多
关键词 预训练模型 BERT LDA 文本聚类 主题挖掘
在线阅读 下载PDF
基于BERT-LDA的关键技术识别方法及其实证研究——以农业机器人为例 被引量:65
7
作者 王秀红 高敏 《图书情报工作》 CSSCI 北大核心 2021年第22期114-125,共12页
[目的/意义]好的关键技术识别方法能够更好地为各层各级的关键技术识别、预测和研发提供支撑。[方法/过程]提出基于BERT-LDA模型的关键技术识别方法,通过将BERT与LDA相结合,以弥补单一使用LDA主题模型缺乏上下文语义信息的缺陷,并以农... [目的/意义]好的关键技术识别方法能够更好地为各层各级的关键技术识别、预测和研发提供支撑。[方法/过程]提出基于BERT-LDA模型的关键技术识别方法,通过将BERT与LDA相结合,以弥补单一使用LDA主题模型缺乏上下文语义信息的缺陷,并以农业机器人为例进行实证研究。具体包括以下过程:①基于python构建BERT语义特征向量和LDA主题特征向量,将其在高维空间进行向量拼接,利用自编码器学习连接向量的低维潜在空间表示;②在潜在空间表示上使用K-means算法实现语义关联聚类,得到二维聚类效果图及关键技术主题词云图;③进行关键技术判定;④在农业机器人技术领域,与基于德温特TI专利软件的专利分析结果和《中国制造2025》重点领域技术路线图中农业装备关键共性技术清单对比,实证本方法的有效性。[结果/结论]研究表明:BERT-LDA模型提高了主题聚类的连贯性及细粒度划分的精准度;具有很好的关键技术识别精准率和召回率;对识别的不同数据库和出版类型的文献数据集具有较好的包容性与兼容性,适应性强;可广泛应用于各类关键技术的识别。 展开更多
关键词 关键技术识别 农业机器人 bert-lda模型 德温特专利
原文传递
融合SAO和BERT-LDA的古籍保护关键技术识别研究 被引量:1
8
作者 王秀红 王同玉 《汉字文化》 2024年第4期198-201,共4页
古籍保护肩负着传承文化的职能,是国家“十四五”规划和2035远景目标之一。对古籍保护技术的概念界定及其关键技术识别将促进相关技术的利用和创新,助推古籍保护工作。在原生性保护、再生性保护和传承性保护思路下对古籍保护技术进行界... 古籍保护肩负着传承文化的职能,是国家“十四五”规划和2035远景目标之一。对古籍保护技术的概念界定及其关键技术识别将促进相关技术的利用和创新,助推古籍保护工作。在原生性保护、再生性保护和传承性保护思路下对古籍保护技术进行界定。以德温特创新平台(DI)全球专利数据库收录的古籍相关专利为数据源,基于DI专家改写的DWPI专利摘要文本,融合SAO和BERT-LDA构建深度学习模型,验证其有效性并用以识别古籍保护关键技术主题;使用K-means算法实现语义关联聚类,结合古籍保护专家知识、DI主题聚类、具体技术内容解读,判定并验证关键技术主题名称。融合SAO实体结构和BERT-LDA的模型聚类效果佳;主题数为5时类内具有最高的连贯性与一致性;识别出古籍保护关键技术主题:脱酸加固、保存环境控制、破损修复、数字化及整理出版、展示推广技术。本研究丰富了技术识别模型,助推古籍保护技术专题数据库建设,为古籍保护的相关工作、技术研发、技术推广应用等提供了技术信息参考。 展开更多
关键词 古籍保护 关键技术识别 SAO bert-lda
原文传递
基于LDA和BERT模型的网络舆情监测实验平台设计
9
作者 郭毅 涂婧璐 《武汉工程职业技术学院学报》 2025年第4期32-39,55,共9页
当前网络已经成为公众发表个人意见、态度和情绪的重要场所,而无序的互联网环境容易将某些言论放大,形成具有负面影响的网络舆情事件,而通过监测识别与干预,引导失控的网络舆论回到正轨,避免恶劣影响是网络舆情监测的主要任务,也是学生... 当前网络已经成为公众发表个人意见、态度和情绪的重要场所,而无序的互联网环境容易将某些言论放大,形成具有负面影响的网络舆情事件,而通过监测识别与干预,引导失控的网络舆论回到正轨,避免恶劣影响是网络舆情监测的主要任务,也是学生课程学习应具备的技能。基于OBE理念设计了网络舆情监测实验平台,通过LDA主题模型挖掘文本深层语义信息并结合词频统计,对评论文本进行主题标识,通过BERT预训练模型对评论内容进行情感极性分类,以实现舆情大数据的主题挖掘和情感分类,培养学生具备有效跟踪热点舆情、分析公众的情绪变化倾向、对舆情的发展演化趋势进行评估预判并提出合理化建议的能力。 展开更多
关键词 舆情监测 LDA模型 BERT模型 网络舆情 网络传播
在线阅读 下载PDF
基于预训练大模型的电信诈骗案件分类研究
10
作者 王江涛 《智能计算机与应用》 2025年第12期69-73,共5页
电信诈骗案件的增加对社会安全和经济稳定造成严重威胁。传统的诈骗案件分类方法主要依赖于人工经验,分类效率低、准确性不高。本文提出了一种基于双向Trnsformer编码器表征模型(Bidirectional Encoder Representations from Transforme... 电信诈骗案件的增加对社会安全和经济稳定造成严重威胁。传统的诈骗案件分类方法主要依赖于人工经验,分类效率低、准确性不高。本文提出了一种基于双向Trnsformer编码器表征模型(Bidirectional Encoder Representations from Transformers,BERT)与潜在狄利克雷分配模型(Latent Dirichlet Allocation,LDA)主题建模的特征融合模型,用于电信诈骗文本笔录的特征提取以及分类。该模型结合了BERT模型的深度语义理解能力与LDA主题建模的文本主题分析能力,通过特征融合技术,将两者提取的特征进行有效整合,从而更全面地捕捉电信诈骗文本笔录的关键信息。实验结果表明,该模型的分类准确率达95.24%,F1-score为95.04%,显著优于GLM-4模型;在12类诈骗案件中如刷单返利、冒充电商客服等,均表现出色,分类效果稳定,数据依赖性较强。融合BERT与LDA的模型能有效捕捉文本语义与主题特征,为电信诈骗案件智能化分类提供了高效解决方案,对提升警务工作效率具有重要实践价值。 展开更多
关键词 BERT模型 LDA主题建模 案件分类 电信诈骗 GLM-4模型
在线阅读 下载PDF
基于LGCM-BERT的文本情感分析研究
11
作者 张仲千 杜艳平 +1 位作者 窦水海 白慧娟 《北京印刷学院学报》 2025年第6期21-28,共8页
评论文本中由于词域开放、词序颠倒、一词多义和上下文信息缺乏等问题,文本利用率低、有效信息提取困难,同时,现有的情感分析模型在分类过程中往往忽略文本主题信息对分类效果的影响。针对以上问题,提出一种融入主题信息与跨区域多头自... 评论文本中由于词域开放、词序颠倒、一词多义和上下文信息缺乏等问题,文本利用率低、有效信息提取困难,同时,现有的情感分析模型在分类过程中往往忽略文本主题信息对分类效果的影响。针对以上问题,提出一种融入主题信息与跨区域多头自注意力机制的LGCM-BERT文本情感分析模型。该模型以BERT-BiGRU-TextCNN为基础,通过LDA模型提取文本主题词,结合BERT词嵌入层生成词向量;利用BiGRU获取词间依赖关系与双向上下文信息;采用TextCNN层捕捉文本的局部相关性;使用跨区域多头自注意力机制在不同主题区域之间建立更强关联与理解,提取和整合主题词特征信息,显著提高了情感分析的准确率。在实验数据集上的实验表明,该模型与传统的情感分析模型相比,有效地提高了分类性能。 展开更多
关键词 BERT BiGRU TextCNN LDA 跨区域多头自注意力
在线阅读 下载PDF
基于LDA和BERT模型的道德评价主题演化分析——以社会热点事件的网络讨论为例
12
作者 蔡丽 《宜春学院学报》 2025年第8期44-50,共7页
道德评价是人们道德生活的重要组成部分,是透视人们道德认知和道德素养的一个重要窗口。社会热点事件“5·4 K435列车持刀杀人案”引发的网络讨论蕴含大量道德评价数据。运用LDA和BERT模型对这些讨论数据进行主题挖掘和情感分析,发... 道德评价是人们道德生活的重要组成部分,是透视人们道德认知和道德素养的一个重要窗口。社会热点事件“5·4 K435列车持刀杀人案”引发的网络讨论蕴含大量道德评价数据。运用LDA和BERT模型对这些讨论数据进行主题挖掘和情感分析,发现道德评价文本大数据可以聚类为五个主题,包括底线责任和见义勇为高尚品德两类道德标准,对安检、凶手和受害者三者的道德评价;五大聚类主题的情感偏负面,既反映了公众对恶性事件的批判与担忧,又表达了对见义勇为还是不为的犹豫和分化态度。在科学把握人们道德评价的基础之上,可以有针对性地采取相关的道德教育、宣传引导和政策完善来提升人们的道德认知和推动人们的道德实践。 展开更多
关键词 道德评价 LDA模型 BERT模型
在线阅读 下载PDF
基于文本深度聚类的意见领袖识别模型研究 被引量:2
13
作者 王世航 汤艳君 薛秋爽 《中国人民警察大学学报》 2024年第4期31-36,78,共7页
网络舆情事件所引发的犯罪呈高发态势,而传统意见领袖识别方法通常基于用户信息、转发、评论数等元数据,忽略了网络结构和文本内容等关键信息,缺乏意见领袖观点,容易导致结果偏差。针对上述问题,提出结合语义聚类的意见领袖识别模型,通... 网络舆情事件所引发的犯罪呈高发态势,而传统意见领袖识别方法通常基于用户信息、转发、评论数等元数据,忽略了网络结构和文本内容等关键信息,缺乏意见领袖观点,容易导致结果偏差。针对上述问题,提出结合语义聚类的意见领袖识别模型,通过BERT-LDA&DEC算法对用户文本进行聚类,根据不同子话题对意见领袖进行分组,提取关键词,通过将分组后的用户从网络拓扑、个人属性、活跃度三个方面建立指标体系,使用熵权灰色关联法对用户指标进行评价,最后结合聚类关键词进行综合分析。实验证明,该方法可以有效识别微博话题中不同子话题中的意见领袖及其观点。 展开更多
关键词 DEC深度嵌入聚类 意见领袖 熵权灰色关联法 bert-lda
在线阅读 下载PDF
多维视角下新一代人工智能技术的公众感知研究 被引量:9
14
作者 聂思言 杨江华 《情报杂志》 CSSCI 北大核心 2024年第9期130-138,共9页
[研究目的]社交媒体评论是分析研判公众对新技术应用态度感知的重要对象,为突破传统文本主题挖掘技术的随机性弊端以及情感分析技术的单一性限制,提升文本数据量化分析的精准性以及实现更佳的可视化效果,亟需构建新的主题模型方法与情... [研究目的]社交媒体评论是分析研判公众对新技术应用态度感知的重要对象,为突破传统文本主题挖掘技术的随机性弊端以及情感分析技术的单一性限制,提升文本数据量化分析的精准性以及实现更佳的可视化效果,亟需构建新的主题模型方法与情感分析手段。[研究方法]通过建立结构性融合的深度学习模型——BERT-LDA模型,以ChatGPT微博评论文本为研究对象,利用BERT和LDA分别提取文本的复杂语义信息和关键主题,实现了对深度隐藏主题特征的挖掘,并基于BERT情感分析,从整体、主题和态度多维度视角设计了情感演化的可视化分析。[研究结论]研究表明,BERT-LDA模型能够高效处理大规模、短文本、非结构的社交媒体评论数据,成功识别出公众对ChatGPT在就业教育、未来发展、产品开发、技术变革等不同领域带来影响的态度差异;与传统主题识别模型(LDA、TF-IDF、BERT)相比,BERT-LDA模型在主题识别效果和泛化能力上表现更优,尤其体现在对关键主题和重要词汇的精准挖掘能力上;公众对ChatGPT的认知态度并不统一,表现出赞誉与质疑并存的复杂情绪。 展开更多
关键词 人工智能 ChatGPT 微博 评论文本 主题挖掘 情感分析 公众感知 bert-lda模型
在线阅读 下载PDF
融合Sentence-BERT和LDA的评论文本主题识别 被引量:22
15
作者 阮光册 黄韵莹 《现代情报》 CSSCI 2023年第5期46-53,共8页
[目的/意义]为了解决评论文本主题识别时语义描述不充分以及学习到的主题语义连贯性不强等问题。本文将Sentence-BERT句子嵌入模型和LDA模型相结合,提升评论文本主题的语义性。[方法/过程]采用Sentence-BERT模型获取评论文本句子层面的... [目的/意义]为了解决评论文本主题识别时语义描述不充分以及学习到的主题语义连贯性不强等问题。本文将Sentence-BERT句子嵌入模型和LDA模型相结合,提升评论文本主题的语义性。[方法/过程]采用Sentence-BERT模型获取评论文本句子层面的向量特征,同时,采用LDA模型获取评论文本的概率主题向量,随后使用自动编码器连接两组向量,运用K-means算法对潜在空间向量进行聚类,从类簇中获取上下文主题信息。[结果/结论]通过对评论文本数据集的实验,本文方法可以较好地获得具有语义信息的主题词。Sentence-BERT模型与LDA结合,增加了模型的复杂性。通过对比,本文方法获得的主题一致性指标(Coherence)优于目前常见的评论文本主题识别方法。 展开更多
关键词 Sentence-BERT LDA模型 评论文本 主题识别
在线阅读 下载PDF
基于BERT和LDA模型的酒店评论文本挖掘 被引量:15
16
作者 綦方中 田宇阳 《计算机应用与软件》 北大核心 2023年第7期71-76,90,共7页
通过主题模型对酒店评论文本进行文本挖掘,有利于引导酒店管理者和客户对评论信息做出合适的鉴别和判断。提出一种基于预训练的BERT语言模型与LDA主题聚类相结合的方法;利用中文维基百科语料库训练BERT模型并从中获取文本向量,基于深度... 通过主题模型对酒店评论文本进行文本挖掘,有利于引导酒店管理者和客户对评论信息做出合适的鉴别和判断。提出一种基于预训练的BERT语言模型与LDA主题聚类相结合的方法;利用中文维基百科语料库训练BERT模型并从中获取文本向量,基于深度学习算法对评论文本进行情感分类;通过LDA模型对分类后的文本进行主题聚类,分别获取不同情感极性文本的特征主题词,进而挖掘出酒店客户最为关注的问题,并对酒店管理者提出具有参考价值的建议。实验结果表明,通过BERT模型获取的文本向量在情感分类任务中表现较好,且BERT-LDA文本挖掘方法能使酒店评论文本的主题更具表达性。 展开更多
关键词 BERT LDA主题模型 情感分类 文本挖掘 酒店评论
在线阅读 下载PDF
基于密度Canopy的评论文本主题识别方法 被引量:1
17
作者 刘滨 詹世源 +7 位作者 刘宇 雷晓雨 杨雨宽 陈伯轩 刘格格 高歆 皇甫佳悦 陈莉 《河北科技大学学报》 CAS 北大核心 2023年第5期493-501,共9页
融合Sentence-BERT和LDA的评论文本主题识别(SBERT-LDA)方法,将LDA的主题数作为K-means算法中的k值,导致算法可解释性较差、主题一致性较低。为了解决上述问题,提出基于密度Canopy的SBERT-LDA优化方法(SBERT-LDA-DC),利用密度Canopy改进... 融合Sentence-BERT和LDA的评论文本主题识别(SBERT-LDA)方法,将LDA的主题数作为K-means算法中的k值,导致算法可解释性较差、主题一致性较低。为了解决上述问题,提出基于密度Canopy的SBERT-LDA优化方法(SBERT-LDA-DC),利用密度Canopy改进Kmeans算法。实验结果表明,提出的方法在一致性指标上要优于使用K-means以及K-means++对特征向量聚类的同类方法;与SBERT-LDA方法相比,在1852条戏剧评论数据集上,一致性指标值提高了22.9%。因此,所提出的SBERT-LDA-DC方法是有效的,对产品或服务提供者更好地了解用户意见、完善自身产品或提升服务水平提供了新方法,具有较强的实际应用价值。 展开更多
关键词 自然语言处理 主题识别 评论文本 Sentence-BERT LDA
在线阅读 下载PDF
基于中心词和LDA的微博热点话题发现研究 被引量:15
18
作者 刘干 林杰豪 翟雯熠 《情报杂志》 CSSCI 北大核心 2021年第5期143-148,164,共7页
[目的/意义]通过引入中心词概念,提出一种改进LDA主题模型,以期在微博热点话题发现中获得更好的话题分布效果。[方法/过程]以微博热点数据为研究对象,进行文本表示学习,将基于Bert和Word2Vec的模型设为实验组,基于TF-IDF和BOW的模型设... [目的/意义]通过引入中心词概念,提出一种改进LDA主题模型,以期在微博热点话题发现中获得更好的话题分布效果。[方法/过程]以微博热点数据为研究对象,进行文本表示学习,将基于Bert和Word2Vec的模型设为实验组,基于TF-IDF和BOW的模型设为对照组,令实验组和对照组分别生成改进LDA模型和传统LDA模型。[结果/结论]通过对比传统LDA模型和改进LDA模型,发现改进方法所生成的LDA模型在高频词分布集中度上更优于传统方法,在下游任务应用中更适合热点话题生成。 展开更多
关键词 中心词 Bert 吉布斯抽样 LDA 微博热点话题
在线阅读 下载PDF
面向企业竞争情报的弱信号识别研究 被引量:4
19
作者 杨波 邵婉婷 《现代情报》 CSSCI 2021年第9期53-63,共11页
[目的/意义]针对现有企业弱信号识别方法的单一性,本文提出一种基于LDA-BERT融合模型的弱信号全自动识别方法。[方法/过程]该方法首先通过LDA主题模型对文本数据集进行分类;其次,构建主题和术语双层过滤函数从主题分类的结果中提取早期... [目的/意义]针对现有企业弱信号识别方法的单一性,本文提出一种基于LDA-BERT融合模型的弱信号全自动识别方法。[方法/过程]该方法首先通过LDA主题模型对文本数据集进行分类;其次,构建主题和术语双层过滤函数从主题分类的结果中提取早期预警信号,通过紧密中心度、主题权重以及主题自相关性三大度量对主题进行过滤,并基于主题内术语的归一化频率和概率提取出弱信号;最后,运用BERT深度学习模型在语义上拓展弱信号。[结果/结论]本文使用企业社交媒体新闻数据集对构建的系统模型进行验证,有效检测出相关弱信号,并挖掘出弱信号随时间推移逐渐增强的演化特性。该模型不仅解决了现有弱信号研究人工参与较多和检测结果可解释能力不高的问题,且融合模型弥补了LDA词袋模型的不足,能更有效地对弱信号进行识别,为企业危机预警和战略决策管理提供参考信息的同时,也为弱信号识别研究提供了新思路、新方法。 展开更多
关键词 弱信号 识别 LDA-BERT融合模型 企业竞争情报
在线阅读 下载PDF
基于LDA与BERT-BiLSTM-Attention模型的突发公共卫生事件网络舆情演化分析 被引量:31
20
作者 曾子明 陈思语 《情报理论与实践》 CSSCI 北大核心 2023年第9期158-166,共9页
[目的/意义]探索突发公共卫生事件网络舆情发展周期中的主题和情感演化历程,研究影响网民情感波动的因素,为网络舆情有效管控提供决策支持。[方法/过程]结合博文数量的时序特征和生命周期理论进行周期划分,利用LDA模型、BERT-BiLSTM-Att... [目的/意义]探索突发公共卫生事件网络舆情发展周期中的主题和情感演化历程,研究影响网民情感波动的因素,为网络舆情有效管控提供决策支持。[方法/过程]结合博文数量的时序特征和生命周期理论进行周期划分,利用LDA模型、BERT-BiLSTM-Attention模型构建研究框架,探究不同周期的舆情主题差异及情感演化。[结果/结论]线下病毒变异演化和线上舆情主题与情感演化具有关联性。在新型冠状病毒变异语料库中,BERT-BiLSTM-Attention模型分类准确率为0.8817,F1值为0.8778,其在情感演化分析上具有优越性。构建的“数据采集预处理、舆情周期划分、主题演化和情感演化到获得策略输出”的全过程分析框架对相关部门有效引导网络舆情提供了决策支持和理论支撑,BERT-BiLSTM-Attention模型能更准确地进行情感分类。[局限]数据源单一,面向时间维度上的演化历程未进行时空结合的演化分析。 展开更多
关键词 网络舆情 演化分析 LDA BERT-BiLSTM-Attention 病毒变异
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部