期刊文献+
共找到195篇文章
< 1 2 10 >
每页显示 20 50 100
“强度-内容”视域下我国公共数字文化政策主题演化研究
1
作者 侯艳辉 赵文静 王家坤 《山东科技大学学报(社会科学版)》 2025年第4期81-92,共12页
为分析我国公共数字文化政策主题分布及其演化路径,有效揭示政策主题变迁趋势,把握政策主题演化深层机制,为政策制定与应用提供理论支持。收集我国公共数字文化政策文本,运用LDA模型识别政策文本主题及其关键词;构建融合多特征的主题强... 为分析我国公共数字文化政策主题分布及其演化路径,有效揭示政策主题变迁趋势,把握政策主题演化深层机制,为政策制定与应用提供理论支持。收集我国公共数字文化政策文本,运用LDA模型识别政策文本主题及其关键词;构建融合多特征的主题强度表征模型,分析主题强度演化情况;利用Word2Vec模型获取主题关键词最相似词集合,分析主题内容演化情况。研究发现,我国公共数字文化政策主要有三大惠民工程建设、均等化配置、建设与保障管理和数字文化产业发展四大主题,主题演化呈现阶段性变化、科学技术驱动、聚焦发展问题等特点。基于主题演化分析结果,未来公共数字文化建设应紧密围绕国家战略导向,加强科技创新与人才培养;积极响应公众数字文化需求,促进共建共享合作模式;聚焦发展问题与矛盾,缩小不同区域与群体间发展差距。 展开更多
关键词 公共数字文化 主题强度 多特征融合 主题内容 主题演化
在线阅读 下载PDF
融合多层级特征表示的多领域谣言早期检测方法 被引量:1
2
作者 黄涛 肖玉芝 +2 位作者 向洁萍 金胜 霍宣蓉 《情报杂志》 北大核心 2025年第4期127-135,共9页
[研究目的]网络谣言的治理是当前社会广泛关注的问题,提高网络谣言在传播早期的识别效率,能更好的阻止谣言信息的传播并维护社会的和谐稳定。[研究方法]提出一种多领域话题下的早期谣言检测方法。通过协同注意力机制融合文本的词汇、短... [研究目的]网络谣言的治理是当前社会广泛关注的问题,提高网络谣言在传播早期的识别效率,能更好的阻止谣言信息的传播并维护社会的和谐稳定。[研究方法]提出一种多领域话题下的早期谣言检测方法。通过协同注意力机制融合文本的词汇、短语和句子级特征,构建多层级特征增强的单元门模块以挖掘谣言深层信息。利用该模块构建领域感知特征抽取器,捕获谣言文本的领域特征及偏差,形成多领域与多层级的谣言特征表示,判断是否为谣言。[研究结果/结论]在涵盖9个不同领域的公开数据集上的实验结果表明,该模型的准确率、F1值和AUC值分别达到了92.85%、93.11%和96.96%,能够有效的对多领域谣言进行早期检测。 展开更多
关键词 网络谣言 谣言识别 早期谣言检测 多领域话题 特征增强 领域感知
在线阅读 下载PDF
基于多源舆情的区域营商环境评价研究
3
作者 何秀美 朱庆华 沈超 《南京邮电大学学报(社会科学版)》 2025年第2期62-72,共11页
针对区域营商环境所呈现的差异性、动态性特征,构建基于多源舆情的营商环境评价机制,测算营商环境要素水平。为兼顾常态化与突发性要素信息的采集,对来自多源平台的舆情信息基于主题特征进行融合,通过建立舆情信息与营商环境要素的映射... 针对区域营商环境所呈现的差异性、动态性特征,构建基于多源舆情的营商环境评价机制,测算营商环境要素水平。为兼顾常态化与突发性要素信息的采集,对来自多源平台的舆情信息基于主题特征进行融合,通过建立舆情信息与营商环境要素的映射机制,实现大数据驱动的营商环境评价,并以南通、扬州两市为例进行实证研究。分析表明,多源舆情能够更全面地反映营商环境要素。多源舆情融合后评价指标权重动态调整,营商环境指数变化较为明显。多源舆情融合评价在指标体系稳定性、评价结果均衡性等方面较其他评价方法具有一定的优势。 展开更多
关键词 多源舆情 营商环境 市场主体 主题识别 信息融合 要素优化
在线阅读 下载PDF
基于潜在影响力预测和多源信息融合的新兴技术识别方法
4
作者 张甜 陈进东 +2 位作者 周晓纪 孙胜凯 张永伟 《情报杂志》 北大核心 2025年第9期134-142,133,共10页
[研究目的]针对新兴技术识别在前瞻性预测及单一数据源等方面的不足,提出基于潜在影响力预测和多源信息融合的新兴技术识别方法。[研究方法]首先,从“科学-技术”视角构建影响力评估指标体系,提出基于深度学习模型Bi-LSTM的潜在影响力... [研究目的]针对新兴技术识别在前瞻性预测及单一数据源等方面的不足,提出基于潜在影响力预测和多源信息融合的新兴技术识别方法。[研究方法]首先,从“科学-技术”视角构建影响力评估指标体系,提出基于深度学习模型Bi-LSTM的潜在影响力预测方法,识别未来短期、中期、长期具有高影响力的论文和专利;其次,利用LDA模型提取研究主题,聚类合并科学主题和技术主题,并基于主题演化网络和主题共现网络识别新兴技术;最后,通过新闻数据验证本文方法的有效性,并结合情感分析挖掘公众诉求。[研究结果/结论]以碳中和领域为例,基于本文提出的新兴技术识别方法,识别得到未来短期、中期、长期新兴技术共7项,实验结果验证了潜在影响力预测方法在识别高影响力研究中的有效性,以及融合多源信息的新兴技术识别方法的准确性。 展开更多
关键词 新兴技术识别 多源数据 潜在影响力预测 多源信息融合 主题分析 碳中和
在线阅读 下载PDF
静定结构内力计算的几种方法
5
作者 魏鹏云 李朝阳 +1 位作者 李勇 洪顺军 《工程与试验》 2025年第2期1-5,共5页
静定结构的内力求解是结构力学的重要内容。为了加深学生对静定结构内力计算方法的理解,本文采用涉及材料力学及结构力学的7种方法对同一简支梁受相同荷载作用下指定截面的弯矩和剪力进行了求解。采用结构力学求解器对结果进行了验证,并... 静定结构的内力求解是结构力学的重要内容。为了加深学生对静定结构内力计算方法的理解,本文采用涉及材料力学及结构力学的7种方法对同一简支梁受相同荷载作用下指定截面的弯矩和剪力进行了求解。采用结构力学求解器对结果进行了验证,并对7种方法进行了归纳比较。在教学活动中采用一题多解的方法可以调动学生的学习兴趣和积极性,从而提高教学质量。 展开更多
关键词 静定结构 弯矩 剪力 一题多解 结构力学求解器
在线阅读 下载PDF
面向多标签隐性知识的文本数据挖掘算法
6
作者 邓乔夫 李骁娅 郭校君 《沈阳工业大学学报》 北大核心 2025年第5期594-601,共8页
【目的】随着社交软件用户群体的不断扩大,越来越多的平台采用多标签标注对文本信息进行分类。如何通过多标签文本数据挖掘来分析用户行为与心理,已成为当前研究的热点问题。本文基于深度主题特征提取模型,提出了一种面向多标签隐性知... 【目的】随着社交软件用户群体的不断扩大,越来越多的平台采用多标签标注对文本信息进行分类。如何通过多标签文本数据挖掘来分析用户行为与心理,已成为当前研究的热点问题。本文基于深度主题特征提取模型,提出了一种面向多标签隐性知识的数据挖掘算法,以提升文本分类的准确性和数据挖掘的效率。【方法】针对多标签文本数据中隐性知识的显性化问题,基于SECI理论对文本信息中的隐性知识进行显性化转换,并利用循环神经网络的短时记忆能力提高隐性知识的转换效率。在此基础上,考虑到文本信息的复杂性,分别从局部特征和全局特征两个维度进行分析,并采用特征融合策略提高数据挖掘的准确性。由于文本信息前后文关联性较强,利用基于长短期记忆网络(LSTM)模型的门控机制,提取文本的上下文信息,以捕捉文本中的序列依赖关系;采用潜在狄利克雷分配(LDA)模型,对文本的主题结构进行建模,从而避免因人工标注标准差异导致的模型训练偏差;通过特征拼接的方式,并结合LDA主题模型和LSTM模型提取的局部及全局特征,以降低特征提取过程中信息丢失的风险;引入主题控制器,通过缩小推理范围,提高文本特征提取的有效性;构建基于高斯解码器的上下文主题层,计算词汇在特定主题下的条件概率矩阵,并利用高斯混合解码器优化文本主题建模,提高文本内容的扩充能力;使用Softmax函数计算各标签的概率,实现多标签文本分类。【结果】对比实验中,使用困惑度作为模型训练的评估指标。结果表明,本文模型的困惑度优于对照组(LDA主题模型与LSTM模型),验证了LDA与LSTM结合的特征拼接策略可有效发挥两种模型的优势。此外,与NVDM、LSTM、LDA和VAETM模型进行对比,以准确率和查全率为评估指标,本文模型在准确率和查全率方面分别提升了5.05%和2.75%,表明其在多标签文本分类任务中的有效性与优越性。【结论】对比实验结果表明,本文模型能够显著提升文本分类的性能,相比LDA主题模型和LSTM模型,在处理多标签文本时表现更优;能够高效挖掘多标签文本数据中的隐性知识,为文本分类、语义分析和信息检索等任务提供了一种高效、精准的解决方案。 展开更多
关键词 多标签文本 深度主题特征提取模型 隐性知识 循环神经网络 LSTM神经网络 LDA主题模型 特征拼接 高斯解码器
在线阅读 下载PDF
融合多维度相似算法的中药复方个性化煎煮推荐研究 被引量:5
7
作者 李智彪 江民财 +4 位作者 赵化勇 杜建强 熊旺平 罗计根 伍振峰 《世界中医药》 CAS 北大核心 2024年第16期2392-2398,共7页
目的:为实现中药汤剂智能煎煮设备煎煮参数快速推荐,提出一种融合方剂多维度相似算法,借鉴古代经典名方的个性化煎煮推荐。方法:选取30首经典名方,给出算法推荐的煎煮参数值,比较与典籍记载对应的煎煮参数值之间的差异。针对中药复方的... 目的:为实现中药汤剂智能煎煮设备煎煮参数快速推荐,提出一种融合方剂多维度相似算法,借鉴古代经典名方的个性化煎煮推荐。方法:选取30首经典名方,给出算法推荐的煎煮参数值,比较与典籍记载对应的煎煮参数值之间的差异。针对中药复方的组成成分、剂量以及功用维度特性,分别采用Jaccard相似系数、夹角余弦相似度和潜在狄利克雷分布(LDA)主题模型相似度算法,计算实验方剂与煎煮数据库中方剂间的相似度,将各维度最为相似方剂的煎煮参数加权融合,获取30首经典名方的个性化煎煮参数。结果:加水量、武火及文火时长参数值之间的相对误差分别为5.3%、3.4%、7.1%。结论:2组煎煮参数值较为接近,较好地借鉴和传承经典名方煎煮工艺。 展开更多
关键词 中药汤剂 个性化煎煮 多维度 潜在狄利克雷分布主题模型 方剂相似度 夹角余弦 Jaccard相似系数
暂未订购
用户偏好-制造商偏好双重视阈下的产品创新机会识别路径研究 被引量:8
8
作者 王金凤 仵轩 +2 位作者 冯立杰 张珂 刘鹏 《计算机集成制造系统》 EI CSCD 北大核心 2024年第4期1433-1445,共13页
精准识别产品创新机会对制造商规避盲目创新风险,持续获取竞争优势至关重要。针对现有产品创新机会识别研究中因视角单一致使制造商价值创造的效率难以最大化,以及识别的创新机会聚焦度不清晰等诸多问题,基于用户偏好制造商偏好双重视... 精准识别产品创新机会对制造商规避盲目创新风险,持续获取竞争优势至关重要。针对现有产品创新机会识别研究中因视角单一致使制造商价值创造的效率难以最大化,以及识别的创新机会聚焦度不清晰等诸多问题,基于用户偏好制造商偏好双重视阈构建了产品创新机会识别路径。首先,运用结构主题模型从用户在线评论和产品描述文本中分别提取用户偏好及制造商偏好的产品属性主题;其次,基于两类主题之间的相似度进行主题分类以获取具象产品的创新需求;再次,从现有相关专利中提取创新要素并依托多维技术创新地图识别产品创新机会;最后,以老年智能手环靶向开展产品创新机会识别为例,验证了所提路径的可行性。应用结果表明,构建的用户偏好制造商偏好双重视阈下的产品创新机会识别路径能够为制造商高效开展产品创新活动提供可资借鉴的决策理论支持。 展开更多
关键词 产品创新机会识别 用户偏好制造商偏好双重视阈 多维技术创新地图 结构主题模型
在线阅读 下载PDF
用于意图识别的自适应多标签信息学习模型 被引量:1
9
作者 马坤 刘筱云 +3 位作者 李乐平 纪科 陈贞翔 杨波 《山东大学学报(工学版)》 CAS CSCD 北大核心 2024年第1期45-51,62,共8页
为解决多标签文本分类在捕获标签关系时忽视标签共现特性的问题,提出基于统计特征的自适应多标签信息学习方法(adaptive label feature learning,ALFL),用于检测内容营销文章。构建主题先验自适应标记狄利克雷主题模型(labeled latent d... 为解决多标签文本分类在捕获标签关系时忽视标签共现特性的问题,提出基于统计特征的自适应多标签信息学习方法(adaptive label feature learning,ALFL),用于检测内容营销文章。构建主题先验自适应标记狄利克雷主题模型(labeled latent dirichlet allocation with adaptive topic priors,LDATP),根据每个文本的标签集合情况,与标签集合对应的全部营销主题约束模型生成主题词概率分布;构建标签信息整合网络(label information integration network,LIIN),利用主题词概率分布和标签的图结构学习标签相关信息,获得标签嵌入表示;进行文本和标签空间之间的信息交互,捕获语义特征以识别营销文章。试验结果表明,基于统计特征的ALFL方法以召回率为80.92%、准确率为88.14%,优于其他基线模型,具有更高的预测准确性。 展开更多
关键词 多标签文本分类 标签共现 主题模型 图结构 标签嵌入
原文传递
基于多尺度上下文的英文作文自动评分研究 被引量:4
10
作者 于明诚 党亚固 +2 位作者 吴奇林 吉旭 毕可鑫 《计算机工程》 CAS CSCD 北大核心 2024年第3期259-266,共8页
目前作文自动评分模型缺乏对不同尺度上下文语义特征的提取,未能从句子级别计算与作文主题关联程度的特征。提出基于多尺度上下文的英文作文自动评分研究方法MSC。采用XLNet英文预训练模型提取原始作文文本单词嵌入和句嵌入,避免在处理... 目前作文自动评分模型缺乏对不同尺度上下文语义特征的提取,未能从句子级别计算与作文主题关联程度的特征。提出基于多尺度上下文的英文作文自动评分研究方法MSC。采用XLNet英文预训练模型提取原始作文文本单词嵌入和句嵌入,避免在处理长序列文本时无法准确捕捉到符合上下文语境的向量嵌入,提升动态向量语义表征质量,解决一词多义问题,并通过一维卷积模块提取不同尺度的短语级别嵌入。多尺度上下文网络通过结合内置自注意力简单循环单元和全局注意力机制,分别捕捉单词、短语和句子级别的作文高维潜在上下文语义关联关系,利用句向量与作文主题计算语义相似度提取篇章主题层次特征,将所有特征输入融合层通过线性层得到自动评分结果。在公开的标准英文作文评分数据集ASAP上的实验结果表明,MSC模型平均二次加权的Kappa值达到了80.5%,且在多个子集上取得了最佳效果,优于实验对比的深度学习自动评分模型,证明了MSC在英文作文自动评分任务上的有效性。 展开更多
关键词 英文作文自动评分 预训练模型 多尺度上下文 全局注意力 主题层次特征
在线阅读 下载PDF
基于BERT-BiLSTM混合模型的社交媒体虚假信息识别研究 被引量:2
11
作者 冯由玲 康鑫 +1 位作者 周金娉 李军 《情报科学》 CSSCI 北大核心 2024年第6期89-98,共10页
【目的/意义】探索信息疫情背景下社交媒体中真伪信息的主题特征,研究社交媒体平台评论信息特征及真伪识别问题,为用户和社交媒体平台信息识别提供参考依据。【方法/过程】针对社交媒体平台上疫情相关的多主题数据,以Twitter平台推文为... 【目的/意义】探索信息疫情背景下社交媒体中真伪信息的主题特征,研究社交媒体平台评论信息特征及真伪识别问题,为用户和社交媒体平台信息识别提供参考依据。【方法/过程】针对社交媒体平台上疫情相关的多主题数据,以Twitter平台推文为数据集。运用LDA模型,提取真实信息和虚假信息的主要表述和语义特征。引入BERT预处理方式,融合双向长短时记忆网络算法,构建BERT-BiLSTM混合模型,识别虚假疫情信息。【结果/结论】基于LDA主题模型的对比研究,发现真实和虚假信息在主题和表述特征上存在显著差异。通过与传统机器学习算法进行比较,BERT-BiLSTM模型对虚假疫情信息识别具有显著优势,准确率达到0.960,F1值为0.961。因此,本文构建的BERT-BiLSTM模型将为虚假信息识别提供更精准、高效的解决方案。【创新/局限】以社交媒体平台疫情信息为研究对象,综合运用LDA主题模型探究了疫情信息的特征,在小规模数据集上以较低成本实现了多主题数据的有效识别,为信息疫情治理提供了高效的解决方案。 展开更多
关键词 社交媒体 多主题数据 LDA模型 对比研究 虚假信息识别 BERT-BiLSTM
原文传递
罕见病病种遴选与优先主题确定方法的思考 被引量:1
12
作者 李柯欣 陈敬丹 +5 位作者 张丁丁 郭武栋 郑佳音 李林康 赵琨 张抒扬 《罕见病研究》 2024年第2期269-274,共6页
本文通过对罕见病病种遴选和优先主题确定全流程的梳理和总结,对罕见病病种的申报和初步审查、病种主题信息的标准化、病种主题优先级遴选的证据梳理及罕见病主题确定和病种遴选的评价方法等多个环节内容进行了深入分析。以期为后续开... 本文通过对罕见病病种遴选和优先主题确定全流程的梳理和总结,对罕见病病种的申报和初步审查、病种主题信息的标准化、病种主题优先级遴选的证据梳理及罕见病主题确定和病种遴选的评价方法等多个环节内容进行了深入分析。以期为后续开展罕见病病种遴选工作、提升罕见病病种遴选的公平合理性和科学性,并进一步推动中国罕见病相关领域的研究和决策提供参考和借鉴。 展开更多
关键词 罕见病 病种遴选 优先主题 多准则决策分析
原文传递
在线社交网络中的多主题谣言溯源
13
作者 戴树兴 夏正友 《计算机技术与发展》 2024年第1期30-36,共7页
随着通信技术的快速发展,用户之间的信息可以很快地流通,同时也导致谣言在社交网络中传播,因此亟需对谣言来源进行检测以确保社交网络的公信力。目前关于谣言溯源的研究方向基本注重于单主题谣言传播,然而社交网络中存在大量不同主题的... 随着通信技术的快速发展,用户之间的信息可以很快地流通,同时也导致谣言在社交网络中传播,因此亟需对谣言来源进行检测以确保社交网络的公信力。目前关于谣言溯源的研究方向基本注重于单主题谣言传播,然而社交网络中存在大量不同主题的谣言,谣言源头以及谣言主题数量越多,产生的不良影响越大。针对多主题谣言同时存在的情况,信息的传播过程需要被重新定义。因此,该文提出了一种多主题独立级联模型,并在该模型的基础上定义了谣言溯源问题。从已感染的网络子图中,基于影响力最大化的原则找出前k个可疑节点,这组节点被认为是最可能的谣言来源。并证明了该问题是NP难的,以及目标函数是单调且子模的。在此基础上,提出了一种基于影响力最大化的近似比为(1-1/e)的贪婪算法。在大型真实数据集上的实验表明,平均误差距离控制在1跳之内。而且与其他算法相比,该算法具有更高的准确性以及有效性。 展开更多
关键词 多主题 社交网络 谣言溯源 谣言来源 独立级联
在线阅读 下载PDF
基于SWPF2vec和DJ-TextRCNN的古籍文本主题分类研究 被引量:1
14
作者 武帅 杨秀璋 +1 位作者 何琳 公佐权 《情报学报》 CSSCI CSCD 北大核心 2024年第5期601-615,共15页
以编目分类和规则匹配为主的古籍文本主题分类方法存在工作效能低、专家知识依赖性强、分类依据单一化、古籍文本主题自动分类难等问题。对此,本文结合古籍文本内容和文字特征,尝试从古籍内容分类得到符合研究者需求的主题,推动数字人... 以编目分类和规则匹配为主的古籍文本主题分类方法存在工作效能低、专家知识依赖性强、分类依据单一化、古籍文本主题自动分类难等问题。对此,本文结合古籍文本内容和文字特征,尝试从古籍内容分类得到符合研究者需求的主题,推动数字人文研究范式的转型。首先,参照东汉古籍《说文解字》对文字的分析方式,以前期标注的古籍语料数据集为基础,构建全新的“字音(说)-原文(文)-结构(解)-字形(字)”四维特征数据集。其次,设计四维特征向量提取模型(speaking,word,pattern,and font to vector,SWPF2vec),并结合预训练模型实现对古籍文本细粒度的特征表示。再其次,构建融合卷积神经网络、循环神经网络和多头注意力机制的古籍文本主题分类模型(dianji-recurrent convolutional neural networks for text classification,DJ-TextRCNN)。最后,融入四维语义特征,实现对古籍文本多维度、深层次、细粒度的语义挖掘。在古籍文本主题分类任务上,DJ-TextRCNN模型在不同维度特征下的主题分类准确率均为最优,在“说文解字”四维特征下达到76.23%的准确率,初步实现了对古籍文本的精准主题分类。 展开更多
关键词 多维特征融合 古籍文本 主题分类 SWPF2vec DJ-TextRCNN
在线阅读 下载PDF
多文本阅读教学议题选择策略与实践研究 被引量:1
15
作者 谢云 《吉林省教育学院学报》 2024年第1期35-40,共6页
多文本阅读教学围绕议题以多个文本组合呈现在课堂上,它容量大、内容丰富、形式多样,有利于从多个层面、多个角度对文本展开深入探究,打破了传统单篇阅读容量过小、视野狭窄、拓展不深等局限。为了实现多文本阅读教学目标,提升教学有效... 多文本阅读教学围绕议题以多个文本组合呈现在课堂上,它容量大、内容丰富、形式多样,有利于从多个层面、多个角度对文本展开深入探究,打破了传统单篇阅读容量过小、视野狭窄、拓展不深等局限。为了实现多文本阅读教学目标,提升教学有效性,还需以议题为抓手,综合学生认知特点、发展需求、语文学科性质、学段要求等,基于单元主题、训练重点、习作要求等研定议题,并确保议题的集中性和可议论性。本文从多文本阅读教学议题选定的要点着手,分析了议题选择的基本策略,并最终以两组案例说明了议题选择策略的合理性。 展开更多
关键词 多文本阅读教学 议题选择 语文素养
在线阅读 下载PDF
结合文本聚类和多标签分类的学科交叉主题早期识别方法 被引量:2
16
作者 冯岭 《情报杂志》 CSSCI 北大核心 2024年第8期160-169,共10页
[研究目的]以专利为研究数据,提出一种结合文本聚类和多标签分类的学科交叉主题早期识别方法。[研究方法]以“量子计算”作为研究领域,通过基于聚类结果的筛选和基于多标签分类的筛选等两种方法将大量非学科交叉专利从专利集合中过滤,... [研究目的]以专利为研究数据,提出一种结合文本聚类和多标签分类的学科交叉主题早期识别方法。[研究方法]以“量子计算”作为研究领域,通过基于聚类结果的筛选和基于多标签分类的筛选等两种方法将大量非学科交叉专利从专利集合中过滤,进而在学科交叉专利占比较高的小数据集上采用主题识别方法实现学科交叉主题的早期识别。随后,在德温特专利数据集上进行实证研究,验证了所提出方法的有效性。[研究结论]研究发现了“量子加密技术”和“量子计算技术与量子计算机”等学科交叉主题。与已有方法相比,提出的识别方法可以在交叉领域尚处于萌芽期或成长期、相关文献数量较少的情况下,发现文献集合中的学科交叉主题。 展开更多
关键词 专利数据 学科交叉主题 早期识别 多标签分类 学科交叉专利 文本聚类 量子计算
在线阅读 下载PDF
一种融合多维关系的地理环境时空主题发现方法
17
作者 朱杰 张宏军 +1 位作者 廖湘琳 徐有为 《武汉大学学报(信息科学版)》 EI CAS CSCD 北大核心 2024年第2期291-302,共12页
对战场文本数据的深入挖掘,可以高质量和高效率地发现时空主题结构,从而有效揭示战场事件发展的时空规律。针对现有的主题发现方法无法有效适用于具有多维异构关系的时空主题发现,提出了一种融合多维关系联合聚类的时空主题发现方法,首... 对战场文本数据的深入挖掘,可以高质量和高效率地发现时空主题结构,从而有效揭示战场事件发展的时空规律。针对现有的主题发现方法无法有效适用于具有多维异构关系的时空主题发现,提出了一种融合多维关系联合聚类的时空主题发现方法,首先构建以地理环境实体、地理位置与事件主题为节点的主题关系网络;然后以张量模型的Tucker分解建立主题关系的完全表达式作为主题分类的目标函数;最后运用块值矩阵分解方法进行联合聚类计算,获取主题分类结果和内聚结构。实验结果表明,该方法能够有效发现具有时空语义关系特征的主题结构,较好地体现出地理环境要素与时空主题之间的关联性,以及时空主题在地理位置与事件主题标签上的内聚性,反映出主题的演化过程。 展开更多
关键词 地理环境 多维关系 时空主题发现 块值矩阵分解 联合聚类
原文传递
基于K-BERT-LDA的层级多标签招标标段分类方法
18
作者 侯继辉 吴小忠 +4 位作者 刘晖 夏卓群 梁涤青 邱涵 徐嘉慧 《软件导刊》 2024年第12期66-74,共9页
传统人工招标分标效率准确率低,针对语义特征稀疏且标签具有明显层级结构特点的物资招标文本,提出了一种基于K-BERT-LDA的层级多标签文本分类方法。首先,通过混合模型提取文本特征,K-BERT模型提取具有知识注入的文本特征以弥补语义信息... 传统人工招标分标效率准确率低,针对语义特征稀疏且标签具有明显层级结构特点的物资招标文本,提出了一种基于K-BERT-LDA的层级多标签文本分类方法。首先,通过混合模型提取文本特征,K-BERT模型提取具有知识注入的文本特征以弥补语义信息缺失,LDA主题模型提取主题分布特征,并通过特征融合进一步丰富文本特征表示。其次,联合嵌入类别标签,即上层标签预测结果能引导下层分类,并充分利用标签间的树形结构关系提升多标签文本分类准确性。最后,提出一种基于文本相似度算法的智能处理策略,通过合并预投资金额不足的标段以保障招标成功率并得到分标结果。实验表明,所提方法相较于其他分类方法及单一模型而言分类性能更好,准确率、精确度和F1值分别达到95.45%、92.57%和91.88%,能高效、准确地实现智能分标目的。 展开更多
关键词 招标分标 层级多标签文本分类 知识注入 主题分布 特征融合 文本相似度
在线阅读 下载PDF
基于改进BERTopic模型的领域主题表征及演化研究 被引量:1
19
作者 刘颖 于春梅 +2 位作者 李晓晨 李叶 赵铭宇 《图书情报工作》 北大核心 2025年第3期78-89,共12页
[目的/意义]瞄准领域前沿范围,预测未来发展研究主题,有助于科研工作者寻找该领域新的学科增长点,优化政府部门资源配置。[方法/过程]运用深度学习预训练模型增强文本的语义表示能力,提出改进BERTopic(SBERT-UMAP-HDBSCAN-TopMine)主题... [目的/意义]瞄准领域前沿范围,预测未来发展研究主题,有助于科研工作者寻找该领域新的学科增长点,优化政府部门资源配置。[方法/过程]运用深度学习预训练模型增强文本的语义表示能力,提出改进BERTopic(SBERT-UMAP-HDBSCAN-TopMine)主题表征模型,以期丰富和完善主题表征与主题演化方法。首先,使用SBERT模型进行句子嵌入,弥补句子向量存在非光滑各向异性,UMAP降维后利用HDBSCAN算法进行主题聚类,为避免主题识别在语义表达上存在盲点,运用TopMine对聚类主题短语抽取进行主题表征;其次,利用WMD计算相邻时间段不同主题间相似度,发现不同时间段领域主题产生、发生和动态关联的过程,并对领域热点主题进行动态演化分析。[结果/结论]以供应链金融领域为例进行实证分析,将供应链金融的研究方向划分为供应链金融风险评估、供应链金融融资模式、现代金融科技赋能和可持续供应链金融4个类别,模型有助于提升供应链金融领域热点主题的可解释性与可识别性,通过动态演化分析发现可持续供应链金融是目前及未来关注的重点。 展开更多
关键词 BERtopic 领域主题 主题表征 动态演化 多源数据
原文传递
引入主题节点的异构图舆情摘要方法
20
作者 宝日彤 曾淼瑞 孙海春 《科学技术与工程》 北大核心 2024年第23期9965-9972,共8页
微博等社交软件承载着网民对社会舆论事件的不同观点,如何在海量主题评论中识别出有价值的信息已经成为重要课题。提出了一种基于异构图的舆情摘要方法,有效提取热点事件的主流观点,便于引导化解互联网舆情危机。针对多文档摘要任务中... 微博等社交软件承载着网民对社会舆论事件的不同观点,如何在海量主题评论中识别出有价值的信息已经成为重要课题。提出了一种基于异构图的舆情摘要方法,有效提取热点事件的主流观点,便于引导化解互联网舆情危机。针对多文档摘要任务中难以捕捉跨文档语义关系的难点问题,将主题节点引入评论句子图从而挖掘出输入文档间的潜在语义关联。具体地,抽取评论的主题并构建包含主题节点的异构图模型,利用图注意力机制进行不同粒度节点语义信息的交互,最后结合最大边界相关算法进行候选摘要句子的抽取。实验结果显示,改进模型在英文通用Multi-News数据集上Rouge1、Rouge2、,RougeL分数分别提升了0.46%、0.46%、0.48%;与已有Textrank、Sumpip等热点模型对比,在自制微博评论数据集上该模型性能达到最好。 展开更多
关键词 多文档摘要 舆情摘要 主题节点 图注意力机制 微博评论摘要
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部