期刊文献+
共找到64篇文章
< 1 2 4 >
每页显示 20 50 100
基于BERTopic和LSTM模型的新兴主题预测研究 被引量:5
1
作者 张家惠 丁敬达 《情报科学》 北大核心 2025年第1期98-105,126,共9页
【目的/意义】相比新兴主题的回溯性探测,对新兴主题进行预测研究可以提高新兴主题识别的准确性和前瞻性,有助于丰富新兴主题探测分析的方法体系。【方法/过程】首先,利用BERTopic模型得到领域系列主题;其次,基于文档频率、引用频率、Ps... 【目的/意义】相比新兴主题的回溯性探测,对新兴主题进行预测研究可以提高新兴主题识别的准确性和前瞻性,有助于丰富新兴主题探测分析的方法体系。【方法/过程】首先,利用BERTopic模型得到领域系列主题;其次,基于文档频率、引用频率、Pscore和新兴分数构建模型预测特征集;然后基于主题前三年特征集数据采用LSTM模型预测后两年新兴分数,判断得到领域新兴主题。【结果/结论】构建基于BERTopic和LSTM模型的新兴主题预测方法,并以数据安全领域为例进行实证研究,通过和BP、SVM模型以及相关研究结果的比较表明该方法得到的新兴主题更加有效和合理。【创新/局限】融合新颖性、增长性和影响性特征,构建单一指标新兴分数来预测新兴主题,但没有考虑对未来可能出现主题的预测。 展开更多
关键词 BERtopic模型 神经网络 LSTM 预测 新兴主题 数据安全
原文传递
新能源汽车轮毂造型感性意象预测研究
2
作者 孙利 张宇彤 +2 位作者 吴俭涛 覃忠志 晁佳媛 《机械设计》 北大核心 2025年第9期203-211,共9页
为改善当前新能源汽车(new energy vehicle, NEV)轮毂造型设计中情感意象预测精度,提出一种基于感性工学(kansei engineering, KE)的预测模型构建方法。收集NEV轮毂样本,采用造型分析法解构轮毂造型特征;采用词对主题模型(biterm topic ... 为改善当前新能源汽车(new energy vehicle, NEV)轮毂造型设计中情感意象预测精度,提出一种基于感性工学(kansei engineering, KE)的预测模型构建方法。收集NEV轮毂样本,采用造型分析法解构轮毂造型特征;采用词对主题模型(biterm topic model, BTM)从在线评论文本数据中深入挖掘用户感性意象,通过层次分析法(analytic hierarchy process, AHP)提取代表性感性语汇;基于反向传播神经网络(back propagation neural network, BPNN)构建关联模型,捕捉轮毂造型特征与感性意象间的非线性关系,并引入粒子群优化算法(particle swarm optimization, PSO)和遗传算法(genetic algorithm, GA)分别优化BPNN预测性能;通过误差比较法对不同模型预测效果进行评估。结果表明:PSO-BPNN在预测精度、鲁棒性等方面均优于BPNN和GA-BPNN,可有效提升造型意象预测精度,为NEV轮毂的情感化设计提供理论依据和创新路径。 展开更多
关键词 汽车轮毂 造型设计 感性意象预测 词对主题模型 反向传播神经网络 粒子群优化算法
原文传递
基于编码器增强的生成式文本摘要模型研究
3
作者 华庚兴 朱欣鑫 +1 位作者 陶林娟 李波 《计算机与数字工程》 2025年第8期2127-2132,共6页
当前主流的生成式文本摘要模型均是基于编码器-解码器架构,其中的编码器往往只使用了单一来源的信息。论文以循环神经网络为基础,通过融入卷积神经网络提取的局部语义信息和神经主题模型提取的主题信息来增强单一的循环神经网络编码器,... 当前主流的生成式文本摘要模型均是基于编码器-解码器架构,其中的编码器往往只使用了单一来源的信息。论文以循环神经网络为基础,通过融入卷积神经网络提取的局部语义信息和神经主题模型提取的主题信息来增强单一的循环神经网络编码器,以此来提升文本摘要的性能。实验结果表明,使用增强编码器的文本摘要模型性能显著优于一系列基线模型。 展开更多
关键词 生成式摘要 局部语义信息 神经主题模型
在线阅读 下载PDF
结合主题图卷积神经网络与提示学习的短文本分类模型
4
作者 徐仁楷 李艳婷 潘尔顺 《机械设计与研究》 北大核心 2025年第5期235-242,共8页
短文本由于其长度较短,常见的分类模型难以提取其中有效的文本结构和语义信息,导致模型性能下降。针对这一问题,提出了一种结合主题信息的图卷积神经网络与提示学习的短文本分类模型TGCNPL。该模型通过基于伪文档的主题建模(PTM)挖掘文... 短文本由于其长度较短,常见的分类模型难以提取其中有效的文本结构和语义信息,导致模型性能下降。针对这一问题,提出了一种结合主题信息的图卷积神经网络与提示学习的短文本分类模型TGCNPL。该模型通过基于伪文档的主题建模(PTM)挖掘文本的潜在主题结构,并将这些主题信息融入图卷积神经网络中,以实现对文本全局结构特征的提取。同时,将PTM得到的主题信息与提示学习方法相结合,弥补短文本语义稀疏的问题,并利用预训练语言模型提取完善后的文本语义特征。最后,结合将通过图卷积神经网络获得的结构信息和预训练语言模型提取的语义信息,建立分类模型。在四个英文短文本数据集上的多次实验结果表明,TGCNPL模型相比基线模型具有更优越的分类性能。 展开更多
关键词 短文本分类 主题建模 图卷积神经网络 提示学习 预训练语言模型
原文传递
一种并发漏洞主题建模与分析方法
5
作者 薄莉莉 胡宇飞 +1 位作者 刘静 孟醒 《小型微型计算机系统》 北大核心 2025年第10期2502-2507,共6页
传统的主题模型在训练过程中仅利用了单个文档内词语的相互关系,未能充分利用与该文档主题相关的其他文档和词语信息.工作提出了一种基于图注意力网络的并发漏洞文档间主题建模方法(GATTM),旨在捕捉并发漏洞文档间的相关性,克服了传统... 传统的主题模型在训练过程中仅利用了单个文档内词语的相互关系,未能充分利用与该文档主题相关的其他文档和词语信息.工作提出了一种基于图注意力网络的并发漏洞文档间主题建模方法(GATTM),旨在捕捉并发漏洞文档间的相关性,克服了传统方法的局限性.该方法将并发漏洞语料库中文档和词语表示为文档关系图,并引入了注意力机制,强化了节点特征表示,并通过聚合文档邻接节点信息来识别主题分布.通过所构建的数据集进行对比实验,GATTM在主题建模中的性能表现优于其他常见方法,能够深入探讨并发漏洞数据集中受用户欢迎和困惑程度较高的主题.通过分析主题难度和流行度,提升了Stack Overflow用户的指导效率和问题解决准确性. 展开更多
关键词 主题模型 并发漏洞 神经网络
在线阅读 下载PDF
面向多标签隐性知识的文本数据挖掘算法
6
作者 邓乔夫 李骁娅 郭校君 《沈阳工业大学学报》 北大核心 2025年第5期594-601,共8页
【目的】随着社交软件用户群体的不断扩大,越来越多的平台采用多标签标注对文本信息进行分类。如何通过多标签文本数据挖掘来分析用户行为与心理,已成为当前研究的热点问题。本文基于深度主题特征提取模型,提出了一种面向多标签隐性知... 【目的】随着社交软件用户群体的不断扩大,越来越多的平台采用多标签标注对文本信息进行分类。如何通过多标签文本数据挖掘来分析用户行为与心理,已成为当前研究的热点问题。本文基于深度主题特征提取模型,提出了一种面向多标签隐性知识的数据挖掘算法,以提升文本分类的准确性和数据挖掘的效率。【方法】针对多标签文本数据中隐性知识的显性化问题,基于SECI理论对文本信息中的隐性知识进行显性化转换,并利用循环神经网络的短时记忆能力提高隐性知识的转换效率。在此基础上,考虑到文本信息的复杂性,分别从局部特征和全局特征两个维度进行分析,并采用特征融合策略提高数据挖掘的准确性。由于文本信息前后文关联性较强,利用基于长短期记忆网络(LSTM)模型的门控机制,提取文本的上下文信息,以捕捉文本中的序列依赖关系;采用潜在狄利克雷分配(LDA)模型,对文本的主题结构进行建模,从而避免因人工标注标准差异导致的模型训练偏差;通过特征拼接的方式,并结合LDA主题模型和LSTM模型提取的局部及全局特征,以降低特征提取过程中信息丢失的风险;引入主题控制器,通过缩小推理范围,提高文本特征提取的有效性;构建基于高斯解码器的上下文主题层,计算词汇在特定主题下的条件概率矩阵,并利用高斯混合解码器优化文本主题建模,提高文本内容的扩充能力;使用Softmax函数计算各标签的概率,实现多标签文本分类。【结果】对比实验中,使用困惑度作为模型训练的评估指标。结果表明,本文模型的困惑度优于对照组(LDA主题模型与LSTM模型),验证了LDA与LSTM结合的特征拼接策略可有效发挥两种模型的优势。此外,与NVDM、LSTM、LDA和VAETM模型进行对比,以准确率和查全率为评估指标,本文模型在准确率和查全率方面分别提升了5.05%和2.75%,表明其在多标签文本分类任务中的有效性与优越性。【结论】对比实验结果表明,本文模型能够显著提升文本分类的性能,相比LDA主题模型和LSTM模型,在处理多标签文本时表现更优;能够高效挖掘多标签文本数据中的隐性知识,为文本分类、语义分析和信息检索等任务提供了一种高效、精准的解决方案。 展开更多
关键词 多标签文本 深度主题特征提取模型 隐性知识 循环神经网络 LSTM神经网络 LDA主题模型 特征拼接 高斯解码器
在线阅读 下载PDF
融合主题模型的图卷积神经网络知识图谱实体对齐
7
作者 李腾腾 杨光 《计算机系统应用》 2025年第4期207-217,共11页
实体对齐技术旨在识别并匹配不同知识图谱中指代同一实体的项,对于知识图谱的融合具有至关重要的作用,其在知识补全、社交网络分析等多个领域已经展现出广泛的应用潜力与显著的实用价值.随着基于知识表征学习的实体对齐方法的不断演进,... 实体对齐技术旨在识别并匹配不同知识图谱中指代同一实体的项,对于知识图谱的融合具有至关重要的作用,其在知识补全、社交网络分析等多个领域已经展现出广泛的应用潜力与显著的实用价值.随着基于知识表征学习的实体对齐方法的不断演进,研究者们开始探索利用实体之间的多种信息维度来计算相似度,从而评估源实体与目标实体之间的相似性.尽管如此,实体的部分属性信息在目前已有的方法中仍未得到充分利用,尤其是实体属性中的主题信息,通过主题模型能够识别出实体间更为显著的语义联系.针对这一研究,以实体属性的主题信息为核心,提出了一种实体对齐框架EAGT(knowledge graph entity alignment via graph convolutional network with biterm topic model),通过实体主题结合图卷积神经网络进行实体对齐.为了验证所提方法的有效性,在开源的数据集上进行了实验,结果表明,EAGT在大多数情况下均实现了性能提升. 展开更多
关键词 知识图谱 实体对齐 主题模型 图卷积神经网络
在线阅读 下载PDF
融合主题模型和卷积神经网络的APP推荐研究 被引量:4
8
作者 王杰 唐菁荟 +1 位作者 王昊 邓三鸿 《情报理论与实践》 CSSCI 北大核心 2019年第4期158-165,共8页
[目的/意义]将主题模型与卷积神经网络进行结合,以实现APP的个性化推荐,并缓解评分数据稀疏性问题。[方法/过程]提出TMCNN模型,针对文本内容,通过用户和APP双通道的卷积神经网络获取卷积语义特征,同时使用LDA模型获取主题特征,并与用户... [目的/意义]将主题模型与卷积神经网络进行结合,以实现APP的个性化推荐,并缓解评分数据稀疏性问题。[方法/过程]提出TMCNN模型,针对文本内容,通过用户和APP双通道的卷积神经网络获取卷积语义特征,同时使用LDA模型获取主题特征,并与用户和APP的数值特征组合,从而预测用户对APP的评分,进而推荐。[结果/结论]通过360手机助手数据集的测试,从RMSE,召回率,NDCG三个指标进行分析,TMCNN模型不仅具有良好的评分预测效果,而且APP的推荐结果也相对较好。同时,TMCNN模型也丰富了APP推荐的研究方法。[局限]没有考虑APP的权限信息,评论信息的有用性,以及TMCNN模型的优化函数有待改进。 展开更多
关键词 APP推荐 LDA模型 卷积神经网络 主题模型
原文传递
基于局部特征和全局特征融合的微博情感分析 被引量:1
9
作者 胥桂仙 陈思瑾 +2 位作者 孟月婷 张廷 于绍娜 《中南民族大学学报(自然科学版)》 CAS 北大核心 2023年第4期526-534,共9页
目前的神经网络一般只将词粒度层面的词向量作为输入,忽略了语义层面的全局语义特征.针对此问题,提出了一种基于局部特征和全局特征融合的情感分类方法,以解决评论特征稀疏和主题聚焦性差的问题.对于局部特征,选择基于情感词典和BiLSTM... 目前的神经网络一般只将词粒度层面的词向量作为输入,忽略了语义层面的全局语义特征.针对此问题,提出了一种基于局部特征和全局特征融合的情感分类方法,以解决评论特征稀疏和主题聚焦性差的问题.对于局部特征,选择基于情感词典和BiLSTM神经网络模型提取基于词向量的文本特征.对于文本集的全局主题特征,采用神经主题模型提取文本主题特征,并将其作为全局特征来表示短文本信息.最终将基于局部加权词向量的文本特征和基于神经主题模型的文本主题特征进行拼接,并通过Softmax层输出,完成文本情感分类.结果表明:融合全局主题语义和局部加权词向量可以更加丰富神经网络的特征,从而有效地提高情感分类的准确率. 展开更多
关键词 情感分析 特征融合 神经主题模型 词向量
在线阅读 下载PDF
多原型词向量与文本主题联合学习模型 被引量:5
10
作者 曹中华 夏家莉 +1 位作者 彭文忠 张志斌 《中文信息学报》 CSCD 北大核心 2020年第3期64-71,106,共9页
常见的词嵌入向量模型存在每个词只具有一个词向量的问题,词的主题值是重要的多义性条件,可以作为获得多原型词向量的附加信息。在skip-gram(cbow)模型和文本主题结构基础上,该文研究了两种改进的多原型词向量方法和基于词与主题的嵌入... 常见的词嵌入向量模型存在每个词只具有一个词向量的问题,词的主题值是重要的多义性条件,可以作为获得多原型词向量的附加信息。在skip-gram(cbow)模型和文本主题结构基础上,该文研究了两种改进的多原型词向量方法和基于词与主题的嵌入向量表示的文本生成结构。该模型通过联合训练,能同时获得文本主题、词和主题的嵌入向量,实现了使用词的主题信息获得多原型词向量,和使用词和主题的嵌入式向量学习文本主题。实验表明,该文提出的方法不仅能够获得具有上下文语义的多原型词向量,也可以获得关联性更强的文本主题。 展开更多
关键词 多原型词向量 多义词 主题模型 神经网络
在线阅读 下载PDF
基于深度神经网络的嵌入式向量及话题模型 被引量:4
11
作者 何永强 秦勤 王俊鹏 《计算机工程与设计》 北大核心 2016年第12期3384-3388,3399,共6页
在对文档集合进行话题分析的过程中,为描述文档中单词间的依赖关系,提高话题分析的效果,提出一种基于反馈递归神经网络的嵌入式向量生成及话题模型。在将单词表示为One-hot向量后,采用递归神经网络将文档嵌入在低维的向量空间。在文档... 在对文档集合进行话题分析的过程中,为描述文档中单词间的依赖关系,提高话题分析的效果,提出一种基于反馈递归神经网络的嵌入式向量生成及话题模型。在将单词表示为One-hot向量后,采用递归神经网络将文档嵌入在低维的向量空间。在文档的嵌入式向量计算过程中,采用LSTM(long short-term memory)描述单词间的前向依赖关系,提出一种反馈神经网络用于描述单词间的后向依赖关系。在话题分析模型中,采用原文档和变异文档对作为正样本,采用原文档和随机文档对作为负样本进行模型的训练。实验结果表明,该方法时间和空间复杂度低,具有更好的话题分析效果。 展开更多
关键词 话题模型 递归神经网络 深度学习 反馈机制 嵌入式
在线阅读 下载PDF
融合主题信息和卷积神经网络的混合推荐算法 被引量:23
12
作者 田保军 刘爽 房建东 《计算机应用》 CSCD 北大核心 2020年第7期1901-1907,共7页
针对传统的协同过滤算法中数据稀疏和推荐结果不准确的问题,提出了一种基于隐狄利克雷分布(LDA)与卷积神经网络(CNN)的概率矩阵分解推荐模型(LCPMF),该模型综合考虑项目评论文档的主题信息与深层语义信息。首先,分别使用LDA主题模型和文... 针对传统的协同过滤算法中数据稀疏和推荐结果不准确的问题,提出了一种基于隐狄利克雷分布(LDA)与卷积神经网络(CNN)的概率矩阵分解推荐模型(LCPMF),该模型综合考虑项目评论文档的主题信息与深层语义信息。首先,分别使用LDA主题模型和文本CNN对项目评论文档建模;然后,获取项目评论文档的显著潜在低维主题信息及全局深层语义信息,从而捕获项目文档的多层次特征表示;最后,将得到的用户和多层次的项目特征融合到概率矩阵分解(PMF)模型中,产生预测评分进行推荐。在真实数据集Movielens 1M、Movielens 10M与Amazon上,将LCPMF与经典的PMF、协同深度学习(CDL)、卷积矩阵因子分解模型(ConvMF)模型进行对比。实验结果表明,相较PMF、CDL、ConvMF模型,所提推荐模型LCPMF的均方根误差(RMSE)和平均绝对误差(MAE)在Movielens 1M数据集上分别降低了6.03%和5.38%、5.12%和4.03%、1.46%和2.00%,在Movielens 10M数据集上分别降低了5.35%和5.67%、2.50%和3.64%、1.75%和1.74%,在Amazon数据集上分别降低17.71%和23.63%、14.92%和17.47%、3.51%和4.87%,验证了所提模型在推荐系统中的可行性与有效性。 展开更多
关键词 推荐算法 主题模型 卷积神经网络 概率矩阵分解 协同过滤
在线阅读 下载PDF
基于词向量聚类的中文微博产品命名实体识别 被引量:8
13
作者 王洪亮 《兰州理工大学学报》 CAS 北大核心 2017年第1期104-110,共7页
随着微博等社交平台的兴起,如何针对微博数据进行产品命名实体识别成为了自然语言处理领域研究的热点之一,也是实现舆情监督和商业智能的基础.传统的命名实体识别技术没有考虑中文微博口语化、不规范等特点,且忽略了深层语义对命名实体... 随着微博等社交平台的兴起,如何针对微博数据进行产品命名实体识别成为了自然语言处理领域研究的热点之一,也是实现舆情监督和商业智能的基础.传统的命名实体识别技术没有考虑中文微博口语化、不规范等特点,且忽略了深层语义对命名实体识别的重要作用.因此,考虑中文微博的特殊性,提出一种融合全局上下文信息的词向量特征选择方法,分别采用主题模型和神经网络词向量聚类两种方法获取深层语义信息,并结合层叠条件随机场进行中文微博的命名实体识别.实验结果表明,基于词向量聚类的中文微博产品命名实体识别方法取得了较好的效果. 展开更多
关键词 中文微博 命名实体 主题模型 神经网络 词向量
在线阅读 下载PDF
自适应短文本关键词生成模型 被引量:3
14
作者 王永剑 孙亚茹 杨莹 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第2期199-208,共10页
关键词抽取对文本处理影响较大,其识别的准确度及流畅程度是任务的关键。为有效缓解短文本关键词提取过程中词划分不准确、关键词与文本主题不匹配、多语言混合等难题,提出了一种基于图到序列学习模型的自适应短文本关键词生成模型ADGC... 关键词抽取对文本处理影响较大,其识别的准确度及流畅程度是任务的关键。为有效缓解短文本关键词提取过程中词划分不准确、关键词与文本主题不匹配、多语言混合等难题,提出了一种基于图到序列学习模型的自适应短文本关键词生成模型ADGCN。模型采用图神经网络与注意力机制相结合的方式作为对文本信息特征提取的编码框架,针对词的位置特征和语境特征编码,解决了短文本结构不规律和词之间存在关联复杂信息的问题。同时采用了一种线性解码方案,生成了可解释的关键词。在解决问题的过程中,从某社交平台收集并公布了一个标签数据集,其包括社交平台发文文本和话题标签。实验中,从用户需求角度出发对模型结果的相关性、信息量、连贯性进行评估和分析,所提模型不仅可以生成符合短文本主题的关键词,还可以有效缓解数据扰动对模型的影响。所提模型在公开数据集KP20k上仍表现良好,具有较好的可移植性. 展开更多
关键词 关键词提取 关键词生成 图神经网络 注意力机制 主题模型
原文传递
基于注意力LSTM的音乐主题推荐模型 被引量:8
15
作者 贾宁 郑纯军 《计算机科学》 CSCD 北大核心 2019年第S11期230-235,共6页
针对传统音乐推荐过程中存在的分类准确率较低、周期较长、难以满足人们在生活中对主题音乐的需求等问题,设计了一种注意力机制与长短期记忆(Long Short-Term Memory,LSTM)相结合的神经网络模型,它由音乐主题模型和音乐推荐模型构成,在... 针对传统音乐推荐过程中存在的分类准确率较低、周期较长、难以满足人们在生活中对主题音乐的需求等问题,设计了一种注意力机制与长短期记忆(Long Short-Term Memory,LSTM)相结合的神经网络模型,它由音乐主题模型和音乐推荐模型构成,在使用注意力机制和LSTM网络实现音乐情感分类的基础上,音乐主题模型有效地组合了音频码本和主题模型,实现了对某个情感下的音乐主题子类的判别。音乐推荐模型则利用低级描述符(Low-Level Descriptor,LLD)和频谱图,构建手工特征与卷积循环神经网络(Convolutional Recurrent Neural Network,CRNN)特征的联合表示形式,从而获得用户语音表达的情感,并对其进行精准的音乐主题推荐。实验中,针对两个模型分别进行设计,采用两种不同的传统模型作为基线,实验结果表明,与传统的单一模型相比,此模型不仅可以提升主题分类精度,而且可以精准地判断用户语音数据的情感,从而定向地完成主题音乐的推荐。 展开更多
关键词 音乐主题推荐 长短期记忆网络 注意力机制 卷积循环神经网络 低级描述符 主题模型
在线阅读 下载PDF
高分辨率遥感影像目标分类与识别研究进展 被引量:59
16
作者 刘扬 付征叶 郑逢斌 《地球信息科学学报》 CSCD 北大核心 2015年第9期1080-1091,共12页
高分辨率遥感影像的目标分类与识别,是对地观测系统进行图像分析理解,以及自动目标识别系统提取目标信息的重要手段。本文综述了当前国内外在可见光、红外、合成孔径雷达和合成孔径声纳等遥感影像的目标分类与识别的关键技术和最新研究... 高分辨率遥感影像的目标分类与识别,是对地观测系统进行图像分析理解,以及自动目标识别系统提取目标信息的重要手段。本文综述了当前国内外在可见光、红外、合成孔径雷达和合成孔径声纳等遥感影像的目标分类与识别的关键技术和最新研究进展。首先,讨论了高分辨率遥感影像的目标分类与识别问题的主要研究层次和内容;其次,深入分析了高分辨率遥感影像目标分类与识别,在滤波降噪、特征提取、目标检测、场景分类、目标分类和目标识别的关键技术及其所存在的问题;最后,结合并行计算、神经计算和认知计算等技术,讨论了目标分类与识别的可行性方案。具体包括:(1)高性能并行计算在高分辨率遥感图像处理的主流技术,并给出了基于Hadoop+Open MP+CUDA的高分辨率遥感影像混合并行处理架构;(2)深度学习对于提升目标分类和识别精度的应用前景,以及基于深度神经网络的多层次遥感影像目标识别方法;(3)认知计算在解决遥感影像大数据不确定性分析的模型与算法,并讨论了层次主题模型的多尺度遥感影像场景描述方案。此外,根据媒体神经认知计算的相关研究,探讨了遥感影像大数据的目标分类和识别的发展趋势和研究方向。 展开更多
关键词 目标分类与识别 媒体神经认知计算 并行计算 深度学习 主题模型
原文传递
大数据驱动的社交网络舆情用户情感主题分类模型构建研究——以“移民”主题为例 被引量:21
17
作者 王晰巍 邢云菲 +1 位作者 韦雅楠 王铎 《信息资源管理学报》 CSSCI 2020年第1期29-38,48,共11页
基于卷积神经网络构建大数据驱动的社交网络舆情用户情感主题分类模型,通过爬虫分别获取微博和Twitter用户针对热点主题“移民”的情感文本内容,利用Word2Vector训练中文词向量,GloVe训练英文词向量,使用NLPIR和BosonNLP工具进行分词,... 基于卷积神经网络构建大数据驱动的社交网络舆情用户情感主题分类模型,通过爬虫分别获取微博和Twitter用户针对热点主题“移民”的情感文本内容,利用Word2Vector训练中文词向量,GloVe训练英文词向量,使用NLPIR和BosonNLP工具进行分词,构建基于“移民”主题的用户情感语料库,通过CNN卷积神经网络对情感分类进行训练和测试,并将分类结果与Time-LSTM和SVM的分类结果进行对比以验证CNN分类的优越性。数据结果表明,所构建的模型能够实现有效的多语言环境下中英文文本分类,通过合理设置激活函数和相关参数能够优化提高模型分类准确度,相较传统机器学习具有一定的优越性。在处理“移民”话题的文本分类上,CNN分类效果优于Time-LSTM模型。研究为跨语言的社交网络舆情用户情感主题图谱的可视化分析提供了前期的研究框架。 展开更多
关键词 卷积神经网络 社交网络 情感分类 主题模型 舆情监测 用户研究
在线阅读 下载PDF
基于神经自回归分布估计的涉案新闻主题模型构建方法 被引量:5
18
作者 毛存礼 梁昊远 +3 位作者 余正涛 郭军军 黄于欣 高盛祥 《中文信息学报》 CSCD 北大核心 2021年第2期89-98,共10页
神经主题模型能有效获取文本的深层语义特征,但现有的神经主题模型忽略了外部知识对获取主题分布的帮助。因此,针对涉案主题分析任务,该文提出了一种基于神经自回归分布估计的涉案新闻主题模型构建方法。以案件要素作为外部知识对iDocNA... 神经主题模型能有效获取文本的深层语义特征,但现有的神经主题模型忽略了外部知识对获取主题分布的帮助。因此,针对涉案主题分析任务,该文提出了一种基于神经自回归分布估计的涉案新闻主题模型构建方法。以案件要素作为外部知识对iDocNADEe模型进行了扩展,通过计算案件要素与主题词的相关度来构建注意力机制对iDocNADEe模型双向编码的隐状态进行加权,利用神经自回归算法计算加权后的主题词双向隐状态的自回归条件概率实现涉案新闻文本主题模型构建。实验结果表明,该文提出方法较基线模型困惑度降低了0.66%、主题连贯性提高了6.26%,并且在文档检索精确率方面也明显高于基线模型。 展开更多
关键词 案件要素 iDocNADEe 注意力机制 神经自回归分布估计 涉案新闻 主题模型
在线阅读 下载PDF
融合SOM功能聚类与DeepFM质量预测的API服务推荐方法 被引量:25
19
作者 曹步清 肖巧翔 +1 位作者 张祥平 刘建勋 《计算机学报》 EI CSCD 北大核心 2019年第6期1367-1383,共17页
由于越来越多的企业和组织纷纷将自己的业务、数据或资源封装成服务,并通过API的形式发布到互联网上,API服务的数量呈现倍增趋势.在此背景下,如何从这样一个大规模的API服务集合中,快速有效地找到满足开发者用户Mashup需求的API服务,已... 由于越来越多的企业和组织纷纷将自己的业务、数据或资源封装成服务,并通过API的形式发布到互联网上,API服务的数量呈现倍增趋势.在此背景下,如何从这样一个大规模的API服务集合中,快速有效地找到满足开发者用户Mashup需求的API服务,已成为一个挑战性问题.为此,本文聚焦于“推荐合适的API服务以构建高质量Mashup应用”问题,以面向服务内容的功能聚类为基础,结合基于多维服务质量的评分预测,提出一种融合SOM功能聚类与DeepFM质量预测的API服务推荐方法,用于创建高质量的Mashup应用.该方法首先采用Wikipedia 作为外部语料库扩充API服务文档的内容并利用HDP模型建模其主题分布.通过WikiExtractor抽取出Wikipedia中的语料数据,并利用Word2vec工具训练该语料数据获得其词向量模型.利用训练好的Wikipedia词向量模型对API服务描述文档进行扩充.针对扩充后的API服务文档,使用HDP主题建模技术,挖掘出其隐含的主题信息,自动确定最优主题个数,以准确地度量API服务文档之间的语义相似度.然后,采用SOM神经网络进行面向主题的API服务聚类.在HDP主题建模之后,对获得的“API服务文档-主题”向量采用SOM神经网络聚类算法进行主题聚类,通过自组织过程,将众多的API服务划分到不同的功能类簇中,每一个功能类中包含多个具有相似功能的API服务.接下来,针对API服务类簇中所有具有相似功能的API服务,利用DeepFM模型建模和挖掘其多维QoS属性之间的复杂交互关系,预测并排序API服务的质量得分.DeepFM模型自动地提取出QoS数据中(包括流行度、共现次数等)的有效的特征组合关系(包括高阶特征和低阶特征组合关系),预测并排序每一个API服务相对于目标Mashup应用的质量得分,推荐得分靠前的 N 个API服务给开发者用户.最后,在真实Web服务数据集上进行了实验比较与分析,实验结果表明:本文方法在准确率、召回率、纯度、熵、DCG、HMD等性能方面都要整体优于其它六种方法.相比于TF-IDF、LDA-K-CF、LDA-K-FM、HDP-K-CF、HDP-K-FM、HDP-S - FM,本文方法的准确率指标分别提升了196.2%、49%、33.8%、31.2%、12.3%、10.3%,DCG值分别提升了161.8%、26.4%、18.6%、16.2%、6.73%、4.5%. 展开更多
关键词 API推荐 Mashup应用 HDP主题模型 SOM神经网络 深度因子分解机
在线阅读 下载PDF
一种融合用户动态偏好和注意力机制的跨领域推荐方法 被引量:4
20
作者 钱忠胜 涂宇 +2 位作者 俞情媛 李端明 孙志旺 《小型微型计算机系统》 CSCD 北大核心 2022年第6期1335-1344,共10页
作为当今电子商务中的一项重要技术,推荐系统的重要性日益提升.在项目空间上用户的评分数据十分稀疏,导致推荐系统的质量不佳.商品评论中蕴含着丰富的信息,通过提取评论文本信息能够有效地减少数据稀疏性带来的影响.事实上,用户的偏好... 作为当今电子商务中的一项重要技术,推荐系统的重要性日益提升.在项目空间上用户的评分数据十分稀疏,导致推荐系统的质量不佳.商品评论中蕴含着丰富的信息,通过提取评论文本信息能够有效地减少数据稀疏性带来的影响.事实上,用户的偏好并非一成不变的,将不同时间段设置不同的权重能更有效地描述用户的整体状况.在神经网络算法广泛应用的背景下,将神经网络引入到跨领域推荐中可以发现不同领域用户偏好的映射关系.此外,注意力机制是一种流行的深度学习方法,将注意力机制与主题模型结合,提出一种基于注意力机制的跨领域推荐方法.首先,使用LDA(Latent Dirichlet Allocation)主题模型分别提取源领域和目标领域的项目主题分布.接着,将其与用户评分、时间权重因子、注意力机制结合,得到用户的动态偏好.然后,使用BP(Back Propagation)神经网络学习用户偏好的映射关系,并将用户在源领域与目标领域的偏好结合.最后,通过协同过滤的方法进行评分预测.实验结果表明,提出的推荐方法在亚马逊电子商品、影视与以及音乐的评分评论数据集上较其它传统推荐策略有着更好的推荐效果. 展开更多
关键词 主题模型 动态偏好 跨领域推荐 神经网络 注意力机制
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部