期刊文献+
共找到216篇文章
< 1 2 11 >
每页显示 20 50 100
基于Transformer和Text-CNN的日志异常检测
1
作者 尹春勇 张小虎 《计算机工程与科学》 北大核心 2025年第3期448-458,共11页
日志数据作为软件系统中最为重要的数据资源之一,记录着系统运行期间的详细信息,自动化的日志异常检测对于维护系统安全至关重要。随着大型语言模型在自然语言处理领域的广泛应用,基于Transformer的日志异常检测方法被广泛地提出。传统... 日志数据作为软件系统中最为重要的数据资源之一,记录着系统运行期间的详细信息,自动化的日志异常检测对于维护系统安全至关重要。随着大型语言模型在自然语言处理领域的广泛应用,基于Transformer的日志异常检测方法被广泛地提出。传统的基于Transformer的方法,难以捕捉日志序列的局部特征,针对上述问题,提出了基于Transformer和Text-CNN的日志异常检测方法LogTC。首先,通过规则匹配将日志转换成结构化的日志数据,并保留日志语句中的有效信息;其次,根据日志特性采用固定窗口或会话窗口将日志语句划分为日志序列;再次,使用自然语言处理技术Sentence-BERT生成日志语句的语义化表示;最后,将日志序列的语义化向量输入到LogTC日志异常检测模型中进行检测。实验结果表明,LogTC能够有效地检测日志数据中的异常,且在2个数据集上都取得了较好的结果。 展开更多
关键词 日志异常检测 深度学习 词嵌入 TRANSFORMER text-cnn
在线阅读 下载PDF
基于Text-CNN模型的工程质量信息化研究
2
作者 母晓维 《建筑机械化》 2025年第9期28-32,共5页
针对建设工程质量问题分类的复杂性与数据不平衡问题,提出Text-CNN模型进行智能分类,通过数据预处理与基于语言学规则的数据增强方法解决类别不平衡问题,实现数据集的适度平衡。构建并训练Text-CNN模型,有效实现建设工程质量问题的识别... 针对建设工程质量问题分类的复杂性与数据不平衡问题,提出Text-CNN模型进行智能分类,通过数据预处理与基于语言学规则的数据增强方法解决类别不平衡问题,实现数据集的适度平衡。构建并训练Text-CNN模型,有效实现建设工程质量问题的识别与分类,与SVM和LSTM模型对比,Text-CNN在准确率与召回率及精确率方面具有明显优势,证明了其在建设工程监理信息化中的高效性与实用性。 展开更多
关键词 工程质量 施工监理 卷积神经网络 text-cnn 信息化
原文传递
融合Text-CNN与注意力机制的特产小吃评论情感分析 被引量:2
3
作者 韦斯羽 朱广丽 谈光璞 《阜阳师范大学学报(自然科学版)》 2023年第1期57-63,共7页
面向特产小吃评论数据的情感分析,旨在挖掘消费者对不同特产小吃的观点和看法,从而提高特产小吃产品的销量。针对当前特产小吃评论情感分析准确率较低的问题,本文构建了特产小吃评论数据集,并提出一种融合Text-CNN(Convolutional Naural... 面向特产小吃评论数据的情感分析,旨在挖掘消费者对不同特产小吃的观点和看法,从而提高特产小吃产品的销量。针对当前特产小吃评论情感分析准确率较低的问题,本文构建了特产小吃评论数据集,并提出一种融合Text-CNN(Convolutional Naural Networks)与注意力机制的模型对其进行情感分析。首先,通过Text-CNN对文本局部特征信息进行提取;然后,将局部特征引入注意力机制单元中,完成对文本信息的特征提取。最后在Softmax分类器中输入提取的特征,进行情感分类。实验结果表明,提出的模型与Text-CNN、Bi-RNN+Attention、Char-CNN、LEAM四种模型进行对比,准确率有所提升。 展开更多
关键词 情感分析 特产小吃 text-cnn 注意力机制
在线阅读 下载PDF
利用Text-CNN改进PubMedBERT在化学诱导性疾病实体关系分类效果的尝试 被引量:1
4
作者 董淼 苏中琪 +3 位作者 周晓北 兰雪 崔志刚 崔雷 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第11期145-152,共8页
【目的】改进PubMedBERT在化学诱导性疾病(CID)实体关系分类的效果。【方法】提出一种基于PubMedBERT并结合Text-CNN的实体关系分类方法。该方法以实体对和文本组成句子对进行输入,利用PubMedBERT预训练模型对化学诱导性疾病相关文本进... 【目的】改进PubMedBERT在化学诱导性疾病(CID)实体关系分类的效果。【方法】提出一种基于PubMedBERT并结合Text-CNN的实体关系分类方法。该方法以实体对和文本组成句子对进行输入,利用PubMedBERT预训练模型对化学诱导性疾病相关文本进行编码获取全局特征,通过Text-CNN捕捉文本局部重要信息,判断实体对是否具有CID关系。【结果】在BioCreative V CDR数据集中,该方法的精确率、召回率和F1值分别达到78.3%、73.5%和75.8%,较其他方法最少提升了3.1%、1.5%和3.3%。【局限】仅考虑了化学诱导性疾病文本语料,在临床等其他语料上的效果有待检验。【结论】该方法能够捕捉化学诱导性疾病文本特征,提升实体关系分类的效果。 展开更多
关键词 CID实体关系分类 PubMedBERT text-cnn 句子对
原文传递
基于双通道和注意力机制的多特征融合的文本情感分类模型
5
作者 邓治文 张龙健 +1 位作者 李锦辉 魏其武 《软件工程》 2025年第12期1-5,共5页
针对单一模型在文本分类时难以捕捉丰富语义信息的问题,提出了一种基于双通道和注意力机制的多特征融合的文本情感分类模型(MFF-DCAM)。首先,利用BERT-WWM-EXT获取文本词向量;其次,分别使用多尺度卷积神经网络和双向长短期记忆网络提取... 针对单一模型在文本分类时难以捕捉丰富语义信息的问题,提出了一种基于双通道和注意力机制的多特征融合的文本情感分类模型(MFF-DCAM)。首先,利用BERT-WWM-EXT获取文本词向量;其次,分别使用多尺度卷积神经网络和双向长短期记忆网络提取局部特征和上下文特征;再次,拼接两个特征并使用注意力机制对该特征加权;然后,使用全局平均池化突出句子整体信息;最后,使用Softmax函数进行分类。实验结果表明,MFFDCAM模型的准确率、精确率和F1值优于8个基准模型,验证了该模型在提升文本情感分类方面的有效性。 展开更多
关键词 双通道 注意力机制 BiLSTM模型 text-cnn模型
在线阅读 下载PDF
基于交通事故文本挖掘的高速公路行车风险改进预测方法
6
作者 胡立伟 侯智 +4 位作者 赵雪亭 刘冰 陈琛 贺雨 张瑞杰 《西南交通大学学报》 北大核心 2025年第6期1487-1498,共12页
为有效解决高速公路巡查里程长、管控难度大等问题,对现有双向长短记忆网络(BiLSTM)文本分类模型及卷积神经网络(CNN)风险预测模型进行适用性改进,分析挖掘历史道路交通事故文本数据,引入道路区段划分方法以准确预测高速公路行车风险分... 为有效解决高速公路巡查里程长、管控难度大等问题,对现有双向长短记忆网络(BiLSTM)文本分类模型及卷积神经网络(CNN)风险预测模型进行适用性改进,分析挖掘历史道路交通事故文本数据,引入道路区段划分方法以准确预测高速公路行车风险分布,实现高速公路行车安全科学管控.首先,基于自注意力机制改进的双向长短期记忆网络(BiLSTM-AT)对交通事故文本进行分类,得到每条事故对应的事故风险等级;其次,在ArcGIS中区段划分高速公路,统计每个区段内的行车风险等级并进行核密度分析,将文本分类结果可视化,展示不同区域的风险大小;最后,基于长短记忆网络(LSTM)的卷积神经网络(CNN-LSTM)对分类后的风险等级进行时间序列预测,得到未来高速公路行车风险的空间分布,得到并绘制高速公路行车风险等级云图.研究结果表明:在事故文本分类方面,BiLSTM-AT模型的分类准确率达到95.03%,较BiLSTM和GRU分别提高0.91%和0.67%;在风险预测方面时,CNN-LSTM的平均相对误差和均方根误差分别为0.04和0.07,相较于次优的LSTM模型分别下降了9.05%和6.84%.本文提出从事故文本分类、区段划分、行车风险预测到结果可视化紧密相接的方法,可有效对交通事故文本中的行车风险信息进行提取及分析,为优化高速公路巡查路线及重点区段的交通管控提供参考. 展开更多
关键词 交通工程 BiLSTM-AT CNN-LSTM 交通事故文本 高速公路行车风险
在线阅读 下载PDF
基于ERNIE-CAB-CNN的稀土专利文本分类模型
7
作者 廖列法 石利娇 《电子技术应用》 2025年第1期18-24,共7页
针对稀土专利文本专业性强的特点以及现有的文本分类方法存在的不足,鉴于类别注意力在计算机视觉领域的广泛应用和取得的良好效果,提出了一种用于文本分类的类别注意力模块(Category Attention Module,CAB),并结合预训练模型ERNIE和卷... 针对稀土专利文本专业性强的特点以及现有的文本分类方法存在的不足,鉴于类别注意力在计算机视觉领域的广泛应用和取得的良好效果,提出了一种用于文本分类的类别注意力模块(Category Attention Module,CAB),并结合预训练模型ERNIE和卷积神经网络(Convolutional Neural Networks,CNN)构建了一个用于稀土专利文本分类的创新模型ERNIE-CAB-CNN。模型使用ERNIE对专利文本进行向量化,得到语义信息更加丰富的向量表示后,通过CAB为文本中各个类别的重要特征赋予较高权值,使模型可以更准确地区分不同类别的特征。最后用CNN进一步提取文本中其他关键局部特征,得到的最终文本向量表示用于分类。通过Patsnap专利数据库官方网站检索下载稀土专利数据构建数据集进行实验,实验结果表明,稀土专利文本分类模型ERNIE-CAB-CNN在测试集上分类的准确率、精确率、F1分数分别为82.68%、83.2%、82.06%,取得了良好的分类效果。 展开更多
关键词 稀土专利分类 文本分类 类别注意力 ERNIE CNN 特征提取
在线阅读 下载PDF
基于多模态财务大数据的智能分析预测模型 被引量:2
8
作者 王伯平 王邦平 《无线电通信技术》 北大核心 2025年第3期501-510,共10页
当前,研究者对财务领域的文本情感分析和语音情感识别越来越感兴趣,因其可以捕捉到企业利益相关者(如管理者和投资者)的意图和意见。结合文本情感信息,企业在预测财务绩效方面取得了显著的性能提升。然而,仅考虑文本情感,对管理者的情... 当前,研究者对财务领域的文本情感分析和语音情感识别越来越感兴趣,因其可以捕捉到企业利益相关者(如管理者和投资者)的意图和意见。结合文本情感信息,企业在预测财务绩效方面取得了显著的性能提升。然而,仅考虑文本情感,对管理者的情感状态以及对财务危机预测的关注度远远不够。因此提出了一种基于多模态财务大数据的智能分析预测模型(Multi Modal Financial Intelligent Model,MMFIM),融合了语音情感特征、文本情感特征以及传统财务特征多模态数据以解决上述问题。MMFIM通过卷积神经网络(Convolutional Neural Network,CNN)模型识别管理者的语音情感状态,利用FinBERT模型抽取文本情感特征,将获得的情感信息与传统的财务指标相融合实现对财务危机更准确的预测。在美国40家最大(按市值计算)企业的1278次财报电话会议数据上对MMFIM模型进行验证,实验结果表明,与现有预测模型相比,所提MMFIM模型具有更高的准确率。 展开更多
关键词 多模态 语音情感识别 文本情感分析 卷积神经网络 FinBERT 财务危机预测
在线阅读 下载PDF
基于长短期记忆网络-卷积神经网络的电力设备缺陷文本归口研究 被引量:1
9
作者 王璇 曹靖 韩培洁 《山西电力》 2025年第1期10-14,共5页
随着电网企业发展,电网生产运营中会产生大量电力设备缺陷文本,其中蕴含着电力设备维护与检修的重要信息。由于缺陷文本是非结构化数据,其价值的挖掘依赖于归口,为提升文本利用效率,提出了一种基于长短期记忆网络-卷积神经网络的电力设... 随着电网企业发展,电网生产运营中会产生大量电力设备缺陷文本,其中蕴含着电力设备维护与检修的重要信息。由于缺陷文本是非结构化数据,其价值的挖掘依赖于归口,为提升文本利用效率,提出了一种基于长短期记忆网络-卷积神经网络的电力设备缺陷文本自动归口模型。以变压器缺陷文本为例开展研究,模型采用长短期记忆网络对词的权重进行学习,卷积神经网络对带权重的词进行特征提取,用softmax进行分类,最终得到文本归口。通过算例分析,证明该模型在准确度、召回率等方面均优于卷积神经网络等常规方法。 展开更多
关键词 电力设备缺陷文本 文本分类 长短期记忆网络 卷积神经网络
在线阅读 下载PDF
融合BiLSTM与CNN的推特黑灰产分类模型 被引量:3
10
作者 朱恩德 王威 高见 《计算机工程与应用》 北大核心 2025年第1期186-195,共10页
当前推特等国外社交平台,已成为从事网络黑灰产犯罪不可或缺的工具,对推特上黑灰产账号进行发现、检测和分类对于打击网络犯罪、维护社会稳定具有重大意义。现有的推文分类模型双向长短时记忆网络(bi-directional long short-term memor... 当前推特等国外社交平台,已成为从事网络黑灰产犯罪不可或缺的工具,对推特上黑灰产账号进行发现、检测和分类对于打击网络犯罪、维护社会稳定具有重大意义。现有的推文分类模型双向长短时记忆网络(bi-directional long short-term memory,BiLSTM)可以学习推文的上下文信息,却无法学习局部关键信息,卷积神经网络(convolution neural network,CNN)模型可以学习推文的局部关键信息,却无法学习推文的上下文信息。结合BiLSTM与CNN两种模型的优势,提出了BiLSTM-CNN推文分类模型,该模型将推文进行向量化后,输入BiLSTM模型学习推文的上下文信息,再在BiLSTM模型后引入CNN层,进行局部特征的提取,最后使用全连接层将经过池化的特征连接在一起,并应用softmax函数进行四分类。模型在自主构建的中文推特黑灰产推文数据集上进行实验,并使用TextCNN、TextRNN、TextRCNN三种分类模型作为对比实验,实验结果显示,所提的BiLSTM-CNN推文分类模型在对四类推文进行分类的宏准确率为98.32%,明显高于TextCNN、TextRNN和TextRCNN三种模型的准确率。 展开更多
关键词 文本分类 双向长短期记忆网络(BiLSTM) 卷积神经网络(CNN) 黑灰产 推特
在线阅读 下载PDF
融合文本分析和CNN-BiLSTM模型的校园霸凌舆情分析——以邯郸初中生被害案为例 被引量:1
11
作者 黄金柱 杨云飞 +2 位作者 周丹萍 王淑影 王纯杰 《情报探索》 2025年第1期64-71,共8页
[目的/意义]校园霸凌是一种严重影响学生身心健康的现象,在教育领域和社会中引起了广泛关注。本文旨在深入研究校园霸凌事件,揭示公众对校园霸凌的态度和看法。[方法/过程]应用Python软件爬取公众对某校园霸凌热点事件的微博评论数据,... [目的/意义]校园霸凌是一种严重影响学生身心健康的现象,在教育领域和社会中引起了广泛关注。本文旨在深入研究校园霸凌事件,揭示公众对校园霸凌的态度和看法。[方法/过程]应用Python软件爬取公众对某校园霸凌热点事件的微博评论数据,使用文本分析和CNN-BiLSTM模型对该事件中民众的主要观点进行情感分析研究。[结果/结论]通过实例分析说明了该模型具有更好的预测准确率,并得到舆论关注的热点,提出舆论应对建议。 展开更多
关键词 教育舆情 校园霸凌 文本分析 情感分析 CNN-BiLSTM模型
在线阅读 下载PDF
基于循环和卷积神经网络的句子级文本情感分类研究
12
作者 昝嵘 《计算机与网络》 2025年第4期357-362,共6页
现有的句子级文本情感分类中,采用简单的词袋模型在获取句子级全局语义表示时,只能捕捉文本中的部分上下文关系和语义依赖,导致情感分类的准确性降低。为此,提出基于循环和卷积神经网络(Convolutional Neural Network,CNN)的句子级文本... 现有的句子级文本情感分类中,采用简单的词袋模型在获取句子级全局语义表示时,只能捕捉文本中的部分上下文关系和语义依赖,导致情感分类的准确性降低。为此,提出基于循环和卷积神经网络(Convolutional Neural Network,CNN)的句子级文本情感分类研究。对句子级文本进行预处理,去除高频但无实际情感贡献的停用词,利用Word2Vec词嵌入技术和Skip-gram模型训练词向量。通过长短时记忆(Long Short Term Memory,LSTM)网络对预处理后的文本进行建模,得到句子级的全局语义表示。利用CNN对句子级文本语义特征进行提取,通过设定卷积核参数并进行卷积运算,结合分段池化技术,形成丰富的特征向量。采用softmax函数作为分类机制,将特征向量转化为情感分类的条件概率分布,判断句子级文本的情感类别。实验结果表明,所提方法在混淆矩阵和曲线下面积(Area Under Curve,AUC)值上均优于对比方法,可实现更加精准的句子级文本情感分类。 展开更多
关键词 循环神经网络 卷积神经网络 句子级文本 情感分类 语义表示
在线阅读 下载PDF
基于R-CNN的中医医案诊断分类方法
13
作者 邱雪峰 查青林 朱根华 《现代信息科技》 2025年第13期47-52,57,共7页
针对中医医案中常见的复杂语句结构,以及在诊断分类中上下文语义捕捉不足的问题,文章提出一种基于RoBERTa、R-CNN和多头自注意力机制的中医医案诊断分类模型。首先,通过RoBERTa对文本进行预训练,获取深层语义表示,增强上下文理解能力。... 针对中医医案中常见的复杂语句结构,以及在诊断分类中上下文语义捕捉不足的问题,文章提出一种基于RoBERTa、R-CNN和多头自注意力机制的中医医案诊断分类模型。首先,通过RoBERTa对文本进行预训练,获取深层语义表示,增强上下文理解能力。然后,采用R-CNN提取局部特征信息,捕捉语义与症状。进一步引入多头自注意力机制,强化长距离依赖关系建模,获取文本中的关键信息。该模型充分结合全局语义与局部特征,提升分类准确性。实验结果表明,模型在诊断分类任务中的预测精度和F1值分别达80.89%和79.76%,有效改善了文本分类性能。 展开更多
关键词 中医医案 R-CNN RoBERTa 多头自注意力机制 文本分类
在线阅读 下载PDF
基于改进ADAM算法的变电站SCD文本分词方法
14
作者 郑翔 陈韶昱 +3 位作者 吴俊飞 阮黎翔 骆兆军 徐小俊 《微型电脑应用》 2025年第1期255-258,共4页
针对电力领域文本数据分词准确性较低的问题,提出一种基于改进ADAM(adaptive moment estimation)算法的中文分词技术。选用Skip-Gram模型作为字嵌入模型,将字词转为分布式向量,搭建卷积神经网络-门控循环单元-条件随机场(CNN-Bi-GRU-CRF... 针对电力领域文本数据分词准确性较低的问题,提出一种基于改进ADAM(adaptive moment estimation)算法的中文分词技术。选用Skip-Gram模型作为字嵌入模型,将字词转为分布式向量,搭建卷积神经网络-门控循环单元-条件随机场(CNN-Bi-GRU-CRF)模型实现电力领域文本语句的分割,提出一种改进的ADAM算法,通过控制不同时间窗口的学习率优化神经网络模型,提高模型训练速度。将所提算法运用于变电站SCD(system configuration description)文本数据分词的算例分析,通过与其他主流分词算法进行比较,验证所提分词技术的先进性与准确性。 展开更多
关键词 中文分词技术 ADAM算法 CNN-Bi-GRU-CRF 变电站SCD文本
在线阅读 下载PDF
基于BERT-CNN-SIFRank的智能预问诊模型研究与设计
15
作者 崔晓笛 吴冠朋 刘文强 《中国数字医学》 2025年第8期65-71,共7页
目的:研究并设计智能预问诊模型,模拟医生实际问诊过程,准确了解患者就诊意图,自动解答患者提出的问题,减少患者问诊等待时间,提升患者就医体验,提高医生接诊效率。方法:基于深度学习技术构建智能预问诊模型,设计基于BERT-CNN的医疗文... 目的:研究并设计智能预问诊模型,模拟医生实际问诊过程,准确了解患者就诊意图,自动解答患者提出的问题,减少患者问诊等待时间,提升患者就医体验,提高医生接诊效率。方法:基于深度学习技术构建智能预问诊模型,设计基于BERT-CNN的医疗文本分类模型实现患者问题分类,利用基于SIFRank的医疗文本关键词抽取模型提取患者问题关键词,进而获取患者医疗问题意图。结果:基于BERT-CNN的医疗文本分类模型在公开数据集上的F1值达到82.84%,有效提高了医疗文本分类准确率。结论:基于BERT-CNNSIFRank的智能预问诊模型丰富了预问诊研究技术路线,为构建高效、智能、个性化的预问诊系统提供了理论模型基础,有利于促进互联网医院高质量发展。 展开更多
关键词 预问诊模型 医疗文本分类 医疗关键词抽取 BERT CNN
在线阅读 下载PDF
基于Word2vec和句法规则的自动问答系统问句相似度研究 被引量:7
16
作者 刘杰 白尚旺 +2 位作者 陆望东 党伟超 潘理虎 《计算机应用与软件》 北大核心 2021年第3期169-174,201,共7页
自动问答系统问句相似度计算的准确率直接影响系统返回答案的准确率,对此提出一种基于Word2vec和句法规则的问句相似度计算方法。构造Text-CNN问句分类模型将问句进行分类,再构造Word2vec词向量模型将问句中词与词的空间向量相似度转换... 自动问答系统问句相似度计算的准确率直接影响系统返回答案的准确率,对此提出一种基于Word2vec和句法规则的问句相似度计算方法。构造Text-CNN问句分类模型将问句进行分类,再构造Word2vec词向量模型将问句中词与词的空间向量相似度转换成语义相似度,并加入句法规则的分析。随机从搜狗公开问答数据集中抽取200条数据进行测试,结果表明,该方法与TF-IDF方法相比,自动问答系统返回答案的准确率和召回率分别提高了0.259和0.154。 展开更多
关键词 自动问答系统 Word2vec text-cnn 问句相似度
在线阅读 下载PDF
基于CNN-DPCNN-LSTM融合模型的建筑材料设备分类研究
17
作者 孙华建 《工程建设标准化》 2025年第12期106-112,共7页
随着工程造价信息化的深入发展,建筑材料设备作为工程造价控制的核心要素,其分类精准性已成为影响造价管理效率的关键因素。传统依赖人工经验或规则匹配的分类方法,在面对跨项目、多业态的海量工程文本时,易出现分类偏差且一致性不足等... 随着工程造价信息化的深入发展,建筑材料设备作为工程造价控制的核心要素,其分类精准性已成为影响造价管理效率的关键因素。传统依赖人工经验或规则匹配的分类方法,在面对跨项目、多业态的海量工程文本时,易出现分类偏差且一致性不足等问题,难以满足行业需求。为此,本研究提出融合卷积神经网络(CNN)、深度残差卷积网络(DPCNN)与长短期记忆网络(LSTM)的深度学习框架,构建分类融合模型。实验结果表明,融合模型在测试集上的准确率达94.50%,显著优于单一基础模型。研究验证了模型融合在提升文本分类精度与鲁棒性上的有效性,为建筑材料设备智能分类提供有效方法,也为建筑工程造价数字化管理与智能化应用提供实践参考。 展开更多
关键词 建筑材料设备 文本分类 卷积神经网络 深度残差卷积网络 长短期记忆网络
在线阅读 下载PDF
一种文本-图像增强的多模态知识图谱嵌入方法 被引量:4
18
作者 肖桂阳 王立松 江国华 《计算机科学》 CSCD 北大核心 2023年第8期163-169,共7页
大多传统的知识表示学习方法只关注三元组中的结构化信息,无法很好地利用实体图像、关系路径、文本描述等附加信息来学习知识表示或只融合一种附加信息。因此,提出同时融合实体描述和图像的多模态知识图谱嵌入方法,通过文本、图像相互增... 大多传统的知识表示学习方法只关注三元组中的结构化信息,无法很好地利用实体图像、关系路径、文本描述等附加信息来学习知识表示或只融合一种附加信息。因此,提出同时融合实体描述和图像的多模态知识图谱嵌入方法,通过文本、图像相互增强,可以提供更加全面的外部信息来弥补单个信息源的不完整性给知识表示学习带来的不足。首先进行实体描述和图像建模,得到实体的文本表示和图像表示,并把它们作为TransE中结构表示的补充,最后通过3种实体表示的联合训练实现知识图谱和文本、图像的统一空间表示,提高实体和关系预测的准确性。实验结果表明,该模型实体预测的命中率比不融合附加信息的方法提高了3.09%,比只融合实体描述的方法提高了0.97%,比只融合实体图像的方法提高了1.32%。 展开更多
关键词 知识表示学习 实体描述 实体图像 text-cnn 联合训练
在线阅读 下载PDF
融合多头自注意力机制的中文分类方法 被引量:8
19
作者 熊漩 严佩敏 《电子测量技术》 2020年第10期125-130,共6页
中文文本分类任务中,深度学习神经网络方法具有自动提取特征、特征表达能力强的优势,但其模型可解释性不强。提出了一种Text-CNN+Multi-Head Attention模型,引入多头自注意力机制克服Text-CNN可解释性的不足。首先采用Text-CNN神经网络... 中文文本分类任务中,深度学习神经网络方法具有自动提取特征、特征表达能力强的优势,但其模型可解释性不强。提出了一种Text-CNN+Multi-Head Attention模型,引入多头自注意力机制克服Text-CNN可解释性的不足。首先采用Text-CNN神经网络,高效提取文本局部特征信息;然后通过引入多头自注意力机制,最大限度发挥Text-CNN的并行运算能力,强调文本序列全局信息的捕捉;最后在时间和空间上完成对文本信息的特征提取。实验结果表明,提出的模型较其他模型在保证运算速度的同时,准确率提升了1%~2%。 展开更多
关键词 中文文本分类 text-cnn Multi-Head Self-Attention
原文传递
融合主题信息的卷积神经网络文本分类方法研究 被引量:20
20
作者 杨锐 陈伟 +3 位作者 何涛 张敏 李蕊伶 岳芳 《现代情报》 CSSCI 2020年第4期42-49,共8页
[目的/意义]针对能源政策语义信息丰富的特点,研究不同环境下卷积神经网络模型对能源政策文本特征分类识别的效果并提出优化方法,辅助能源政策信息资源进行自动分类操作,方便研究人员更好地进行能源政策解读。[方法/过程]在不同环境下... [目的/意义]针对能源政策语义信息丰富的特点,研究不同环境下卷积神经网络模型对能源政策文本特征分类识别的效果并提出优化方法,辅助能源政策信息资源进行自动分类操作,方便研究人员更好地进行能源政策解读。[方法/过程]在不同环境下利用字符级和词级卷积神经网络模型对能源政策自动文本分类识别效果进行实验,从标题、内容、核心主题句等角度全面对比分析,利用Doc2Vec抽取不同比例核心主题句,将这些主题信息融入卷积神经网络模型中以对实验进行优化。[结果/结论]随着核心主题句抽取率的提高F1均值呈正态分布,当抽取率为70%时达到平衡,神经网络模型评估F1均值为83.45%,较实验中的其它方法均有所提高,通过Doc2Vec提取主题信息,并将其融入卷积神经网络的方法有效提升了卷积神经网络模型自动文本分类的效果。 展开更多
关键词 能源政策 卷积神经网络 文本分类 词向量 文本向量
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部